找回密码
 加入我们
搜索
      
楼主: jaycty

[软件] Po哦t播放器250909增加了whisper AI实时生成字幕的功能,超级好用

  [复制链接]
发表于 2025-9-23 14:24 | 显示全部楼层
我来补充一下

模型可以通过镜像网站
https://hf-mirror.com/ggerganov/whisper.cpp

关于模型,文件名中有EN,表示只支持英语。

还有部分模型文件对于中文识别可能会出现繁体字的情况


除了播放器,还有一些第三方工具, 例如WishperDetkop 也是使用相同技术,可以自动生成字幕。。



另外,如果是最新的Win11 是 自带的字幕工具,按 WIn+ Ctrl + L 可以呼叫出来

PS。 微软最新的EDGE 对在线直播添加 本地   语音翻译功能, 在视频上悬停后,点击翻译音频, 下载一个模型,就会自动变成中文出来。


PS2. 说一下 whisper一些缺点,作为OPENAI的开源声音识别工具,提供任意语言到英语的翻译,可惜对国内用户用处不大。 其次,由于支持全球大部分语言,中文部分识别的可能会有一些不准确地方,包括方言识别。
最后,whisper 一个缺点是无法识别发言人。 对于要做文档整理的。不是很方便。
发表于 2025-9-23 14:27 | 显示全部楼层
YsHaNg 发表于 2025-9-18 23:15
本地起个ollama和openai api一样的 url用127.0.0.1:11434就能访问了 用instruct模型或者qwen3系列 prompt ...

不需要这么麻烦。。

Qwen 官方有 no_think 模型,例如 qwen3:4b-instruct
发表于 2025-9-23 14:28 | 显示全部楼层
邪恶的光B 发表于 2025-9-23 12:14
转成bin很快的,比慢慢下载快多了。

对于非专业 用户太麻烦了,还要准备环境。。


可以直接用HFmirror 镜像下载,也很快的。
发表于 2025-9-23 14:43 来自手机 | 显示全部楼层
没有延时吗
发表于 2025-9-23 14:45 | 显示全部楼层
试了英文 日语为什么啥反应都没有呢?
QQ20250923-144408.png
发表于 2025-9-23 15:29 | 显示全部楼层
是否可以翻译?
发表于 2025-9-23 17:36 | 显示全部楼层
不用注册api key 的话,倒是方便。周末测试看看
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-9-26 03:02 , Processed in 0.008404 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表