找回密码
 加入我们
搜索
      
楼主: jaycty

[软件] Po哦t播放器250909增加了whisper AI实时生成字幕的功能,超级好用

  [复制链接]
 楼主| 发表于 2025-9-19 12:04 | 显示全部楼层
allensakura 发表于 2025-9-19 11:25
翻译效果最好的是qwen3-30b-A3B,但是恐怕要24G才能跟上实时翻译的需求,特别是large-v3语音识别还要吃2. ...

翻译还是等几年再说吧,或者哪个网络AI服务商大发慈悲给大家随便接入就好了。
发表于 2025-9-19 12:21 | 显示全部楼层
graz_chell 发表于 2025-9-19 11:51
请问下,AMD显卡能用吗?看回复基本都是N卡,是只能N卡么。。

好像只是N卡福利,我9070xt,只有tiny最好用
发表于 2025-9-19 12:21 | 显示全部楼层
allensakura 发表于 2025-9-19 11:25
翻译效果最好的是qwen3-30b-A3B,但是恐怕要24G才能跟上实时翻译的需求,特别是large-v3语音识别还要吃2. ...

应该都是提前语音识别、字幕翻译的,看llm的log里,字幕都是几十条一起翻译出来的。
发表于 2025-9-19 12:23 | 显示全部楼层
jupz 发表于 2025-9-19 12:21
好像只是N卡福利,我9070xt,只有tiny最好用

好的,非常感谢哈
发表于 2025-9-19 12:55 | 显示全部楼层
ggml-large-v3  --我这里只有5m大小呢.....有谁发个完整版到夸克吗..谢了.
发表于 2025-9-19 12:59 | 显示全部楼层
接入在线api好点,本地小模型质量不行的
发表于 2025-9-19 13:44 | 显示全部楼层
那在哪里下pot呢?
好像不太好下我记得
国内那个镜像站?
发表于 2025-9-19 14:09 | 显示全部楼层
mark
刚好想重新看一遍基与皮尔,苦于字幕组一直没有做3-5季中字,生肉啃得太痛苦了。
发表于 2025-9-19 14:22 | 显示全部楼层
试了下mid模型效果凑合,晚上试试大模组
发表于 2025-9-19 14:27 | 显示全部楼层
马克一下,ai字幕
发表于 2025-9-19 14:43 | 显示全部楼层
jupz 发表于 2025-9-19 12:21
好像只是N卡福利,我9070xt,只有tiny最好用

能帮我看一下9070xt延迟吗?4080使用V3延迟在1-3s左右,算是可用
v3 turbo没什么区别
6c4e8698-fc6c-4670-9a5b-c8e83d5b5f7a.png


发表于 2025-9-19 14:53 | 显示全部楼层
Mark备用
发表于 2025-9-19 15:17 | 显示全部楼层
帮大家问问 日语呢
发表于 2025-9-19 15:23 | 显示全部楼层
allensakura 发表于 2025-9-19 14:43
能帮我看一下9070xt延迟吗?4080使用V3延迟在1-3s左右,算是可用
v3 turbo没什么区别

请问CUDA有比Vulkan好用吗?
发表于 2025-9-19 15:24 | 显示全部楼层
很多电视剧或者电影其实是由英语字幕的,到不一定非要语音转文字才能翻译,不知道能不能直接从内嵌字幕着手翻译出来
 楼主| 发表于 2025-9-19 15:28 | 显示全部楼层
megaslx 发表于 2025-9-19 15:24
很多电视剧或者电影其实是由英语字幕的,到不一定非要语音转文字才能翻译,不知道能不能直接从内嵌字幕着手 ...


这AI功能肯定更好,但是更加高级了,目前还不能普及到PC无脑使用吧,过几年吧。目前仅仅是AI直接读取A语言文本翻译成B语言,就已经很吃硬件配置了。绝大部分PC硬件都跑不快,延迟大
发表于 2025-9-19 15:32 | 显示全部楼层
sun1a2b3c4d 发表于 2025-9-19 15:23
请问CUDA有比Vulkan好用吗?

测试了几次,在4080上察觉不到任何区别
但cpu完全没法跑,我不懂为啥
发表于 2025-9-19 15:51 | 显示全部楼层
我想测试一下日语的翻译效果,谁能个JAVBUS能访问的网址呀
发表于 2025-9-19 16:09 来自手机 | 显示全部楼层
完美解码行不行?
发表于 2025-9-19 16:28 | 显示全部楼层
太好了。。。先回去试试,不行就换卡。终于有理由换卡了。哈哈哈
发表于 2025-9-19 17:46 | 显示全部楼层
megaslx 发表于 2025-9-19 15:24
很多电视剧或者电影其实是由英语字幕的,到不一定非要语音转文字才能翻译,不知道能不能直接从内嵌字幕着手 ...

可以没问题。
发表于 2025-9-19 17:46 | 显示全部楼层
sun1a2b3c4d 发表于 2025-9-19 15:23
请问CUDA有比Vulkan好用吗?

cuda效率更高,vulkan也不是不能用。
发表于 2025-9-19 17:47 | 显示全部楼层
iamyangyi 发表于 2025-9-19 07:43
支持哪些国家语言 有日语不 ,看番就方便了。

昨晚试了几个视频,正常语速正常对话、独白能识别,“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。
发表于 2025-9-19 17:49 | 显示全部楼层
Judecca 发表于 2025-9-19 16:09
完美解码行不行?

没问题,0829版上跑通的。
发表于 2025-9-19 18:08 | 显示全部楼层
Wang_Yves 发表于 2025-9-19 17:47
昨晚试了几个视频,正常语速正常对话、独白能识别,“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。 ...

看来恐怖片和战争片不太适合用
发表于 2025-9-19 18:14 | 显示全部楼层
Wang_Yves 发表于 2025-9-19 17:47
昨晚试了几个视频,正常语速正常对话、独白能识别,“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。 ...

你这是动作番
发表于 2025-9-19 18:15 | 显示全部楼层
mark,试试看。
发表于 2025-9-19 18:18 | 显示全部楼层
sun1a2b3c4d 发表于 2025-9-19 18:08
看来恐怖片和战争片不太适合用

非实时的生成字幕有个VAD功能,实时的还没有,vad识别人声的,勾选试试,先生成,再挂载字幕看。
发表于 2025-9-19 21:26 | 显示全部楼层
确实有这需求,不一定实时。如果有个独立工具,可以根据视频文件生成字幕文件也很好。 字幕生成后,再用播放器观看。
发表于 2025-9-19 21:29 | 显示全部楼层
jaycty 发表于 2025-9-19 02:06
目前我用过的语音识别率最强的是豆包。

是的,我也是这种感觉,甚至好奇为什么字节不出个语音输入法
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-9-21 04:09 , Processed in 0.012587 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表