Po哦t播放器250909增加了whisper AI实时生成字幕的功能，超级好用

allensakura · 发表于 2025-9-19 00:19

字幕跑了几段之后直接消失，看转换引擎还在启用，很正常
不知道怎解决....

allensakura · 发表于 2025-9-19 01:22

本帖最后由 allensakura 于 2025-9-19 03:18 编辑

jaycty 发表于 2025-9-19 00:44
显卡性能不足

7800X3D 4080
开启生成有声字幕，运行显示正常，不断识别出字幕
但是影片本身就是没有

---------------------
知道了，要选字幕，有声字幕即时

allensakura · 发表于 2025-9-19 11:25

本帖最后由 allensakura 于 2025-9-19 11:39 编辑

红色惊雷发表于 2025-9-19 10:38
可以离线输出字幕吗？实时跑我怕性能不够···

翻译效果最好的是qwen3-30b-A3B，但是恐怕要24G才能跟上实时翻译的需求，特别是large-v3语音识别还要吃2.5G的情况下

allensakura · 发表于 2025-9-19 14:43

jupz 发表于 2025-9-19 12:21
好像只是N卡福利，我9070xt，只有tiny最好用

能帮我看一下9070xt延迟吗？4080使用V3延迟在1-3s左右，算是可用
v3 turbo没什么区别

allensakura · 发表于 2025-9-19 15:32

sun1a2b3c4d 发表于 2025-9-19 15:23
请问CUDA有比Vulkan好用吗？

测试了几次，在4080上察觉不到任何区别
但cpu完全没法跑，我不懂为啥

allensakura · 发表于 2025-9-20 02:06

本地部属个人有几个选项
qwen3-30b-a3b-2507，17G，大小最大速度最慢，效果也最好
sakura-galtransl-14b-v3.8，8G，QWEN2.5的底子，针对“那方面”特别训练过，大小中等
hunyuan-mt-7b，4G，专针对翻译训练，这应该是这个大小目前翻译能力最好的模型了，再更小都是胡言乱语级别

allensakura · 发表于 2025-9-20 14:55

毛毛叉发表于 2025-9-20 11:13
兄弟，能不能把那几个模型文件上传到百度网盘或者其它网盘啊？那个链接打不开，应该需要科学吧 ...

s/1ZysokcNH3x1RBberjR_t2Q?pwd=wxqb

tiny到v3 turbo，看显存和硬体能力选
只识别en的版本大家应该没兴趣

allensakura · 发表于 2025-9-22 20:52

gartour 发表于 2025-9-22 20:42
这几个在哪里下？

我用LM Stusio直接搜就能下了，都是Hugging Face的

账号		自动登录	找回密码
密码			加入我们

[软件] Po哦t播放器250909增加了whisper AI实时生成字幕的功能，超级好用

浏览过的版块