找回密码
 加入我们
搜索
      
查看: 12543|回复: 126

[软件] Po哦t播放器250909增加了whisper AI实时生成字幕的功能,超级好用

  [复制链接]
发表于 2025-9-19 00:19 | 显示全部楼层
字幕跑了几段之后直接消失,看转换引擎还在启用,很正常
不知道怎解决....
发表于 2025-9-19 01:22 | 显示全部楼层
本帖最后由 allensakura 于 2025-9-19 03:18 编辑


7800X3D 4080
开启生成有声字幕,运行显示正常,不断识别出字幕
但是影片本身就是没有

---------------------
知道了,要选字幕,有声字幕即时
发表于 2025-9-19 11:25 | 显示全部楼层
本帖最后由 allensakura 于 2025-9-19 11:39 编辑
红色惊雷 发表于 2025-9-19 10:38
可以离线输出字幕吗?实时跑我怕性能不够···


翻译效果最好的是qwen3-30b-A3B,但是恐怕要24G才能跟上实时翻译的需求,特别是large-v3语音识别还要吃2.5G的情况下
发表于 2025-9-19 14:43 | 显示全部楼层
jupz 发表于 2025-9-19 12:21
好像只是N卡福利,我9070xt,只有tiny最好用

能帮我看一下9070xt延迟吗?4080使用V3延迟在1-3s左右,算是可用
v3 turbo没什么区别
6c4e8698-fc6c-4670-9a5b-c8e83d5b5f7a.png


发表于 2025-9-19 15:32 | 显示全部楼层
sun1a2b3c4d 发表于 2025-9-19 15:23
请问CUDA有比Vulkan好用吗?

测试了几次,在4080上察觉不到任何区别
但cpu完全没法跑,我不懂为啥
发表于 2025-9-20 02:06 | 显示全部楼层
本地部属个人有几个选项
qwen3-30b-a3b-2507,17G,大小最大速度最慢,效果也最好
sakura-galtransl-14b-v3.8,8G,QWEN2.5的底子,针对“那方面”特别训练过,大小中等
hunyuan-mt-7b,4G,专针对翻译训练,这应该是这个大小目前翻译能力最好的模型了,再更小都是胡言乱语级别
发表于 2025-9-20 14:55 | 显示全部楼层
毛毛叉 发表于 2025-9-20 11:13
兄弟,能不能把那几个模型文件上传到百度网盘或者其它网盘啊?那个链接打不开,应该需要科学吧 ...

s/1ZysokcNH3x1RBberjR_t2Q?pwd=wxqb

tiny到v3 turbo,看显存和硬体能力选
只识别en的版本大家应该没兴趣
发表于 2025-9-22 20:52 | 显示全部楼层
gartour 发表于 2025-9-22 20:42
这几个在哪里下?

我用LM Stusio直接搜就能下了,都是Hugging Face的
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-11-1 12:38 , Processed in 0.008134 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表