Chiphell - 分享与交流用户体验

标题: Po哦t播放器250909增加了whisper AI实时生成字幕的功能,超级好用 [打印本页]

作者: jaycty    时间: 2025-9-18 19:52
标题: Po哦t播放器250909增加了whisper AI实时生成字幕的功能,超级好用
本帖最后由 jaycty 于 2025-9-19 13:04 编辑

更新250909版本之后,在播放窗口点右键,选择subtitles -> create subtitles from audio(real time),选一个model,等他自动下载即可。

模型文件目录:%userprofile%\AppData\Roaming\Po哦tPlayerMini64\Model


我随便下了几个
ggml-tiny.bin 74MB
ggml-tiny.en.bin 74.1MB
ggml-base.bin 141MB
ggml-large-v3.bin 2.88GB

经网友提示,模型可以直接去HF下载,网址是这个https://huggingface.co/ggerganov/whisper.cpp/tree/main
大家找我上面列出的同名/类似名字的文件下载即可,然后放在模型文件目录即可

目前在使用最大的模型,我是RTX5070显卡

初步体验结论:效果一流。他会预读取音频来进行翻译,所以只要你的视频不是0秒起手就开始有人讲话的话,那么当你播放到讲话的时间帧,字幕就已经生成完了。目前试了中英文视频都没啥问题。甚至电视直播都可以翻译

我真爱AI

不过字幕实时翻译功能似乎还只能接入各个服务商的API啊,啥时候也能像这个听音写字幕功能一样跑本地模型就好了。到时候,各大字幕组终于可以杀青了

(, 下载次数: 38)

(, 下载次数: 36)


作者: crystone    时间: 2025-9-18 19:53
啥播放器?pot?
作者: 逃学生    时间: 2025-9-18 19:53
Mark一下,回去试试
作者: 皇冠3.0L    时间: 2025-9-18 20:06
支持普通话吗?
作者: jaycty    时间: 2025-9-18 20:07
皇冠3.0L 发表于 2025-9-18 20:06
支持普通话吗?


支持,英文视频和中文视频我全试了,特别厉害。语言保持默认的AUTO即可
作者: 皇冠3.0L    时间: 2025-9-18 20:23
jaycty 发表于 2025-9-18 20:07
支持,英文视频和中文视频我全试了,特别厉害。语言保持默认的AUTO即可 ...

模型下载到本地硬盘后,生成字幕还依赖网络吗?
能不能断网离线生成
作者: jaycty    时间: 2025-9-18 20:25
皇冠3.0L 发表于 2025-9-18 20:23
模型下载到本地硬盘后,生成字幕还依赖网络吗?
能不能断网离线生成


核心功能应该是不依赖网络的,不像那个翻译,需要网络API
作者: aozorahishi    时间: 2025-9-18 20:34
翻译也本地化可以本地跑一个模型,在播放器里通过鸡皮提的翻译插件走api翻译
https://github.com/Felix3322/
作者: 绿茵豪门    时间: 2025-9-18 20:35
有时间试试~~~
作者: jaycty    时间: 2025-9-18 20:39
本帖最后由 jaycty 于 2025-9-18 20:41 编辑
aozorahishi 发表于 2025-9-18 20:34
翻译也本地化可以本地跑一个模型,在播放器里通过鸡皮提的翻译插件走api翻译
https://github.com/Felix3322 ...


去年我对接过deepseek的模型,不是太好用,跑起来比较慢,思考过程也都显示出来了,我不太会调。
这项目看起来又更新了,回头我试试看看是不是变得好用了。其实最好还是POT官方自己做一个本地功能比较好,省事,适合我这种懒人
作者: dgpwin    时间: 2025-9-18 20:40
某播放器?
作者: aozorahishi    时间: 2025-9-18 20:42
jaycty 发表于 2025-9-18 20:39
去年我对接过deepseek的模型,不是太好用,跑起来比较慢,思考过程也都显示出来了,我不太会调。 ...

我直接用qwen-turbo体验还过得去,本地5050也跑不了啥模型不如用在线的api
作者: ndswj    时间: 2025-9-18 20:46
试了一下,生成中文好像是繁体字
作者: af_x_if    时间: 2025-9-18 20:58
我是mpv派的
作者: 皇冠3.0L    时间: 2025-9-18 20:59
ndswj 发表于 2025-9-18 20:46
试了一下,生成中文好像是繁体字

你下载的视频,是不是台湾腔
作者: jaycty    时间: 2025-9-18 21:12
ndswj 发表于 2025-9-18 20:46
试了一下,生成中文好像是繁体字

可能跟说话口音有关系,我也遇到过繁体字。但只要字正腔圆的标准发音视频都是简体字
作者: jifenghas    时间: 2025-9-18 21:17
B站也有了 今天我同事看一个UP 播游戏 里面就有AI翻译
作者: zibing    时间: 2025-9-18 21:25
麻烦大佬私个直播源,感谢感谢!
作者: 萌猪哥哥    时间: 2025-9-18 21:34
B站搞了个直接语音翻译的大模型,看了下效果还挺不错
作者: 邪恶的光B    时间: 2025-9-18 21:35
这功能挺好的,等会试试三上悠亚、桃乃木香奈的电影
作者: kanshuderen    时间: 2025-9-18 21:36
更新的时候也看到了这个更新内容,不过还没试。。。。
作者: rikechen    时间: 2025-9-18 22:09
谢谢楼主,我也搞定了,学到知识了
作者: sun1a2b3c4d    时间: 2025-9-18 22:12
本帖最后由 sun1a2b3c4d 于 2025-9-18 22:19 编辑

请问large的v3性能最好吧?Vulkan和CUDA用哪个好呢?
作者: hallo2014    时间: 2025-9-18 22:32
已经用了一段时间,电影、电视只能说能看个基本情况,和机翻效果差不多,与字幕组的翻译还有一定差距,包括各位老师们的片子。
作者: hallo2014    时间: 2025-9-18 22:43
有些场景,啥说话音都翻译,还是机翻,很影响观感,现阶段看片还是得找字幕组的
作者: loughlion    时间: 2025-9-18 22:48
什么播放器?**?
作者: 流氓海    时间: 2025-9-18 22:52
有没有下载好的模型啊,自己下载太久了
作者: YsHaNg    时间: 2025-9-18 23:15
jaycty 发表于 2025-9-18 12:39
去年我对接过deepseek的模型,不是太好用,跑起来比较慢,思考过程也都显示出来了,我不太会调。
这项目 ...

本地起个ollama和openai api一样的 url用127.0.0.1:11434就能访问了 用instruct模型或者qwen3系列 prompt /no_think
作者: BloodRaining    时间: 2025-9-18 23:35
用我的5090试了试 最大模型ggml-large-v3-turbo,体验强悍无比,代价是5090直接占用10G显存,机箱风扇转速起飞,牛逼,
作者: powerduke    时间: 2025-9-18 23:41
https://www.koc.com.tw/archives/595714

网上的方法试了下,pot可以本地llm翻译,效果可用,测试了下,开英文字幕的自动翻译,字幕内容没问题,就是看视频需要占不少显存跑模型

结合openai的Whisper工具,pot是越来越方便了,就是太费算力,以后看个国外视频不整个n卡都不行了。

(, 下载次数: 33)
作者: jaycty    时间: 2025-9-19 00:11
BloodRaining 发表于 2025-9-18 23:35
用我的5090试了试 最大模型ggml-large-v3-turbo,体验强悍无比,代价是5090直接占用10G显存,机箱风扇转速 ...

这个模型是最大的吗?才1.5GB大小啊。我这里只吃2G多显存,没有ggml-large-v3.bin吃得多
作者: jaycty    时间: 2025-9-19 00:11
powerduke 发表于 2025-9-18 23:41
https://www.koc.com.tw/archives/595714

网上的方法试了下,pot可以本地llm翻译,效果可用,测试了下,开 ...

我回头试试看
作者: allensakura    时间: 2025-9-19 00:19
字幕跑了几段之后直接消失,看转换引擎还在启用,很正常
不知道怎解决....
作者: powerduke    时间: 2025-9-19 00:33
1080P的无字幕版Dracula A Love Tale (2025)mp4测试,

字幕生成 + 自动翻译,5070ti已经接近100%占用率了,这还没算madvr算力部分已经放在了核显上跑(占用率60%)

缺点是需要设置+gpu满载,优点是任何视频都可以自动翻译中文了,a3b翻译结果完全接受,甚至怀疑是不是这个模型训练时候素材里有xx动作片的日中对照字幕文本  

(, 下载次数: 40)
作者: jaycty    时间: 2025-9-19 00:40
powerduke 发表于 2025-9-19 00:33
1080P的无字幕版Dracula A Love Tale (2025)mp4测试,

字幕生成 + 自动翻译,5070ti已经接近100%占用率了 ...

生成字幕其实不咋吃GPU,主要是那个翻译吃GPU,毕竟需要使用一个足够强大的LLM作为基础,不然翻出来的字句都没法看
作者: jaycty    时间: 2025-9-19 00:44
allensakura 发表于 2025-9-19 00:19
字幕跑了几段之后直接消失,看转换引擎还在启用,很正常
不知道怎解决.... ...

显卡性能不足
作者: Wang_Yves    时间: 2025-9-19 01:08
sun1a2b3c4d 发表于 2025-9-18 22:12
请问large的v3性能最好吧?Vulkan和CUDA用哪个好呢?

非实时用的vulcan,他推荐的那个一直下载不下来。

实时选的vlucan(客户端推荐),不需要额外下载引擎文件,模型选最大的ggml-large-v3,显卡5080OC,仅供参考。
作者: sun1a2b3c4d    时间: 2025-9-19 01:11
本帖最后由 sun1a2b3c4d 于 2025-9-19 01:15 编辑
BloodRaining 发表于 2025-9-18 23:35
用我的5090试了试 最大模型ggml-large-v3-turbo,体验强悍无比,代价是5090直接占用10G显存,机箱风扇转速 ...


turbo是给偏好更快推理速度的用户用的,如果你想更准确应该用v3。
作者: sun1a2b3c4d    时间: 2025-9-19 01:17
Wang_Yves 发表于 2025-9-19 01:08
非实时用的vulcan,他推荐的那个一直下载不下来。

实时选的vlucan(客户端推荐),不需要额外下载引擎文 ...

多谢,我的设定和你一样,但是Auto模式下有时会出现语种识别错误的情况,最好还是手动选择。
作者: Wang_Yves    时间: 2025-9-19 01:20
sun1a2b3c4d 发表于 2025-9-19 01:17
多谢,我的设定和你一样,但是Auto模式下有时会出现语种识别错误的情况,最好还是手动选择。 ...

那就是选Chinese呗
作者: allensakura    时间: 2025-9-19 01:22
本帖最后由 allensakura 于 2025-9-19 03:18 编辑
jaycty 发表于 2025-9-19 00:44
显卡性能不足


7800X3D 4080
开启生成有声字幕,运行显示正常,不断识别出字幕
但是影片本身就是没有

---------------------
知道了,要选字幕,有声字幕即时
作者: wm1128    时间: 2025-9-19 01:30
最近有项目用到whisper和微软的speech text,感觉质量离生产力还是有不小的差距的
作者: jaycty    时间: 2025-9-19 02:06
wm1128 发表于 2025-9-19 01:30
最近有项目用到whisper和微软的speech text,感觉质量离生产力还是有不小的差距的 ...

目前我用过的语音识别率最强的是豆包。
作者: enolc    时间: 2025-9-19 02:33
麻烦LZ私个直播源+1,感谢
作者: Wang_Yves    时间: 2025-9-19 03:16
sun1a2b3c4d 发表于 2025-9-19 01:17
多谢,我的设定和你一样,但是Auto模式下有时会出现语种识别错误的情况,最好还是手动选择。 ...

源语言自动或者手选,展示字幕用源语言auto,感觉它自动的翻译不太行。
想看中文,手动装个翻译插件,我用的小牛。
作者: pdokdy    时间: 2025-9-19 05:01
用Ohllma可以+ Qwen 3.2b模型  可以翻译...日文和英文都可以....

勉强能看...不怎么吃算力...3070正在用
作者: iamyangyi    时间: 2025-9-19 07:43
支持哪些国家语言 有日语不 ,看番就方便了。
作者: ternatcn    时间: 2025-9-19 08:13
人类,留给你们的时间不多了
作者: 大名琴    时间: 2025-9-19 08:23
有模型跑本地翻译,我已经看了几部SONE的中文电影
作者: popgame    时间: 2025-9-19 08:47
这个需要安装python cuda驱动那些吗

还是只要下个模型就可以了
作者: mcy9569    时间: 2025-9-19 10:09
日语效果如何
作者: 红色惊雷    时间: 2025-9-19 10:38
可以离线输出字幕吗?实时跑我怕性能不够···
作者: 创世神493    时间: 2025-9-19 10:46
注意按hf上写的,只有large系列支持多语言,其他好像只支持英文。
下载不了的可以手动去hf下,不过要**。下载地址
下载后缀.bin的,名字和播放器中名字一致。
作者: allensakura    时间: 2025-9-19 11:25
本帖最后由 allensakura 于 2025-9-19 11:39 编辑
红色惊雷 发表于 2025-9-19 10:38
可以离线输出字幕吗?实时跑我怕性能不够···


翻译效果最好的是qwen3-30b-A3B,但是恐怕要24G才能跟上实时翻译的需求,特别是large-v3语音识别还要吃2.5G的情况下

作者: lumiere    时间: 2025-9-19 11:38
是不是科学上网才能下的到?
作者: BloodRaining    时间: 2025-9-19 11:49
sun1a2b3c4d 发表于 2025-9-19 01:11
turbo是给偏好更快推理速度的用户用的,如果你想更准确应该用v3。

多谢分享
作者: BloodRaining    时间: 2025-9-19 11:50
jaycty 发表于 2025-9-19 00:11
这个模型是最大的吗?才1.5GB大小啊。我这里只吃2G多显存,没有ggml-large-v3.bin吃得多 ...

v3最大,turbo不大我理解错误。看有个turbo以为更强
作者: graz_chell    时间: 2025-9-19 11:51
请问下,AMD显卡能用吗?看回复基本都是N卡,是只能N卡么。。
作者: jaycty    时间: 2025-9-19 12:02
BloodRaining 发表于 2025-9-19 11:50
v3最大,turbo不大我理解错误。看有个turbo以为更强

turbo应该是加速的意思,缩减了一些


(, 下载次数: 38)
作者: jaycty    时间: 2025-9-19 12:02
graz_chell 发表于 2025-9-19 11:51
请问下,AMD显卡能用吗?看回复基本都是N卡,是只能N卡么。。

应该是可以的,我用i5 8265u都可以,但是非常慢,完全不可用。
作者: jaycty    时间: 2025-9-19 12:04
allensakura 发表于 2025-9-19 11:25
翻译效果最好的是qwen3-30b-A3B,但是恐怕要24G才能跟上实时翻译的需求,特别是large-v3语音识别还要吃2. ...

翻译还是等几年再说吧,或者哪个网络AI服务商大发慈悲给大家随便接入就好了。
作者: jupz    时间: 2025-9-19 12:21
graz_chell 发表于 2025-9-19 11:51
请问下,AMD显卡能用吗?看回复基本都是N卡,是只能N卡么。。

好像只是N卡福利,我9070xt,只有tiny最好用
作者: powerduke    时间: 2025-9-19 12:21
allensakura 发表于 2025-9-19 11:25
翻译效果最好的是qwen3-30b-A3B,但是恐怕要24G才能跟上实时翻译的需求,特别是large-v3语音识别还要吃2. ...

应该都是提前语音识别、字幕翻译的,看llm的log里,字幕都是几十条一起翻译出来的。
作者: graz_chell    时间: 2025-9-19 12:23
jupz 发表于 2025-9-19 12:21
好像只是N卡福利,我9070xt,只有tiny最好用

好的,非常感谢哈
作者: ooff22    时间: 2025-9-19 12:55
ggml-large-v3  --我这里只有5m大小呢.....有谁发个完整版到夸克吗..谢了.

作者: CptQ    时间: 2025-9-19 12:59
接入在线api好点,本地小模型质量不行的
作者: huihuige    时间: 2025-9-19 13:44
那在哪里下pot呢?
好像不太好下我记得
国内那个镜像站?
作者: reIop    时间: 2025-9-19 14:09
mark
刚好想重新看一遍基与皮尔,苦于字幕组一直没有做3-5季中字,生肉啃得太痛苦了。
作者: popgame    时间: 2025-9-19 14:22
试了下mid模型效果凑合,晚上试试大模组
作者: life3000    时间: 2025-9-19 14:27
马克一下,ai字幕
作者: allensakura    时间: 2025-9-19 14:43
jupz 发表于 2025-9-19 12:21
好像只是N卡福利,我9070xt,只有tiny最好用

能帮我看一下9070xt延迟吗?4080使用V3延迟在1-3s左右,算是可用
v3 turbo没什么区别
(, 下载次数: 34)



作者: Chris1943    时间: 2025-9-19 14:53
Mark备用
作者: ANDYS    时间: 2025-9-19 15:17
帮大家问问 日语呢
作者: sun1a2b3c4d    时间: 2025-9-19 15:23
allensakura 发表于 2025-9-19 14:43
能帮我看一下9070xt延迟吗?4080使用V3延迟在1-3s左右,算是可用
v3 turbo没什么区别

请问CUDA有比Vulkan好用吗?
作者: megaslx    时间: 2025-9-19 15:24
很多电视剧或者电影其实是由英语字幕的,到不一定非要语音转文字才能翻译,不知道能不能直接从内嵌字幕着手翻译出来
作者: jaycty    时间: 2025-9-19 15:28
megaslx 发表于 2025-9-19 15:24
很多电视剧或者电影其实是由英语字幕的,到不一定非要语音转文字才能翻译,不知道能不能直接从内嵌字幕着手 ...


这AI功能肯定更好,但是更加高级了,目前还不能普及到PC无脑使用吧,过几年吧。目前仅仅是AI直接读取A语言文本翻译成B语言,就已经很吃硬件配置了。绝大部分PC硬件都跑不快,延迟大
作者: allensakura    时间: 2025-9-19 15:32
sun1a2b3c4d 发表于 2025-9-19 15:23
请问CUDA有比Vulkan好用吗?

测试了几次,在4080上察觉不到任何区别
但cpu完全没法跑,我不懂为啥
作者: tozofly    时间: 2025-9-19 15:51
我想测试一下日语的翻译效果,谁能个JAVBUS能访问的网址呀
作者: Judecca    时间: 2025-9-19 16:09
完美解码行不行?
作者: xinxin1982    时间: 2025-9-19 16:28
太好了。。。先回去试试,不行就换卡。终于有理由换卡了。哈哈哈
作者: powerduke    时间: 2025-9-19 17:46
megaslx 发表于 2025-9-19 15:24
很多电视剧或者电影其实是由英语字幕的,到不一定非要语音转文字才能翻译,不知道能不能直接从内嵌字幕着手 ...

可以没问题。
作者: powerduke    时间: 2025-9-19 17:46
sun1a2b3c4d 发表于 2025-9-19 15:23
请问CUDA有比Vulkan好用吗?

cuda效率更高,vulkan也不是不能用。
作者: Wang_Yves    时间: 2025-9-19 17:47
iamyangyi 发表于 2025-9-19 07:43
支持哪些国家语言 有日语不 ,看番就方便了。

昨晚试了几个视频,正常语速正常对话、独白能识别,“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。
作者: powerduke    时间: 2025-9-19 17:49
Judecca 发表于 2025-9-19 16:09
完美解码行不行?

没问题,0829版上跑通的。
作者: sun1a2b3c4d    时间: 2025-9-19 18:08
Wang_Yves 发表于 2025-9-19 17:47
昨晚试了几个视频,正常语速正常对话、独白能识别,“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。 ...

看来恐怖片和战争片不太适合用
作者: iamyangyi    时间: 2025-9-19 18:14
Wang_Yves 发表于 2025-9-19 17:47
昨晚试了几个视频,正常语速正常对话、独白能识别,“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。 ...

你这是动作番
作者: linkzero    时间: 2025-9-19 18:15
mark,试试看。
作者: Wang_Yves    时间: 2025-9-19 18:18
sun1a2b3c4d 发表于 2025-9-19 18:08
看来恐怖片和战争片不太适合用

非实时的生成字幕有个VAD功能,实时的还没有,vad识别人声的,勾选试试,先生成,再挂载字幕看。
作者: netjunegg    时间: 2025-9-19 21:26
确实有这需求,不一定实时。如果有个独立工具,可以根据视频文件生成字幕文件也很好。 字幕生成后,再用播放器观看。
作者: jerryan    时间: 2025-9-19 21:29
jaycty 发表于 2025-9-19 02:06
目前我用过的语音识别率最强的是豆包。

是的,我也是这种感觉,甚至好奇为什么字节不出个语音输入法
作者: 原神职业玩家    时间: 2025-9-19 21:39
还记得原来要先计算一遍 现在都实时了 还是有进步啊
(, 下载次数: 12)
作者: jaycty    时间: 2025-9-19 21:54
netjunegg 发表于 2025-9-19 21:26
确实有这需求,不一定实时。如果有个独立工具,可以根据视频文件生成字幕文件也很好。 字幕生成后,再用播 ...


这个功能这次v250909更新其实也有的。你可以试试

而且如果字幕可以提取出来的话,把文件后缀改成txt然后丢给豆包跟他说这个是字幕文件让他帮忙翻译一下就行了,很快就搞定。速度贼快
作者: Wang_Yves    时间: 2025-9-19 23:00
唱歌这种会改变汉字音调的,他也识别不准
作者: Oxyer    时间: 2025-9-19 23:25
(, 下载次数: 12)
勉强能用,感觉不是很智能。
作者: 邪恶的光B    时间: 2025-9-20 01:01
流氓海 发表于 2025-9-18 22:52
有没有下载好的模型啊,自己下载太久了

openai的whisper有下载地址的,微软自己的服务器下载速度很快啊。

模型地址,2.88G很快就下完了。
_MODELS = {
    "tiny.en": "https://openaipublic.azureedge.net/main/whisper/models/d3dd57d32accea0b295c96e26691aa14d8822fac7d9d27d5dc00b4ca2826dd03/tiny.en.pt",
    "tiny": "https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt",
    "base.en": "https://openaipublic.azureedge.net/main/whisper/models/25a8566e1d0c1e2231d1c762132cd20e0f96a85d16145c3a00adf5d1ac670ead/base.en.pt",
    "base": "https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt",
    "small.en": "https://openaipublic.azureedge.net/main/whisper/models/f953ad0fd29cacd07d5a9eda5624af0f6bcf2258be67c92b79389873d91e0872/small.en.pt",
    "small": "https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt",
    "medium.en": "https://openaipublic.azureedge.net/main/whisper/models/d7440d1dc186f76616474e0ff0b3b6b879abc9d1a4926b7adfa41db2d497ab4f/medium.en.pt",
    "medium": "https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714f32e89e936602e85993674d08dcb1/medium.pt",
    "large-v1": "https://openaipublic.azureedge.net/main/whisper/models/e4b87e7e0bf463eb8e6956e646f1e277e901512310def2c24bf0e11bd3c28e9a/large-v1.pt",
    "large-v2": "https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt",
    "large-v3": "https://openaipublic.azureedge.net/main/whisper/models/e5b1a55b89c1367dacf97e3e19bfd829a01529dbfdeefa8caeb59b3f1b81dadb/large-v3.pt",
    "large": "https://openaipublic.azureedge.net/main/whisper/models/e5b1a55b89c1367dacf97e3e19bfd829a01529dbfdeefa8caeb59b3f1b81dadb/large-v3.pt",
    "large-v3-turbo": "https://openaipublic.azureedge.net/main/whisper/models/aff26ae408abcba5fbf8813c21e62b0941638c5f6eebfb145be0c9839262a19a/large-v3-turbo.pt",
    "turbo": "https://openaipublic.azureedge.net/main/whisper/models/aff26ae408abcba5fbf8813c21e62b0941638c5f6eebfb145be0c9839262a19a/large-v3-turbo.pt",
}

作者: allensakura    时间: 2025-9-20 02:06
本地部属个人有几个选项
qwen3-30b-a3b-2507,17G,大小最大速度最慢,效果也最好
sakura-galtransl-14b-v3.8,8G,QWEN2.5的底子,针对“那方面”特别训练过,大小中等
hunyuan-mt-7b,4G,专针对翻译训练,这应该是这个大小目前翻译能力最好的模型了,再更小都是胡言乱语级别

作者: 木子滴血    时间: 2025-9-20 02:13

老师们的电影效果如何
作者: xiao88    时间: 2025-9-20 04:13
是不是只能支持WMV格式啊?!
作者: 碌木    时间: 2025-9-20 06:06
xiao88 发表于 2025-9-20 04:13
是不是只能支持WMV格式啊?!

没有特定视频的格式吧,因为是从音轨识别音频的
作者: qzwalter    时间: 2025-9-20 10:43
日文可以吗




欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) Powered by Discuz! X3.5