Chiphell - 分享与交流用户体验

标题: Po哦t播放器250909增加了whisper AI实时生成字幕的功能，超级好用 [打印本页]

作者: jaycty 时间: 2025-9-18 19:52
标题: Po哦t播放器250909增加了whisper AI实时生成字幕的功能，超级好用
本帖最后由 jaycty 于 2025-9-19 13:04 编辑

更新250909版本之后，在播放窗口点右键，选择subtitles -> create subtitles from audio(real time)，选一个model，等他自动下载即可。

模型文件目录：%userprofile%\AppData\Roaming\Po哦tPlayerMini64\Model

我随便下了几个
ggml-tiny.bin 74MB
ggml-tiny.en.bin 74.1MB
ggml-base.bin 141MB
ggml-large-v3.bin 2.88GB

经网友提示，模型可以直接去HF下载，网址是这个https://huggingface.co/ggerganov/whisper.cpp/tree/main
大家找我上面列出的同名/类似名字的文件下载即可，然后放在模型文件目录即可

目前在使用最大的模型，我是RTX5070显卡

初步体验结论：效果一流。他会预读取音频来进行翻译，所以只要你的视频不是0秒起手就开始有人讲话的话，那么当你播放到讲话的时间帧，字幕就已经生成完了。目前试了中英文视频都没啥问题。甚至电视直播都可以翻译

我真爱AI

不过字幕实时翻译功能似乎还只能接入各个服务商的API啊，啥时候也能像这个听音写字幕功能一样跑本地模型就好了。到时候，各大字幕组终于可以杀青了

(, 下载次数: 38)

(, 下载次数: 36)

作者: crystone 时间: 2025-9-18 19:53
啥播放器？pot？

作者: 逃学生 时间: 2025-9-18 19:53
Mark一下，回去试试

作者: 皇冠3.0L 时间: 2025-9-18 20:06
支持普通话吗？

作者: jaycty 时间: 2025-9-18 20:07

皇冠3.0L 发表于 2025-9-18 20:06
支持普通话吗？

支持，英文视频和中文视频我全试了，特别厉害。语言保持默认的AUTO即可

作者: 皇冠3.0L 时间: 2025-9-18 20:23

jaycty 发表于 2025-9-18 20:07
支持，英文视频和中文视频我全试了，特别厉害。语言保持默认的AUTO即可 ...

模型下载到本地硬盘后，生成字幕还依赖网络吗？
能不能断网离线生成

作者: jaycty 时间: 2025-9-18 20:25

皇冠3.0L 发表于 2025-9-18 20:23
模型下载到本地硬盘后，生成字幕还依赖网络吗？
能不能断网离线生成

核心功能应该是不依赖网络的，不像那个翻译，需要网络API

作者: aozorahishi 时间: 2025-9-18 20:34
翻译也本地化可以本地跑一个模型，在播放器里通过鸡皮提的翻译插件走api翻译
https://github.com/Felix3322/

作者: 绿茵豪门 时间: 2025-9-18 20:35
有时间试试~~~

作者: jaycty 时间: 2025-9-18 20:39
本帖最后由 jaycty 于 2025-9-18 20:41 编辑

aozorahishi 发表于 2025-9-18 20:34
翻译也本地化可以本地跑一个模型，在播放器里通过鸡皮提的翻译插件走api翻译
https://github.com/Felix3322 ...

去年我对接过deepseek的模型，不是太好用，跑起来比较慢，思考过程也都显示出来了，我不太会调。
这项目看起来又更新了，回头我试试看看是不是变得好用了。其实最好还是POT官方自己做一个本地功能比较好，省事，适合我这种懒人

作者: dgpwin 时间: 2025-9-18 20:40
某播放器?

作者: aozorahishi 时间: 2025-9-18 20:42

jaycty 发表于 2025-9-18 20:39
去年我对接过deepseek的模型，不是太好用，跑起来比较慢，思考过程也都显示出来了，我不太会调。 ...

我直接用qwen-turbo体验还过得去，本地5050也跑不了啥模型不如用在线的api

作者: ndswj 时间: 2025-9-18 20:46
试了一下，生成中文好像是繁体字

作者: af_x_if 时间: 2025-9-18 20:58
我是mpv派的

作者: 皇冠3.0L 时间: 2025-9-18 20:59

ndswj 发表于 2025-9-18 20:46
试了一下，生成中文好像是繁体字

你下载的视频，是不是台湾腔

作者: jaycty 时间: 2025-9-18 21:12

ndswj 发表于 2025-9-18 20:46
试了一下，生成中文好像是繁体字

可能跟说话口音有关系，我也遇到过繁体字。但只要字正腔圆的标准发音视频都是简体字

作者: jifenghas 时间: 2025-9-18 21:17
B站也有了今天我同事看一个UP 播游戏里面就有AI翻译

作者: zibing 时间: 2025-9-18 21:25
麻烦大佬私个直播源，感谢感谢！

作者: 萌猪哥哥 时间: 2025-9-18 21:34
B站搞了个直接语音翻译的大模型，看了下效果还挺不错

作者: 邪恶的光B 时间: 2025-9-18 21:35
这功能挺好的，等会试试三上悠亚、桃乃木香奈的电影

作者: kanshuderen 时间: 2025-9-18 21:36
更新的时候也看到了这个更新内容，不过还没试。。。。

作者: rikechen 时间: 2025-9-18 22:09
谢谢楼主，我也搞定了，学到知识了

作者: sun1a2b3c4d 时间: 2025-9-18 22:12
本帖最后由 sun1a2b3c4d 于 2025-9-18 22:19 编辑

请问large的v3性能最好吧？Vulkan和CUDA用哪个好呢？

作者: hallo2014 时间: 2025-9-18 22:32
已经用了一段时间，电影、电视只能说能看个基本情况，和机翻效果差不多，与字幕组的翻译还有一定差距，包括各位老师们的片子。

作者: hallo2014 时间: 2025-9-18 22:43
有些场景，啥说话音都翻译，还是机翻，很影响观感

，现阶段看片还是得找字幕组的

作者: loughlion 时间: 2025-9-18 22:48
什么播放器？**？

作者: 流氓海 时间: 2025-9-18 22:52
有没有下载好的模型啊，自己下载太久了

作者: YsHaNg 时间: 2025-9-18 23:15

jaycty 发表于 2025-9-18 12:39
去年我对接过deepseek的模型，不是太好用，跑起来比较慢，思考过程也都显示出来了，我不太会调。
这项目 ...

本地起个ollama和openai api一样的 url用127.0.0.1:11434就能访问了用instruct模型或者qwen3系列 prompt /no_think

作者: BloodRaining 时间: 2025-9-18 23:35
用我的5090试了试最大模型ggml-large-v3-turbo，体验强悍无比，代价是5090直接占用10G显存，机箱风扇转速起飞，牛逼，

作者: powerduke 时间: 2025-9-18 23:41
https://www.koc.com.tw/archives/595714

网上的方法试了下，pot可以本地llm翻译，效果可用，测试了下，开英文字幕的自动翻译，字幕内容没问题，就是看视频需要占不少显存跑模型

结合openai的Whisper工具，pot是越来越方便了，就是太费算力，以后看个国外视频不整个n卡都不行了。

(, 下载次数: 33)

作者: jaycty 时间: 2025-9-19 00:11

BloodRaining 发表于 2025-9-18 23:35
用我的5090试了试最大模型ggml-large-v3-turbo，体验强悍无比，代价是5090直接占用10G显存，机箱风扇转速 ...

这个模型是最大的吗？才1.5GB大小啊。我这里只吃2G多显存，没有ggml-large-v3.bin吃得多

作者: jaycty 时间: 2025-9-19 00:11

powerduke 发表于 2025-9-18 23:41
https://www.koc.com.tw/archives/595714

网上的方法试了下，pot可以本地llm翻译，效果可用，测试了下，开 ...

我回头试试看

作者: allensakura 时间: 2025-9-19 00:19
字幕跑了几段之后直接消失，看转换引擎还在启用，很正常
不知道怎解决....

作者: powerduke 时间: 2025-9-19 00:33
1080P的无字幕版Dracula A Love Tale (2025)mp4测试，

字幕生成 + 自动翻译，5070ti已经接近100%占用率了，这还没算madvr算力部分已经放在了核显上跑（占用率60%）

缺点是需要设置+gpu满载，优点是任何视频都可以自动翻译中文了，a3b翻译结果完全接受，甚至怀疑是不是这个模型训练时候素材里有xx动作片的日中对照字幕文本

(, 下载次数: 40)

作者: jaycty 时间: 2025-9-19 00:40

powerduke 发表于 2025-9-19 00:33
1080P的无字幕版Dracula A Love Tale (2025)mp4测试，

字幕生成 + 自动翻译，5070ti已经接近100%占用率了 ...

生成字幕其实不咋吃GPU，主要是那个翻译吃GPU，毕竟需要使用一个足够强大的LLM作为基础，不然翻出来的字句都没法看

作者: jaycty 时间: 2025-9-19 00:44

allensakura 发表于 2025-9-19 00:19
字幕跑了几段之后直接消失，看转换引擎还在启用，很正常
不知道怎解决.... ...

显卡性能不足

作者: Wang_Yves 时间: 2025-9-19 01:08

sun1a2b3c4d 发表于 2025-9-18 22:12
请问large的v3性能最好吧？Vulkan和CUDA用哪个好呢？

非实时用的vulcan，他推荐的那个一直下载不下来。

实时选的vlucan（客户端推荐），不需要额外下载引擎文件，模型选最大的ggml-large-v3，显卡5080OC，仅供参考。

作者: sun1a2b3c4d 时间: 2025-9-19 01:11
本帖最后由 sun1a2b3c4d 于 2025-9-19 01:15 编辑

BloodRaining 发表于 2025-9-18 23:35
用我的5090试了试最大模型ggml-large-v3-turbo，体验强悍无比，代价是5090直接占用10G显存，机箱风扇转速 ...

turbo是给偏好更快推理速度的用户用的，如果你想更准确应该用v3。

作者: sun1a2b3c4d 时间: 2025-9-19 01:17

Wang_Yves 发表于 2025-9-19 01:08
非实时用的vulcan，他推荐的那个一直下载不下来。

实时选的vlucan（客户端推荐），不需要额外下载引擎文 ...

多谢，我的设定和你一样，但是Auto模式下有时会出现语种识别错误的情况，最好还是手动选择。

作者: Wang_Yves 时间: 2025-9-19 01:20

sun1a2b3c4d 发表于 2025-9-19 01:17
多谢，我的设定和你一样，但是Auto模式下有时会出现语种识别错误的情况，最好还是手动选择。 ...

那就是选Chinese呗

作者: allensakura 时间: 2025-9-19 01:22
本帖最后由 allensakura 于 2025-9-19 03:18 编辑

jaycty 发表于 2025-9-19 00:44
显卡性能不足

7800X3D 4080
开启生成有声字幕，运行显示正常，不断识别出字幕
但是影片本身就是没有

---------------------
知道了，要选字幕，有声字幕即时

作者: wm1128 时间: 2025-9-19 01:30
最近有项目用到whisper和微软的speech text，感觉质量离生产力还是有不小的差距的

作者: jaycty 时间: 2025-9-19 02:06

wm1128 发表于 2025-9-19 01:30
最近有项目用到whisper和微软的speech text，感觉质量离生产力还是有不小的差距的 ...

目前我用过的语音识别率最强的是豆包。

作者: enolc 时间: 2025-9-19 02:33
麻烦LZ私个直播源+1，感谢

作者: Wang_Yves 时间: 2025-9-19 03:16

sun1a2b3c4d 发表于 2025-9-19 01:17
多谢，我的设定和你一样，但是Auto模式下有时会出现语种识别错误的情况，最好还是手动选择。 ...

源语言自动或者手选，展示字幕用源语言auto，感觉它自动的翻译不太行。
想看中文，手动装个翻译插件，我用的小牛。

作者: pdokdy 时间: 2025-9-19 05:01
用Ohllma可以+ Qwen 3.2b模型可以翻译...日文和英文都可以....

勉强能看...不怎么吃算力...3070正在用

作者: iamyangyi 时间: 2025-9-19 07:43
支持哪些国家语言有日语不，看番就方便了。

作者: ternatcn 时间: 2025-9-19 08:13
人类，留给你们的时间不多了

作者: 大名琴 时间: 2025-9-19 08:23
有模型跑本地翻译，我已经看了几部SONE的中文电影

作者: popgame 时间: 2025-9-19 08:47
这个需要安装python cuda驱动那些吗

还是只要下个模型就可以了

作者: mcy9569 时间: 2025-9-19 10:09
日语效果如何

作者: 红色惊雷 时间: 2025-9-19 10:38
可以离线输出字幕吗？实时跑我怕性能不够···

作者: 创世神493 时间: 2025-9-19 10:46
注意按hf上写的，只有large系列支持多语言，其他好像只支持英文。
下载不了的可以手动去hf下，不过要**。下载地址
下载后缀.bin的，名字和播放器中名字一致。

作者: allensakura 时间: 2025-9-19 11:25
本帖最后由 allensakura 于 2025-9-19 11:39 编辑

红色惊雷发表于 2025-9-19 10:38
可以离线输出字幕吗？实时跑我怕性能不够···

翻译效果最好的是qwen3-30b-A3B，但是恐怕要24G才能跟上实时翻译的需求，特别是large-v3语音识别还要吃2.5G的情况下

作者: lumiere 时间: 2025-9-19 11:38
是不是科学上网才能下的到？

作者: BloodRaining 时间: 2025-9-19 11:49

sun1a2b3c4d 发表于 2025-9-19 01:11
turbo是给偏好更快推理速度的用户用的，如果你想更准确应该用v3。

多谢分享

作者: BloodRaining 时间: 2025-9-19 11:50

jaycty 发表于 2025-9-19 00:11
这个模型是最大的吗？才1.5GB大小啊。我这里只吃2G多显存，没有ggml-large-v3.bin吃得多 ...

v3最大，turbo不大我理解错误。看有个turbo以为更强

作者: graz_chell 时间: 2025-9-19 11:51
请问下，AMD显卡能用吗？看回复基本都是N卡，是只能N卡么。。

作者: jaycty 时间: 2025-9-19 12:02

BloodRaining 发表于 2025-9-19 11:50
v3最大，turbo不大我理解错误。看有个turbo以为更强

turbo应该是加速的意思，缩减了一些

(, 下载次数: 38)

作者: jaycty 时间: 2025-9-19 12:02

graz_chell 发表于 2025-9-19 11:51
请问下，AMD显卡能用吗？看回复基本都是N卡，是只能N卡么。。

应该是可以的，我用i5 8265u都可以，但是非常慢，完全不可用。

作者: jaycty 时间: 2025-9-19 12:04

allensakura 发表于 2025-9-19 11:25
翻译效果最好的是qwen3-30b-A3B，但是恐怕要24G才能跟上实时翻译的需求，特别是large-v3语音识别还要吃2. ...

翻译还是等几年再说吧，或者哪个网络AI服务商大发慈悲给大家随便接入就好了。

作者: jupz 时间: 2025-9-19 12:21

graz_chell 发表于 2025-9-19 11:51
请问下，AMD显卡能用吗？看回复基本都是N卡，是只能N卡么。。

好像只是N卡福利，我9070xt，只有tiny最好用

作者: powerduke 时间: 2025-9-19 12:21

allensakura 发表于 2025-9-19 11:25
翻译效果最好的是qwen3-30b-A3B，但是恐怕要24G才能跟上实时翻译的需求，特别是large-v3语音识别还要吃2. ...

应该都是提前语音识别、字幕翻译的，看llm的log里，字幕都是几十条一起翻译出来的。

作者: graz_chell 时间: 2025-9-19 12:23

jupz 发表于 2025-9-19 12:21
好像只是N卡福利，我9070xt，只有tiny最好用

好的，非常感谢哈

作者: ooff22 时间: 2025-9-19 12:55
ggml-large-v3 --我这里只有5m大小呢.....有谁发个完整版到夸克吗..谢了.

作者: CptQ 时间: 2025-9-19 12:59
接入在线api好点，本地小模型质量不行的

作者: huihuige 时间: 2025-9-19 13:44
那在哪里下pot呢？
好像不太好下我记得
国内那个镜像站？

作者: reIop 时间: 2025-9-19 14:09
mark
刚好想重新看一遍基与皮尔，苦于字幕组一直没有做3-5季中字，生肉啃得太痛苦了。

作者: popgame 时间: 2025-9-19 14:22
试了下mid模型效果凑合，晚上试试大模组

作者: life3000 时间: 2025-9-19 14:27
马克一下，ai字幕

作者: allensakura 时间: 2025-9-19 14:43

jupz 发表于 2025-9-19 12:21
好像只是N卡福利，我9070xt，只有tiny最好用

能帮我看一下9070xt延迟吗？4080使用V3延迟在1-3s左右，算是可用
v3 turbo没什么区别
(, 下载次数: 34)

作者: Chris1943 时间: 2025-9-19 14:53
Mark备用

作者: ANDYS 时间: 2025-9-19 15:17
帮大家问问日语呢

作者: sun1a2b3c4d 时间: 2025-9-19 15:23

allensakura 发表于 2025-9-19 14:43
能帮我看一下9070xt延迟吗？4080使用V3延迟在1-3s左右，算是可用
v3 turbo没什么区别

请问CUDA有比Vulkan好用吗？

作者: megaslx 时间: 2025-9-19 15:24
很多电视剧或者电影其实是由英语字幕的，到不一定非要语音转文字才能翻译，不知道能不能直接从内嵌字幕着手翻译出来

作者: jaycty 时间: 2025-9-19 15:28

megaslx 发表于 2025-9-19 15:24
很多电视剧或者电影其实是由英语字幕的，到不一定非要语音转文字才能翻译，不知道能不能直接从内嵌字幕着手 ...

这AI功能肯定更好，但是更加高级了，目前还不能普及到PC无脑使用吧，过几年吧。目前仅仅是AI直接读取A语言文本翻译成B语言，就已经很吃硬件配置了。绝大部分PC硬件都跑不快，延迟大

作者: allensakura 时间: 2025-9-19 15:32

sun1a2b3c4d 发表于 2025-9-19 15:23
请问CUDA有比Vulkan好用吗？

测试了几次，在4080上察觉不到任何区别
但cpu完全没法跑，我不懂为啥

作者: tozofly 时间: 2025-9-19 15:51
我想测试一下日语的翻译效果，谁能个JAVBUS能访问的网址呀

作者: Judecca 时间: 2025-9-19 16:09
完美解码行不行？

作者: xinxin1982 时间: 2025-9-19 16:28
太好了。。。先回去试试，不行就换卡。终于有理由换卡了。哈哈哈

作者: powerduke 时间: 2025-9-19 17:46

megaslx 发表于 2025-9-19 15:24
很多电视剧或者电影其实是由英语字幕的，到不一定非要语音转文字才能翻译，不知道能不能直接从内嵌字幕着手 ...

可以没问题。

作者: powerduke 时间: 2025-9-19 17:46

sun1a2b3c4d 发表于 2025-9-19 15:23
请问CUDA有比Vulkan好用吗？

cuda效率更高，vulkan也不是不能用。

作者: Wang_Yves 时间: 2025-9-19 17:47

iamyangyi 发表于 2025-9-19 07:43
支持哪些国家语言有日语不，看番就方便了。

昨晚试了几个视频，正常语速正常对话、独白能识别，“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。

作者: powerduke 时间: 2025-9-19 17:49

Judecca 发表于 2025-9-19 16:09
完美解码行不行？

没问题，0829版上跑通的。

作者: sun1a2b3c4d 时间: 2025-9-19 18:08

Wang_Yves 发表于 2025-9-19 17:47
昨晚试了几个视频，正常语速正常对话、独白能识别，“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。 ...

看来恐怖片和战争片不太适合用

作者: iamyangyi 时间: 2025-9-19 18:14

Wang_Yves 发表于 2025-9-19 17:47
昨晚试了几个视频，正常语速正常对话、独白能识别，“特殊的语气词、呐喊、尖叫、呻吟”等无法正常识别。 ...

你这是动作番

作者: linkzero 时间: 2025-9-19 18:15
mark,试试看。

作者: Wang_Yves 时间: 2025-9-19 18:18

sun1a2b3c4d 发表于 2025-9-19 18:08
看来恐怖片和战争片不太适合用

非实时的生成字幕有个VAD功能，实时的还没有，vad识别人声的，勾选试试，先生成，再挂载字幕看。

作者: netjunegg 时间: 2025-9-19 21:26
确实有这需求，不一定实时。如果有个独立工具，可以根据视频文件生成字幕文件也很好。字幕生成后，再用播放器观看。

作者: jerryan 时间: 2025-9-19 21:29

jaycty 发表于 2025-9-19 02:06
目前我用过的语音识别率最强的是豆包。

是的，我也是这种感觉，甚至好奇为什么字节不出个语音输入法

作者: 原神职业玩家 时间: 2025-9-19 21:39
还记得原来要先计算一遍现在都实时了还是有进步啊

(, 下载次数: 12)

作者: jaycty 时间: 2025-9-19 21:54

netjunegg 发表于 2025-9-19 21:26
确实有这需求，不一定实时。如果有个独立工具，可以根据视频文件生成字幕文件也很好。字幕生成后，再用播 ...

这个功能这次v250909更新其实也有的。你可以试试

而且如果字幕可以提取出来的话，把文件后缀改成txt然后丢给豆包跟他说这个是字幕文件让他帮忙翻译一下就行了，很快就搞定。速度贼快

作者: Wang_Yves 时间: 2025-9-19 23:00
唱歌这种会改变汉字音调的，他也识别不准

作者: Oxyer 时间: 2025-9-19 23:25
(, 下载次数: 12)
勉强能用，感觉不是很智能。

作者: 邪恶的光B 时间: 2025-9-20 01:01

流氓海发表于 2025-9-18 22:52
有没有下载好的模型啊，自己下载太久了

openai的whisper有下载地址的，微软自己的服务器下载速度很快啊。

模型地址，2.88G很快就下完了。
_MODELS = {
"tiny.en": "https://openaipublic.azureedge.net/main/whisper/models/d3dd57d32accea0b295c96e26691aa14d8822fac7d9d27d5dc00b4ca2826dd03/tiny.en.pt",
"tiny": "https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt",
"base.en": "https://openaipublic.azureedge.net/main/whisper/models/25a8566e1d0c1e2231d1c762132cd20e0f96a85d16145c3a00adf5d1ac670ead/base.en.pt",
"base": "https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt",
"small.en": "https://openaipublic.azureedge.net/main/whisper/models/f953ad0fd29cacd07d5a9eda5624af0f6bcf2258be67c92b79389873d91e0872/small.en.pt",
"small": "https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt",
"medium.en": "https://openaipublic.azureedge.net/main/whisper/models/d7440d1dc186f76616474e0ff0b3b6b879abc9d1a4926b7adfa41db2d497ab4f/medium.en.pt",
"medium": "https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714f32e89e936602e85993674d08dcb1/medium.pt",
"large-v1": "https://openaipublic.azureedge.net/main/whisper/models/e4b87e7e0bf463eb8e6956e646f1e277e901512310def2c24bf0e11bd3c28e9a/large-v1.pt",
"large-v2": "https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt",
"large-v3": "https://openaipublic.azureedge.net/main/whisper/models/e5b1a55b89c1367dacf97e3e19bfd829a01529dbfdeefa8caeb59b3f1b81dadb/large-v3.pt",
"large": "https://openaipublic.azureedge.net/main/whisper/models/e5b1a55b89c1367dacf97e3e19bfd829a01529dbfdeefa8caeb59b3f1b81dadb/large-v3.pt",
"large-v3-turbo": "https://openaipublic.azureedge.net/main/whisper/models/aff26ae408abcba5fbf8813c21e62b0941638c5f6eebfb145be0c9839262a19a/large-v3-turbo.pt",
"turbo": "https://openaipublic.azureedge.net/main/whisper/models/aff26ae408abcba5fbf8813c21e62b0941638c5f6eebfb145be0c9839262a19a/large-v3-turbo.pt",
}

作者: allensakura 时间: 2025-9-20 02:06
本地部属个人有几个选项
qwen3-30b-a3b-2507，17G，大小最大速度最慢，效果也最好
sakura-galtransl-14b-v3.8，8G，QWEN2.5的底子，针对“那方面”特别训练过，大小中等
hunyuan-mt-7b，4G，专针对翻译训练，这应该是这个大小目前翻译能力最好的模型了，再更小都是胡言乱语级别

作者: 木子滴血 时间: 2025-9-20 02:13

老师们的电影效果如何

作者: xiao88 时间: 2025-9-20 04:13
是不是只能支持WMV格式啊?!

作者: 碌木 时间: 2025-9-20 06:06

xiao88 发表于 2025-9-20 04:13
是不是只能支持WMV格式啊?!

没有特定视频的格式吧，因为是从音轨识别音频的

作者: qzwalter 时间: 2025-9-20 10:43
日文可以吗

欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/)