找回密码
 加入我们
搜索
      
查看: 1824|回复: 22

[软件] 有没有比较精准的语音生成字幕软件

[复制链接]
发表于 2024-4-30 13:41 | 显示全部楼层 |阅读模式
工作需要,要把视频配上字幕,但是找了好几款软件,都有点不尽人意。

首先第一个想到剪映,字幕的准确率还可以,但是时间轴很多对不上,一个视频大概30-40分钟,字幕很多对不上时间轴的

然后也试过了Videosrt Pro,情况和剪映差不多,也是时间轴问题

陆陆续续找了几款软件,先不谈语音识别的准确率,无一例外都是时间轴对不上,一个一个去调太费时间了

有没老哥给介绍款软件,要求也不高

收费免费都可以

有无翻译也行,最好就有吧

一定要时间轴能对上的
发表于 2024-4-30 13:53 | 显示全部楼层
https://github.com/CheshireCC/faster-whisper-GUI

识别后用自带的whisper-x模块校准时间轴,能获得比较准确的时间轴
发表于 2024-4-30 13:56 | 显示全部楼层
对字幕 这玩意还是得人工~

有一说一,你还不如花钱去找人帮你把字幕给配了...自己动手太费时间了
发表于 2024-4-30 13:58 | 显示全部楼层
花钱找字幕组给你翻吧
发表于 2024-4-30 14:02 | 显示全部楼层
付费的话讯飞不错
 楼主| 发表于 2024-4-30 14:02 | 显示全部楼层
ben19910518 发表于 2024-4-30 13:53
https://github.com/CheshireCC/faster-whisper-GUI

识别后用自带的whisper-x模块校准时间轴,能获得比较 ...

谢谢老哥,我试试
 楼主| 发表于 2024-4-30 14:03 | 显示全部楼层
qp6g3o 发表于 2024-4-30 13:56
对字幕 这玩意还是得人工~

有一说一,你还不如花钱去找人帮你把字幕给配了...自己动手太费时间了 ...

公司不肯花这个钱
 楼主| 发表于 2024-4-30 14:03 | 显示全部楼层
cmz118 发表于 2024-4-30 14:02
付费的话讯飞不错

我记得这个有个免费的,好像用过,效果不太行
发表于 2024-4-30 14:28 | 显示全部楼层
hemlock 发表于 2024-4-30 14:03
公司不肯花这个钱

不愿意花钱,那就只能自己下场干了。免费的识别软件先跑一遍初版字幕,自己下场学习如何经校字幕。
 楼主| 发表于 2024-4-30 16:32 | 显示全部楼层
qp6g3o 发表于 2024-4-30 14:28
不愿意花钱,那就只能自己下场干了。免费的识别软件先跑一遍初版字幕,自己下场学习如何经校字幕。 ...

现在就是这样,就是花时间了
发表于 2024-4-30 16:33 | 显示全部楼层
时间轴也不是啥大问题,想要时间轴精准,最终还是要人工调,软件最多起到辅助作用,用分离人声的软件,半小时时长的视频以我的速度要花半小时作精调,这都不算翻译断句和时间轴优化等细枝末节的时间。
发表于 2024-4-30 16:58 | 显示全部楼层
https://github.com/Const-me/Whisper
7.2k Star
就用过一次,还可以

至于时间轴对不上,这个可能不是识别软件的问题
发表于 2024-4-30 17:13 | 显示全部楼层
hemlock 发表于 2024-4-30 14:03
我记得这个有个免费的,好像用过,效果不太行

免费讯飞还不如直接用剪映呢,准确度差不多,至少剪映直接铺在视频序列里了,就是微调时间轴得自己手动。
发表于 2024-4-30 17:22 | 显示全部楼层
hemlock 发表于 2024-4-30 14:03
我记得这个有个免费的,好像用过,效果不太行

讯飞就算付费也很便宜的吧,我记得咸鱼很多有卖识别套餐时间的,很久没用忘记了
 楼主| 发表于 2024-4-30 17:36 | 显示全部楼层
cmz118 发表于 2024-4-30 17:22
讯飞就算付费也很便宜的吧,我记得咸鱼很多有卖识别套餐时间的,很久没用忘记了 ...

好的 我去看看
 楼主| 发表于 2024-4-30 17:36 | 显示全部楼层
yjd159 发表于 2024-4-30 16:58
https://github.com/Const-me/Whisper
7.2k Star
就用过一次,还可以

谢谢,我试试
发表于 2024-4-30 20:33 | 显示全部楼层
ben19910518 发表于 2024-4-30 13:53
https://github.com/CheshireCC/faster-whisper-GUI

识别后用自带的whisper-x模块校准时间轴,能获得比较 ...

这个有教程么
是不是要安装什么环境
发表于 2024-4-30 21:54 | 显示全部楼层
前几天在sspai看到的,您可以参考下
https://sspai.com/post/88291
发表于 2024-4-30 23:30 | 显示全部楼层
语音生成字幕这个事情,效果好不好,首要条件是语音发音是否标准,我用剪映识别的字幕,除了同音字,基本没有错的
发表于 2024-5-1 15:52 | 显示全部楼层
见龙卸甲 发表于 2024-4-30 20:33
这个有教程么
是不是要安装什么环境

不用,他已经做成一个软件可以直接用
发表于 2024-5-6 21:38 | 显示全部楼层

自己经常经常翻译国外游泳视频,一开始用剪映,后面发现英文的精准度不高,后面看到快转字幕这个网站,用免费积分测试了几个视频,确实比剪映精准
总体还是降低了字幕工作的时间,因为原英文准确度大大降低了我翻译的难度。
也是基于fastwhisper做的一个平台,另外还搞了一些增加效率的功能吧,智能重排,这个目前fastwhisper gui那个软件好像还不能很智能到进行断时间轴,字幕内容过长,不便于阅读,所以还得人工去断轴,快转字幕的重排功能还是减少很多人工的操作。

18楼的老哥发的链接也是介绍这个网页的使用,目前还是值得推荐的,毕竟不用自己本地部署,不占用gpu,真心推荐!

https://www.kzzimu.com/?invite_code=480348
微信图片_20240506213050.png
发表于 2024-5-6 22:33 | 显示全部楼层
PR自带的不就可以吗
发表于 2024-5-9 09:55 | 显示全部楼层
楼主,你的情况可能是视频噪音太大吧?后面解决了吗?
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-5-16 04:36 , Processed in 0.013373 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表