国语视界

 找回密码
 立即注册
查看: 20880|回复: 77

[字幕技术] 语音转字幕之基于python3开源代码autosub3详细教程

  [复制链接]

77

主题

2022

帖子

3117

积分

团长

大洋
87589
阅读权限
60
发表于 21-4-24 17:02 | 显示全部楼层 |阅读模式
本帖最后由 yaojingzhe 于 21-4-29 17:10 编辑

菜鸟教菜鸟之
语音转字幕之基于python3开源代码autosub3详细教程


有时我们很容易找到国语音轨,但找不到对应的国语字幕,如果听一句打一句字的录入,太费劲了,这里给大家分享国语音轨直接转srt字幕的方法

语音转字幕及处理字幕和音轨要用到的软件,请看我发布的这几个贴子:

SubtitleEdit 3.6 把SUP转SRT 及百度翻译插件等实用插件
https://cnlang.org/thread-84159-1-1.html
Aegisub安装Aegisub-motion v1.0.9等84个自动化脚本教程
https://cnlang.org/thread-84318-1-1.html
听录和转字幕用到的人声分离工具之一Spleeter详细教程
https://cnlang.org/thread-84080-1-1.html
语音转字幕之用vidio-srt调用阿里云免费语音识别详细教程
https://cnlang.org/thread-84580-1-1.html
语音转字幕之用autosub-alpha调用百度云免费语音识别详细教程
https://cnlang.org/thread-84853-1-1.html



基础篇:安装和配置python、ffmpeg、微软常用运行库集合
请看我的教程
《听录_语音转字幕_重混国语音轨,纯人声分离工具之一SpleeterGUI详细教程》



准备篇:提取纯人声音轨

请用SpleeterGUI把国语音轨的纯人声提取出来,
分离音轨的方法请看我上面的贴子

这一步不是必须的,但能提高语音转文字的识别率,并且时间轴也在语音附件,否则,时间轴有些会在语音前后5秒远的地方,增加校对文字和调时间轴的工作量。



重要说明:由于语音识别技术仍不能完全准确,因此结果的准确度可能会有所不同,这取决于许多因素,主要是音频的质量/清晰度。理想情况下,音频输入不应有背景噪音、声音效果或音乐。如果只有一个说话者,而他说话的速度又清晰又慢,那么识别的准确性就高得多。有时,在理想/幸运的条件下,有可能获得接近95%的准确度结果。

完美星球的腾讯国语转字幕效果:



正文:
游客,如果您要查看本帖隐藏内容请回复






另外,我正在与deepspeech的团队联系,用deepspeech的数据库实现离线的语音转字幕,双方已经沟通了多次。我现在只实现了英语转英文字幕。用他们的普通话库,一直没有成功。


感谢大家的支持!我将把我更多的经验与大家分享。

国语视界真的是我最喜欢的论坛

点评

autosub3后台调用的是Google web speech API,在国内可能无法使用。如果有离线数据库应该不受此限  发表于 22-5-29 16:41

评分

参与人数 2威望 +50 大洋 +2900 收起 理由
why1812 + 50 + 900 很给力!
bobo + 2000 很给力!

查看全部评分

77

主题

2022

帖子

3117

积分

团长

大洋
87589
阅读权限
60
 楼主| 发表于 21-4-24 17:06 | 显示全部楼层
遇到问题我在二楼回复
回复 支持 反对

使用道具 举报

3

主题

2265

帖子

306

积分

排长

大洋
105057
阅读权限
30
发表于 21-4-24 17:55 | 显示全部楼层
这个很牛啊。楼主技术达人
回复 支持 反对

使用道具 举报

14

主题

1540

帖子

7001

积分

旅长

大洋
41856
阅读权限
70

悍匪之王

发表于 21-4-24 17:59 | 显示全部楼层
真正技术贴
回复 支持 反对

使用道具 举报

1

主题

2011

帖子

1008

积分

营长

大洋
12818
阅读权限
50
发表于 21-4-24 18:23 | 显示全部楼层
看下教程,以前也搜到过autosub这软件
回复 支持 反对

使用道具 举报

274

主题

4874

帖子

6万

积分

炊事员

大洋
322679
阅读权限
120

灌水之王热心会员论坛元老王者至尊

发表于 21-4-24 19:13 | 显示全部楼层
搜了一下,似乎采用讯飞API了,试试效果。
回复 支持 反对

使用道具 举报

0

主题

1901

帖子

224

积分

排长

大洋
15919
阅读权限
30
发表于 21-4-24 19:19 | 显示全部楼层
多谢楼主分享!!!
回复 支持 反对

使用道具 举报

374

主题

1461

帖子

9020

积分

养老族

大洋
259054
阅读权限
110
发表于 21-4-24 19:50 | 显示全部楼层
看看,感谢分享
回复 支持 反对

使用道具 举报

4

主题

321

帖子

159

积分

班长

大洋
8561
阅读权限
20
发表于 21-4-24 20:29 | 显示全部楼层
谢谢分享语音转写字幕教程!
回复 支持 反对

使用道具 举报

77

主题

2022

帖子

3117

积分

团长

大洋
87589
阅读权限
60
 楼主| 发表于 21-4-24 20:30 | 显示全部楼层
gumfifa 发表于 21-4-24 19:13
搜了一下,似乎采用讯飞API了,试试效果。

我也在关注讯飞api接口,但讯飞只有3个月试用期一共5小时的免费额度。
回复 支持 反对

使用道具 举报

77

主题

2022

帖子

3117

积分

团长

大洋
87589
阅读权限
60
 楼主| 发表于 21-4-24 20:31 | 显示全部楼层

你发的技术贴子,非常有营养,感谢你的分享
回复 支持 反对

使用道具 举报

8

主题

2万

帖子

8817

积分

旅长

大洋
153574
阅读权限
70

灌水之王热心会员论坛元老

发表于 21-4-24 21:30 | 显示全部楼层
好的技术贴要学习
回复 支持 反对

使用道具 举报

1

主题

980

帖子

124

积分

班长

大洋
25254
阅读权限
20
发表于 21-4-24 22:09 | 显示全部楼层
多谢楼主分享方法
回复 支持 反对

使用道具 举报

1

主题

156

帖子

24

积分

列兵

大洋
782
阅读权限
10
发表于 21-4-24 23:45 | 显示全部楼层
膜拜大神系列教程
回复 支持 反对

使用道具 举报

143

主题

1万

帖子

3141

积分

团长

大洋
36697
阅读权限
60
发表于 21-4-25 06:35 | 显示全部楼层
这个帖子太有价值了。
回复 支持 反对

使用道具 举报

453

主题

4086

帖子

1万

积分

养老族

大洋
1103184
阅读权限
110

王者至尊富甲天下帅哥宣传达人最佳新人优秀版主突出贡献版主音轨组热心会员

发表于 21-4-25 06:40 | 显示全部楼层
讯飞的识别率确实高。
回复 支持 反对

使用道具 举报

8

主题

1万

帖子

1406

积分

营长

大洋
55372
阅读权限
50
发表于 21-4-25 08:10 | 显示全部楼层
我以前都是听一句打一句,有的还要反复听也听不出是什么,太费劲,学习一下大神的办法。先谢谢啦!
回复 支持 反对

使用道具 举报

1

主题

1820

帖子

9141

积分

旅长

大洋
9156
阅读权限
70
发表于 21-4-25 08:55 | 显示全部楼层
感谢大神指点 正有此需要 太棒了 谢谢
回复 支持 反对

使用道具 举报

72

主题

5301

帖子

7001

积分

旅长

大洋
4810
阅读权限
70
发表于 21-4-25 10:04 | 显示全部楼层
最近的教程大爆发
回复 支持 反对

使用道具 举报

194

主题

2693

帖子

865

积分

连长

大洋
29338
阅读权限
40
发表于 21-4-25 12:30 | 显示全部楼层
虽然不会,但是这么实用的教程,必须支持!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表