国语视界

 找回密码
 立即注册
查看: 29308|回复: 135

[字幕技术] 语音转字幕之用vidio-srt调用阿里云免费语音识别详细教程

  [复制链接]

77

主题

2021

帖子

3117

积分

团长

大洋
87522
阅读权限
60
发表于 21-4-26 11:30 | 显示全部楼层 |阅读模式
本帖最后由 yaojingzhe 于 21-4-29 17:31 编辑

菜鸟教菜鸟之
语音转字幕之用vidio-srt调用阿里云免费语音识别详细教程


一直关注国语视界,有幸注今年1月册进来。真的是大爱国语视界,高手如云,大家都积极分享。
在此,代表论坛的"各级军官和列兵":

特别感谢@cnlang 提供国语视界这平台,感谢各位版主,辛苦地管理论坛

已经发布了下面几个贴子。


SubtitleEdit 3.6 把SUP转SRT 及百度翻译插件等实用插件
https://cnlang.org/thread-84159-1-1.html
Aegisub安装Aegisub-motion v1.0.9等84个自动化脚本教程
https://cnlang.org/thread-84318-1-1.html
听录和转字幕用到的人声分离工具之一Spleeter详细教程
https://cnlang.org/thread-84080-1-1.html
语音转字幕教程之基于python3开源代码autosub3详细教程
https://cnlang.org/thread-84774-1-1.html
语音转字幕之用autosub-alpha调用百度云免费语音识别详细教程
https://cnlang.org/thread-84853-1-1.html



不管是用Autosub3还是pyTranscriber,都是调用Google-Speech-v2的语音识别接口,普通话的识别率不算高,语音识别率高的还是国内云巨头,比如百度云、阿里云、讯飞云、腾讯云等。但对于我们普通的使用者,不知道用什么软件工具、如何调用这些云的接口。

本篇详细讲述阿里云的语音识别接口长期免费额度调用,实现语音转字幕。


阿里云语音识别率惊人的高,我把完美星球前2分钟转出字幕,达到90%左右



而用autosub3调用谷歌云的识别率有60-80%左右,如下:






第一节、提取纯人声
(不是必须,但剔除背景音,提高转字幕的正确率,并且时间轴也在语音附近,减少校核文字和调整时间轴的工作量)

请用我上面帖子“听录和转字幕用到的人声分离工具之一Spleeter详细教程”里的方法,用SpleeterGUI把音轨的纯人声提取出来。


重要说明:由于语音识别技术仍不能完全准确,因此结果的准确度可能会有所不同,这取决于许多因素,主要是音频的质量/清晰度。理想情况下,音频输入不应有背景噪音、声音效果或音乐。如果只有一个说话者,而他说话的速度又清晰又慢,那么识别的准确性就高得多。有时,在理想/幸运的条件下,有可能获得接近95%的准确度结果。


第二节、安装软件和配置接口
游客,如果您要查看本帖隐藏内容请回复


写得累死我了,估计你们看得也快累死了



我同时还在研究由百度硅谷AI实验室与美国合作开发deepspeech离线语音识别技术

我用离线英文语言包成功转出英文字幕,但用中文语言包,转出的字幕驴唇不对马嘴。作者指导我修改源代码,现在还没有成功,有结果了就分享给大家

评分

参与人数 2威望 +50 大洋 +2000 收起 理由
cnlang + 500 很给力!
why1812 + 50 + 1500 技术大佬辛苦!

查看全部评分

77

主题

2021

帖子

3117

积分

团长

大洋
87522
阅读权限
60
 楼主| 发表于 21-4-26 11:30 | 显示全部楼层
本帖最后由 yaojingzhe 于 21-4-26 11:47 编辑

这是我用到的几个语音转字幕方法中,最好的之一,以前担心只有90天的免费额度,在与客服沟通后,可以用很多年,就极力推荐给大家


技术问题我在二楼回复
回复 支持 反对

使用道具 举报

194

主题

2670

帖子

859

积分

连长

大洋
29179
阅读权限
40
发表于 21-4-26 11:37 | 显示全部楼层
原来阿里的识别率这么高!
一直用百度输入法,感觉语音转文字识别率挺高的,而且自动加标点断句
回复 支持 反对

使用道具 举报

11

主题

4873

帖子

687

积分

连长

大洋
56323
阅读权限
40
发表于 21-4-26 12:03 | 显示全部楼层
阿里的只能识别确实不错啊
回复 支持 反对

使用道具 举报

274

主题

4866

帖子

6万

积分

炊事员

大洋
315473
阅读权限
120

灌水之王热心会员论坛元老王者至尊

发表于 21-4-26 12:03 | 显示全部楼层
看看各种接口调用
回复 支持 反对

使用道具 举报

33

主题

8735

帖子

3501

积分

团长

大洋
74295
阅读权限
60
发表于 21-4-26 12:40 | 显示全部楼层
楼主好人,
回复

使用道具 举报

8

主题

3421

帖子

739

积分

连长

大洋
4429
阅读权限
40
发表于 21-4-26 12:58 | 显示全部楼层
楼主厉害,有这个技术,以后制作国配字幕会轻松很多
回复 支持 反对

使用道具 举报

45

主题

1197

帖子

8465

积分

旅长

大洋
183019
阅读权限
70

论坛元老灌水之王热心会员悍匪之王

发表于 21-4-26 13:11 | 显示全部楼层
感谢分享技术贴,听写作者的福音
回复 支持 反对

使用道具 举报

97

主题

2922

帖子

3123

积分

团长

大洋
709122
阅读权限
60
发表于 21-4-26 13:28 | 显示全部楼层
此系列教程可以大大提高国配字幕制作的效率
声明:本人制作的所有字幕作品仅限论坛会员测试之用!请在测试后24小时内删除!严禁非法传播或用于商业用途,对用于商业用途所产生的法律责任,由使用者自负!
回复 支持 反对

使用道具 举报

21

主题

4438

帖子

1503

积分

营长

大洋
413
阅读权限
50
发表于 21-4-26 13:54 | 显示全部楼层
工欲善其事,必先利其器!
回复 支持 反对

使用道具 举报

21

主题

2978

帖子

1556

积分

营长

大洋
18512
阅读权限
50
发表于 21-4-26 14:12 | 显示全部楼层
这个敢情好。赶紧去试试
回复 支持 反对

使用道具 举报

1

主题

2445

帖子

2953

积分

营长

大洋
42489
阅读权限
50
发表于 21-4-26 14:35 | 显示全部楼层
教程很详细,做的很精致,学习了!谢谢!
回复 支持 反对

使用道具 举报

8

主题

2553

帖子

679

积分

连长

大洋
24362
阅读权限
40
发表于 21-4-26 14:44 | 显示全部楼层
这真的是硬核教学呀,谢谢楼主了!
回复 支持 反对

使用道具 举报

2

主题

2136

帖子

2489

积分

营长

大洋
343
阅读权限
50

灌水之王热心会员

发表于 21-4-26 15:56 | 显示全部楼层
本帖最后由 撒哈拉夜空 于 21-4-26 16:04 编辑

支持感谢技术大佬无私的分享,但感觉太繁琐了害怕学不会啊
國語視界  聲畫殿堂
回复 支持 反对

使用道具 举报

7

主题

621

帖子

140

积分

班长

大洋
3426
阅读权限
20
发表于 21-4-26 16:25 | 显示全部楼层
提取纯人声看来很关键,我用阿里云识别率很一般,估计就是纯人声没提取。
回复 支持 反对

使用道具 举报

77

主题

2021

帖子

3117

积分

团长

大洋
87522
阅读权限
60
 楼主| 发表于 21-4-26 16:41 | 显示全部楼层
chinagear 发表于 21-4-26 16:25
提取纯人声看来很关键,我用阿里云识别率很一般,估计就是纯人声没提取。 ...

是的,提取纯人声,对提高识别率,和时间轴都有很大的帮助
回复 支持 反对

使用道具 举报

8

主题

2730

帖子

376

积分

排长

大洋
21008
阅读权限
30
发表于 21-4-26 16:53 | 显示全部楼层
这个技术太强了,拜读一下啊。不仅仅是识别字幕有用
回复 支持 反对

使用道具 举报

374

主题

1459

帖子

9019

积分

养老族

大洋
258399
阅读权限
110
发表于 21-4-26 17:04 | 显示全部楼层
看看,不知道阿里云怎么样
回复 支持 反对

使用道具 举报

4

主题

1820

帖子

3041

积分

团长

大洋
69322
阅读权限
60
发表于 21-4-26 18:43 | 显示全部楼层
这么好的内容,好好学习,再收藏一下。
回复 支持 反对

使用道具 举报

25

主题

1861

帖子

1153

积分

营长

大洋
5706
阅读权限
50
发表于 21-4-26 20:53 | 显示全部楼层
给大佬点赞 这个受益匪浅
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表