国语视界

 找回密码
 立即注册
查看: 7294|回复: 65

[字幕技术] 语音转字幕之用autosub-alpha调用百度云免费语音识别详细教程

  [复制链接]

72

主题

1664

帖子

3029

积分

团长

大洋
78226
阅读权限
60
发表于 21-4-28 11:17 | 显示全部楼层 |阅读模式
本帖最后由 yaojingzhe 于 21-4-28 11:17 编辑

菜鸟教菜鸟之
语音转字幕之用autosub-alpha调用百度云免费语音识别详细教程


应大家的要求,写一篇关于如何用百度云的短语音识别接口把语音转成字幕的教程


前期已经发布了与制作字幕和语音转字幕的教程

SubtitleEdit 3.6 把SUP转SRT 及百度翻译插件等实用插件
https://cnlang.org/thread-84159-1-1.html
Aegisub安装Aegisub-motion v1.0.9等84个自动化脚本教程
https://cnlang.org/thread-84318-1-1.html
听录和转字幕用到的人声分离工具之一Spleeter详细教程
https://cnlang.org/thread-84080-1-1.html
语音转字幕教程之基于python3开源代码autosub3详细教程
https://cnlang.org/thread-84774-1-1.html
语音转字幕之用vidio-srt调用阿里云免费语音识别详细教程

https://cnlang.org/thread-84580-1-1.html


百度云的语音识别技术与阿里云的不一样,百度云语音是短语音,语音不能超过60秒。这就要使用Auditok来自动检测语音区域,通过ffmpeg根据语音区域来切割音频,每段音频就是一个连续一句话的语音段,上传到百度云API将语音转为文字,再合并为一个完整的字幕文件。




百度短语音的识别率也非常高,与阿里云比,有时高有时低,但都比谷歌识别率好


而百度语音转出的字幕,时间轴是最好的,有些只需要微调一下就能用







第一部分:百度云短语音识别的设置及获取你的密钥


比较简单

第一步、用你的百度网盘的用户名登陆百度云https://cloud.baidu.com/



第二步、登录后,点击“产品”--“人工智能”,找到“短语音识别”



第三步、选择“立即使用”



第四步、创建应用



第五步、按照下图填写,并“立即创建”



第六步、就看到“AppID”、“API key”、“Secret Key”



第七步、找到“领取免费额度”,在中文普通话这行,立即领取


到此,你的百度云短语音识别就开通了,到你的账户里完成个人认证,就有免费15万次使用量,有效期180天。



第二部分、软件使用教程

游客,如果您要查看本帖隐藏内容请回复

评分

参与人数 2威望 +50 大洋 +2000 收起 理由
cnlang + 800 厉害了我的神!
why1812 + 50 + 1200 很给力!

查看全部评分

194

主题

1966

帖子

634

积分

连长

大洋
18940
阅读权限
40
发表于 21-4-28 12:02 | 显示全部楼层
用百度手机输入法,感觉断句加标点挺准,看来时间轴准也有关,可惜只能短句呀
回复 支持 反对

使用道具 举报

90

主题

1万

帖子

2468

积分

营长

大洋
18810
阅读权限
50
发表于 21-4-28 12:49 | 显示全部楼层
教程不错,学习了
回复 支持 反对

使用道具 举报

28

主题

7802

帖子

3254

积分

团长

大洋
64230
阅读权限
60
发表于 21-4-28 13:31 | 显示全部楼层
楼主分享长篇叫教程,辛苦了
回复 支持 反对

使用道具 举报

8

主题

1万

帖子

1294

积分

营长

大洋
48833
阅读权限
50
发表于 21-4-28 13:34 | 显示全部楼层
收藏保存了,慢慢学,先谢谢大神制作教程!
回复 支持 反对

使用道具 举报

21

主题

4226

帖子

877

积分

连长

大洋
2003
阅读权限
40
发表于 21-4-28 13:52 | 显示全部楼层
感谢大佬分享宝贵经验
回复 支持 反对

使用道具 举报

45

主题

935

帖子

875

积分

连长

大洋
3653
阅读权限
40
发表于 21-4-28 17:32 | 显示全部楼层
谢谢大佬的精彩分享,学习一下
回复 支持 反对

使用道具 举报

6

主题

3341

帖子

388

积分

排长

大洋
10864
阅读权限
30
发表于 21-4-28 19:40 | 显示全部楼层
又一实用的详细教程,学习了,谢谢大佬
回复 支持 反对

使用道具 举报

9

主题

1049

帖子

240

积分

禁止访问

大洋
1590
阅读权限
0
发表于 21-4-28 20:49 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

257

主题

4556

帖子

3万

积分

军区司令

大洋
389386
阅读权限
105

灌水之王热心会员论坛元老王者至尊

发表于 21-4-28 21:09 | 显示全部楼层
阿里、百度、讯飞、网易见外、i笛云听写,这几个网络AI,看谁能干过谁?
回复 支持 反对

使用道具 举报

72

主题

1664

帖子

3029

积分

团长

大洋
78226
阅读权限
60
 楼主| 发表于 21-4-28 22:17 | 显示全部楼层
gumfifa 发表于 21-4-28 21:09
阿里、百度、讯飞、网易见外、i笛云听写,这几个网络AI,看谁能干过谁?

这4个我都测试过,目前是讯飞=阿里>百度>网易见外>i笛云听写
回复 支持 反对

使用道具 举报

15

主题

191

帖子

55

积分

列兵

大洋
692
阅读权限
10
发表于 21-4-30 08:38 | 显示全部楼层
yaojingzhe 发表于 21-4-28 22:17
这4个我都测试过,目前是讯飞=阿里>百度>网易见外>i笛云听写

网易见外和译视界排第几?
回复 支持 反对

使用道具 举报

72

主题

1664

帖子

3029

积分

团长

大洋
78226
阅读权限
60
 楼主| 发表于 21-4-30 08:50 | 显示全部楼层
i990049 发表于 21-4-30 08:38
网易见外和译视界排第几?

如果一个语音,阿里云能到90%的识别率,网易见外应该能到85%以上,实测。译视界没有用过,不知道识别率多少
回复 支持 反对

使用道具 举报

68

主题

4511

帖子

1246

积分

营长

大洋
55501
阅读权限
50
发表于 21-4-30 17:16 | 显示全部楼层
楼主太牛X了,学习了
回复 支持 反对

使用道具 举报

0

主题

3

帖子

0

积分

列兵

大洋
14
阅读权限
10
发表于 21-4-30 21:40 | 显示全部楼层
这个厉害,试试看
回复 支持 反对

使用道具 举报

5

主题

321

帖子

43

积分

列兵

大洋
696
阅读权限
10
发表于 21-4-30 23:13 | 显示全部楼层
感谢您的发布
回复 支持 反对

使用道具 举报

1

主题

1675

帖子

9115

积分

旅长

大洋
11482
阅读权限
70
发表于 21-4-30 23:58 | 显示全部楼层
真是太棒了 感谢感谢 非常有用
回复 支持 反对

使用道具 举报

1

主题

4662

帖子

454

积分

排长

大洋
5969
阅读权限
30
发表于 21-5-3 13:00 | 显示全部楼层
认真学习,感谢大佬分享!
回复 支持 反对

使用道具 举报

1

主题

132

帖子

3000

积分

团长

大洋
15063
阅读权限
60
发表于 21-5-8 11:19 | 显示全部楼层
感谢大神的教程,谢谢
回复 支持 反对

使用道具 举报

3

主题

2333

帖子

3611

积分

团长

大洋
27552
阅读权限
60

灌水之王论坛元老悍匪之王热心会员爱心大使

发表于 21-5-8 13:10 | 显示全部楼层
赞一个,再来一篇,慢慢学习。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表