国语视界

 找回密码
 立即注册
查看: 6521|回复: 17

[技术交流] SubtitleEdit 在OCR时如何去除字符间的空格?

[复制链接]

4

主题

1212

帖子

614

积分

连长

大洋
1004
阅读权限
40
发表于 21-5-12 15:58 | 显示全部楼层 |阅读模式
根据论坛大神的教程已经可以实现OCR字幕了,但是发现中文字转出来之后每个字符间都有空格,必须要校对的时候一个一个字符的删,想问下有没有其他什么方法可以不让软件生成空格呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

0

主题

1529

帖子

328

积分

排长

大洋
8027
阅读权限
30
发表于 21-5-12 17:52 | 显示全部楼层
笨办法,我都是存成srt用wps打开,右对齐后竖选空格删除。
回复 支持 1 反对 0

使用道具 举报

13

主题

1432

帖子

1080

积分

营长

大洋
4896
阅读权限
50
发表于 21-5-13 03:30 | 显示全部楼层
ocr中文用这个软件准确率很低,建议用idxsubocr,速度快,准确率高。
回复 支持 1 反对 0

使用道具 举报

374

主题

1459

帖子

9019

积分

养老族

大洋
258469
阅读权限
110
发表于 21-5-13 01:51 | 显示全部楼层
不建议使用这个软件OCR中文,错误率太高
回复 支持 反对

使用道具 举报

13

主题

1432

帖子

1080

积分

营长

大洋
4896
阅读权限
50
发表于 21-5-13 03:31 | 显示全部楼层
当然这里还是提供个方法,字幕如果ocr后产生空格,那就用aegisub的替换功能,查找那里打个空格,然后替换那里不用打任何东西。
回复 支持 反对

使用道具 举报

3

主题

123

帖子

105

积分

班长

大洋
277
阅读权限
20
发表于 21-5-13 07:57 | 显示全部楼层
不错的教程~·
回复 支持 反对

使用道具 举报

0

主题

792

帖子

187

积分

班长

大洋
9423
阅读权限
20
发表于 21-5-13 12:48 | 显示全部楼层
空格我目前只有采取批量替换的方式
回复 支持 反对

使用道具 举报

47

主题

1744

帖子

265

积分

排长

大洋
25342
阅读权限
30
发表于 21-5-13 20:27 | 显示全部楼层
言冰云 发表于 21-5-13 03:31
当然这里还是提供个方法,字幕如果ocr后产生空格,那就用aegisub的替换功能,查找那里打个空格,然后替换那 ...

替换可能会产生错误,有的字幕本身带有很多空格
回复 支持 反对

使用道具 举报

13

主题

1432

帖子

1080

积分

营长

大洋
4896
阅读权限
50
发表于 21-5-13 22:27 | 显示全部楼层
本帖最后由 言冰云 于 21-5-13 22:38 编辑
feb12345 发表于 21-5-13 20:27
替换可能会产生错误,有的字幕本身带有很多空格


这个方法对普通字幕当然会产生错误,但是对于subtitledit的ocr出来的字幕的话用这方法就不会了。第一subtitledit的识别准确率本来就低,用它来ocr,还不如手打呢,这种情况下还在乎会不会产生错误?第二用我这个方法即使会误伤一些真的有空格的地方,但考虑到subtitledit的识别率必定会人工校对一遍,不然就截图上的字幕准确率能看?对于我前面提到的情况来说,这个时候人工来删除空格和批量替换来删除空格,肯定是后者更加便捷,当然如果你有更好的方法也可以提出来交流一下。
回复 支持 反对

使用道具 举报

13

主题

1432

帖子

1080

积分

营长

大洋
4896
阅读权限
50
发表于 21-5-13 22:28 | 显示全部楼层
feb12345 发表于 21-5-13 20:27
替换可能会产生错误,有的字幕本身带有很多空格

我这个方法也仅限于subtitledit的ocr字幕,对于像idxsubocr的字幕当然就不推荐这种方法了。
回复 支持 反对

使用道具 举报

245

主题

2004

帖子

2291

积分

管理员

大洋
21392
阅读权限
200
发表于 21-5-14 10:51 | 显示全部楼层
把生成的文本字幕用记事本打开,然后把空格替换成什么都没有就解决了。
回复 支持 反对

使用道具 举报

47

主题

1744

帖子

265

积分

排长

大洋
25342
阅读权限
30
发表于 21-5-14 20:27 | 显示全部楼层
言冰云 发表于 21-5-13 22:27
这个方法对普通字幕当然会产生错误,但是对于subtitledit的ocr出来的字幕的话用这方法就不会了。第一subt ...

我没有更好的方法,因为有效的中文校对软件很难实现。
我也认为SubtitleEdit的中文OCR功能本来就没有太大的使用价值。
我记得对岸的某个论坛就有人使用SubtitleEdit对繁体中文OCR,而且他们似乎不屑使用idxsubocr。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

5

主题

1539

帖子

515

积分

连长

大洋
9901
阅读权限
40
发表于 21-5-19 08:28 | 显示全部楼层
出现这种情况,我一般都是批量替换的,至于误伤的那些,校对的时候再添加把~
回复 支持 反对

使用道具 举报

2

主题

319

帖子

206

积分

排长

大洋
1456
阅读权限
30
发表于 21-5-23 19:03 | 显示全部楼层
额,听说这个软件对于英文的识别率比较高,中文太差。
回复 支持 反对

使用道具 举报

22

主题

5398

帖子

804

积分

连长

大洋
6401
阅读权限
40
发表于 21-6-7 09:01 | 显示全部楼层
这问题,只有专业的大佬们回答你。
回复 支持 反对

使用道具 举报

22

主题

230

帖子

479

积分

排长

大洋
428
阅读权限
30
发表于 21-7-4 10:53 | 显示全部楼层
这个软件识别成功率确实太低,字母识别有时候,都出错!
回复 支持 反对

使用道具 举报

10

主题

53

帖子

20

积分

列兵

大洋
158
阅读权限
10
发表于 21-9-19 14:55 | 显示全部楼层
言冰云 发表于 21-5-13 03:31
当然这里还是提供个方法,字幕如果ocr后产生空格,那就用aegisub的替换功能,查找那里打个空格,然后替换那 ...

替换功能用这个软件的批量转换,可以批量替换
回复 支持 反对

使用道具 举报

13

主题

1432

帖子

1080

积分

营长

大洋
4896
阅读权限
50
发表于 21-9-20 04:37 | 显示全部楼层
本帖最后由 言冰云 于 21-9-20 04:39 编辑
asxzwang 发表于 21-9-19 14:55
替换功能用这个软件的批量转换,可以批量替换


也可以,只不过我一般都用aegisub来做字幕,所以才推荐用aegisub,但用别的字幕软件替换也可以。subtitle edit我一般都用它来ocr英文sup。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表