国语视界

 找回密码
 立即注册
查看: 94628|回复: 247

[字幕技术] SUP/SUB+idx字幕OCR教程

  [复制链接]

375

主题

1466

帖子

9065

积分

养老族

大洋
260064
阅读权限
110
发表于 19-4-30 05:33 | 显示全部楼层 |阅读模式
本帖最后由 zsh月夜苍狼 于 19-9-6 21:54 编辑

本教程来源于【用MODI OCR 21种语言】 作者:马健
在此感谢作者对于软件的制作于开发

https://www.cnblogs.com/stronghorse/p/4913356.html

语言支持:
简体中文
繁体中文
英语
日语
韩语
波兰语
捷克语
匈牙利语


一 Office2003 MODI的安装。
1.解压压缩包文件,打开文件夹点击安装



2.输入密匙,点击下一步





3.勾选完全安装,点击下一步



4.等待Office2003安装完毕

二 安装MODI繁体中文OCR识别补丁
1.压缩包解压,打开文件夹



2.将下面的文件复制到以下文件夹:
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0          (32位系统 Office 2003)
C:\Program Files (x86)\Common Files\microsoft shared\MODI\11.0    (64位系统 Office 2003)
C:\Program Files\Common Files\Microsoft Shared\MODI\12.0          (32位系统 Office 2007)
C:\Program Files (x86)\Common Files\microsoft shared\MODI\12.0    (64位系统 Office 2007)

TCCODE.UNI
TCPRINT.DAT
TCPRINT2.DAT
TCSERHT.DAT
TCTREE.DAT
TW_BU.DAT
TW_UB.DAT
TWBIG532.DLL

3. 双击CHT-OCR.REG文件导入注册表后,在MODI的OCR选项卡里,“OCR语言”即可看到“中文(繁体)”。





三.打开IdxSubOcr,开始OCR
1.添加字幕



2.选择字幕,点击确定



3.选择OCR语言,把图片调成白底黑字,点击确定



4.等待OCR完成



软件打包下载:
游客,如果您要查看本帖隐藏内容请回复


IdxSubOcr更新到2.0.1版本 支持sup字幕OCR
Version 2.02
修正单条字幕字数太少可能会造成OCR出错中断的错误。
Version 2.01
功能增强:对于日语字幕中的竖排情况进行特殊处理,增强OCR识别能力。
功能增强:对于中日韩(CJK)语言中因为某条字幕字数太少导致识别为空的情况进行特殊处理。
功能修正:某些sup的相同字幕被合并,减少字幕条数。
功能修正:新增的除CJK和英文外的语言OCR准确性略有提高。
功能修正:拉高字幕显示区域,以免某些竖排的字幕显示不下。
错误修正:校对字幕时,某些字幕编号可能会出现跳跃。
错误修正:某些sup文件的时间轴不准。

Version 2.00
新增功能:能够OCR蓝光DVD的sup字幕,又称HDMV Presentation Graphic Stream subtitles。
功能增强:发行版改为Unicode版,打不开外文文件名的idx、sup情况不会再出现。
功能增强:OCR支持21种语言,同时srt文件编码从ANSI变成utf-8,以支持多语言OCR结果。
功能增强:在选择字幕文字颜色时新增“自动选择”选型,以对付那些颜色变来变去的字幕。
功能增强:对打开文件后的界面进行合并,减少界面切换的麻烦。
功能增强:增强OCR的容错能力。
功能增强:放大界面字号,适应高分辨率屏幕;放大字幕图像显示区域,适应sup高分辨率图像。
功能增强:在任务栏上显示OCR进度。
新发行英文版本。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

评分

参与人数 4大洋 +114 收起 理由
xiafei + 5 厉害了我的神!
lingyu888888 + 2 很给力!
why1812 + 100 赞一个!
xiaobai + 7 很给力!

查看全部评分

375

主题

1466

帖子

9065

积分

养老族

大洋
260064
阅读权限
110
 楼主| 发表于 19-4-30 07:34 | 显示全部楼层
本帖最后由 zsh月夜苍狼 于 19-9-20 03:48 编辑

Office2010的安装MODI教程
Office 2010以上版本不再提供MODI组件,OCR功能改由OneNote完成,不过微软官方给出了在Office 2010下安装Office 2007版MODI的方法及步骤:
http://support.microsoft.com/kb/982760/
如果不想安装Office,但又希望使用MODI,也可以按照微软的上述建议,从SharePoint Designer 2007安装MODI。







软件下载:
链接: https://pan.baidu.com/s/1xAmah3T7VpX5UCqwIznEXg 提取码: jfdm
回复 支持 0 反对 1

使用道具 举报

375

主题

1466

帖子

9065

积分

养老族

大洋
260064
阅读权限
110
 楼主| 发表于 19-4-30 05:49 | 显示全部楼层
本帖最后由 zsh月夜苍狼 于 19-5-2 04:24 编辑

Office2007 MODI的安装教程
1.下载Office2007简体安装包,解压文件,点击安装



2.输入密匙CTKXX-M97FT-89PW2-DHKD3-74MYJ。点击继续





3.选择自定义安装



4.找到Microsoft Office Document Imaging选项,选择“从本机运行全部程序”



5.等待安装完成

6. 把TWRECC.DLL复制到以下文件夹
C:\Program Files\Common Files\Microsoft Shared\MODI\12.0          (32位系统 Office 2007)
C:\Program Files (x86)\Common Files\microsoft shared\MODI\12.0    (64位系统 Office 2007)

后面的步骤跟Office 2003一样

Office2007简体安装包下载:度盘秒离线链接
  1. ed2k://|file|cn_office_professional_plus_2007_dvd_X12-38713.iso|694059008|CFAE350F8A9028110D12D61D9AEC1315|/
复制代码


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

14

主题

1540

帖子

7001

积分

旅长

大洋
41856
阅读权限
70

悍匪之王

发表于 19-4-30 09:02 | 显示全部楼层
目前我用的是百度OCR的接口 效果不错
回复 支持 反对

使用道具 举报

174

主题

6809

帖子

6310

积分

养老族

大洋
122790
阅读权限
110
发表于 19-4-30 10:58 | 显示全部楼层
我偶尔会OCR,久了都有点忘了
回复 支持 反对

使用道具 举报

69

主题

5089

帖子

5478

积分

团长

大洋
22949
阅读权限
60
发表于 19-4-30 12:26 | 显示全部楼层
需要修改的还是很多
回复 支持 反对

使用道具 举报

70

主题

1394

帖子

7093

积分

旅长

大洋
52905
阅读权限
70
发表于 19-4-30 14:11 | 显示全部楼层
zsh月夜苍狼 发表于 19-4-30 07:34
Office2010的安装教程

期待大神
回复 支持 反对

使用道具 举报

5

主题

653

帖子

3118

积分

团长

大洋
21870
阅读权限
60
发表于 19-4-30 14:39 | 显示全部楼层
不知道有没有Office 2009
回复 支持 反对

使用道具 举报

23

主题

2603

帖子

3517

积分

团长

大洋
30402
阅读权限
60
发表于 19-4-30 17:00 | 显示全部楼层
感谢制作教程。有现成的字幕,ocr真的比听录要省力得多,只需要精调下时间轴,修改下两行同屏啊错别字啊长句拆短句之类的,即可用了!
回复 支持 反对

使用道具 举报

3

主题

1797

帖子

1258

积分

论坛贵宾

大洋
17678
阅读权限
130
发表于 19-4-30 17:09 | 显示全部楼层
感谢制作教程。
回复 支持 反对

使用道具 举报

4

主题

631

帖子

535

积分

连长

大洋
5563
阅读权限
40
发表于 19-4-30 17:47 | 显示全部楼层
感谢这个教程,虽然已经掌握
回复 支持 反对

使用道具 举报

1

主题

1526

帖子

283

积分

排长

大洋
22472
阅读权限
30
发表于 19-4-30 18:10 | 显示全部楼层
学习一下,以后或许有用
回复 支持 反对

使用道具 举报

5

主题

4092

帖子

487

积分

排长

大洋
50738
阅读权限
30
发表于 19-4-30 18:26 | 显示全部楼层
技术帖子不易,感谢楼主分享
回复 支持 反对

使用道具 举报

1

主题

2044

帖子

5198

积分

团长

大洋
11308
阅读权限
60
QQ
发表于 19-4-30 18:48 | 显示全部楼层
好久没ocr了,复习复习
12345
回复 支持 反对

使用道具 举报

72

主题

5344

帖子

7007

积分

旅长

大洋
5963
阅读权限
70
发表于 19-4-30 18:53 | 显示全部楼层
学习了,谢谢教程
回复 支持 反对

使用道具 举报

0

主题

1919

帖子

226

积分

排长

大洋
16035
阅读权限
30
发表于 19-4-30 19:59 | 显示全部楼层
多谢楼主分享!!!
回复 支持 反对

使用道具 举报

47

主题

1754

帖子

266

积分

排长

大洋
25410
阅读权限
30
发表于 19-4-30 20:55 | 显示全部楼层
本帖最后由 feb12345 于 19-4-30 21:12 编辑

我用的是office 2019,没有modi,试过所谓的单独提取包,经测定都不行。后来安装office 2007,只安装modi,测试只可以ocr简体中文,后来不知道下载了什么繁體中文支持,就可以了。现在新版office 2019/2016都可以了。非常好。

用过Adobe Acrobat Pro,那个中文ocr真是强悍啊,如果能移植或者调用OCr字幕那就太好了!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

6

主题

1万

帖子

1486

积分

营长

大洋
5443
阅读权限
50
QQ
发表于 19-4-30 21:32 | 显示全部楼层
感谢技术贴,受教
回复 支持 反对

使用道具 举报

24

主题

633

帖子

569

积分

禁止访问

大洋
13379
阅读权限
0
发表于 19-4-30 22:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

1

主题

2299

帖子

2927

积分

营长

大洋
64949
阅读权限
50
发表于 19-5-1 00:29 | 显示全部楼层
下来试试呢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表