Re: [问题] OCR（光学辨识）推荐书籍或函式库 vgod PTT批踢踢实业坊

Re: [问题] OCR（光学辨识）推荐书籍或函式库

楼主: vgod (vgod) 2011-11-08 12:47:35

这问题要拆成两部分来看, 第一是text detection, 在任意图上找出文字的位置
第二是text recognition, 给定图和文字区块的位置, 输出文字字串
第一个问题有很多种算法, 要看你图的性质而决定要用哪种
如果能知道文字的位置后, 接下来其实就比较简单,
因为第二个问题可以直接用现成的OCR引擎加上一些image processing来处理
最容易取得的OCR引擎是Tesseract, 3.0后还支援包含中文在内的多国语言
但如你所说, OCR引擎大多是假设图片是白底黑字的文件
所以直接把有复杂背景的图片丢进去是不行的
最简单的处理方法就是用一些影像处理的算法把背景去掉, 然后转成白底黑字的样子
这样再丢进OCR引擎的结果就会好很多
基本概念是这样, 关键字也都在上面了,
如果能看英文论文的话, 在google scholar能找到非常多资料
※ 引述《tonytonyjan (南洋大兜虫)》之铭言：
: 我把我的问题贴在 Komica 得到的回复贴在这里与大家分享：
: 无名氏: 这应该偏影像辨识的学门了之前是有玩face Detection (rpJRwjDA 11/11/03
: 07:12)
: 无名氏: 不过那是辨识人脸的 (rpJRwjDA 11/11/03 07:12)
: 无名氏: 文字辨识英文的话到还好，如果你要做中文的。我想你会做到死..........
: (aOLUs/V6 11/11/03 10:36)
: 无名氏: 中文光是常用的字，少说有5千字....... (aOLUs/V6 11/11/03 10:37)
: 无名氏: 不然就是要找人家做好的来套用了 (aOLUs/V6 11/11/03 10:38)
: 无标题名称: 无名氏 [11/11/03(四)01:01 ID:jIVsifTM] No.6783 推
: 虽然我对OCR不熟，不过这个东西的确就是你的方向。
: 类似的应该还有车牌辨识/CAPTCHA破解之类的。
: 提到CAPTCHA破解我倒记得有一个很有趣的例子，
: 使用JavaScript实作类神经网络来破验证码。
: http://ejohn.org/blog/ocr-and-neural-nets-in-javascript/
: 或许你也可以从这方面下手。
: 无标题名称: 无名氏 [11/11/03(四)07:36 ID:OK9R6lHk] No.6784 推
: http://www.google.com/insidesearch/searchbyimage.html
: 无标题名称: 无名氏 [11/11/03(四)16:56 ID:a.T6EASg] No.6786 推
: Google image search 是 content based 没错，但是和原 PO 的需求不同吧？
: ※ 引述《tonytonyjan (南洋大兜虫)》之铭言：
: : 有鉴于在像 komica 这类的讨论版或论坛
: : 回复时都夹带图片，而图片上常常会有字幕或者是漫画角色的台词，笑果十足
: : 但是要蒐集这些东西其实很累，于是我有个 idea：
: : 我打算实做一个 content based image search engine
: : 对图片上的文字，经过辨识之后做 indexing
: : 如此只要把想要的话输入进去，就可以找到任何相关动漫或电影台词的引用图片
: : （我 google 老半天发现这世界好像还没有这样的搜寻引擎，让我更想做了）
: : 我有IR背景知识，但对于图形辨识完全不得其门而入
: : 希望在图形辨识上有经验的人可以给我一些指引
: : 我目前试过 tesseract, gocr
: : 不过经过测试我发现他们似乎主力在“文件”，对于卡通图片中的文字辨识能力薄弱
: : 问题：
: : 1. 对于我的需求，我要找得技术是 OCR 没错吧？或者我弄错关键字了？
: : 2. 如果关键字确实是 OCR，是否有其他适合辨识图画（非文件）的函式库？
: : 3. 接续 2，有什么推荐的书籍，可以学习如何实做一个 OCR system 呢？
: : 感激不尽^_^
: : PS.
: : 这是自娱专案，有兴趣参与的人也可来信 XD

作者: hilorrk (Cary) 2010-01-08 13:47:00

有神快拜

作者: PsMonkey (痞子军团团长) 2010-01-08 16:10:00

有神快拜

作者: tonytonyjan (南洋大兜虫) 2010-01-09 01:03:00

惊！原来你是 SIKULI 的作者，有神快拜！m()m

作者: xatier (一切重来就好了...) 2010-01-09 01:10:00

V神！快拜！

作者: kewang (652公共汽车) 2010-01-10 12:47:00

有神快拜！！！

作者: frank99977 (hello) 2010-01-12 14:47:00

有神快拜!

作者: yudsx 2011-02-10 01:20:00

有神快拜!

作者: laiis (你今天集点了吗?) 2011-02-15 02:39:00

有神快拜!

继续阅读

[问题] 请问DreamCoder的GUI是用什么开发工具??evantw [问题] SA&D的模组化与OO的类别差异vity Re: [问题] OCR（光学辨识）推荐书籍或函式库tonytonyjan [问题] OCR（光学辨识）推荐书籍或函式库tonytonyjan Fw: [问题] H.264 intra predictioncypher [问题] 中文语音辨识台湾有哪些研究单位？yoco315 [请益] 质数发现规律了，它如何进化电脑的世界？arrow552299 [问题] clustered systems与distributed syste …hans0406 Re: [问题] Agile development 和 Rapid applicati …reader [问题] Agile development 和 Rapid application developmentvity