这问题要拆成两部分来看, 第一是text detection, 在任意图上找出文字的位置
第二是text recognition, 给定图和文字区块的位置, 输出文字字串
第一个问题有很多种算法, 要看你图的性质而决定要用哪种
如果能知道文字的位置后, 接下来其实就比较简单,
因为第二个问题可以直接用现成的OCR引擎加上一些image processing来处理
最容易取得的OCR引擎是Tesseract, 3.0后还支援包含中文在内的多国语言
但如你所说, OCR引擎大多是假设图片是白底黑字的文件
所以直接把有复杂背景的图片丢进去是不行的
最简单的处理方法就是用一些影像处理的算法把背景去掉, 然后转成白底黑字的样子
这样再丢进OCR引擎的结果就会好很多
基本概念是这样, 关键字也都在上面了,
如果能看英文论文的话, 在google scholar能找到非常多资料
※ 引述《tonytonyjan (南洋大兜虫)》之铭言:
: 我把我的问题贴在 Komica 得到的回复贴在这里与大家分享:
: 无名氏: 这应该偏影像辨识的学门了 之前是有玩face Detection (rpJRwjDA 11/11/03
: 07:12)
: 无名氏: 不过那是辨识人脸的 (rpJRwjDA 11/11/03 07:12)
: 无名氏: 文字辨识英文的话到还好,如果你要做中文的。我想你会做到死..........
: (aOLUs/V6 11/11/03 10:36)
: 无名氏: 中文光是常用的字,少说有5千字....... (aOLUs/V6 11/11/03 10:37)
: 无名氏: 不然就是要找人家做好的来套用了 (aOLUs/V6 11/11/03 10:38)
: 无标题 名称: 无名氏 [11/11/03(四)01:01 ID:jIVsifTM] No.6783 推
: 虽然我对OCR不熟,不过这个东西的确就是你的方向。
: 类似的应该还有车牌辨识/CAPTCHA破解之类的。
: 提到CAPTCHA破解我倒记得有一个很有趣的例子,
: 使用JavaScript实作类神经网络来破验证码。
: http://ejohn.org/blog/ocr-and-neural-nets-in-javascript/
: 或许你也可以从这方面下手。
: 无标题 名称: 无名氏 [11/11/03(四)07:36 ID:OK9R6lHk] No.6784 推
: http://www.google.com/insidesearch/searchbyimage.html
: 无标题 名称: 无名氏 [11/11/03(四)16:56 ID:a.T6EASg] No.6786 推
: Google image search 是 content based 没错,但是和原 PO 的需求不同吧?
: ※ 引述《tonytonyjan (南洋大兜虫)》之铭言:
: : 有鉴于在像 komica 这类的讨论版或论坛
: : 回复时都夹带图片,而图片上常常会有字幕或者是漫画角色的台词,笑果十足
: : 但是要蒐集这些东西其实很累,于是我有个 idea:
: : 我打算实做一个 content based image search engine
: : 对图片上的文字,经过辨识之后做 indexing
: : 如此只要把想要的话输入进去,就可以找到任何相关动漫或电影台词的引用图片
: : (我 google 老半天发现这世界好像还没有这样的搜寻引擎,让我更想做了)
: : 我有IR背景知识,但对于图形辨识完全不得其门而入
: : 希望在图形辨识上有经验的人可以给我一些指引
: : 我目前试过 tesseract, gocr
: : 不过经过测试我发现他们似乎主力在“文件”,对于卡通图片中的文字辨识能力薄弱
: : 问题:
: : 1. 对于我的需求,我要找得技术是 OCR 没错吧?或者我弄错关键字了?
: : 2. 如果关键字确实是 OCR,是否有其他适合辨识图画(非文件)的函式库?
: : 3. 接续 2,有什么推荐的书籍,可以学习如何实做一个 OCR system 呢?
: : 感激不尽^_^
: : PS.
: : 这是自娱专案,有兴趣参与的人也可来信 XD