[问题] OCR（光学辨识）推荐书籍或函式库 tonytonyjan PTT批踢踢实业坊

[问题] OCR（光学辨识）推荐书籍或函式库

楼主: tonytonyjan (南洋大兜虫) 2011-11-02 22:21:14

有鉴于在像 komica 这类的讨论版或论坛
回复时都夹带图片，而图片上常常会有字幕或者是漫画角色的台词，笑果十足
但是要蒐集这些东西其实很累，于是我有个 idea：
我打算实做一个 content based image search engine
对图片上的文字，经过辨识之后做 indexing
如此只要把想要的话输入进去，就可以找到任何相关动漫或电影台词的引用图片
（我 google 老半天发现这世界好像还没有这样的搜寻引擎，让我更想做了）
我有IR背景知识，但对于图形辨识完全不得其门而入
希望在图形辨识上有经验的人可以给我一些指引
我目前试过 tesseract, gocr
不过经过测试我发现他们似乎主力在“文件”，对于卡通图片中的文字辨识能力薄弱
问题：
1. 对于我的需求，我要找得技术是 OCR 没错吧？或者我弄错关键字了？
2. 如果关键字确实是 OCR，是否有其他适合辨识图画（非文件）的函式库？
3. 接续 2，有什么推荐的书籍，可以学习如何实做一个 OCR system 呢？
感激不尽^_^
PS.
这是自娱专案，有兴趣参与的人也可来信 XD

作者: kewang (652公共汽车) 2010-01-02 22:55:00

还蛮有趣的，要不要试试MODI这个library，不过要安装OFFICE

楼主: tonytonyjan (南洋大兜虫) 2010-01-02 23:01:00

但我要跑在 UN*X Server上耶，这样 MODI 没问题吗

作者: hilorrk (Cary) 2010-01-03 01:03:00

关键字：字幕辨识/撷取..

继续阅读

Fw: [问题] H.264 intra predictioncypher [问题] 中文语音辨识台湾有哪些研究单位？yoco315 [请益] 质数发现规律了，它如何进化电脑的世界？arrow552299 [问题] clustered systems与distributed syste …hans0406 Re: [问题] Agile development 和 Rapid applicati …reader [问题] Agile development 和 Rapid application developmentvity [问题] 请问Labview机率..b9722074 Re: [问题] 怎样的class diagram才算好呢？jiaan Re: [问题] P=NP是什么？LPH66 [问题] P=NP是什么？mabus