[问题] OCR(光学辨识)推荐书籍或函式库

楼主: tonytonyjan (南洋大兜虫)   2011-11-02 22:21:14
有鉴于在像 komica 这类的讨论版或论坛
回复时都夹带图片,而图片上常常会有字幕或者是漫画角色的台词,笑果十足
但是要蒐集这些东西其实很累,于是我有个 idea:
我打算实做一个 content based image search engine
对图片上的文字,经过辨识之后做 indexing
如此只要把想要的话输入进去,就可以找到任何相关动漫或电影台词的引用图片
(我 google 老半天发现这世界好像还没有这样的搜寻引擎,让我更想做了)
我有IR背景知识,但对于图形辨识完全不得其门而入
希望在图形辨识上有经验的人可以给我一些指引
我目前试过 tesseract, gocr
不过经过测试我发现他们似乎主力在“文件”,对于卡通图片中的文字辨识能力薄弱
问题:
1. 对于我的需求,我要找得技术是 OCR 没错吧?或者我弄错关键字了?
2. 如果关键字确实是 OCR,是否有其他适合辨识图画(非文件)的函式库?
3. 接续 2,有什么推荐的书籍,可以学习如何实做一个 OCR system 呢?
感激不尽^_^
PS.
这是自娱专案,有兴趣参与的人也可来信 XD
作者: kewang (652公共汽车)   2010-01-02 22:55:00
还蛮有趣的,要不要试试MODI这个library,不过要安装OFFICE
楼主: tonytonyjan (南洋大兜虫)   2010-01-02 23:01:00
但我要跑在 UN*X Server上耶,这样 MODI 没问题吗
作者: hilorrk (Cary)   2010-01-03 01:03:00
关键字:字幕辨识/撷取..

Links booklink

Contact Us: admin [ a t ] ucptt.com