有鉴于在像 komica 这类的讨论版或论坛
回复时都夹带图片,而图片上常常会有字幕或者是漫画角色的台词,笑果十足
但是要蒐集这些东西其实很累,于是我有个 idea:
我打算实做一个 content based image search engine
对图片上的文字,经过辨识之后做 indexing
如此只要把想要的话输入进去,就可以找到任何相关动漫或电影台词的引用图片
(我 google 老半天发现这世界好像还没有这样的搜寻引擎,让我更想做了)
我有IR背景知识,但对于图形辨识完全不得其门而入
希望在图形辨识上有经验的人可以给我一些指引
我目前试过 tesseract, gocr
不过经过测试我发现他们似乎主力在“文件”,对于卡通图片中的文字辨识能力薄弱
问题:
1. 对于我的需求,我要找得技术是 OCR 没错吧?或者我弄错关键字了?
2. 如果关键字确实是 OCR,是否有其他适合辨识图画(非文件)的函式库?
3. 接续 2,有什么推荐的书籍,可以学习如何实做一个 OCR system 呢?
感激不尽^_^
PS.
这是自娱专案,有兴趣参与的人也可来信 XD