[问题] 图片辨识输出文字

楼主: unknown (ya)   2019-06-06 02:11:46
目前有乘客文件可以扫描成PDF档案,想透过程式将身份字号转译成文字档,该透过什么方
法呢?
这方面有想过可能要透过智慧学习方式提高辨识度
作者: CCWck (干嘛要暱称)   2019-06-06 10:19:00
找ocr api
作者: wii8898333 (frf228898)   2019-06-06 12:54:00
orc辨识度太低怎么办呢
作者: Hsins (翔)   2019-06-06 15:09:00
找足够的 dataset 自己 train 一个问题就在于你有没有足够的 data 给他 train,还有你会不会train…
作者: hsnuyi (羊咩咩~)   2019-06-06 16:51:00
除非辨识率100% 不然到时候你还不是要人工比对一次? 身分证字号可以错喔?用时新找个工读抄写就好 要辨识做啥? 有比较省时便宜又正确?^时薪
作者: wahaha279 (哇哈哈:3)   2019-06-06 17:44:00
想玩机器学习先叫老板给资料 不然就是做不到
作者: ohcE0 (音回)   2019-06-06 20:27:00
身分证资料多少算是可以错的? 毕竟有验证码字段资料的话 应该已经算是很好自行产生的了
作者: vi000246 (Vi)   2019-06-06 23:06:00
手写还是印刷的字?
作者: wii8898333 (frf228898)   2019-06-07 06:37:00
印刷
作者: king22649   2019-06-07 07:17:00
印刷的 tesseract 就行了 画值不要太低的话
作者: art1 (人,原来不是人)   2019-06-07 16:02:00
买个专业的 OCR 软件来辨识比较实在一些
作者: MasterChang (我爱ASM)   2019-06-08 00:57:00
印刷的用tesseract去串接就好.....

Links booklink

Contact Us: admin [ a t ] ucptt.com