[请益] 认得缩排的文字辨识?

楼主: dharma (達)   2019-09-05 23:44:09
https://imgur.com/BgG1h30
有些网络上的程式码范例
作者是用图片的方式
想偷懒的话
将程式码图片做文字辨识
可是像Google文件做的文字辨识
无法认得缩排,得自己慢慢调
且中英文混合时,中文部分的辨识很糟
请问像上图这种文字辨识
有做的比Google文件更好的吗?
可以认得缩排
thanks
作者: MOONY135 (谈无欲)   2019-09-05 23:49:00
google 影像转文字 app 不知道够不够用
作者: jennya (Jennya)   2019-09-05 23:50:00
我之前试用过多个线上服务或app的经验是,光英文和数字的OCR就已经很容易出错、中文的OCR更是几乎没有、缩排也是每家都没做。
作者: alog (A肉哥)   2019-09-05 23:58:00
印象大部分的OCR一开始在做预先处理时 空白的部分就被挑掉没有缩排很正常吧 目的是辨识字 缩排这个除非特别有针对特定状况下去写
作者: ripple0129 (perry tsai)   2019-09-06 00:01:00
先replace所有缩排为灨,文字辨识完再replace灨回空白XD
作者: alog (A肉哥)   2019-09-06 00:02:00
不过原po那个范例... 呃 那个字体双引号、注解内容XD、还有赋值一下有空白又没空白 这种code我直接略过.看不下去
作者: GGFACE (ggface)   2019-09-06 00:24:00
付一百块给你隔壁同事
作者: nevak (^o^)   2019-09-06 01:47:00
马上想到这个 https://ms-paint-i.de/
作者: vi000246 (Vi)   2019-09-06 02:00:00
你可以先抓出文字位置 算出空格 再一行一行辨识文字辨识完后把空格加上去
作者: doranako (真爱无限)   2019-09-06 09:21:00
要自己用影像辨识lib去做,可能不太有现成工具
作者: onlykevinpan (小潘)   2019-09-06 10:38:00
程式码自己抄一遍都比纯cp上去好啊

Links booklink

Contact Us: admin [ a t ] ucptt.com