[问题] google ocr api的辨识问题

楼主: be00148 (ThirtyCentimeter)   2022-06-23 14:25:35
一直以来都有使用google cloud vision的api来帮我做图片辨识
但是最近常会发生 段落乱跳的问题
让我无法依据过去经验撷取我要的文字
例如一本书的辨识
过去会一行一行辨识下来
标题
内文
页码
但是现在可能会由左至右 的方式
可能变成
标题
页码 (因为页码在最左边)
内容
不晓得是不是有什么参数可以去调整?
还是我必须将图片的背景改成单一颜色,让他不会乱区分段落?
感谢
作者: papple23g (逆道者)   2022-06-24 01:02:00
辨识结果有附文字框座标 可以用 相对位置+正则表达式判断 来决定读字的顺序

Links booklink

Contact Us: admin [ a t ] ucptt.com