公司有一个OCR 专案是以Google Vision API 认字然后用Regex 处理
以前API 回传的字都有顺序,如下图
http://i.imgur.com/ThAIHlL.jpg
清单左边的项目对应其数量
回传结果就是项目后方数字就是它的数量,要找到其正确数量用regex 轻易办到,成功率也有70~80%
可是一个礼拜前突然跌到20%,排查结论就是Vision API 回传的顺序不一样了
如下图
http://i.imgur.com/mYgZkte.jpg
项目和数字分两组上下分组一堆,而且各自的顺序还不一样,用Regex 已经不可能做到了,最后决定重写改以座标找数字
有用Vision API 的前辈最近有发现什么异样吗?