楼主:
roberchu (泽泽吃炸鸡)
2018-09-12 20:51:391.原文连结:
https://goo.gl/S3MEby
2.原文内容:
不少网站防止 BOT 攻击的机制采用 CAPTCHA,要你辨识图像中的数字与文字,从而分辨
人类与 BOT。但你知道吗,这些人类顺手之劳的打打字小工作,不少次是帮助 Google 地
图做机器学习,辨识街景中出现的门牌与路名。
即便像 Google 这类大量依靠机器学习的公司,仍有不少地方要靠人工去做,要靠大量的
人力协助辨识门牌、路名区块中,里面出现的数字或是文字。Google 地图软件工程师 An
drew Lookingbill 表示,不只是 Google 地图采用机器学习的问题,这是整体机器学习
技术领域遇到的挑战。长远的目标会是减少涉入的人力,但又不会破坏建立的模型,仍然
能用既有模型去跑。
Lookingbill 说采用深度学习处理电脑视觉板题,是相当高难度的事情,街景车每天上街
拍摄的照片数量相当庞大,但仍然需要有方式处理。一般人很快就能辨识出门牌及街上路
牌上的路名,用深度学习则是挑战。Google 地图采用递归神经网络 (recurrent neural
network, RNN),找出街景车拍摄的照片,辨识不同角度照片中出现的路牌资讯,从中截
取需要的路名或是门牌资讯。
https://i.imgur.com/7KmJJC4.jpg
商家的店面入口除了店名之外,还有贩售产品资讯、特价优惠等文字。上述资讯也许当地
人能找出店家叫什么,但对于机器来说,以及远在天边并不是当地人,训练 AI 的工程师
来说,是相当有挑战性的事情。Google 地图团队运用注意力机制 (Attention Mechanism
),从街景车拍摄的店面,找出人类视觉集中之处,从而判断店家店名。
https://i.imgur.com/0Oorp9a.jpg
路名常用缩写表示,而对当地人来说,很容易还原完整的路名。Lookingbill 说他们会对
路名做规范化 (Normalization) 工作,处理路名中的缩写,像是 Av. 代表 Avene,Pres
. 则是 President 的缩写。
https://i.imgur.com/hdrSiW9.jpg
Lookingbill 还提及 Google 地图整合经机器学习方式绘制的 1.1 亿栋建筑外框,补充
说道没有限制在全球某个地方,而是看那个地方影像适合他们模型,能得到最好的结果。
https://i.imgur.com/O4IZWDS.jpg
https://i.imgur.com/GXdNz26.jpg
Google 街景车当初推出是相当大的噱头,但如今是喂养 Google 机器学习模型的庞大资
料。当被问到街景影像以及卫星图辨识的问题,Lookingbill 说影像如有遮荫,会增加辨
识建筑物的困难度。
Lookingbill 谈到用机器学习处理地图资讯,技术本身是其次,而是要怎么将不断变动的
现实世界,相关变动反映到地图,而且尽可能缩短地图资料处理时间。更快速的反映现实
变化的地图,Lookingbill 说这是他们的团队一直在努力的方向。
3.心得/评论:
目前Google致力于AI发展,虽然还没有到很成熟,但是Google手握资金和技术,未来也是
会是AI界的霸主。
尤其Google又是一间有垄断性的公司,其他公司很难超越它,或者直接被它买下,未来最
强大的公司,没有之一。