[新闻] Google：即使用了机器学习仍有人力帮忙制 roberchu PTT批踢踢实业坊

[新闻] Google：即使用了机器学习仍有人力帮忙制

楼主: roberchu (泽泽吃炸鸡) 2018-09-12 20:51:39

1.原文连结：
https://goo.gl/S3MEby
2.原文内容：
不少网站防止 BOT 攻击的机制采用 CAPTCHA，要你辨识图像中的数字与文字，从而分辨
人类与 BOT。但你知道吗，这些人类顺手之劳的打打字小工作，不少次是帮助 Google 地
图做机器学习，辨识街景中出现的门牌与路名。
即便像 Google 这类大量依靠机器学习的公司，仍有不少地方要靠人工去做，要靠大量的
人力协助辨识门牌、路名区块中，里面出现的数字或是文字。Google 地图软件工程师 An
drew Lookingbill 表示，不只是 Google 地图采用机器学习的问题，这是整体机器学习
技术领域遇到的挑战。长远的目标会是减少涉入的人力，但又不会破坏建立的模型，仍然
能用既有模型去跑。
Lookingbill 说采用深度学习处理电脑视觉板题，是相当高难度的事情，街景车每天上街
拍摄的照片数量相当庞大，但仍然需要有方式处理。一般人很快就能辨识出门牌及街上路
牌上的路名，用深度学习则是挑战。Google 地图采用递归神经网络 (recurrent neural
network, RNN)，找出街景车拍摄的照片，辨识不同角度照片中出现的路牌资讯，从中截
取需要的路名或是门牌资讯。
https://i.imgur.com/7KmJJC4.jpg
商家的店面入口除了店名之外，还有贩售产品资讯、特价优惠等文字。上述资讯也许当地
人能找出店家叫什么，但对于机器来说，以及远在天边并不是当地人，训练 AI 的工程师
来说，是相当有挑战性的事情。Google 地图团队运用注意力机制 (Attention Mechanism
)，从街景车拍摄的店面，找出人类视觉集中之处，从而判断店家店名。
https://i.imgur.com/0Oorp9a.jpg
路名常用缩写表示，而对当地人来说，很容易还原完整的路名。Lookingbill 说他们会对
路名做规范化 (Normalization) 工作，处理路名中的缩写，像是 Av. 代表 Avene，Pres
. 则是 President 的缩写。
https://i.imgur.com/hdrSiW9.jpg
Lookingbill 还提及 Google 地图整合经机器学习方式绘制的 1.1 亿栋建筑外框，补充
说道没有限制在全球某个地方，而是看那个地方影像适合他们模型，能得到最好的结果。
https://i.imgur.com/O4IZWDS.jpg
https://i.imgur.com/GXdNz26.jpg
Google 街景车当初推出是相当大的噱头，但如今是喂养 Google 机器学习模型的庞大资
料。当被问到街景影像以及卫星图辨识的问题，Lookingbill 说影像如有遮荫，会增加辨
识建筑物的困难度。
Lookingbill 谈到用机器学习处理地图资讯，技术本身是其次，而是要怎么将不断变动的
现实世界，相关变动反映到地图，而且尽可能缩短地图资料处理时间。更快速的反映现实
变化的地图，Lookingbill 说这是他们的团队一直在努力的方向。
3.心得/评论：
目前Google致力于AI发展，虽然还没有到很成熟，但是Google手握资金和技术，未来也是
会是AI界的霸主。
尤其Google又是一间有垄断性的公司，其他公司很难超越它，或者直接被它买下，未来最
强大的公司，没有之一。

作者: Alwen (凤梨) 2018-09-12 20:52:00

我只知道他们说的AI跟平民民众想像的AI是不同东西

作者: SweetLee (äººç”Ÿå¦‚æˆ²) 2018-09-12 20:59:00

难怪我有时候打错也会过关真是害到了那些学习的机器了抱歉

作者: knives 2018-09-12 21:00:00

原来是工人智慧，还以为是AI咧

作者: SweetLee (äººç”Ÿå¦‚æˆ²) 2018-09-12 21:00:00

有些人是把图像辨识有包含在ai的一种的

作者: chengweiwei (维维) 2018-09-12 21:07:00

labelling总要有人做R

作者: cuttleufish (热带鱼) 2018-09-12 23:12:00

无人化是强AI 现在根本不可能完成

作者: mmnnoo (PP) 2018-09-12 23:47:00

图像办识目前很红啊… 大家本来就把目前的AI的领域搞错了，做了个会讲话的女机器人头就可以出来骗钱…

作者: Sylph (仙客来) 2018-09-13 11:36:00

CAPTCHA是最讨厌的东西之一

继续阅读

Re: [其他] 股版是不是反指标 m4vu0 [新闻] 贸易战延烧中共停批美企金融服务等牌照CLV518 [其他] 股版是不是反指标 a000209898 Re: [心得] test520之初级胜率论tonyrao Re: [标的] 台积电 2330sysc [新闻] 稳懋遭外资降评跌停拖累同族群CreditSuisse Re: [新闻] 台股融资追缴令出笼 (警世文)Saver20 [标的] 台积电(2330) 大立光 (3008) 鸿海 (2317)gdchess Re: [请益] 减资的金额会多久收到s5869157 [请益] 股市的真理是不是追高杀低froglilibon