[新闻] 我们就是机器人的大脑──知识工程师

楼主: laimiesteri (Laimi)   2018-01-16 14:51:56
【酷到掉下巴】我们就是机器人的大脑──知识工程师
http://www.cheers.com.tw/blog/blogTopic.action?id=831&nid=9161
“我们就是机器人的大脑。”
这句话充满自信,但讲话的不是IT工程师,反而是一群文科背景的“知识工程师”。如何
让机器人听得懂人类语言?他们可得担负起打造电影《钢铁人》中智慧管家Jarvis的重责
大任!
“台北市2017年11月30日,白天天气预报是多云时阴短暂雨,温度区间是21度到23度,”
对着自然语意人工智能服务机器人“小智”,询问“今天温度几度”,“小智”随即依照
所处的地点,精准地回报台北市大安区的天气概况。
“小智”不只懂天气,它还能告诉你两天的下午3点后,从台北到苗栗最快的高铁车次,
及当日美金现钞汇率最佳的银行。虽然回答速度仍不若真人流畅,但它“听得进”问题,
还能一字一句“说出”答案,身高130公分的“小智”,靠的是它在水汪汪的蓝色眼珠下
,拥有听说能力的大脑。
负责让“小智”能即时反应和思考的背后的一大推手,是“知识工程师”。
创立“知识工程师”职位的经纬航太科技公司董事长罗正方笑着解释,“知识工程师”不
是程式设计师或工程师,反而是一群有语言学、语意学、认知学或法律系背景的文科生。
而他们的任务很简单:建置语意分析及语意知识数据库,让机器人可以在“自然语言处理
”(NLP)领域理解问题、回答正确答案,无论问天气、汇率或餐厅,都能准确答复;甚
至有朝一日能进展至电影《云端情人》中,虚拟机器人拥有与男主角谈情说爱的能力。
就算是人与人当面沟通,都可能因为彼此对一句话、一个字的理解不同产生误会。专长看
来和科技不直接相关的知识工程师,如何在科技公司让AI变得更聪明?
语言学硕士生勇敢踏进科技领域
踏进经纬航太的办公室,几位“知识工程师”就像一般上班族一样,坐在座位上细心地优
化机器人语料库。每做一次改善,都会让让静静站在角落的“小智”,拥有更聪明的脑袋

“我们是机器人的大脑啊!”1990年次的政治大学语言学研究所硕士毕业生林欣莹热切地
说,就像想把对语言的热情,一股脑地全部灌注给“小智”。
林欣莹说,她在求学做研究时,就曾学习计算机语言学,了解简单的程式语言概念。不过
,语言学硕士生的就业走向不是当教师就是攻读博士,怎么也没想过毕业后会加入科技公
司。
“当初找工作时,老师建议我上网搜寻‘机器人+语料分析’,于是看到知识工程师的职
务。投履历后,和董事长面试的过程,也很特别,”林欣莹回想2016年和罗正方面试时,
谈的不是艰涩的科技,反而被问到近期阅读的小说及电影,从电影《云端情人》聊到日本
作家东野圭吾。
谈起这段过程,罗正方哈哈大笑地解释,他希望确定面试者是“图像式”或“学识型”思
考者,理解对方看待世界的方式,甚至在文字运用上,有没有办法解构小说引人入胜的结
构。
这项能力,其实就是知识工程师特别需要的“文字敏感度”。优秀的知识工程师,必须透
过语料分析,以科学方式进行逻辑分析,才能建置逻辑清晰、文字语言合宜的通用数据库

林欣莹从语言学硕士摇身成为知识工程师后,推荐政大语言所的同学许馨云加入,加上辅
仁大学语言学研究所硕士夏梵瑀,这几位有语言分析专长的女性文科生,就在本来以男性
为主的科技公司中,与开发工程师合作,担纲起建置机器人大脑的重任。
沟通力成就知识工程师专业
许馨云开启机器人语料管理的云端后台,在萤幕键入天气、路况、金融等用语,解释如何
将语意知识灌输进机器的“大脑”,让机器人接收问题后,懂得产出合宜的答案。
除了通用类的机器人语料库,她们还需要因应银行、旅馆或百货业客户,建置客制化资料
库。各领域使用的术语不同,知识工程师就得从客户提供的素材中,不断“合并”或“拆
分”,整理出有逻辑的问题及答案,才能让机器人上场时,可以即时答复。
林欣莹说,很多客户给的问与答素材,没有正确逻辑,她们就得挑出逻辑,说服客户使用
。例如询问天气预报的方法包括:
“明天天气好吗?”
“明天温度几度?”
“需要带雨伞吗?”
“明天太阳大吗?”
在语言逻辑中,4个问句“意图”相同,都是导向回答天气预报,但很多客户希望4种问句
就有4种答案,林欣莹得将问题化繁为简地“合并”为同一个答案,才能避免用户询问机
器人时,问句不对,就得不到正确解答。
另外,知识工程师也要懂得根据不同情境,“拆分”答案给不同的题目。
例如顾客到银行发问:“我要存台币”
银行客户却设定机器人回答:“存台币外请至1号柜台,存外币请至2号柜台,基金请至3
号柜台……。”
这就显得“鸡同鸭讲”,此时,知识工程师就得说服客户,将3种答案拆分给3个正确对应
的题目。
“她们每天都在与人沟通,而且真的很多人、很多人、很多人,”负责带领知识工程师团
队的经纬航太人工智能应用部经理吴鸿谦忍不住用了3次惊叹语气,反映出她们不能只和
冷冰冰的电脑对话,还得耗费许多时间与开发工程师及客户沟通,才能打造出最精准的资
料库。
每天忙于打电话、发邮件或至开会沟通进度,知识工程师早就习以为常,但谈起遇到同一
个厂商因为立场不同、理解落差,提问相同问题超过百次的经验,林欣莹和许馨云忍不住
相视而笑。那次沟通简直像在拔河比赛中,双方坚持不下,咬著牙又不能认输般让人“刻
骨铭心”的回忆。
许馨云说,有一次制作客制化语意数据库时,需由厂商提供机器人以萤幕文字回答的语意
资料,或适合靠纯语音答复的资料。但因合作过程中,厂商设定过程有误,屡次出现文字
及语音同时出现、乱码等程式错误。
“同一个问题真的花了非常久时间沟通,”许馨云口气无奈地说,协调过程中,原以为是
客户内部团队沟通不佳,却屡屡发生同一个人询问同一个问题,或同团队不同成员询问相
同疑问的状况,“一件事回答了不下10次。”
“不下百次!”林欣莹在旁边抢话补充,显然对这次经验印象深刻。更反映出称职的知识
工程师,不但需要对人有强大的沟通力,更需要耐心。不管面对再冗长的沟通流程,林欣
莹拉高音量笑说:“都不能放弃,如果放弃,我们就输了。”
一面得“搞定”客户,另一面要调教出在人工智能日趋成熟的环境下,最“接地气”的机
器人语料知识库,并提供最好的人机对话接口,与朝夕相处的工程师培养好默契也很重要

许馨云笑称,“隔行如隔山”,彼此使用的术语不同,双方就会“鸭子听雷”。例如,她
曾与工程师沟通工作进度时,被工程师回以“你在说中文吗?”的疑惑表情,让她觉得好
气又好笑。但历经1年多磨合期,语言学文科生也能逐渐找到与理工科工程师沟通合作的
默契。
“学习能力很重要,”林欣莹表示,在这个光速时代,每天都有新的语言产生,每天都是
挑战;如果不能勇于面对这些不断诞生的新事物,就会成为知识工程师与IT工程师在共事
时,要联手达成目标的阻碍。
人机协同的时代,知识工程师在机器深度学习跨入语音辨识领域时,拥有高度价值。“知
识工程师的起薪跟IT工程师差不多,”罗正方大方地透露。而当“很爽”、“开心”、“
狂喜”等语言中的情绪表达也能量化,年轻人流行语或新兴的网络词汇都能逐步加入机器
人语料库内时,机器会变得更有“人味”,人机互动时也更有趣味。
国际研究暨顾问机构顾能(Gartner)研究指出,2020年将有180万个职位被人工智能取代
,但同时,人工智能也会创造出230万个工作机会。知识工程师一职的诞生,正代表各种
背景的“人”,在这个新时代中都充满无限可能。
作者: opengaydoor (开甲门)   2018-01-16 15:34:00
好奇+1
作者: Iceballz (无糖无热量)   2018-01-16 15:54:00
我们就是机器人的老二 新机器人都是我们做出来的
作者: allenxxx (fufuxxx)   2018-01-16 16:20:00
老板:问题是没大脑的东西不用钱!
作者: npsi   2018-01-16 16:25:00
很合理啊 术业有专攻
作者: zzzz8931 (肥宅)   2018-01-16 16:28:00
名字快被取光了 (X)
作者: ctct0513 (00)   2018-01-16 16:36:00
姿势攻城狮
作者: svmaXk (SvMax)   2018-01-16 17:21:00
杂务跑腿工程师
作者: belatrixluci (阿中)   2018-01-16 17:22:00
询问小智:你什么时候拿联盟冠军?
作者: qoo60606 (凛)   2018-01-16 18:01:00
文组工程师
作者: drajan (EasoN)   2018-01-16 19:32:00
还以为是建造知识图谱knowledge graph的工程师
作者: viger (疯狂米哥)   2018-01-16 19:38:00
让文组发挥所长很好啊很棒啊
作者: sweettin (冲冲冲。)   2018-01-16 21:23:00
嘴砲工程师
作者: havanabay (Havana)   2018-01-16 21:43:00
这在NLP领域很常见 讲白了就是做标记
作者: Gwdz (梅川伊服)   2018-01-16 22:16:00
通称为label工程师
作者: iwami (吃)   2018-01-16 22:45:00
好奇薪水高吗?
楼主: laimiesteri (Laimi)   2018-01-16 23:05:00
梦到去面试过的人说新人起薪35k......
作者: iam066 (垂钓梦想的男人)   2018-01-17 01:18:00
这种比影像标记还难吧 推一个
作者: rodndy666 (今暗帕榔球)   2018-01-17 01:35:00
label工程师
作者: leonEEman (EE)   2018-01-17 09:46:00
工程师大泛滥时代
作者: s0930194 (航海之家)   2018-01-17 10:13:00
老板:我不管!给我做出来就对了![有钱还需要脑?]
作者: chencjj (神骨鸡好好吃)   2018-01-17 16:10:00
火箭队
作者: jeff94lee (Todd)   2018-01-18 15:16:00
机器人要能识别人类这种模糊的用语的确需要文科的人才协助
作者: RS512 (flying)   2018-01-18 18:19:00
我还以为是奇摩知识家咧
作者: marges (JO)   2018-01-18 18:35:00
知识工程师说高级一点就是高级打字员
作者: lspci (awk sed echo)   2018-01-18 21:55:00
所以机器人还是厂商做的呀干

Links booklink

Contact Us: admin [ a t ] ucptt.com