[新闻] 用中文跟Google助理自然聊天 研究员:

楼主: rhino0314 (鬼岛梦想家)   2018-05-13 21:38:42
用中文跟Google助理自然聊天 研究员:还得再等等
Google从语音输入、搜寻开始,到语音助理Google Assistant已发展多时,今年Google
I/O开发者大会上更宣布将支援超过30国语言、在80个国家服务,同时也由Google执行长
皮采(Sundar Pichai)展示新功能“Duplex”,像是为用户拨打电话订餐厅、预约剪发
等,如同人类般的聊天功力及节奏是这次Google Assistant的亮点之一,不过,在功能越
发强大的同时,还是得问“那中文呢?”,目前看来要做到与Google Assistant自然的聊
天还是没办法。
专攻自然语音处理(Natural Language Processing,让电脑更懂人类语言)的Google研
究员宋云轩,与台湾媒体分享中文对Google Assistant带来的挑战。宋云轩表示,语音辨
识技术发展已近30年,Google很强调自然语言(口语)处理,而要让Google Assistant组
织起语言,需先辨读大量的声音及语言资讯,自然地以中文与它聊天之所以难,或对自然
语言翻译最具挑战的地方是断词断句、词汇顺序及语调。
第一,没有明显的“断词”,比如:我们在野生动物园玩,可以有“我们 在 野生 动物
园 玩”及“我们 在野 生动 物园 玩”两种辨读,另外,不同标点符号的位置也会有不
同意思,毕竟我们在讲话不会特别说出标点符号,但声音讯号在给AI分析后,还需要特别
做出断句(Sentence Segmentation)。
前后文改动顺序也会有不同意思,拿Google翻译来说“他昨天睡很晚
He woke up late yesterday”就与“他昨天很晚睡He went to bed late yesterday”,
在来是语调,普通话有4种语调(4声)、而广东则有9种,像是“我要睡觉”跟“我要水
饺”对AI来说就有辨识上的难度,更别说是方言与腔调了。
宋云轩指出,Google近来投入深度学习及神经网络的应用,由工程师写出深度学习的模组
,以训练分析中文没有很严谨的句子结构,不过,利用深度学习已经大有改善(有别于将
每个句子转为数字、深度学习能够直接对声音进行处理),句子辨识的错误率降低了
15~20%。
至于何时才能跟Google Assistant聊天、或使用到Duplex的技术,宋云轩表示进展还无法
透露,而在韩语Google Assistant推出后,也让人担心中文的发展进度,会不会是因为“
数据库不足”造成开发缓慢,宋云轩表示这并非最大因素。目前中文Google Assistant可
以做到语音搜寻、但还不能聊天,Command不等于Search,毕竟Search只是将你句子的重
要词汇抓出来丢到数据库搜寻而已,Google Assistant要能与你进行自然语言的交流,首
先还是得完整了解你的需求,对于“世界最难语言”之一的中文,Google还是有段长路要
走。(廖家葆/旧金山报导)
https://tw.appledaily.com/new/realtime/20180511/1351674/
作者: kuninaka   2018-05-13 21:40:00
鹿港腔OK吗
作者: Superxixai (洪粉吱已)   2018-05-13 21:41:00
海口腔可以吗
作者: orangeon11 (11)   2018-05-13 21:43:00
疗色吗
作者: XOXOXOXO (阿良)   2018-05-13 21:45:00
可以让肥宅练习亏妹吗
作者: jetaime851 (jetaime)   2018-05-13 21:47:00
我男

Links booklink

Contact Us: admin [ a t ] ucptt.com