[新闻] Google对话式AI有望支援台语 盼携手本土学者

楼主: CCY0927 (只是个暱称罢了)   2023-08-16 22:57:23
https://www.cna.com.tw/news/ait/202308160338.aspx
Google对话式AI有望支援台语 盼携手本土学者
2023/8/16 20:17(8/16 22:16 更新)
https://i.imgur.com/2R9XKiu.png
Google杰出科学家纪怀新目前在Google总部DeepMind团队,带领大型语言模型研究与对话
式人工智能(AI)Bard开发。他16日出席媒体聚会,分享Google针对大型语言模型技术研
究与应用的发展概况。中央社记者吴家豪摄 112年8月16日
(中央社记者吴家豪台北16日电)Google对话式人工智能(AI)服务Bard今年7月扩大支
援包含繁体中文在内的40种语言,Google今天表示,Bard未来有机会支援台语,但台语属
于低资源语言,较难蒐集相关数据,Google有意愿与台湾本土学者合作克服困难。
Google今天由杰出科学家(Distinguished Scientist)纪怀新出席媒体聚会,分享
Google针对大型语言模型技术研究与应用的发展概况。纪怀新来自台湾、目前在总部
Google DeepMind团队,带领大型语言模型(LLM)研究与Bard开发工作。
他说,大型语言模型的发展变革仍在早期阶段,它会大幅改变人们与AI互动的方式,为生
活带来显著改变。Google发表Bard,并非因为已经是完整的产品,Bard更像是实验性质的
产品,Google希望了解用户对它的期望。
中央社记者提问,未来Bard是否有机会支援台语、客语等台湾本土语言;纪怀新回应,在
自然语言学术研究上,数据蒐集是相当困难的问题,尤其是低资源语言(low-resource
languages),连Google这么大的公司,想蒐集相关资料都很困难。
纪怀新说,在全球不同地区,可能已经有当地学者在蒐集当地语言相关资料,如果Google
自行蒐集数据,品质不见得比当地学者更好。台湾学术机构例如中央研究院,对本土语言
的研究相当重视,Google有意愿与台湾学者合作,克服相关困难。
纪怀新提到,台湾人才以往较注重硬件制造,1980、1990年代很多人才到国外学习新技术
带回台湾,奠定台湾制造业在国际的领先地位。
他说,Google目前策略是兼顾硬件和软件,台湾在AI和机器学习的发展上具有很大潜力,
现在是好时机走向新局面,包括台语和客语研究都是Google与台湾学者可以合作的机会。
谈到这次回台湾想做的事,纪怀新笑说,自己大约一年没回来,希望多吃一点台湾美食、
与Google台湾员工交流。他看好台湾在AI方面有发展潜力,希望能花一些时间为台湾做出
贡献。
从2013年起,纪怀新带领的团队为YouTube、Google新闻、广告、Google Play商店等产品
,带来超过720项改进。他著名的研究领域为网络和线上社群系统对使用者行为的影响,
并拥有39项专利和200多篇研究论文发表。(编辑:张良知)1120816
作者: medama ( )   2023-08-17 00:11:00
fb之前也有支援
作者: MilchFlasche (实践才能发光)   2023-08-17 08:57:00
FB那个后来有实际开放使用吗XD(当然是乐观其成)回应原文,投入资金和人力的话低资源语言也可很快变高资源语言啊。期待共享和合作了。
作者: Tahuiyuan (mata)   2023-08-18 08:21:00
不期不待,高机率变成厦门话版本。Google真那么有本事,就不会拿中国数据库当作Google翻译中文版标准资料,正确做法是以信、雅、达且较复杂的台湾繁体及用语为准,由繁驭简,才能兼顾繁简。
作者: medama ( )   2023-08-18 08:56:00
厦门话语料没有台湾多吧fb之前的闽南语翻译版也是以台湾腔闽南语为主
作者: MilchFlasche (实践才能发光)   2023-08-18 13:55:00
我做过几年的l10n in-house,我知影Google滥著zh-cn有可能是想欲省钱,阁嘛可能是主持者本成著毋是台湾出身个
作者: gmkuo (嗯嗯)   2023-08-18 14:14:00
干焦水饺馅橐个束个捎落去乌白搅包包咧,毋知的人拢讲好食GIGO
作者: saram (saram)   2023-08-18 20:54:00
振奋人心好消息.
作者: MilchFlasche (实践才能发光)   2023-08-20 08:03:00
因为人家已经聊开到Google翻译去了,当然不只关于语音资料。看别人在谈什么也看完整一点好吗
作者: saram (saram)   2023-08-20 19:43:00
我要的不只是翻译字词.要得是能输入语言为字词,也要按照输入麦克风语音或串流音档而翻成台文.就像中文的语音处理一样.你是地下爬的虫我则是天上飞的鹰.
作者: sodabubble (石の上にも三年)   2023-08-20 21:47:00
你要“输入麦克风语音”,你还打错字。要“的”是,连字都打不正确、选不正确的人……
作者: saram (saram)   2023-08-21 01:25:00
字与音是两个层次,但在最终(以线上翻译而言)两样会一起呈现如果完全不用汉字,以标音符号为字面也无碍于语音的判读.换言之语音词库的索引只是一个内码而已.先要建立所有台语词的音档库.它怎么写(图形档)都不重要.接电话时我们听到熟悉的语音就明白,不必再看文字.呈现的汉字就算你不满意,或根本是台罗字都无所谓.
作者: MilchFlasche (实践才能发光)   2023-08-21 07:37:00
继续扎稻草人好为人师啊。
作者: Tahuiyuan (mata)   2023-08-21 09:58:00
讲啥…只要有了台语的优势语音,以IPA形式建档到足以提供TTS服务,再参考人类语言的同位异音模型,就可以建立台语的初版语音输入法,再参考使用者的语音升级到能辨认各种腔调、口音或不标准发音,语音输入一般都是这样建立起来的。

Links booklink

Contact Us: admin [ a t ] ucptt.com