https://www.chinatimes.com/newspapers/20221028000240-260204?chdtv
Meta英翻台 全靠闽南语剧
04:10 2022/10/28 工商时报 何英炜
https://images.chinatimes.com/newsphoto/2022-10-28/1024/A13A00_P_02_01.jpg
Meta AI软件工程师陈鹏仁,是该公司UST部门的主要研发人员,负责语音对语音即时翻译
,第一个成功做出来的语系为闽南语。来自台湾的他,也透过闽南语的绘本,教小孩熟悉
闽南语。图/业者提供
Meta上周发表AI技术支援非书写语音翻译系统,首先推出的是闽南语系。负责这项开发专
案的AI软件工程师陈鹏仁来自台湾。26日晚间陈鹏仁接受越洋访问时表示,此次语言资料
库来源靠的是台湾闽南语连续剧,这研发过程中,也获得台大教授李弘毅及阳明交通大学
廖元甫教授实验室的鼎力相助。
陈鹏仁表示,现在所有的语言翻译都是以文字为基础,Meta是第一个实践语音直接翻译成
语言的公司。而这也与Meta的目标一致,希望未来在元宇宙时代,大家即时互动时,可以
直接用语言交谈,即使是不同语言及语系,可以直接翻译,不需要透过文字。
Meta负责语音对语音即时翻译的团队为Universal Speech Translator(UST,通用语音翻
译工具),在做出闽南语系的语音翻译后,陈鹏仁表示,未来的目标将希望语音翻译更精
准、更顺畅、更即时,延迟时间更缩短。
谈到研发的困难,他表示“最困难的是资料的蒐集”,没有文字书写的语言,通常是资源
匮乏的语言,也没有足够的资料以供机器训练和学习。尤其是闽南语的七声八调,特定语
气代表不同意义,是非常不容易的事情。
陈鹏仁表示,研发过程中,获得许多人的帮助,例如台大的李宏毅教授及阳明交通大学的
廖元甫教授,均将研究室语音数据库提供给Meta,而来自台湾的闽南语连续剧,也成为资
料库重要的来源。
至于接下来还会考虑什么样的语系,陈鹏仁说,目前尚未定案,但是客语及原住民语言都
是考虑范围内。目前Meta的语音对语音翻译还属于研发及实验阶段,商业化时间点预计在
2~5年后。
Meta创办人兼执行长祖克柏(Mark Zuckerberg)上周与陈鹏仁在脸书上秀出一段英语与
闽南语对谈的即时翻译影片,该影片获19万人按赞,并有184万人看过。
陈鹏仁表示,该影片上线后,的确收到很多询问,像是他开民宿的伯父就问他那里可以买
得到吗?因为当有外国客人投宿时,此系统将可帮助彼此沟通顺畅。
#语系 #语言 #研发 #教授 #资料