机器翻译问题几乎解决,科学家认为人力翻译走向尾声
https://technews.tw/2024/12/17/machine-translation-2/
科技新报 December 17, 2024 林妤柔
电脑科学家 Vasco Pedro 认为,尽管人工智能(AI)已经崛起,但机器要像专业翻译员一
样翻译语言,始终需要人的参与。但他看到翻译平台新创公司 Unbabel 举办比赛,针对公
司最新 AI 模型与人工翻译员进行比较,他发现人类在翻译濒临结束,目前全球翻译产业中
,人工约占 95%,但未来三年内人类参与度可能降至零。
70 多年前,第一次电脑翻译是使用一台 IBM 电脑,其程式被编入 250 个英语和俄语单字
以及六条语法规则。这种“以规则为基础”方法到了 1990 年代被基于处理大数据集的“统
计”方法取代,而 Google 在 2006 年推出以机器学习为基础的 Google 翻译(Google Tra
nslate),是当时最先进技术。但到 2016 年,Google 转用“神经”引擎,即大语言模型
(LLM)的前身时,这个领域开始出现爆炸性发展。
在 Unbabel 测试中,人类与机器译者被要求翻译各种内容,从随便的文字讯息到密集的法
律合约,还有马可.奥理略(Marcus Aurelius)所著《沉思录》旧译本中的古老英文。从
结果来说,Unbabel 的 AI 模组完全不落下风。
另据追踪翻译品质的 Multidimensional Quality Metrics(多维品质度量)框架衡量,如
果人类精通两种语言,同时是领域翻译专家(如处理合约的专业法律译者),人类表现会比
机器更好。但从现在看,Pedro 认为两三年后,很难想像机器不会完全超越人类。
罗马 Translated 老板 Marco Trombetti 创造一种不同的机器翻译品质测量方法,称为编
辑时间(TTE),这是人类翻译员检查机器翻译誊本所需的时间。当誊本错误越多,人类所
需的时间越长。在 2017 年至 2022 年间,在十种翻译最多的语言中,TTE 从每字三秒降至
两秒,Trombetti 预测未来两年内 TTE 将降至一秒。
翻译考验直翻还是融入当地说法
Google 翻译研究员 Isaac Caswell 指出,那些拥有最多训练资料的“高资源”(high-res
ource)语言而言,将句子翻成另个句子的问题“几乎已经解决”,但要达到多语言人士的
水准,或者那些没大量可用训练资料的语言而言,是项艰钜任务。
此外,由于无法规划、参考长期记忆、从事实资料来源或修改输出,即使是最好的翻译工具
也很难处理长篇大论的工作或精确任务,另外也可能为了符合目标语言的语法结构,而“幻
觉”出他们不需要的资讯。Caswell 认为,“要获得完美的翻译,还必须拥有人类水平的智
慧,没有一个有能力的诗人,是很难翻译俳句的”。
事实上,翻译长期都在“透明度”(transparency)与“保真度”(fidelity)之间挣扎,
该选择完全照原文翻译,还是考量目标受众的感受进行翻译。前者会保留语词组的原貌,后
者则会改变整个文化参考,翻译出更贴近当地文化的用语。有时甚至需要比原始资料更多的
资讯,例如将“我喜欢你”(I like you)这句话翻成日文,需要知道说话者的性别、他们
与对方的关系及对方名字,以避免不礼貌地使用“你”这个字。
进阶翻译需要更多资讯,不只是原始文字
德国 AI 新创 DeepL 创办人 Jarek Kutylowski 表示,要求提出后续问题、知道何时以透
明度换取保真度,以及了解翻译目的,意味进阶翻译需要更多资讯,而不只是原始文字。
再来是“资源匮乏”(low-resource)语言的问题,这些语言的书面文字稀少,意味翻译准
确性无法透过 LLM 突破来改善。针对这类状况,Google 团队建立一套系统,为 15 种非洲
语言增加语音到语音的翻译,这并非根据数千兆字节的音讯资料进行训练,而是像小孩一
样学习阅读书面上的文字,将语音与书面上的字符序列联系起来。
即时翻译软件 DeepL 也于 11 月推出语音对语音翻译系统,提供一对一的当面对话和多人
视讯聊天的口译服务。与此同时,Unbabel 展示一款装置,能读取手腕或眉毛的细微肌肉动
作,并将其与 LLM 产生的文字配对,让人们无需说话或打字即可进行沟通。该公司打算将
这项技术制成一种辅助装置,用于那些无法自己说话的运动神经病症患者。
Google 翻译研究员 Caswell 表示,翻译工具对于探索世界非常有用,但它们只是一种工具
,无法取代人类学习语言的经验,例如真正了解其他人的出身,了解不同地方是什么样子。