※ 引述《Cyuhsuan (姆斯没去过强队)》之铭言:
: 1.媒体来源:
: iThome
: 2.完整新闻标题:
: 机器翻译大突破!微软加入新方法,AI中翻英程度达人类专业水准
: 3.完整新闻内文:
: 微软AI研究团队近日于官方的部落格中表示,微软的AI机器翻译系统可以将中文的新闻文章翻译成英文,透过双语专业人员评估,AI机器翻译系统的表现与人类相当,微软表示,中文和英文有较充足的词汇数据库,透过新闻的常见词汇搭配深度学习算法,再加入新方法模仿人类翻译的流程,不断地调整,让机器翻译系统产出的结果更加准确。
: 特别的是,微软的研究团队在AI机器翻译系统中,加入双重学习(Dual learning)的机制,也就是说,系统将中文的新闻文章翻成英文后,会再将英文的翻译结果翻成中文,重新比对两者的相似性,并让系统从错误中学习。除此之外,该AI机器翻译系统还加入了审议网络(Deliberation network),系统会学习研究员翻译句子的过程,模拟人类一次次编修文字的过程。
: 而为了确保翻译结果的准确性,微软加入联合训练方法(Joint training),透过中翻英和英翻中2个系统交互学习,英翻中的系统可以提供新的中文句子,与原文的中文句子形成一组资料集,增加训练集的资料量,中翻英也是如此,将2个系统互相学习时,即可以改善各自的准确率。
: 另外,微软也尝试采用一致性正规化(Agreement regularization)的方法来加强翻译结果的准确性,简单来说,AI机器翻译系统从左到右,或是从右到左阅读语句,翻译出来的结果必须一致,微软相信,系统若产生相同的翻译结果,是比较准确的。
: 在微软负责语音、自然语言和机器翻译的技术团队成员Xuedong Huang表示,这项成果是自然语言处理任务中,非常重要的里程碑,机器翻译达到人类的水准一直是团队的目标,他表示,没想到这么快就能实现。
: 过去几十年来,机器翻译一直是研究员想要解决的问题之一,许多语言专家也认为机器翻译不可能达到人类的水准,这项成果虽然是重要的里程碑,但是不代表机器翻译的问题已经解决,微软亚洲研究院副院长周明表示,还有许多挑战和问题,像是在即时新闻上测试机器翻译系统,他期待,这项成果可以应用在不同的语言,甚至是不同的AI研究领域中。
: 4.完整新闻连结 (或短网址):
: https://www.ithome.com.tw/news/121818
: 5.备注:
: 翻译人员是否要失业了?
这个翻译系统目前还在实验室,所以我们无法测试,不过根据Google以及微软(Bing)
目前在线上的系统来看,我们还是可以看得出目前英文自动翻译中文的极限。
然后,其实这世界上执行英翻中最强的公司,并非Google以及微软。
而是中国公司“有道词典”。以目前Google跟Bing的翻译结果来看,他们要达到有道
的程度还差很远,所以我是满怀疑微软能达到的成效。有道词典即使面对GRE等级的
阅读,也可以达到相当令人满意的翻译结果。
我用这篇CNN今天的新闻为例,分别用Google, Bing以及有道词典的类神经网络翻译
得到的结果,我附在最后面,我知道大家不太有时间看,所以我挑几句翻译的摘要
详情可以看最后的内容。
http://cnn.it/2FSD3Me
原文:
"This latest action by Russia fits into a pattern of behavior in
which Russia disregards the international rules-based order,
undermines the sovereignty and security of countries worldwide,
and attempts to subvert and discredit Western democratic
institutions and processes."
Bing:
"俄罗斯最近采取的行动符合一种行为模式, 俄罗斯无视国际规则秩序, 破坏
世界各国的主权和安全, 企图颠覆和诋毁西方民主体制。和进程。
Google:
“俄罗斯这一最新行动符合俄罗斯无视国际规则秩序,破坏世界各国主权和
安全的行为模式,并试图颠覆和诋毁西方民主机构和进程。”
有道词典:
“俄罗斯最近采取的行动符合俄罗斯无视国际规则秩序的行为模式,破坏了
世界各国的主权和安全,并试图颠覆和败坏西方民主体制和进程。”
评论-Bing无法正确翻译which子句,他的中文里面第一句话跟第二句话两个俄罗斯
都变成了主词,这破坏了原本英文的词性。最后一句话的and居然被翻译成两句话。
Google的翻译基本上大致正确,但是对于子句的认知感到有点奇怪。原文中逗号的
三句话的主词都是This latest action by Russia,应该是 fits..., undermines...,
跟and attemps to...这三句词,用,跟and连接起来。但Google把第一句跟第二句混在
一起,变成“符合俄罗斯...秩序,破坏..模式”这也翻译不正确。
而有道词典厉害的地方在于,他不但正确判断了三个子句,他也跟Bing一样补上了
“采取”,原主词原本可以写成The latest action (taken) by Russia。基本上
有道翻译的结果不用任何修饰,直接可以变成新闻稿。
原文:
The United Kingdom believes Russia was behind the attempted
murders of Sergei Skripal and his daughter Yulia because the nerve
agent used, Novichok, was developed in the Soviet Union and could
not be replicated by non-state actors. London announced Wednesday
it would expel 23 Russian diplomats after Moscow failed to meet a
UK deadline to give a "credible response."
Bing:
英国认为, 俄罗斯是在试图谋杀谢尔盖 Skripal 和他的女儿的背后, 因为使
用的神经代理, 诺维乔克, 是在苏联发展, 不能由非国家行动者复制。星期
三, 伦敦宣布将驱逐23俄罗斯外交官, 因为莫斯科未能在英国最后期限前做
出 "可信的回应"。
Google:
联合王国认为,俄罗斯支持对Sergei Skripal和他的女儿尤利娅的企图谋杀
背后,因为使用的神经毒剂Novichok是在苏联开发的,无法由非国家行为体
复制。伦敦周三宣布,在莫斯科未能在英国的最后期限之前提出“可信的回
应”,将驱逐23名俄罗斯外交官。
有道词典:
联合王国认为,俄罗斯是企图谋杀谢尔盖·斯克里帕尔和他的女儿尤利娅的
幕后黑手,因为他们使用的神经毒气,诺维科夫,是在苏联发展起来的,不
能被非国家行为者复制。伦敦周三宣布,将驱逐23名俄罗斯外交官。此前,
莫斯科未能在英国的最后期限前给出“可信的回应”。
评论-Bing翻译姓名只翻译了一半,无法正确翻译behind,nerve agent翻成神经代理
,数字背后不会接量词(这是英翻中一项最困难的一点)。不过Bing执得称赞的一点
是他是唯一翻译出“英国”的翻译系统。
Google跟Bing一样无法应对behind的翻译,但是正确的把develop翻成了开发,然后
“非国家行为体”也是三者当中似乎最靠近原意的,但是他最后却严重了误判了最后
一段,虽然他正确补上了“名”但是,他把顺序搞错了,俄罗斯已经错过了deadline
,而Google却翻译成if。
有道词典最棒的地方是它成功的把behind翻译成幕后黑手,这句话翻译得很漂亮,可惜
联合王国依然无法翻译成英国,没能把develop翻译成开发。“非国家行为者”有点
奇怪,整体来说,依然是三者最优。
原文:
But Haley laid the blame firmly at Russia's door. Highlighting
Moscow's support of the Assad regime in Syria following that
government's use of chemical weapons against civilians, Haley told
fellow diplomats the world had reached "a defining moment."
Bing:
但是海莉把责任牢牢地放在了俄罗斯的门上。在叙利亚政府对平民使用化学
武器后, 俄罗斯支援阿萨德政权, 哈利告诉外交官们, 世界已经达到了 "一
个决定性的时刻"。
Google:
但是海莉牢牢地将责任归咎于俄罗斯的大门。海莱在政府对平民使用化学武
器之后强调莫斯科支持叙利亚的阿萨德政权,他告诉外交官,世界已经达到
了“一个决定性时刻”。
有道词典:
但海利却把责任推到了俄罗斯的家门口。在叙利亚政府使用化学武器对付平
民之后,哈雷强调了莫斯科对叙利亚阿萨德政权的支持,他告诉其他外交官
,世界已经到了“决定性时刻”。
评论-Bing没有翻译出Highlighting,“把责任牢牢地放在了俄罗斯的门上”感觉
非常奇怪。Haley在前后两句话姓名可以翻成两个不一样的海莉跟哈利?
“fellow diplomat”的fellow没有翻译出来。
Google这句“但是海莉牢牢地将责任归咎于俄罗斯的大门”完全不知所云,甘俄罗斯
的大门什么事?然后一个Haley在前后两句话姓名可以翻成两个不一样的-海莉跟海莱
。“fellow diplomat”跟bing一样没有翻译出来
有道词典:“但海利却把责任推到了俄罗斯的家门口。”是唯一合理把door的意思准
确用中文翻译出来的系统,“Highlighting”正确翻译出“强调”,不过整句话“
强调”应该翻译成“哈雷强调了莫斯科在叙利亚政府使用化学武器对付平民之后对叙
利亚阿萨德政权的支持”比较通顺。正确的翻译出“其他外交官”但是他们还是无法
正确应对姓名的翻译,跟Bing以及Google一样。Haley变成海利跟哈雷。