Re: [新闻] 机器翻译大突破!微软加入新方法AI中翻英

楼主: derekhsu (華麗的天下無雙)   2018-03-15 19:03:31
※ 引述《Cyuhsuan (姆斯没去过强队)》之铭言:
: 1.媒体来源:
: iThome
: 2.完整新闻标题:
: 机器翻译大突破!微软加入新方法,AI中翻英程度达人类专业水准
: 3.完整新闻内文:
: 微软AI研究团队近日于官方的部落格中表示,微软的AI机器翻译系统可以将中文的新闻文章翻译成英文,透过双语专业人员评估,AI机器翻译系统的表现与人类相当,微软表示,中文和英文有较充足的词汇数据库,透过新闻的常见词汇搭配深度学习算法,再加入新方法模仿人类翻译的流程,不断地调整,让机器翻译系统产出的结果更加准确。
: 特别的是,微软的研究团队在AI机器翻译系统中,加入双重学习(Dual learning)的机制,也就是说,系统将中文的新闻文章翻成英文后,会再将英文的翻译结果翻成中文,重新比对两者的相似性,并让系统从错误中学习。除此之外,该AI机器翻译系统还加入了审议网络(Deliberation network),系统会学习研究员翻译句子的过程,模拟人类一次次编修文字的过程。
: 而为了确保翻译结果的准确性,微软加入联合训练方法(Joint training),透过中翻英和英翻中2个系统交互学习,英翻中的系统可以提供新的中文句子,与原文的中文句子形成一组资料集,增加训练集的资料量,中翻英也是如此,将2个系统互相学习时,即可以改善各自的准确率。
: 另外,微软也尝试采用一致性正规化(Agreement regularization)的方法来加强翻译结果的准确性,简单来说,AI机器翻译系统从左到右,或是从右到左阅读语句,翻译出来的结果必须一致,微软相信,系统若产生相同的翻译结果,是比较准确的。
: 在微软负责语音、自然语言和机器翻译的技术团队成员Xuedong Huang表示,这项成果是自然语言处理任务中,非常重要的里程碑,机器翻译达到人类的水准一直是团队的目标,他表示,没想到这么快就能实现。
: 过去几十年来,机器翻译一直是研究员想要解决的问题之一,许多语言专家也认为机器翻译不可能达到人类的水准,这项成果虽然是重要的里程碑,但是不代表机器翻译的问题已经解决,微软亚洲研究院副院长周明表示,还有许多挑战和问题,像是在即时新闻上测试机器翻译系统,他期待,这项成果可以应用在不同的语言,甚至是不同的AI研究领域中。
: 4.完整新闻连结 (或短网址):
: https://www.ithome.com.tw/news/121818
: 5.备注:
: 翻译人员是否要失业了?
这个翻译系统目前还在实验室,所以我们无法测试,不过根据Google以及微软(Bing)
目前在线上的系统来看,我们还是可以看得出目前英文自动翻译中文的极限。
然后,其实这世界上执行英翻中最强的公司,并非Google以及微软。
而是中国公司“有道词典”。以目前Google跟Bing的翻译结果来看,他们要达到有道
的程度还差很远,所以我是满怀疑微软能达到的成效。有道词典即使面对GRE等级的
阅读,也可以达到相当令人满意的翻译结果。
我用这篇CNN今天的新闻为例,分别用Google, Bing以及有道词典的类神经网络翻译
得到的结果,我附在最后面,我知道大家不太有时间看,所以我挑几句翻译的摘要
详情可以看最后的内容。
http://cnn.it/2FSD3Me
原文:
"This latest action by Russia fits into a pattern of behavior in
which Russia disregards the international rules-based order,
undermines the sovereignty and security of countries worldwide,
and attempts to subvert and discredit Western democratic
institutions and processes."
Bing:
"俄罗斯最近采取的行动符合一种行为模式, 俄罗斯无视国际规则秩序, 破坏
世界各国的主权和安全, 企图颠覆和诋毁西方民主体制。和进程。
Google:
“俄罗斯这一最新行动符合俄罗斯无视国际规则秩序,破坏世界各国主权和
安全的行为模式,并试图颠覆和诋毁西方民主机构和进程。”
有道词典:
“俄罗斯最近采取的行动符合俄罗斯无视国际规则秩序的行为模式,破坏了
世界各国的主权和安全,并试图颠覆和败坏西方民主体制和进程。”
评论-Bing无法正确翻译which子句,他的中文里面第一句话跟第二句话两个俄罗斯
都变成了主词,这破坏了原本英文的词性。最后一句话的and居然被翻译成两句话。
Google的翻译基本上大致正确,但是对于子句的认知感到有点奇怪。原文中逗号的
三句话的主词都是This latest action by Russia,应该是 fits..., undermines...,
跟and attemps to...这三句词,用,跟and连接起来。但Google把第一句跟第二句混在
一起,变成“符合俄罗斯...秩序,破坏..模式”这也翻译不正确。
而有道词典厉害的地方在于,他不但正确判断了三个子句,他也跟Bing一样补上了
“采取”,原主词原本可以写成The latest action (taken) by Russia。基本上
有道翻译的结果不用任何修饰,直接可以变成新闻稿。
原文:
The United Kingdom believes Russia was behind the attempted
murders of Sergei Skripal and his daughter Yulia because the nerve
agent used, Novichok, was developed in the Soviet Union and could
not be replicated by non-state actors. London announced Wednesday
it would expel 23 Russian diplomats after Moscow failed to meet a
UK deadline to give a "credible response."
Bing:
英国认为, 俄罗斯是在试图谋杀谢尔盖 Skripal 和他的女儿的背后, 因为使
用的神经代理, 诺维乔克, 是在苏联发展, 不能由非国家行动者复制。星期
三, 伦敦宣布将驱逐23俄罗斯外交官, 因为莫斯科未能在英国最后期限前做
出 "可信的回应"。
Google:
联合王国认为,俄罗斯支持对Sergei Skripal和他的女儿尤利娅的企图谋杀
背后,因为使用的神经毒剂Novichok是在苏联开发的,无法由非国家行为体
复制。伦敦周三宣布,在莫斯科未能在英国的最后期限之前提出“可信的回
应”,将驱逐23名俄罗斯外交官。
有道词典:
联合王国认为,俄罗斯是企图谋杀谢尔盖·斯克里帕尔和他的女儿尤利娅的
幕后黑手,因为他们使用的神经毒气,诺维科夫,是在苏联发展起来的,不
能被非国家行为者复制。伦敦周三宣布,将驱逐23名俄罗斯外交官。此前,
莫斯科未能在英国的最后期限前给出“可信的回应”。
评论-Bing翻译姓名只翻译了一半,无法正确翻译behind,nerve agent翻成神经代理
,数字背后不会接量词(这是英翻中一项最困难的一点)。不过Bing执得称赞的一点
是他是唯一翻译出“英国”的翻译系统。
Google跟Bing一样无法应对behind的翻译,但是正确的把develop翻成了开发,然后
“非国家行为体”也是三者当中似乎最靠近原意的,但是他最后却严重了误判了最后
一段,虽然他正确补上了“名”但是,他把顺序搞错了,俄罗斯已经错过了deadline
,而Google却翻译成if。
有道词典最棒的地方是它成功的把behind翻译成幕后黑手,这句话翻译得很漂亮,可惜
联合王国依然无法翻译成英国,没能把develop翻译成开发。“非国家行为者”有点
奇怪,整体来说,依然是三者最优。
原文:
But Haley laid the blame firmly at Russia's door. Highlighting
Moscow's support of the Assad regime in Syria following that
government's use of chemical weapons against civilians, Haley told
fellow diplomats the world had reached "a defining moment."
Bing:
但是海莉把责任牢牢地放在了俄罗斯的门上。在叙利亚政府对平民使用化学
武器后, 俄罗斯支援阿萨德政权, 哈利告诉外交官们, 世界已经达到了 "一
个决定性的时刻"。
Google:
但是海莉牢牢地将责任归咎于俄罗斯的大门。海莱在政府对平民使用化学武
器之后强调莫斯科支持叙利亚的阿萨德政权,他告诉外交官,世界已经达到
了“一个决定性时刻”。
有道词典:
但海利却把责任推到了俄罗斯的家门口。在叙利亚政府使用化学武器对付平
民之后,哈雷强调了莫斯科对叙利亚阿萨德政权的支持,他告诉其他外交官
,世界已经到了“决定性时刻”。
评论-Bing没有翻译出Highlighting,“把责任牢牢地放在了俄罗斯的门上”感觉
非常奇怪。Haley在前后两句话姓名可以翻成两个不一样的海莉跟哈利?
“fellow diplomat”的fellow没有翻译出来。
Google这句“但是海莉牢牢地将责任归咎于俄罗斯的大门”完全不知所云,甘俄罗斯
的大门什么事?然后一个Haley在前后两句话姓名可以翻成两个不一样的-海莉跟海莱
。“fellow diplomat”跟bing一样没有翻译出来
有道词典:“但海利却把责任推到了俄罗斯的家门口。”是唯一合理把door的意思准
确用中文翻译出来的系统,“Highlighting”正确翻译出“强调”,不过整句话“
强调”应该翻译成“哈雷强调了莫斯科在叙利亚政府使用化学武器对付平民之后对叙
利亚阿萨德政权的支持”比较通顺。正确的翻译出“其他外交官”但是他们还是无法
正确应对姓名的翻译,跟Bing以及Google一样。Haley变成海利跟哈雷。
作者: irumina   2017-03-15 19:03:00
推!!!
作者: medama ( )   2018-03-15 19:05:00
感谢分享 下次试用看看
作者: livewater (萤幕比本人帅)   2018-03-15 19:05:00
难得有认真文
作者: conpo (狮子たちの旗)   2018-03-15 19:06:00
感谢分享
作者: wayne1997 (大侠皮老板)   2018-03-15 19:06:00
认真文 推
作者: sads333 (阿鼎)   2018-03-15 19:07:00
推中国AI 比欧美强太多了
作者: medama ( )   2018-03-15 19:07:00
好像要安装才能用 没有网页版整篇翻译 不太方便
作者: arod13arod (50_ohm)   2018-03-15 19:07:00
内行优质文给推
作者: Yui5 (唯控)   2018-03-15 19:08:00
认真给推,不知道有道翻日文会不会比日本的Exite好
作者: jerrylin (嘴砲无视)   2018-03-15 19:08:00
可是中国的东西碰到关键字不就被卡掉了吗
作者: Yui5 (唯控)   2018-03-15 19:09:00
不过Google和微软面向的都是英语客户较多吧,中翻英会更好?
作者: StarTouching (抚星)   2018-03-15 19:09:00
太好了 以后看mcstories有中文了
作者: TimeLeft (100天)   2018-03-15 19:10:00
作者: eddieyu (正妹都爱ばか囧)   2018-03-15 19:10:00
专业推
作者: ABuJiuHaoBun (新资料夹(2))   2018-03-15 19:11:00
习包子维尼64没办法翻译啊
作者: StarCat76 (灰色星星)   2018-03-15 19:12:00
翻译王
作者: gibson72 (丹神快拜)   2018-03-15 19:13:00
日文表现九弯十八拐 希望可以达成
作者: legendsleep (时渡)   2018-03-15 19:13:00
其实有道辞典的数据库背后都是几十万个童工在翻译
作者: Yui5 (唯控)   2018-03-15 19:15:00
去有道翻译网站,下面号称有人工翻译时刻待命XDD好肝……
楼主: derekhsu (華麗的天下無雙)   2018-03-15 19:16:00
人工翻译还满便宜的,很夸张很夸张照他们的翻译金额,台湾的翻译社都倒光了
作者: silverair (木栅福山雅治)   2018-03-15 19:18:00
我觉得是本身就是中文语系,最佳化可能比较容易吧,我
作者: dv6 (为台湾加油)   2018-03-15 19:18:00
认真文
作者: avans (阿纬)   2018-03-15 19:20:00
推 认真比较机翻效果!
作者: pttpepe (Ptt屁屁)   2018-03-15 19:20:00
这翻译品质令人惊讶...
作者: seemoon2000 (no)   2018-03-15 19:21:00
我刚刚贴了我论文上去 真的满屌...
作者: Yui5 (唯控)   2018-03-15 19:22:00
刚试了有道和百度的网页翻译看小说家日文,感觉有道没百度好
作者: gn00295120 (Longway)   2018-03-15 19:22:00
台湾的翻译社本来就快倒光了 有些还都等大陆翻好再简转繁
作者: KangSuat   2018-03-15 19:23:00
讯飞比google语音输入好很多 win7可用 win10问题多
作者: Yui5 (唯控)   2018-03-15 19:23:00
在测试了下google原生翻译…好吧完全看不懂了…
作者: shutout5566 (5566给我闭嘴!!打个电话 )   2018-03-15 19:23:00
好猛的AI....
作者: Yui5 (唯控)   2018-03-15 19:25:00
纯粹看小说家这种网络小说日翻中,对比了下还是百度最好…
作者: KangSuat   2018-03-15 19:25:00
看到有人说讯飞不再开发支援电脑 专注在手机市场
作者: Szmanda87 (猪猪爱捣蛋)   2018-03-15 19:26:00
推,很强的感觉,你也太认真测试了
作者: Yui5 (唯控)   2018-03-15 19:26:00
有道把ドラゴン翻译成勇者我直接傻眼……
作者: or0706555 (owentw)   2018-03-15 19:26:00
作者: pttpepe (Ptt屁屁)   2018-03-15 19:27:00
大概都是中文语系 在开发的时候会比较考虑使用者问题
作者: peter41308 (peter)   2018-03-15 19:28:00
日文机翻的话,有些日转英比直接转中文还要清楚
作者: Yui5 (唯控)   2018-03-15 19:30:00
百度翻译AI是不是比较宅XD?记得以前有人说lulu译成鲁鲁修
作者: Plot3D (3D做图)   2018-03-15 19:30:00
中国真是世界最大乱源
作者: schumi7401 (死蚊子给我出来)   2018-03-15 19:30:00
嗯嗯
作者: lazioliz   2018-03-15 19:30:00
为什么新闻说中翻英这边整篇都是英翻中啊?
作者: iceyeman (Xen)   2018-03-15 19:31:00
刚才翻笑话 威力不错 有空拿双关试试
作者: king22649   2018-03-15 19:31:00
google那是免钱的翻译? 还是另一个google翻译?上面的google翻译 是用这个吗?https://cloud.google.com/translate/
作者: vvrr (vvrr)   2018-03-15 19:33:00
人工智能 vs 工人智慧
楼主: derekhsu (華麗的天下無雙)   2018-03-15 19:33:00
免费的,那我用这个翻看看,等等
作者: king22649   2018-03-15 19:36:00
google的ml系列都丢在cloud platform
作者: DH3020 (ckcloud)   2018-03-15 19:37:00
百度超宅的,看fate同人结果专有名词全翻出来
楼主: derekhsu (華麗的天下無雙)   2018-03-15 19:38:00
你提供的这个比免费Google翻译好,但还是不如有道很多
作者: wulaw5566   2018-03-15 19:44:00
中国软件真的猛
作者: IHD (终于要等到时空变异了吗?)   2018-03-15 19:48:00
考试能带电脑吗?能就有救 不能?那一样没救啊
作者: weliche (時雨)   2018-03-15 19:49:00
这翻译机好猛....
作者: jupei (沛)   2018-03-15 19:50:00
其实是真人ㄧ人ㄧ行翻

Links booklink

Contact Us: admin [ a t ] ucptt.com