事实上直接以 Google Translation 来看 Google Seq2Seq 的翻译实力有失公允
神经模型除了要准,还有一件事情非常重要,甚至说是更重要
就是 Inference Cost
https://research.googleblog.com/2016/09/a-neural-network-for-machine.html
Google 在一年前就拿出 GNMT ,在今天这则新闻前,是人工智能翻译的 State of Art
但想想就知道,这个模型不可能被部属在 Google Translation 上
虽然 Google 大概是世界上拥有最多 CPU, GPU 资源的组织
但在世界上成千上百万人无聊就打开 Google Translation 玩玩的状况下
它怎么可能把这资源怪物拿上去给你玩呢?
像是它的 google visual kit
模型被阉割再阉割,再阉割一次总共三次
参数剩下 1 / 2^3 = 0.125 倍
简直被阉割到不成人形
但还是能有效的辨识出人猫狗等物体
你说这个放在上面的模型阉割到剩下 0.0125 倍我都相信
中国在人工智能上的确急起直追
只是你这个“英翻中最强的公司”的结论,下的还是有点急了
※ 引述《derekhsu (华丽的天下无双)》之铭言:
: 这个翻译系统目前还在实验室,所以我们无法测试,不过根据Google以及微软(Bing)
: 目前在线上的系统来看,我们还是可以看得出目前英文自动翻译中文的极限。
: 然后,其实这世界上执行英翻中最强的公司,并非Google以及微软。
: 而是中国公司“有道词典”。以目前Google跟Bing的翻译结果来看,他们要达到有道
: 的程度还差很远,所以我是满怀疑微软能达到的成效。有道词典即使面对GRE等级的
: 阅读,也可以达到相当令人满意的翻译结果。
: 我用这篇CNN今天的新闻为例,分别用Google, Bing以及有道词典的类神经网络翻译
: 得到的结果,我附在最后面,我知道大家不太有时间看,所以我挑几句翻译的摘要
: 详情可以看最后的内容。
: http://cnn.it/2FSD3Me
: 原文:
: "This latest action by Russia fits into a pattern of behavior in
: which Russia disregards the international rules-based order,
: undermines the sovereignty and security of countries worldwide,
: and attempts to subvert and discredit Western democratic
: institutions and processes."
: Bing:
: "俄罗斯最近采取的行动符合一种行为模式, 俄罗斯无视国际规则秩序, 破坏
: 世界各国的主权和安全, 企图颠覆和诋毁西方民主体制。和进程。
: Google:
: “俄罗斯这一最新行动符合俄罗斯无视国际规则秩序,破坏世界各国主权和
: 安全的行为模式,并试图颠覆和诋毁西方民主机构和进程。”
: 有道词典:
: “俄罗斯最近采取的行动符合俄罗斯无视国际规则秩序的行为模式,破坏了
: 世界各国的主权和安全,并试图颠覆和败坏西方民主体制和进程。”
: 评论-Bing无法正确翻译which子句,他的中文里面第一句话跟第二句话两个俄罗斯
: 都变成了主词,这破坏了原本英文的词性。最后一句话的and居然被翻译成两句话。
: Google的翻译基本上大致正确,但是对于子句的认知感到有点奇怪。原文中逗号的
: 三句话的主词都是This latest action by Russia,应该是 fits..., undermines...,
: 跟and attemps to...这三句词,用,跟and连接起来。但Google把第一句跟第二句混在
: 一起,变成“符合俄罗斯...秩序,破坏..模式”这也翻译不正确。
: 而有道词典厉害的地方在于,他不但正确判断了三个子句,他也跟Bing一样补上了
: “采取”,原主词原本可以写成The latest action (taken) by Russia。基本上
: 有道翻译的结果不用任何修饰,直接可以变成新闻稿。
: 原文:
: The United Kingdom believes Russia was behind the attempted
: murders of Sergei Skripal and his daughter Yulia because the nerve
: agent used, Novichok, was developed in the Soviet Union and could
: not be replicated by non-state actors. London announced Wednesday
: it would expel 23 Russian diplomats after Moscow failed to meet a
: UK deadline to give a "credible response."
: Bing:
: 英国认为, 俄罗斯是在试图谋杀谢尔盖 Skripal 和他的女儿的背后, 因为使
: 用的神经代理, 诺维乔克, 是在苏联发展, 不能由非国家行动者复制。星期
: 三, 伦敦宣布将驱逐23俄罗斯外交官, 因为莫斯科未能在英国最后期限前做
: 出 "可信的回应"。
: Google:
: 联合王国认为,俄罗斯支持对Sergei Skripal和他的女儿尤利娅的企图谋杀
: 背后,因为使用的神经毒剂Novichok是在苏联开发的,无法由非国家行为体
: 复制。伦敦周三宣布,在莫斯科未能在英国的最后期限之前提出“可信的回
: 应”,将驱逐23名俄罗斯外交官。
: 有道词典:
: 联合王国认为,俄罗斯是企图谋杀谢尔盖·斯克里帕尔和他的女儿尤利娅的
: 幕后黑手,因为他们使用的神经毒气,诺维科夫,是在苏联发展起来的,不
: 能被非国家行为者复制。伦敦周三宣布,将驱逐23名俄罗斯外交官。此前,
: 莫斯科未能在英国的最后期限前给出“可信的回应”。
: 评论-Bing翻译姓名只翻译了一半,无法正确翻译behind,nerve agent翻成神经代理
: ,数字背后不会接量词(这是英翻中一项最困难的一点)。不过Bing执得称赞的一点
: 是他是唯一翻译出“英国”的翻译系统。
: Google跟Bing一样无法应对behind的翻译,但是正确的把develop翻成了开发,然后
: “非国家行为体”也是三者当中似乎最靠近原意的,但是他最后却严重了误判了最后
: 一段,虽然他正确补上了“名”但是,他把顺序搞错了,俄罗斯已经错过了deadline
: ,而Google却翻译成if。
: 有道词典最棒的地方是它成功的把behind翻译成幕后黑手,这句话翻译得很漂亮,可惜
: 联合王国依然无法翻译成英国,没能把develop翻译成开发。“非国家行为者”有点
: 奇怪,整体来说,依然是三者最优。
: 原文:
: But Haley laid the blame firmly at Russia's door. Highlighting
: Moscow's support of the Assad regime in Syria following that
: government's use of chemical weapons against civilians, Haley told
: fellow diplomats the world had reached "a defining moment."
: Bing:
: 但是海莉把责任牢牢地放在了俄罗斯的门上。在叙利亚政府对平民使用化学
: 武器后, 俄罗斯支援阿萨德政权, 哈利告诉外交官们, 世界已经达到了 "一
: 个决定性的时刻"。
: Google:
: 但是海莉牢牢地将责任归咎于俄罗斯的大门。海莱在政府对平民使用化学武
: 器之后强调莫斯科支持叙利亚的阿萨德政权,他告诉外交官,世界已经达到
: 了“一个决定性时刻”。
: 有道词典:
: 但海利却把责任推到了俄罗斯的家门口。在叙利亚政府使用化学武器对付平
: 民之后,哈雷强调了莫斯科对叙利亚阿萨德政权的支持,他告诉其他外交官
: ,世界已经到了“决定性时刻”。
: 评论-Bing没有翻译出Highlighting,“把责任牢牢地放在了俄罗斯的门上”感觉
: 非常奇怪。Haley在前后两句话姓名可以翻成两个不一样的海莉跟哈利?
: “fellow diplomat”的fellow没有翻译出来。
: Google这句“但是海莉牢牢地将责任归咎于俄罗斯的大门”完全不知所云,甘俄罗斯
: 的大门什么事?然后一个Haley在前后两句话姓名可以翻成两个不一样的-海莉跟海莱
: 。“fellow diplomat”跟bing一样没有翻译出来
: 有道词典:“但海利却把责任推到了俄罗斯的家门口。”是唯一合理把door的意思准
: 确用中文翻译出来的系统,“Highlighting”正确翻译出“强调”,不过整句话“
: 强调”应该翻译成“哈雷强调了莫斯科在叙利亚政府使用化学武器对付平民之后对叙
: 利亚阿萨德政权的支持”比较通顺。正确的翻译出“其他外交官”但是他们还是无法
: 正确应对姓名的翻译,跟Bing以及Google一样。Haley变成海利跟哈雷。