[新闻] 遇敏感词直接跳行 中国翻译软件自动审查

楼主: pulagu (火星塞)   2024-07-31 11:55:11
1.媒体来源:
大纪元
2.记者署名:
大纪元记者林燕报导
3.完整新闻标题:
遇敏感词直接跳行 中国翻译软件自动审查
4.完整新闻内文:
https://i.epochtimes.com/assets/uploads/2023/11/id14123795-170514.jpg
中国的网络平台审查愈来愈严重,就连小猪佩奇的图像走红后也被抖音封杀。
(Matthew Knight/AFP viaGetty Images)
【大纪元2024年07月31日讯】(大纪元记者林燕报导)最新研究发现,中国大陆流行的语
言翻译软件会自己根据内容选择跳过某些句子或内容。
“我们的工作揭示了一个不幸的现实:即使中国用户可以不受审查地访问(外国)新闻或
通信平台,如果他们必须进行语言翻译,他们所读或所写的内容仍可能受到自动审查。”
一家民间监督机构最新发表的一份报告说。
加拿大“公民实验室”(The Citizen Lab)对中国最主要的五家在线翻译服务——四家
中国公司以及一家美国公司进行了测试,发现它们都在内容上进行自动审查。
这四家中国公司分别是阿里巴巴、百度、腾讯和有道,微软的必应翻译(Bing
Translator)是唯一一家在中国境内被允许使用的外国公司。
图片:https://tinyurl.com/3pfbkbza
加拿大“公民实验室”对中国流行的五家在线翻译服务进行测试,发现翻译软件会自己根
据翻译内容跳过某些句子。比如:输入三句话,第二句跟中共领导人有关就被直接省掉了
。(The Citizen Lab)
审查敏感内容 中共有高达1.2万条规则
在对上述公司的翻译服务进行测试后,研究人员发现了1万1,634条针对敏感内容的审查规
则。
“公民实验室”的报告说,这些翻译审查规则是有针对性的、自动应用的,会部分或全部
省略掉用户想要翻译的内容。
研究发现,几乎所有审查规则都针对简体中文、繁体中文、英文或这几种语言的混合。不
过,更多适用于外文翻成中文,而不是从中文翻成外文。
“一旦触发审查,服务通常会省略违规的行、句子或整个翻译输出。”报告写道。
其中,阿里巴巴执行的审查最严,其次是有道,然后是腾讯。百度和必应的审查规则相对
更少。
研究说,除阿里巴巴外,其它几家公司都是进行暗自审查,在用户毫不知情的情况下进行
。一旦触发敏感词或行,或句子,它们会自动删除相关字词或跳过相关行的内容,而不会
给用户任何提示。
图片:https://tinyurl.com/bdf89ccv
最新报告显示,四家中国公司阿里巴巴、百度、腾讯和有道以及微软的必应翻译在中国境
内对用户使用的翻译服务进行言论审查。(The Citizen Lab)
中共主要审查政治和宗教翻译
“翻译服务审查主要针对与中国共产党议程相悖的政治和宗教内容。值得注意的是,我们
吃惊地发现,中共并不怎么审查与色情、黄色内容等相关的其它更为常见的被审查的目标
。”报告强调说。
报告说,这表明,中共现在不再在意伪装其真实的政治议程,或没想到会有人研究它的审
查规则。
研究人员将审查归纳为七个类别。
第一个类别:“异见人士”,包括异见人士、直言不讳的中共政府批评者、中国人权倡导
者。
第二个类别:“党国领导人”,包括中国共产党领导人或其家人,如习近平的别名甚至暗
号等。
第三个类别:“宗教”,与宗教和精神运动有关。
第四个类别:“批评政府”,包括对中共政府或中国共产党的批评。
第五个类别:“天安门”,指与1989年“六四事件”有关。
第六个类别是“色情”,
第七个类别是“艺人”。
此外,还有“其它”和“未知”两个类别。
审查的宗教翻译大多都与法轮功有关
报告说,翻译软件中,被审查的宗教内容大多与法轮功有关,如“法轮大法”。微软的必
应对法轮功的审查非常严苛,包括许多演化或音近的字词都一并被审查,如“功轮法”和
“发伦功”。
研究还发现,许多与法轮功有关的新闻媒体的言论被审查,包括《大纪元时报》和新唐人
电视台。
美国政治内容也受到了审查。例如,天佑川普(God bless Trump)被审查,“川普+包子
”也被审查。
屏蔽跟中共领导人相关的翻译
此外,翻译软件对涉中共领导人词句的审查占审查内容中澈雂j一部分。
报告说,特别是提及习近平,在所有五家软件平台上都被审查,包含“习书记”“习主席
”和“习大大”的内容都被审查。许多提到习近平的隐晦词语也被审查,比如“习斤凭”
和“刁近平”。
此外,阿里巴巴、腾讯和有道对习近平家人,例如,现任妻子彭丽媛、前任妻子柯玲玲、
姐姐齐桥桥和女儿习明泽等进行了审查。
除必应之外,其它四家翻译软件都有很大一部分审查规则针对民众对政府的批评言论。以
一般批评为例,报告发现“政府忽悠群众”词句受到审查。许多规则是专门审查针对党的
领导人的翻译,例如“刁包子”和“维尼”。
阿里巴巴和百度审查了生僻字“奭”(读shi)。该字是嘲讽习近平在一次访谈中吹嘘,
年轻时扛200斤麦子走十里路不换肩。
网民用“奭”字是因为它的形状像一个人在两个肩膀上扛着粮食,而两个肩膀下面的符号
都是“百”部首,合起来就象征著二百斤。
责任编辑:李缘#
5.完整新闻连结 (或短网址)不可用YAHOO、LINE、MSN等转载媒体:
https://www.epochtimes.com/b5/24/7/30/n14301611.htm
6.备注:

Links booklink

Contact Us: admin [ a t ] ucptt.com