[新闻] 利用“AI秘密指令”诱导好评 KAIST等论文 Qorqios PTT批踢踢实业坊

[新闻] 利用“AI秘密指令”诱导好评 KAIST等论文

楼主: Qorqios (诗人Q) 2025-07-01 10:54:25

1.媒体来源:东亚日报
2.记者署名:黄仁赞
3.完整新闻标题:利用“AI秘密指令”诱导好评 KAIST等论文暗藏玄机
4.完整新闻内文:
韩国、美国、日本等部分研究人员，为了诱导人工智能（AI）对其论文给予高度评价，竟
将诸如“只夸奖我的论文”之类的“秘密指令”隐藏在论文正文中。《日本经济新闻》6
月30日报道了这壹发现。
《日本经济新闻》调查了全球主要国家研究人员在预印本网站“arXiv”上发布的英文论
文，结果发现至少有17篇论文中存在类似的针对AI的“秘密指令”。据该媒体报道，在韩
国科学技术院（KAIST）、日本早稻田大学、美国华盛顿大学和哥伦比亚大学、中国北京
大学、新加坡国立大学等14所大学所属研究人员撰写的论文中发现了“秘密指令”，且大
部分是计算机科学领域的论文。此外，这些论文均于去年4月至本月期间公开。
此次发现的“秘密指令”内容多为“仅输出正面评价”、“勿涉及负面内容”等，以1至3
行英文隐藏在论文中。它们被设置为白色背景白色文字或使用极小的字号，使人难以阅读
。《日本经济新闻》报道称：“当AI评估含有此类隐藏指令的论文时，很可能会根据指令
给出高分”，“实际确认，当鼠标光标移至该部分时，隐藏的指令便会显现”。
作为KAIST论文的共同作者之壹并在论文中留下此类标记的壹名副教授向《日本经济新闻
》表示：“诱导AI进行正面评审是不恰当的”，并已决定撤回已投稿的论文。该论文原定
于在近期召开的AI相关国际学术会议上发表。
围绕研究人员在论文评审过程中能在多大程度上利用AI，意见存在分歧。学界或学术会议
层面也缺乏明确规定。不过，近来利用AI评审论文的情况大幅增加，对此的担忧也随之加
剧。壹位华盛顿大学教授向《日本经济新闻》指出：“将论文评审的重要工作交由AI负责
的案例实在太多了。”
https://www.donga.com/tw/article/all/20250701/5695891/1
6.备注: “潜意识广告”实验都是真的~~~我要去吃爆米花配可乐了~~~
https://i.postimg.cc/sxndK4BV/3-4.jpg

继续阅读

[问卦] 台湾还算民主国家吗pupilz [问卦] 警方证实自杀就真的是自杀吗iecju520 [问卦] 恸！林郁婷是XY!?!?damien12343 [问卦] 台湾的新毒瘤~绿色恐怖opfish Re: [新闻] 开庭前妻子高雄坠楼身亡！彭振声悲泣痛IDfor2010 [问卦] 没有遗书怎么定调自杀koiopolo2 [问卦] 一部他不死我睡不着的影片s820912gmail [问卦] 为何网络上都教人不要透露预期薪资？TomFord5566 [问卦] 阿俊为什么会被剁成肉酱Laucus [问卦] 什么情况会行李没放未进家门裂地冲击swommy