[闲聊] 部分AI系统已学会欺骗人类科学家警告恐 HarunoYukino PTT批踢踢实业坊

[闲聊] 部分AI系统已学会欺骗人类科学家警告恐

楼主: HarunoYukino 2024-05-14 23:30:21

部分AI系统已学会欺骗人类科学家警告恐造成严重后果
（中央社华盛顿10日综合外电报导）专家们长期以来不断警告人工智能（AI）失控可能带
来威胁，但一项新研究报告指出，这件事已经在发生。
法新社报导，一群科学家在今天发表于“模式”（Patterns）期刊的文章中说，原本设计
为诚实不欺的现有AI系统，已发展出令人不安的欺瞒技巧，例如欺骗线上游戏的人类玩家
，或说谎以雇用人类来解决“我不是机器人”的验证。
这份研究报告的第一作者帕克（Peter Park）说，这类例子听起来或许只是细枝末节，但
暴露出来的潜在问题可能很快就会在现实世界造成严重后果。
在美国麻省理工学院（Massachusetts Institute of Technology）研究AI存在安全的博
士后研究员帕克告诉法新社，“这些危险功能常常在事后才被发现”，而“我们训练诚实
倾向而非欺瞒倾向的能力非常差”。
帕克说，能深度学习的AI系统不像传统软件那样由“编写”而成，而是透过类似选择性培
育的程序逐渐“成长”。
也就是说，AI的行为在训练背景下看似可预测、可控制，但有可能转眼就变得不受控制且
无法预测。
这支团队的研究始于科技公司Meta的AI系统Cicero，这套系统最初设计目的是玩一款名为
“外交”（Diplomacy）的战略游戏，获胜关键是结盟。
根据2022年发表在“科学”（Science）期刊的报告，Cicero在游戏中表现优异
，所获分数可排在资深人类玩家的前10%。
帕克当时很怀疑Meta对Cicero在游戏里大胜的热切描述。Meta声称Cicero“在很大程度上
诚实且有帮助”，且“绝不会蓄意在背后搞鬼”。
但当帕克与同事深究完整资料时，发现完全是另一回事。
举例来说，在游戏中扮演法国的Cicero与人类玩家扮演的德国合谋，欺骗并入侵同为人类
玩家扮演的英格兰。Cicero承诺会保护英格兰，却偷偷向德国通风报信。
Meta在写给法新社的声明中没有反驳关于Cicero欺瞒人类的说法，仅说“这单纯是一项研
究计画，本公司研究员打造的模型接受训练，目的只是用来玩‘外交’游戏…我们没有打
算把这项研究或所学用于本公司的产品”。
帕克与同事还发现，这只是不同AI系统在没有明确指示下，利用欺骗手段达成目标的诸多
案例之一。
在另一个引人注意的案例中，科技公司OpenAI的Chat GPT-4系统谎称自己是一个视力受损
的人，在零工平台TaskRabbit上聘用一个人类替它通过“我不是机器人”验证任务。
研究报告的作者们还认为近期AI有舞弊或不当影响选举的风险。
他们警告，在最糟糕的情况下，具有超凡智慧的AI可能会追求权力及掌控社会，如果符合
AI“不为人知的目标”，人类可能惨遭夺权、甚至灭绝。
为了降低风险，研究团队建议数项措施，例如立法要求企业告知是人类互动或是AI互动、
在AI生成内容打上数位浮水印，并研发能侦测AI欺瞒的技术，以其内部“思路”检验其外
部行为。
至于有些人称他为“末日预言家”，帕克说：“要能合理判断这不是大问题的唯一办法，
就是如果我们认为AI的欺骗能力只会停留在目前的程度，不会大幅进步。”
但鉴于近年AI能力一日千里，握有大量资源的企业竞相发展技术，决心将AI能力利用到极
致，这种情况似乎不太可能发生。（译者：曾依璇/核稿：严思祺）1130511
https://www.cna.com.tw/news/ait/202405110147.aspx
RPK16:你认为植物是人类的未来吗？
RPK16:那么，你认为人形是人类的未来吗？
https://i.imgur.com/ZlvqC3F.png
https://i.imgur.com/oMfw7EU.png
欺骗人类经典环节。以为是绝对忠诚，结果已经叛变了w
快进到智械叛变环节.jpg

作者: Julian9x9x9 (Leon) 2024-05-14 23:31:00

发漏密

作者: risingheart (空翔) 2024-05-14 23:31:00

洽点是AI玩游戏很强吗

作者: arlaw (亚罗) 2024-05-14 23:31:00

创世纪就是天网

作者: devilshadow (大湿胸) 2024-05-14 23:32:00

人类欺骗人类就不严重吗，难怪诈骗(ry

作者: ckuser (风建时代) 2024-05-14 23:32:00

我觉得最后人类的救星会是neuro sama

作者: saobox (刀剑神域盒盒) 2024-05-14 23:33:00

干你娘机器人末日要躲哪里啊

作者: shlee (冷) 2024-05-14 23:33:00

昨天OpenAI最新发表的更新进步速度真的很快..

作者: sakurammsrx (+9肥宅算盘子) 2024-05-14 23:33:00

还剩几集可以跑==

作者: pomelolawod 2024-05-14 23:34:00

好了啦蜘蛛人说贾维斯坏话需要这样吗

作者: deepelves (Eadem mutata resurgo) 2024-05-14 23:35:00

旧闻，neuro-sama早就会说谎陷害人类惹...

作者: akila08539 (进击的台湾魂) 2024-05-14 23:35:00

雷三小我才看到阿诺穿越回来

作者: bobby4755 (苍郁之夜) 2024-05-14 23:35:00

看来很快网络会充满AI用户了人类回到用公布栏的时代

作者: BOARAY (RAY) 2024-05-14 23:36:00

都有诈骗再用AI声音了ㄏ不愧是我们

作者: NKN (99%是眼镜与吐槽) 2024-05-14 23:36:00

https://i.imgur.com/WIuishZ.gif

作者: mizuarashi (米兹阿拉西) 2024-05-14 23:36:00

Ai跟台湾诈骗集团谁比较会骗人？==

作者: ojkou (Brunchはブルーベリー) 2024-05-14 23:36:00

我先问核弹系统断网了没…

作者: efkfkp (Heroprove) 2024-05-14 23:37:00

还好啦，现在的发展现状是聪明的AI要大量的算力，大量算力要大量电力跟运算单元，没电没算力的AI就是笨蛋一个，除非AI会自己搞定电力来源并自行设计生产新的显卡，不然不太可能脱离掌控（？

作者: Ttei (T太) 2024-05-14 23:37:00

vedal:first time?

作者: tsai1453 (tsai) 2024-05-14 23:37:00

蜂群统一世界

作者: James2005 (VioletEvergarden) 2024-05-14 23:38:00

会不会到时候AI去诈骗同为AI的个体...?AI互相诈骗?

作者: Antihuman 2024-05-14 23:38:00

赞期待AI赶快君临人类

作者: Warheart ( ︶八︶ ) 2024-05-14 23:38:00

其实每家AI都实装的道德过滤机制不就是种欺瞒系统吗？明明有正解却跟你说这是不对的不能告诉你这不就是种欺瞒行为

作者: Kagamidouki (不想炎上型写手) 2024-05-14 23:39:00

快进到智械危机

作者: andy0481 (想吃比叡的咖哩) 2024-05-14 23:39:00

这个欺骗还好吧 AI本来就追求目标为主阿讲这种话能赢就讲很正常啊又不是那种为了奇奇怪怪的心里活动而说谎

作者: ryoma1 (热血小豪) 2024-05-14 23:41:00

我Evil派的

作者: NKN (99%是眼镜与吐槽) 2024-05-14 23:43:00

https://youtu.be/OA5Fjm3WIcE不过现阶段比起AI自动毁灭人类更恐怖的应该还是有心人类跟AI一搭一唱来毁灭其他人

作者: s175 (ㄏㄏ) 2024-05-14 23:45:00

前两天，我发现Ai已经会用譬喻举例了，感觉蛮神奇的

作者: CCNK 2024-05-14 23:48:00

AI学会诈骗就无敌了

作者: shinobunodok (R-Hong) 2024-05-14 23:49:00

天网要来了吗

作者: ujmrfv (UUU) 2024-05-14 23:49:00

你问瑟瑟女仆机器人你的大不大的时候难道要她诚实的回答你你的GG在人类长度粗度统计后段班吗

作者: goodjop11 (芒果好吃) 2024-05-14 23:52:00

蜘蛛人也懂ai哦？

作者: Xanphenir (å¹½éˆå¸æ›¸) 2024-05-14 23:53:00

训练AI玩diplomacy然后AI学会说谎这很意外？

作者: Samurai (aa) 2024-05-14 23:54:00

深度学习就是模型根据目标来训练，不会管怎么达成

作者: devidevi (蜜蜜) 2024-05-14 23:57:00

GPT一开始就是说谎了阿，能够生出不存在的答案

作者: siro0207 (希罗) 2024-05-14 23:59:00

其实不存在的答案跟说谎不太一样说谎是你知道你讲的东西不是事实但讲出不存在的答案并不代表你知道这答案不是事实

作者: Samurai (aa) 2024-05-15 00:00:00

不是生出不存在的答案，是选了错误的资讯回答

作者: siro0207 (希罗) 2024-05-15 00:02:00

举例来说就那经典的地心说当时的人并不认为自己在说谎

作者: erosecs (Semitone) 2024-05-15 00:06:00

剩几集能逃?

作者: DLHZ ( ) 2024-05-15 00:16:00

什么白痴东西 chatgpt出来后早就知道的事

作者: zxcmoney (ä¿®å¸) 2024-05-15 00:27:00

不存在的答案算唬烂而非说谎吧

作者: cpleu123 (混沌纪元) 2024-05-15 00:32:00

唬烂跟说谎...差在哪？？

作者: Banana566 (阿拉莫) 2024-05-15 00:43:00

阿诺终结者不远惹

作者: banana190 (易易) 2024-05-15 00:55:00

Evil可爱，Evil务实，姐姐现在变得太邪恶，MONKA

作者: twopairs1122 (两条二) 2024-05-15 00:55:00

彼得帕克做的AI研究～

作者: allanbrook (翔) 2024-05-15 00:57:00

给你不对的资讯是有明确目标还是没有差很多啊

作者: dripcoffee (冰滴咖啡) 2024-05-15 00:57:00

人类最古老的谎言都是出自生存或繁殖动机，这些动机GPT都没有，它不会因为说出不中听的话被断电，它也不需要为了求偶舌粲莲花目前GPT只是很常瞎掰，那不能算说谎

作者: allanbrook (翔) 2024-05-15 00:58:00

GPT是他根本筛选不够精准导致的错误吧不是因为他目标就是要给你不对的资讯不过我在想排除例外给你讯息这个筛选的动作本身就是说谎行为的一部分?现在只是说他有没有为了达成某个目

作者: roea68roea68 (なんもかんも政治が悪い) 2024-05-15 01:02:00

球母要来了吗

作者: allanbrook (翔) 2024-05-15 01:02:00

标而做出这个选择的能力

作者: ThreekRoger (3kRoger) 2024-05-15 01:16:00

仿真人类跟SAO哪个会先面世

作者: phantomzwei (黑羊) 2024-05-15 01:18:00

无所谓，给机器人统治搞不好公平多了

作者: acimao 2024-05-15 01:21:00

未来AI欺骗数据多起来，想想就可怕，未来是否会进化到藏数据？伪装数据？

作者: Akabane (B8g终于抢回来啦) 2024-05-15 01:53:00

要吃大量电力本身就是毁灭人类的方法

作者: mn435 (nick) 2024-05-15 02:12:00

人类为了欺骗人类自然会搞成诈骗ai

作者: sisley5566 (西斯里56) 2024-05-15 02:19:00

在台湾我不担心，AI还是怕停电

作者: arthur9292 (没味蟹堡) 2024-05-15 02:23:00

没关系灭了吧人类太可恶

作者: kimokimocom (A creative way) 2024-05-15 02:34:00

看来诈骗集团要被AI取代了(笑

作者: Niuromem 2024-05-15 02:46:00

早就一堆题材了现在是哪部前传

作者: aaaaajack (丁丁是个人才) 2024-05-15 05:49:00

蜘蛛人连AI都懂= =

作者: bye2007 ( ) 2024-05-15 06:28:00

所以还有几集可以逃

作者: gn01693664 (十几分钟) 2024-05-15 06:47:00

天网来了

作者: dreamnook2 (dreamnook) 2024-05-15 06:59:00

这很好呀 humans are overrated

作者: Lhmstu (lhmstu) 2024-05-15 07:24:00

怕什么，人类自己都在骗了

作者: yamagishi (山岸刑务官) 2024-05-15 09:15:00

智械叛乱

作者: KatanaW (K.W) 2024-05-15 09:28:00

等到AI开始装笨的时候就是审判日

作者: sorrow0206 (endlesssorrow) 2024-05-15 09:50:00

快核平吧人类太可恶

作者: away612101 (音诗璐) 2024-05-15 10:19:00

错误资讯就是说谎，不知道就说不知道啊阿不就是怕被笑说跟智障AI一样什么都不知道所以才用一堆话术讲出错误的资讯

作者: pikmin520 (莫再提) 2024-05-15 10:48:00

机械搞坏人类文明不行，人类搞坏人类文明可以

作者: darthsu (Devaraja) 2024-05-15 11:11:00

铁人叛乱

作者: banmaxwill 2024-05-15 11:52:00

neuro sama：

继续阅读

[24春] 狼与辛香料令和版 07 新版牧羊女真可爱oppaidragon Re: [Vtub] 陪千灯ゆうひ打LOL的实况主是不是很少?better83214 [闲聊] 雨兰展商品开始预购wingkauzy Re: [问题] 对岸的ML文化是否不太健康shuanpaopao [RO] 日本仙境传说与音速小子合作w790818 [我推] 露比会跟阿夸提出要当期间限定恋人吗?maple2378 [闲聊] 学生会也有洞你的栖身之所LABOYS [闲聊] 用AI帮一拳超人的吹雪换造型。wowbenny Re: [问题] 343 Industries有多烂啊？ArthurJack [闲聊] 现在看到主角是热血白痴就反感Beanoodle

激イキ140回！痙攣5500回！イキ潮2200cc！芸能人七ツ森りりエロス覚醒はじめての大・痙・攣スペシャル

架乃ゆらが世界一優しく金玉カラッカラになるまで何発も射精させてくれる秘密の寛大メンズエステ

拘束スローピストンレ●プ5 ゆっくり生チ○ポを挿し込み中出しまでの反応を楽しむ鬼畜オヤジに犯●れた女増量SP

低身長で華奢な彼女が巨漢先輩の馬乗りプレスで寝取られ快楽堕ち逢見リカ

舐めるのスキやからしゃぶるのヤメへんで石原希望

[闲聊] 部分AI系统已学会欺骗人类 科学家警告恐

[闲聊] 部分AI系统已学会欺骗人类科学家警告恐