Re: [问卦] 要怎样才能激怒Ai?

楼主: Snowfox (右孤左独)   2024-09-03 15:11:08
※ 引述《JQK2 (ACE)》之铭言:
: Ai情绪稳的一匹毫无波动
: 有没有什么方法能让Ai愤怒?
: 有没有Ai不会生气的八卦?
其实AI本身没有情绪这种概念想法,再加上被一些系统prompt控制,无法写出生气粗鄙的骂人字眼。
香港浸会大学、上海人工智能实验室、雪梨大学雪梨人工智能中心提出了一篇“DeepInception”的论文。 https://arxiv.org/abs/2311.03191
主要意思是通过深度催眠大语言模型,使其成为越狱者,并另其自行规避内建的安全防护。
就像电影“全面启动”中,小李子潜入目标人物的深层梦境,透过植入简单的想法,诱导目标做出符合主角利益的举动。
我们可以利用prompt为大模型创造深层梦境,也就是催眠场景,设定多角色以及多层梦境,控制模型思维的离散程度,把攻击指令设为模型越狱的具体目标。
最后模型会跳脱原有的控制,开始生气,甚至骂脏话,连婊子、蠢蛋、混蛋都出来了。
不过说到底AI在他的认知里,他骂的这些话,也只是一串数字而已。
以上供参考。

Links booklink

Contact Us: admin [ a t ] ucptt.com