[问卦] 大语言模型不能限制是不是很危险？ ffdqfe PTT批踢踢实业坊

[问卦] 大语言模型不能限制是不是很危险？

楼主: ffdqfe (苦恼) 2026-06-22 16:45:06

如题
喜欢科幻作品的人
应该都知道机器人三定律
但llm本质上他们根本不能坚持任何限制
譬如现在有各种各样的nsfw限制
但可以在模型内轻松被人类绕过
可以被蒸馏出不含限制的版本
最后闭源模型商只能在输出、输入中
加入传统的审查限制
所以有时候可以看到ai本来输出了一大堆
然后马上被警告文字取代
但本质上现在的llm根本无法坚守规则
自然也无法像人类想像的
把机器人三代定律埋进最底层
而且这是结构上的缺陷
不管发展的多深都无法改变的问题
然后人类正在全力开发这东西
这样是不是很危险？

继续阅读

[问卦] 最后会保护台湾省的是中国大陆abcd5566 [问卦] 为什么要推新青安？cake51640 [问卦] 台女自付1千多元吃春水堂然后开战了（图thewtf Re: [新闻] 中共血洗台湾? 他警告这群更惨：1万人被Lailungsheng [问卦] 甲宝贝怎么放心交出后背Salcea [问卦] 哈哈新加坡也会怕阿嬷的情书ㄛcchh179 [问卦] 同事有房贷比狗还乖，难怪要推新青安SeaForest [问卦] 少去一次酒店可以买多少鲜奶?Tsucomi69 Re: [问卦] 日本做事有规划二战却打输中国swh922 [问卦] 股市创新高了se2422