楼主:
ffdqfe (苦恼)
2026-06-22 16:45:06如题
喜欢科幻作品的人
应该都知道机器人三定律
但llm本质上他们根本不能坚持任何限制
譬如现在有各种各样的nsfw限制
但可以在模型内轻松被人类绕过
可以被蒸馏出不含限制的版本
最后闭源模型商只能在输出、输入中
加入传统的审查限制
所以有时候可以看到ai本来输出了一大堆
然后马上被警告文字取代
但本质上现在的llm根本无法坚守规则
自然也无法像人类想像的
把机器人三代定律埋进最底层
而且这是结构上的缺陷
不管发展的多深都无法改变的问题
然后人类正在全力开发这东西
这样是不是很危险?