: 没关系,偷偷告诉你一个Insight
: 今年NeurIPS 2025有一篇超重量级的论文
: Introducing Nested Learning
: 这篇文论的重要程度不亚于Attention is all you need
: 甚至可以说有过之而无不及
: Transfomer架构只是发明了蒸气机
: Nested Learning这篇论文,简直就是热力学定律的等级了
: 基本上等于宣告Transformer架构过时了(因为是一种扁平和单一频率的特例)
: 未来三到五年,全面转向Nested Learning的时代
: 以下文字是我先写一版,再请Gemini润稿的洞察
: