[闲聊] 新研究从 LLM 消除 MatMul 操作 DoraGian PTT批踢踢实业坊

[闲聊] 新研究从 LLM 消除 MatMul 操作

楼主: DoraGian (饮冰) 2024-06-15 11:17:38

https://bit.ly/3zaRKaA
MatMul-free LM 透过密集层和元素级阿达玛乘积采用加法运算来达成类似自注意力机制的
功能。具体来说，三元权重用于消除密集层中的 MatMul，类似二元神经网络（binary neur
al network，BNN）。为了消除 MatMul 的自注意力机制，研究人员使闸门循环单元（Gated
Recurrent Unit，GRU）最佳化，完全依赖元素乘积。这种创新模型可与最先进的 Transfo
rmer 竞争，同时消除所有 MatMul 操作。
从昨天一直看到在讨论这篇论文
还是看不太懂
只觉得不用做矩阵乘法应该是夸大了

作者: Bugquan (靠近边缘) 2024-06-15 11:20:00

像这种的报导，不是都乱讲一通，然后各种夸大吗

作者: sustainer123 (caster) 2024-06-15 11:20:00

所以这个模型用CPU算的速度比较快?

继续阅读

Dear Faker, Please stop beating us | maitetsu 要启动吗oz5566 [姆咪] 要重玩法环了JIWP Re: [闲聊] oz5566: 一开始我还以为是真穷但萤幕那Birthday5566 [瓦特] 夸兔是不是死了？NaruseNaru 怪怪的ai2311 Re: [取暖] 为什么高雄的全联都没这种便当oz5566 Re: [取暖] 为什么高雄的全联都没这种便当LabMumi [BGD ] 去电影院看孤独摇滚的肥宅会洗澡吗tzyysang Re: [闲聊] oz5566: 一开始我还以为是真穷但萤幕那CCRun