[姆咪] Nvidia 发表双子塔AI模型

楼主: h0103661 (路人喵)   2026-06-26 08:48:12
Nemotron TwoTower 30B-A3B
自回归混合扩散模型
相当于自带D Flash的Nemotron
看了reddit原来不是只有我想到911
虽然双子塔是twin towers
==
作者: pchooooome (匹西吼~~~~~~~~~~~~~~~~~)   2026-06-26 08:49:00
有屌打qwen3.6 35b吗
楼主: h0103661 (路人喵)   2026-06-26 08:52:00
没有,扩散模型目前都差一个世代以上
作者: sustainer123 (caster)   2026-06-26 08:53:00
看了一下是语言模型 类似何恺明那篇的思路?不过中间是mamba 那不就类似Nemotron

Links booklink

Contact Us: admin [ a t ] ucptt.com