纪录一下

楼主: sustainer123 (caster)   2025-10-20 17:52:16
pixel shuffle用在vit架构会出现无法收敛的问题
但用在cnn架构就表现良好
我猜测是学习到的特征分布的问题
vit是全局特征 cnn输出的是局部特征
我随便猜的
明天再想想原因
作者: Wardyal (Wardyal)   2024-10-20 17:52:00
不用想 it just work
楼主: sustainer123 (caster)   2025-10-20 17:53:00
就是不work我才要想 对啊

Links booklink

Contact Us: admin [ a t ] ucptt.com