Vision Transformers Need Registers sustainer123 PTT批踢踢实业坊

Vision Transformers Need Registers

楼主: sustainer123 (caster) 2025-12-30 18:22:16

这篇是处理vit特征图的噪声问题
大抵来说背景会出现高norm的点
这些点大多数是没啥资讯的背景
这些背景会丢失局部讯息并overfit全局讯息
换言之我们可以说这些噪声被模型当成全局讯息的暂存器
解决方法就是加几个token当暂存器
训练完丢掉
我测试对模型效果没提升
然后加的token越少降低越少

继续阅读

[姆咪] 坂本真绫到底是圣女还是邪女?goetz Re: [姆咪]umi0912umi Re: [姆咪]seer2525 [姆咪] newjeans老实说A00610lol Re: [闲聊] 皇城又开始流水轮回了喔YoruHentai [闲聊] 我解除安装战棋了peter6666712 Re: threads热议-【台湾特权量表】TokyoSoda Re: ==wu10200512 Re: [闲聊] 我要成为夜城的传奇了ChrisDavis [ZZZ] 剧情真的烂完了sc95819200