Re: batch former

楼主: sustainer123 (caster)   2025-10-09 18:35:55
※ 引述 《sustainer123 (温水佳树的兄长大人)》 之铭言:
:  
: 可以简单理解成针对batch的注意力机制
:  
: 对每张图片的同个位子做transformer
:  
: 老实说我觉得他的想法满有道理的
:  
: 但我的实验结果不是很好
:  
: 姆咪
:  
: 可能batch size太小
:  
: 也可能写错
:  
: 待观察
:  
一个指标小幅提升 另一个爆跌
但我调了一段时间的直觉应该是没用
连假完再调一下好了
先把他模组化
换个模型试试

Links booklink

Contact Us: admin [ a t ] ucptt.com