PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Marginalman
Re: batch former
楼主:
sustainer123
(caster)
2025-10-09 18:35:55
※ 引述 《sustainer123 (温水佳树的兄长大人)》 之铭言:
:
: 可以简单理解成针对batch的注意力机制
:
: 对每张图片的同个位子做transformer
:
: 老实说我觉得他的想法满有道理的
:
: 但我的实验结果不是很好
:
: 姆咪
:
: 可能batch size太小
:
: 也可能写错
:
: 待观察
:
一个指标小幅提升 另一个爆跌
但我调了一段时间的直觉应该是没用
连假完再调一下好了
先把他模组化
换个模型试试
继续阅读
[闲聊] 爱惠惠什么时候也变士大夫除了
F16V
DIY Diaper Machine 自制宝宝穿裤机 #Shorts
maitetsu
[取暖] 康姐算台女顶标了吗
tomuy
[瓦特] fes
KurageuRoa
铁道出大事了 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
miHoYo
Re: [闲聊] 你齁出大事
PonkotsuMiko
Re: → SuiseiLeda: 都能30分钟跟老师二回战了 很正
PogChampLUL
女方喷“智障台男”大炎上 黑男道歉下架影片
maitetsu
Re: [闲聊] AI小豆
liubruce502
[姆咪] 补青猪
a5WaGyu
Links
booklink
Contact Us: admin [ a t ] ucptt.com