tranformer

楼主: sustainer123 (caster)   2025-09-24 11:56:21
为啥能用啊
为啥loss curve完全没overfitting的迹象
为啥能正常收敛
我只是无聊叫ai写一个简单的vit测试一下
简单调一下超参数
怎么感觉跑出还不错的东西
我要死了 这点资料量怎么可能可以用transformer
作者: steven183 (steven183183)   2025-09-24 11:57:00
变形金刚
作者: wu10200512 (廷廷)   2025-09-24 11:57:00
有先预训练吧
楼主: sustainer123 (caster)   2025-09-24 11:57:00
宝 3000笔资料怎么可能能用vit 我没fine tune
作者: kullan (Welcome to Hentai-wan)   2025-09-24 11:58:00
机魂开心
楼主: sustainer123 (caster)   2025-09-24 11:58:00
我直接重train 因为我资料特性 不太能pretrainfine tune

Links booklink

Contact Us: admin [ a t ] ucptt.com