AI大师请进

楼主: sustainer123 (caster)   2025-01-22 17:47:29
我今天在研究模型大小跟训练速度的关系
我看到的预估方式是macs*2/FLOPS
大概就是训练时间
可是我的训练结果感觉怪怪的
我训练集用Fashion MNIST
卡是1张A100
跑10个epoch
Resnet18的训练速度是145秒
Resnet34是176秒
mnasnet系列都接近200秒
从参数量来看 resnet34是20M resnet18是10M
mnasnet系列大概2-6M
看macs 差距比差不多
我不太理解问题在哪
训练集太小 导致时间都花在io?
作者: oin1104 (是oin的说)   2025-01-22 17:48:00
你是大师
楼主: sustainer123 (caster)   2025-01-22 17:49:00
我垃圾
作者: cities516 (安安路过)   2025-01-22 18:23:00
I/O 平行运算这种秒数级别的差距 搞不好你CPU温度差一点就有影响了

Links booklink

Contact Us: admin [ a t ] ucptt.com