懂深度学习的请进

楼主: sustainer123 (caster)   2024-12-16 17:36:56
一样分布式训练的问题
我拿fashion MNIST当实验品
然后十次叠代
超参数随便调
单卡跟DP的Batch设64
4卡设16
跑出来的时间分别是
单卡:49秒
DDP:84秒
DP:107秒
我无法理解为啥DDP会低成这样
而且我用4张A100 没道理输一张A100吧
楼主: sustainer123 (caster)   2024-12-16 17:37:00
模型就DNN 随便搓的

Links booklink

Contact Us: admin [ a t ] ucptt.com