: 推 a2935373 : 然后在隔壁版看到V100好像还是很抢手 怀疑老黄这次 08/22 03:18
: → a2935373 : 是为了出给专业公司顺便炒作一下游戏来交代股东 不 08/22 03:18
: → a2935373 : 然RTX这几张真的怎么看都不像游戏用 08/22 03:18
讲到这个V100 我朋友最近分享一个 ML Benchmark Result 给我
https://github.com/u39kun/deep-learning-benchmark
先看一下 V100 和 1080 Ti 的规格差异
Model Memory CUDA Cores Tensor Cores
Tesla V100 16GB HBM2 5120 640
1080 Ti 11GB GDDR5 3584 0
V100 boosted Frequency 1455 MHz
1080Ti boosted Frequency: 1582 MHz
测试结果
PyTorch 0.3.0
1080 Ti
精度 vgg16 eval vgg16 train resnet152 eval resnet152 train
32-bit 39.3ms 131.9ms 57.8ms 206.4ms
16-bit 33.5ms 117.6ms 46.9ms 193.5ms
V100
精度 vgg16 eval vgg16 train resnet152 eval resnet152 train
32-bit 26.2ms 83.5ms 38.7ms 136.5ms
16-bit 12.6ms 58.8ms 21.7ms 92.9ms
Tensorflow 1.4.0
1080 Ti
精度 vgg16 eval vgg16 train resnet152 eval resnet152 train
32-bit 43.4ms 131.3ms 69.6ms 300.6ms
16-bit 38.6ms 121.1ms 53.9ms 257.0ms
Tensorflow 1.5.0
V100
精度 vgg16 eval vgg16 train resnet152 eval resnet152 train
32-bit 24.0ms 71.7ms 39.4ms 199.8ms
16-bit 13.6ms 49.4ms 22.6ms 147.4ms
V100 TDP 300W
1080Ti TDP 275W
这样看下来,Tensor Core 的强是表现在能耗比上面
V100 一张要 $8900 @@"