一大早被邮差门铃吵醒,赶紧开门收货开箱,拿出一几乎全白的盒子放在桌上:
https://i.imgur.com/eXLDkXA.jpg
打开后,除了 TITAN V 本体,还有两本手册与一条 DP 转 DVI 的转接线:
https://i.imgur.com/6vKbiLq.jpg
背板有 3 个 DisplayPort 加 1 个 HDMI 接头:
https://i.imgur.com/U9K85dq.jpg
将本体拿出静电袋,准备装进系统:
https://i.imgur.com/ECRr1Ut.jpg
现有一张 ASUS ROG STRIX-GTX1080TI-O11G-GAMING:
https://i.imgur.com/nXXIVmM.jpg
插好插满:
https://i.imgur.com/EX7rItr.jpg
开机测试:
https://i.imgur.com/ldY5EDD.jpg
利马跑个之前写的tensorflow程式,用小量资料组训练个一期,结果跟预想差不多,
在不为 GV100 写客制最佳化程式下其实只比 1080Ti 快 30% 左右,要完整用到那
640 个 Tensor Core 的运算能力,还有很多文件要看程式要写:
https://i.imgur.com/YGDy8Oi.png
不过如果你的程式有用到双精度浮点运算(FP64),倒是不用改程式就可以直接获得
10 倍左右的加速,TITAN V 是 NVIDIA 首次在消费型显卡下放全速 FP64 计算能力:
https://i.imgur.com/lIgIfMm.png
NVIDIA 的专业卡才会有的 ECC 内存,在 TITAN V 上还是没有开放:
https://i.imgur.com/JjbUC5k.png
最后附上一个简单的规格比较表:
╒═══════╤═══════╤══════╤══════╤═══════╕
│ │ Titan V │ Titan Xp │GTX 1080 Ti │ V100 │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ CUDA Cores │ 5120 │ 3840 │ 3584 │ 5120 │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ FP64 Cores │ 2560 │ 120 │ 112 │ 2560 │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ Boost Clock │ 1455 MHz │ 1582 MHz │ 1582 MHz │ 1370 MHz │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ 内存大小 │ 12GB │ 12GB │ 11GB │ 16GB │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ 内存接口 │3072-bit HBM2 │384-bit G5X │352-bit G5X │4096-bit HBM2 │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ 内存频宽 │ 653 GB/s │ 547 GB/s │ 484 GB/s │ 900 GB/s │
╞═══════╪═══════╪══════╪══════╪═══════╡
│半精度(Tensor)│ 110 TFLOPS │0.19 TFLOPS │0.17 TFLOPS │ 112 TFLOPS │
╞═══════╪═══════╪══════╪══════╪═══════╡
│单精度 (FP32) │ 13.8 TFLOPS │12.1 TFLOPS │11.3 TFLOPS │ 14 TFLOPS │
╞═══════╪═══════╪══════╪══════╪═══════╡
│双精度 (FP64) │ 6.9 TFLOPS │0.38 TFLOPS │0.35 TFLOPS │ 7 TFLOPS │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ GPU 芯片 │ GV100 │ GP102 │ GP102 │ GV100 │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ Die Size │ 815 mm2 │ 471 mm2 │ 471 mm2 │ 815 mm2 │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ 电晶体数量 │ 21.1B │ 12B │ 12B │ 21.1B │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ 制程技术 │TSMC 12nm FFN │TSMC 16nm FF│TSMC 16nm FF│TSMC 12nm FFN │
╞═══════╪═══════╪══════╪══════╪═══════╡
│ 售价 │ 10万 │ 4万 │ 2.8万 │ 30万 │
╘═══════╧═══════╧══════╧══════╧═══════╛