补充:
国外也有些文章在讨论,大致上有些脉络了
https://i.imgur.com/rklGqze.jpg
Nvdia先前使用Float 64 Shaders,可执行一个 Float 64或一个 Float 32
Ampere架构的Float 64 Shaders, 可执行一个 Float 64或"两"个 Float 32
Tweakers.net也有分析这个架构:
https://tinyurl.com/yy5o8pop
https://i.imgur.com/Kj0UTEC.jpg
从图片来看就很清楚,FP32被划成两份,所以说类似超线程的说法其实也蛮正确的
先说不是来打脸或看衰的,只是刚好看到不同见解的说法,分享参考。
逛了一下对岸nga,有些文章提到:
1.这个cuda数量是等效数量,实际物理上只有一半,只是现在安培架构吞吐指令数翻倍了
,并不是所有的指令都能合并吞吐,所以这么写其实是不合适的。
2.这次列出3090有一万个,3080有8000+个
其实是不是有点类似于超线程的意思?
每个物理core有两个fp32计算单元
所以算力大约提升两倍?
实际上die里真正的物理核心只有/2这么多?
是的,所以70的CUDA/2的话,传统性能可能还是打不过80ti,加上RTX才能达到老黄ppt
写的性能。
以上,
分享一下不同的看法,
我也不是对这块专业领域的,如果最后有错请勿见怪。