Re: [问卦] 我朋友说AMD有些程式不支援

楼主: pponywong (pony)   2020-09-23 17:38:00
※ 引述《arrenwu (拉姆真可爱)》之铭言:
: ※ 引述《zxcvfr99 (谁も気づかない人)》之铭言:
: : 指令集下面说了就不说,说点软件的
: : 有做科研的应该都有听过intel mkl吧?
: : 这东西就是intel专门开发的数学library
: : 你AMD要跑也不是不能跑啦
: : 只是慢到靠北而已
: : 一堆算矩阵的垃圾东西就是会有差这intel还AMD
: : 所以搞这方面的可怜肥宅工程师还是老实买intel+nvidia就好
: : 当然如果只是拿去打游戏那您随意就好了
: 这个情况现在可能好很多了
: Intel MKL 确实在数值运算上被广为运用,不管是MATLAB还是Numpy都有使用。
: 而长期以来,AMD CPU因为没有AVX2的关系被Intel电成猪头
: 终于,在去年七月的时候,AMD 的第三代Ryzen支援AVX2了!
: 但是这样子还是跑不赢Intel CPU,因为MKL他会认CPU来决定要不要启用AVX2加速。
: 这也不是Intel耍阴招,因为你用某些很旧的Intel CPU也开不了。
: 情况好转的部分是:
: 好事一
: MATLAB 在今年上半年的更新后,迫使MKL在使用 3rd Gen Ryzen 也会启用 AVX2
: 好事二
: 除了 MKL,还有个类似的OpenBLAS也很快
: 这里有人有进行比较 Link: https://bit.ly/33PUOpl
: https://i.imgur.com/95dF2WC.jpg
OpenBLAS 记得是基于 GotoBLAS 开发出来的
主要维护者是对岸的人
这版的 BLAS 它是把全部的 subroutine 对照
cpu都用 SIMD指令去处理
等于是硬干 速度几乎跟 Intel MKL一样
目前还有一个 ATLAS => auto tuned blas
它是用程式自己去调整的 算是各有千秋
另外用MKL单独去比 BLAS subroutine也不公平
BLAS 最复杂的 level 3 也只是 D = A*B + C
依照Intel的网站所讲 它是在否些算法上 使用平行运算
MKL 最主用的library就是 LAPACK
LAPACK其中的 Cholesky decomposition 本身就可以平行运算
至于求 SVD 使用 Householder reflector 也是可以使用平行运算
QR decomposition 也可以用 Householder reflector
还有LAPACK的 chetrd (reduce Hermitian matrix to tridiagonal form)
也是可以平行运算
LAPACK 很多算法 都是要高手才知道细节的
作者: fripSide (fripSide)   2020-09-23 17:42:00
楼下说说看
作者: kerkercheng (✂✂✂✂✂✂✂✂✂)   2020-09-23 17:47:00
你不要这么专业好不好
作者: KVSU (KIVIS)   2020-09-23 17:53:00
快推 免得被人发现我看不懂

Links booklink

Contact Us: admin [ a t ] ucptt.com