楼主:
a1e (我上了贼船了囧)
2025-01-30 17:43:58cuda架构长这样
https://i.imgur.com/Enp8heX.jpeg
一般人都是用上层土黄色那部份的cuda api来写ai程式
PTX就下层driver那部份,基本上还是奠基在NV的GPU上
PTX的操作方法,NV自己都有手册了
https://docs.nvidia.com/cuda/parallel-thread-execution/
PTX还是nv提供的api,只是进行更底层的硬件操作,速度一定会比透过cuda上层api快
但会很难写(看手册就知道)