Re: [新闻] 跳过 CUDA,Deepseek 用精细的 PTX 写成

楼主: a1e (我上了贼船了囧)   2025-01-30 17:43:58
cuda架构长这样
https://i.imgur.com/Enp8heX.jpeg
一般人都是用上层土黄色那部份的cuda api来写ai程式
PTX就下层driver那部份,基本上还是奠基在NV的GPU上
PTX的操作方法,NV自己都有手册了
https://docs.nvidia.com/cuda/parallel-thread-execution/
PTX还是nv提供的api,只是进行更底层的硬件操作,速度一定会比透过cuda上层api快
但会很难写(看手册就知道)

Links booklink

Contact Us: admin [ a t ] ucptt.com