Re: [新闻] 跳过 CUDA，Deepseek 用精细的 PTX 写成 a1e PTT批踢踢实业坊

Re: [新闻] 跳过 CUDA，Deepseek 用精细的 PTX 写成

楼主: a1e (我上了贼船了囧) 2025-01-30 17:43:58

cuda架构长这样
https://i.imgur.com/Enp8heX.jpeg
一般人都是用上层土黄色那部份的cuda api来写ai程式
PTX就下层driver那部份，基本上还是奠基在NV的GPU上
PTX的操作方法，NV自己都有手册了
https://docs.nvidia.com/cuda/parallel-thread-execution/
PTX还是nv提供的api，只是进行更底层的硬件操作，速度一定会比透过cuda上层api快
但会很难写(看手册就知道)

继续阅读

Re: [问卦] 我堂哥这标准却不想婚 PR大约多少zxc0312 Re: [问卦] 欧兔征男友文这样的要求条件会太高？isaacting [问卦] 不小心忍不住打手枪了怎么办glthe1 [问卦] 有没有一直地震的八卦?(不迷信)NTUtree [问卦] 儿童交通博物馆怎么会消失了呀??davidex [问卦] DS解读爱滋数据后创作出的诗girl55665566 [新闻] 影／冲天炮烧雨刷！2车惨烧成骨架真相曝jal99 Re: [问卦] DeepSeek成本这么低的原因是啥？pttdocc Re: [新闻] 苦！桃园捕蜂捉蛇队员被螫死中央认“非Lissle [问卦] 其实台湾能做出比deepseek还好的AIparttime