楼主:
JQK2 2025-02-03 08:26:50绕开辉达护城河 陆媒传DeepSeek可改适配中国国产GPU芯片
22:352025/02/02
中时新闻网 卢伯华
据外媒报导,深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬件整合技术“统一计
算架构”(CUDA)这道AI技术护城河,这种用新的算法高效利用硬件层面加速,能提高模
型效果。只要有足够擅长写PTX语言的内部开发者,就能让大陆开发的AI模型更容易适配
中国国产GPU芯片,这让美国不少AI巨头们感受到极大的威胁。
据《快科技》报导,DeepSeek真的绕过了辉达的计算架构CUDA,北京航空航太大学黄雷副
教授接受采访时表示,绕过CUDA意味着DeepSeek可以直接根据GPU的驱动函数做一些新的开
发,从而实现更加细细微性的操作。
黄雷指出,譬如DeepSeek在多节点通信时绕过了CUDA,直接使用并行线程执行代码(
Parallel Thread Excution, PTX),其最多只能实现以算法的方式来高效利用硬件层
面的加速。一旦速度变得更快,这就意味着别人的模型要训练10天,而DeepSeek只需要训
练5天,那么就能给模型喂更多的资料,即能让模型在同等时间内看到更多的资料,间接
提高模型的效果。
因此,透过PTX虽然可以进行更多专门的最佳化调整,但缺点是很难维持稳定,需要人力
大量除错,因此也显示出 Deepseek 工程师的设计功力。
报导说,Deepseek 的出现,打破了硅谷巨头在人工智能竞争中的军备竞赛局面,AI 开发
或许不一定非要追求最强芯片和庞大芯片数量,透过精细的程式设计也能让低规设备跑出
高效结果,这可能也是前日美国科技股市震荡的主要原因。
报导引述消息人士指出,DeepSeek拥有一些擅长写PTX语言的内部开发者,假如它之后使
用中国国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一
些基本函数接口,就可以仿照辉达GPU硬件的程式设计接口去写相关的代码,从而让自家
大模型更加容易适配国产硬件。
https://reurl.cc/74NOd9
之前就在想芯片被制裁逼使自己搞,那Ai绘图芯片GPU不也能自产?靠自己最实在!