[新闻] 绕开辉达护城河 陆媒传DeepSeek可改适配

楼主: doig (dd)   2025-02-02 23:04:29
1.媒体来源:
中时新闻网 22:35 2025/02/02
2.记者署名:
中时新闻网 卢伯华
3.完整新闻标题:
绕开辉达护城河 陆媒传DeepSeek可改适配中国国产GPU芯片
4.完整新闻内文:
https://i.imgur.com/bLmv1kF.jpeg
DeepSeek在研发大模型时绕过了辉达的CUD技术,这可以让大陆的AI模型更容易适配中国
国产GPU芯片。(图/路透)
据外媒报导,深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬件整合技术“统一计
算架构”(CUDA)这道AI技术护城河,这种用新的算法高效利用硬件层面加速,能提高模
型效果。只要有足够擅长写PTX语言的内部开发者,就能让大陆开发的AI模型更容易适配
中国国产GPU芯片,这让美国不少AI巨头们感受到极大的威胁。
据《快科技》报导,DeepSeek真的绕过了辉达的计算架构CUDA,北京航空航太大学黄雷副
教授接受采访时表示,绕过CUDA意味着DeepSeek可以直接根据GPU的驱动函数做一些新的
开发,从而实现更加细细微性的操作。
黄雷指出,譬如DeepSeek在多节点通信时绕过了CUDA,直接使用并行线程执行代码(
Parallel Thread Excution, PTX),其最多只能实现以算法的方式来高效利用硬件层
面的加速。一旦速度变得更快,这就意味着别人的模型要训练10天,而DeepSeek只需要训
练5天,那么就能给模型喂更多的资料,即能让模型在同等时间内看到更多的资料,间接
提高模型的效果。
因此,透过PTX虽然可以进行更多专门的最佳化调整,但缺点是很难维持稳定,需要人力
大量除错,因此也显示出 Deepseek 工程师的设计功力。
报导说,Deepseek 的出现,打破了硅谷巨头在人工智能竞争中的军备竞赛局面,AI 开发
或许不一定非要追求最强芯片和庞大芯片数量,透过精细的程式设计也能让低规设备跑出
高效结果,这可能也是前日美国科技股市震荡的主要原因。
报导引述消息人士指出,DeepSeek拥有一些擅长写PTX语言的内部开发者,假如它之后使
用中国国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一
些基本函数接口,就可以仿照辉达GPU硬件的程式设计接口去写相关的代码,从而让自家
大模型更加容易适配国产硬件。
5.完整新闻连结:
https://reurl.cc/74NOd9

Links booklink

Contact Us: admin [ a t ] ucptt.com