[新闻] 绕开辉达护城河陆媒传DeepSeek可改适配 doig PTT批踢踢实业坊

[新闻] 绕开辉达护城河陆媒传DeepSeek可改适配

楼主: doig (dd) 2025-02-02 23:04:29

1.媒体来源:
中时新闻网 22:35 2025/02/02
2.记者署名:
中时新闻网卢伯华
3.完整新闻标题:
绕开辉达护城河陆媒传DeepSeek可改适配中国国产GPU芯片
4.完整新闻内文:
https://i.imgur.com/bLmv1kF.jpeg
DeepSeek在研发大模型时绕过了辉达的CUD技术，这可以让大陆的AI模型更容易适配中国
国产GPU芯片。（图／路透）
据外媒报导，深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬件整合技术“统一计
算架构”(CUDA)这道AI技术护城河，这种用新的算法高效利用硬件层面加速，能提高模
型效果。只要有足够擅长写PTX语言的内部开发者，就能让大陆开发的AI模型更容易适配
中国国产GPU芯片，这让美国不少AI巨头们感受到极大的威胁。
据《快科技》报导，DeepSeek真的绕过了辉达的计算架构CUDA，北京航空航太大学黄雷副
教授接受采访时表示，绕过CUDA意味着DeepSeek可以直接根据GPU的驱动函数做一些新的
开发，从而实现更加细细微性的操作。
黄雷指出，譬如DeepSeek在多节点通信时绕过了CUDA，直接使用并行线程执行代码（
Parallel Thread Excution, PTX），其最多只能实现以算法的方式来高效利用硬件层
面的加速。一旦速度变得更快，这就意味着别人的模型要训练10天，而DeepSeek只需要训
练5天，那么就能给模型喂更多的资料，即能让模型在同等时间内看到更多的资料，间接
提高模型的效果。
因此，透过PTX虽然可以进行更多专门的最佳化调整，但缺点是很难维持稳定，需要人力
大量除错，因此也显示出 Deepseek 工程师的设计功力。
报导说，Deepseek 的出现，打破了硅谷巨头在人工智能竞争中的军备竞赛局面，AI 开发
或许不一定非要追求最强芯片和庞大芯片数量，透过精细的程式设计也能让低规设备跑出
高效结果，这可能也是前日美国科技股市震荡的主要原因。
报导引述消息人士指出，DeepSeek拥有一些擅长写PTX语言的内部开发者，假如它之后使
用中国国产GPU，其在硬件适配方面将会更得心应手，其只要了解这些硬件驱动提供的一
些基本函数接口，就可以仿照辉达GPU硬件的程式设计接口去写相关的代码，从而让自家
大模型更加容易适配国产硬件。
5.完整新闻连结:
https://reurl.cc/74NOd9

继续阅读

[新闻] 价值5亿元的凡高真迹画　竟是9年前车库AoyamaNanami [问卦] 美少女梦工厂养成系列有机会再红起来吗weber18767 [新闻] 英超》萨拉赫梅开二度！　助利物浦稳占榜wahaha23 [问卦] 小学女生就挑染是什么情况GKKR [问卦] 什么!? 东七七被交易到湖人ian1107 [问卦] 工作4小时休息半小时484拉基政策R==kerkerson Re: [协寻] 中和国中前面巷子走失黑白猫(奖金)moonfire [问卦] 有骇客能用7zip绕过windows的安全机制saobox [问卦] 台湾48岁女星有谁bban7225 [问卦] 大楼洗窗户的会遇到什么ffreakk

[新闻] 绕开辉达护城河 陆媒传DeepSeek可改适配

[新闻] 绕开辉达护城河陆媒传DeepSeek可改适配