Re: [边缘] Deepseek屌在哪

楼主: TentoEtsu (天藤悦)   2025-01-28 09:37:09
→ windowsill: 不 我是要知道认真的
认真的
1.他很便宜,他在芯片禁令下,用比较少的硬件去做出来,而且能力堪比美国一流AI
除了中共禁字不能提之外,他就是一流AI,美国企业砸了比他更多钱,却不见得比他好
2.他怎么做到的?
有两个关键技术
- 用很多小模型去串成大模型,所以每次运算时只需要动用一部分小模型,所以对算力
要求不高。但这个技术大厂也会,而且大厂也有在用,只是DeepSeek在这方面的算法
写得更优秀,反正中国就是硬件有限,他们只能在其他方面加强来达到效果
- 更关键的是,DeepSeek使用了一个叫“Reinforcement Learning”直翻叫强化学习,
他的原理是让AI自由学习,而在AI学习过程中不告诉它对错,这会让AI爆速成长,很快
就能训练出一个模型,但很明显这方法有风险,因为AI很有可能学习到要怎么毁灭人类
,但DeepSeek一样靠着算法中避免AI演变成负面结果。结果就是花较少的资源和较少
的时间就训练出一个很强的AI。这边用一句话描述就是中国“艺高人胆大”
“Reinforcement Learning”这个技术大厂也会,但他们不太采用,因为就是有风险,
但现在DeepSeek示范了这是可行的,之后大厂应该也会在实验之后也开始使用。
以上可能有一堆错误因为我不是专家 但基本的方向我敢说是没错的
作者: RosieChaeng (我爱彩英)   2025-01-28 09:43:00
所以这用来写程式有比gpt Claude好用吗
楼主: TentoEtsu (天藤悦)   2025-01-28 09:43:00
目前没有而且他用途不多,他没有图像辨识,也没有自动驾驶
作者: windowsill (蓝冬海)   2025-01-28 09:44:00
感谢解释
作者: waitan (微糖儿>////<)   2025-01-28 09:45:00
那老黄的芯片还会有人要吗
作者: kitune (狐)   2025-01-28 09:45:00
最根本的原因还是点出了设备不用堆太多就有点效果
楼主: TentoEtsu (天藤悦)   2025-01-28 09:45:00
但在生成式语言这块很厉害 他学了一堆瞎鸡巴的东西
作者: kitune (狐)   2025-01-28 09:46:00
老黄铲子还是可以卖啊 只是以后大家不会抢购了 正常买
楼主: TentoEtsu (天藤悦)   2025-01-28 09:46:00
例如他会模仿ptt酸民发文
作者: Megacolon (外物侵入造成巨结肠症)   2025-01-28 09:47:00
感觉制裁阿共是对的,让阿共自己练蛊,总会搞出很邪门的东西,牢蒋当年就是让阿共闭门练出蛊王牢毛
楼主: TentoEtsu (天藤悦)   2025-01-28 09:47:00
GPU还是会有很大的需求啊DeepSeek他只是用了比较少的GPU,但实际少到什么程度如果你看到那种很夸张的数字都是吹出来的你就想如果今天中国可以堆硬件 他们会不会堆 一定也会有谁不想 对ㄚ
作者: Alwen (凤梨)   2025-01-28 09:54:00
只要大厂停止加码买铲子,nv就会崩一大段惹,即使他们还是有在买铲子
楼主: TentoEtsu (天藤悦)   2025-01-28 09:54:00
短空长多 送分题
作者: Alwen (凤梨)   2025-01-28 09:55:00
要改买软件类的股啦 ,阿祖昨天就涨给大家看惹
作者: DoraGian (饮冰)   2025-01-28 09:55:00
RL也不是新东西了 他里面没有transformer吗?最耗gpu的部分
楼主: TentoEtsu (天藤悦)   2025-01-28 09:56:00
怎么可能停止加码 = = 有人真的以为DeepSeek是终点站吗变形金刚什么的窝不晓得ㄟ
作者: Alwen (凤梨)   2025-01-28 09:57:00
就是每年资本支出不再巨大成长惹,我蛮怀疑他们短期两三年还会不会继续巨大成长

Links booklink

Contact Us: admin [ a t ] ucptt.com