[新闻] 陆DeepSeek走红！开发者是“95后”天才 koei5566 PTT批踢踢实业坊

[新闻] 陆DeepSeek走红！开发者是“95后”天才

楼主: koei5566 (光荣56) 2025-01-27 15:30:03

1.媒体来源:
UDN
2.记者署名:
2025-01-27 14:08 联合报／记者
陈言乔
／即时报导
3.完整新闻标题:
陆DeepSeek走红！开发者是“95后”天才少女 Meta组4团队应对
4.完整新闻内文:
大陆AI新创公司DeepSeek近来迅速走红，令硅谷十分紧张。DeepSeek-V2的关键开发者之
一是被称为95后AI“天才少女”罗福莉。小米创始人雷军以人民币千万元年薪招揽罗福莉
，领导小米AI大模型团队。
红星资本局报导，2024年底，DeepSeek发布了新一代大语言模型DeepSeek-V3，同时宣布
开源。1月20日，DeepSeek发布新模型DeepSeek-R1并同步开源模型权重，再次引发全球AI
科技圈关注。
DeepSeek昨天（26日）曾出现短时闪崩现象，DeepSeek回应称，当天下午确实出现了局部
服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后用户访问
量激增，服务器一时无法满足大量用户的并发需求。
红星资本局指，在多项基准测试中，V3的成绩超越了主流开源模型，并和世界顶尖的闭源
模型不分伯仲。同时，由于其极低的训练成本，DeepSeek-V3被称为“AI界拼多多”。
公开资料显示，DeepSeek来自杭州“深度求索人工智能基础技术研究有限公司”（下称“
深度求索公司”），专注于开发先进的大语言模型和相关技术，由大陆知名量化资管巨头
“幻方量化”于2023年7月创立，也因此获得资本市场的广泛关注。
而DeepSeek-V2的关键开发者之一罗福莉也迅速走红，她被称为95后（1995年以后出生）
AI“天才少女”。罗福莉本科就读于北京师范大学电脑专业，硕士毕业于北京大学计算语
言学专业。
硕士毕业后，罗福莉先是进入阿里达摩院做人工智能研究，从事预训练语言模型相关的工
作，负责阿里达摩院AliceMind开源专案，主导开发了多语言预训练模型VECO。
2022年，罗福莉加入“幻方量化”从事深度学习相关策略建模和算法研究，后又跳槽到
DeepSeek担任深度学习研究员，参与研发MoE大模型DeepSeek-V2。
就在DeepSeek-V3发布前几天，小米创始人雷军已开出千万年薪招聘罗福莉，领导小米AI
大模型团队。
DeepSeek的爆火后，登顶苹果中国和美国应用商店免费APP下载排行榜，超越了ChatGPT。
澎湃新闻报导，在国外大模型排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名已经
升至全类别大模型第3，与OpenAI的ChatGPT-4o最新版并列。不过，DeepSeek-R1的预训练
费用为557.6万美元，不到OpenAI GPT-4o模型训练成本的十分之一。
红星资本局称，DeepSeek公司的北京子公司正在招人，现共释出52个岗位，包括深度学习
研究员、核心系统研发工程师以及资深ui设计师等。其中，薪资最高的为核心系统研发工
程师（校招），薪资范围人民币6至9万元；大部分岗位的起薪在人民币2万元及以上。
DeepSeek以其研发的极低成本优势，引起美国硅谷等AI公司的紧张。澎湃新闻27日引述
Information网站报导，脸书母公司Meta已成立了4个专门研究小组来研究量化巨头“幻方
量化”旗下的国产大模型DeepSeek的工作原理，并基于此来改进旗下大模型Llama。
其中2个小组正在试图了解“幻方量化”如何降低训练和运行DeepSeek的成本；第3个研究
小组则正在研究“幻方量化”可能使用了哪些资料来训练其模型；第4个小组正在考虑基
于DeepSeek模型属性重构Meta模型的新技术。
据DeepSeek介绍，R1的预训练费用只有557.6万美元，在2048块英伟达（辉达）H800 GPU
（针对中国市场的低配版GPU）集群上运行55天完成，仅是OpenAI GPT-4o模型训练成本的
不到十分之一。一经推出，DeepSeek-R1便凭借其物美价廉的特性在海外开发者社区中引
发了轰动，更是凭借极低的训练成本震撼了硅谷。
数日前，有Meta的工程师们在匿名社交平台TeamBlind上吐露心声，表示DeepSeek所研发
的AI模型为其带来了巨大压力。
5.完整新闻连结 (或短网址)不可用YAHOO、LINE、MSN等转载媒体:
https://udn.com/news/story/7333/8517100?from=redpush
6.备注:
五楼爱萝莉

继续阅读

[问卦] 女朋友上车脚放椅子上可以吗?ReiKuromiya [问卦] 女生很正但说我是一个小偷真的ok? Julian9x9x9 [问卦] 一堆mirror selfie 都是iPhone?ryhma [问卦] 娶台湾女生算上辈子修来的福吗？sushi11 [问卦] 红包不包新钞会怎样？ffdqfe [新闻] 快讯／中居正广性朝贡风波　富士电视台h100733 Re: [新闻] 过年大搞乱伦!少女连2年回曾祖家激战亲tomshiou Re: [新闻] 卓荣泰呛蓝白不敢倒阁　国会改选“民进JOKIC Re: [新闻] 突然爆红的DeepSeek吓坏硅谷美股期指和a15568 [问卦] 这样买etf能行吗pixefew