原文标题:
DeepSeek深夜发布新款开源AI模型Janus-Pro
原文连结:
https://news.cnyes.com/news/id/5847178
发布时间:
2025-01-28 01:51
记者署名:
罗昀玫
原文内容:
DeepSeek 周二 (28 日) 发布开源多模态人工智能 (AI) 模型 Janus-Pro,其中
Janus-Pro-7B 在 GenEval 和 DPG-Bench 基准测试中打败 OpenAI 的 DALL-E 3 和
Stable Diffusion。
DeepSeek 团队正式发表两款多模态框架,即 Janus-Pro 和 JanusFlow。
(图片:苹果)
(图片:DeepSeek 专家)
Janus-Pro 是一款统一多模态理解与生成的创新框架,透过去耦合视觉编码的方式,大幅
提升了模型在不同任务中的适配性与表现。
JanusFlow 是一款透过生成流 (Rectified Flow) 与自回归语言模型融合实现统一的框架
,不仅在理解任务中表现优异,还能制作高品质影像,同时展现框架设计的极简与强大。
其优异表现显示,Janus-Pro-7B 在人工智能任务中具有竞争优势,这可能会影响该领域
未来的研发方向。
随着科技业努力应对 Janus-Pro-7B 的推出及其影响,现在市场高度关注在其他公司将如
何应对 DeepSeek 的挑战。
AI 观察家 Rowan Cheung 表示,DeepSeek 的新模型可以为人工智能效能设定新标准。
AI 战局正迅速变化,竞争可能会更加剧,新模式的出现,会导致进一步的创新,并可能
导致更多的市场波动。AI 宠儿辉达 (NVDA-US) 在美股周一午盘时段暴跌超过 17%。
心得/评论:
github
https://github.com/deepseek-ai/Janus
https://arxiv.org/abs/2410.13848
github与论文
解决了多模态模型中,视觉理解与生成之间的冲突
去年已经发布过1.3B的模型,就有不少人觉得在理解prompt和图片辨识方面很有潜力
现在最新的pro 7b还有待测试
不知道对市场的影响如何,但openai的dalle本来就蛮烂的