[爆卦] Mistral Small 3模型发布比OpenAI更快更好 Sidney0503 PTT批踢踢实业坊

[爆卦] Mistral Small 3模型发布比OpenAI更快更好

楼主: Sidney0503 (Sidney0503) 2025-02-01 04:34:50

Mistral Small 3模型发布比OpenAI和Google类似产品更快更好
欧洲领先的人工智能公司之一 Mistral AI 推出了一款名为 Mistral Small 3 的新模型
。这是一个包含 240 亿参数的模型，但与 Llama 3.3 70B 和 Qwen 32B 等大型模型相当
（至少在 MMLU-Pro 基准测试中）。它不仅运行速度与 Llama 3.3 70B 不相上下，而且
速度更快。
ChatGPT 上最常用的模型是 GPT-4o mini，它是使用者用完 GPT-4o 请求后的备用模型
。 Mistral Small 3 的效能比这个 OpenAI 模型更好，据说延迟也更低。
Mistral AI 介绍说："我们在Apache 2.0 下发布了预训练和指令调整的检查点。检查点
可以作为加速进展的强大基础。需要注意的是Mistral Small 3 既未使用RL 也未使用合
成资料进行训练，因此与Deepseek R1（一项伟大而互补的开源技术！）等模型相比，它
在模型制作流程中处于较早阶段。采用和定制它。
作为一个偏小型的模型，如果你的电脑配置较高，也有可能在自己的电脑上本地运行它
。 Mistral AI 表示，它可以在单块NVIDIA RTX 4090 显示卡或配备 32GB 内存的
MacBook 上运行。
虽然该机型在 MMLU-Pro 基准测试中的表现优于上述其他机型，但它并不总是人类评估人
员的首选。 Mistral 在一组超过 1k 的专有编码和通用提示中将其模型与其他模型进行
了比较。研究发现，与 Gemma-2 27B 和 Qwen-32B 相比，Mistral Small 3 是首选方案
，但与 Llama 3.3 70B 和 GPT-4o mini 相比，Mistral Small 3 的首选度较低。

继续阅读

Re: [新闻] 宜兰车祸1死3伤！追撞驾驶上香致歉　死amanda815625 [问卦] 感觉deepseek官网bot参数大于671b?HowLeeHi Re: [问卦] 为什么中国要免费送deepseek开源？？Sidney0503 [问卦] CIA台湾办公室在哪啊currry [问卦] 年纪越大对妹仔越肤浅？ffdqfe [问卦] 过年带aespa宁宁回老家家里长辈开心吗jkljkl112233 Re: [问卦] 大陆都deepseek人工智能台湾只能点面线？huzhou [问卦] iOS的捷径功能484很好用lianpig5566 [问卦] 有跟印度人合作过的请进PatriStar Re: [问卦] 给建议：欧兔征男友文这样的要求条件会太高？intrepid123