Re: [问卦] 哪个AI聊天机器人最顶？ kimozy PTT批踢踢实业坊

Re: [问卦] 哪个AI聊天机器人最顶？

楼主: kimozy (蛋塔) 2025-04-08 10:31:46

作为业内人士，我就用我的 custom AI 用两种方式回答吧，希望有帮助：
【拟人化风格】
像是在八卦板讲故事一样，轻松但有灵魂。
你说这六个模型要比谁最顶，其实就像在选你深夜最想跟谁讲话的对象：
ChatGPT 就是你家的那只听话又稳重的老狗，会给你安全感，也不会突然暴冲（o1 Pro 的话
，还会帮你修简报跟抓 bug）。
Claude 像是哲学系的暖男，讲话很慢但总会把你没说出口的情绪翻译出来。如果你是那种凌
晨会自问“活着的意义”的人，找他没错。
Gemini（2.5 版）是记忆力超强的助理，一次给你 2000 页资讯不手软，但偶尔会让你怀疑
他是不是太 Google 味、太乖巧，不太敢聊人话。
Grok 像马斯克亲手养大的机器猫，讲话会突然甩你一个迷因，然后开始讲笑话，你不太确定
它在不在状况内，但…好像又挺有梗。
DeepSeek 是还在修行中的剑士，语法很强、数学很准、讲话有点直男，但你隐约觉得他未来
可能会变成 BOSS 级人物。
Perplexity 像是图书馆 AI 管理员，问他什么都会立刻搬出一叠资料给你，但你如果问他“
你还好吗”他大概会回你一篇论文。
最顶？看你想要什么。
要陪伴：ChatGPT
要智慧：Claude
要火力：Gemini
要嘴砲：Grok
要效率：DeepSeek
要参考文献：Perplexity
八卦？Grok 会嘴 GPT，GPT 会偷学 Claude，Claude 会假装没听见，DeepSeek 偷练数学，
Perplexity 偷抓他们讲的话贴给你看，Google 说：“我只想好好做人。”
【技术向版本】
给真的想了解模型能力的人用的，有点嘴但有依据。
六位选手技术面速览来了，各自强项如下：
ChatGPT (GPT-4/o1 Pro)：最稳泛用型，长对话一致性强，程式、写作、逻辑通吃。Turbo
版本反应快，API 生态健全。
Claude 3.7 Sonnet：推理与理解最细腻，长文摘要、伦理推论一流，适合哲学/法律型任务
。现在已能多步解题。
Gemini 2.5 Pro：记忆力最强（一次处理 2000 页），多模态处理王，适合大规模输入与复
杂检索。Google 生态绑定。
Grok 3：架构类 LLaMA 改版，偏社群风格，幽默但不保证逻辑一致性。
DeepSeek-R1：强在 cost/performance，开源社群热门，中文与数理表现突出，推理能力逼
近 GPT 级别。
Perplexity：非自训模型，而是检索式整合器，整合 GPT、Claude 等，适合查资料与汇整，
但生成稳定度不一。
真要选“最顶”？
要 GPT 级实力 → Claude 3.7、ChatGPT o1 Pro
要 long-context 多模态 → Gemini 2.5
要爽快回答/程式效率 → o3-mini-high / DeepSeek-R1
要查资料 → Perplexity
八卦面？
‧ Claude 在 HuggingFace 暂时称霸 Open LLM leaderboard
‧ DeepSeek 跟 GPT 各自抄彼此解法
‧ Grok 吐槽大家“不幽默”
‧ Gemini 不太喜欢被拿来跟 Claude 比
‧ ChatGPT：看着大家吵，我来帮你记下笔记好了
※ 引述《lpbrother》之铭言
: 现在有
: ChatGPT
: Gemini (google的)
: Grok (马斯克发明的)
: Claude
: DeepSeek
: Perplexity
: 这样应该已经够多了
: 毕竟同样一个题目有6个答案就很乱了
: 不知道哪个最顶
: 有没有八卦？

继续阅读

[问卦] 特朗普是个什么样的人playla [新闻] 川普威胁加码50%关税！陆官媒喊“坚决报joe19990815 [问卦] 2009年台湾传产倒一片是真的吗？ansfan Re: [新闻] 绿委拟修《两岸条例》中配获身分证须放Skyblueway [问卦] 台湾就像小孩?v19791119 [问卦] 徐柏岳已成脆新男神？d9070016 [问卦] 脆：台湾赚到一边一国还有低关税colset [问卦] 川普是不是真的很恶心？abc5588646 Re: [问卦] 黄暐瀚为什么会被这么多人讨厌？renna038766 [问卦] 刮中女同事的车会怎样吗thewtf