[新闻] OpenAI神秘gpt2正在A/B测试，奥特曼抢先 jackliao1990 PTT批踢踢实业坊

[新闻] OpenAI神秘gpt2正在A/B测试，奥特曼抢先

楼主: jackliao1990 (jack) 2024-05-08 21:11:21

OpenAI神秘gpt2正在A/B测试，奥特曼抢先剧透，网友已玩嗨
https://www.qbitai.com/2024/05/140099.html
明敏
OpenAI正在秘密A/B测试下一代模型，实力超强被怀疑是GPT-4.5或GPT-5。
就在奥特曼当谜语人暗示之后，两款新模型悄悄上线大模型竞技场。
https://tinyurl.com/57psz9bm
提示词：画一个自由女神像。
和GPT-4-Turbo（左）同场竞技，gpt2-chatbot（右）明显更胜一筹。
https://tinyurl.com/yc84ndz3
先前一款名为gpt2-chatbot的超强模型仅仅上线一天，热情的网友就把服务器挤爆了，不
得不下架，大家纷纷表示还没玩过。
这次重新上线后，模型在一次报错中直接给出了跳转OpenAI平台网站的连结。
这下大家都嗨了，做实了是OpenAI在搞A/B测试？
也有人表示，这俩模型可能已经在推理和计划方面进行微调。
现在在竞技场里随机匹配，就能遇到这两个新模型。
这不，网友们已经纷纷前去测试，一探它们的底细了。
程式码能力突出
和第一次露面有所不同，如今想要用上gpt2，只能在Arena(battle)里碰运气，Direct
Chat中找不到它们的影子。
有的人运气好，试了5次就成功让这俩模型battle了一局。
https://tinyurl.com/yc4tjwyy
结合几个范例来看，im-also-a-good-gpt2-chatbot产生的答案似乎总是更简洁一些。
https://tinyurl.com/7zfv4p6j
程式码生成方面，它能一次产生一个可执行的游戏程式码。
提示词：Code Flappy Bird game in Python
https://tinyurl.com/ywpc67wz
效果如下：
https://tinyurl.com/3hspmth4
如果回答的代码有误，可以进一步追问让它自己改正。
例如让它们写一个康威生命游戏的程式码，在未告知使用Colab时，模型写出的程式码有
问题。
但继续追问并表示自己用的是Colab，im-also-a-good-gpt2-chatbot能够自己修改对程式
码，im-a-good-gpt2-chatbot不行。
还有在解决物理题方面，有Reddit用户说im-also-a-good-gpt2-chatbot能解答出其他模
型都答不对的物理题。
问题：绿灯侠从一栋高楼顶跳下，他从静止状态开始做自由落体运动到地面，在他下
落过程的最后1秒时，距离地面的距离是大楼一半的高度，这座楼有多高？
不过我们实测了下，im-a-good-gpt2-chatbot似乎也能做对。
https://tinyurl.com/ydbxm2ct
还有人测试了一道推理题目，im-a-good-gpt2-chatbot可回答正确，
im-also-a-good-gpt2-chatbot也能做到但需要两次提示。
问题：现在有两个足球队。球队A赢了8次，球队B赢了5次，已知剩下7次比赛，球队
B想要赢得整场比赛，还需要至少赢几场？
https://tinyurl.com/ads7rtcf
网友：白嫖大家回馈吗？
尽管OpenAI还是没有正式认领gpt2-chatbot，但网友几乎已经默认它们是一家了。
因此有人觉得，gpt2-chatbot在竞技场上搞A/B测试，这不是让大家免费给他当志工。
OpenAI想要对内部模型进行人工评估，应该付给测试人员报酬，而不是在免费社区做。
有人觉得他们这么做，就是为了炒热度。
但现在gpt2-chatbot的底层模型到底是啥还不确定。
有人直接问了gpt2-chatbot，但可能有幻觉，它表示自己基于GPT-4架构，是GPT-4.5的变
体。
但之前奥特曼在公开演讲中已经否定了。测试网友表示自己没有给GPT-4.5相关的提示内
容。
https://tinyurl.com/ws3dnjpv
也有人怀疑，这两个模型大小不一样，叫这个名字是不是因为采用了GPT-2的架构来训练
模型。
这和单纯的MoE不同，它们使用了Q*、合成数据，Sam的推特编辑历史是不是暗示了这
一点？
值得一提的是，最近有大V爆料称本周OpenAI将公布进军搜寻引擎的消息。
https://tinyurl.com/46b3tumr
OpenAI已经更新了网站主页，第一个轮番页是一个搜寻框上面写着“向ChatGPT问任何事
情”
https://tinyurl.com/pjxwf72m
爆料说这次发布的时间可能在北京时间周五的凌晨2点。
总之，最近OpenAI的动向，都有点神秘。
参考连结：
[1]https://twitter.com/itsandrewgao/status/1787758687651811705
[2]https://twitter.com/DimitrisPapail/status/1787899811514982887
[3]https://twitter.com/AlphaSignalAI/status/1786025388902097077
[4]https://gizmodo.com/powerful-new-gpt2-chatbot-mysteriously-returns-1851460717

继续阅读

Re: [新闻] 外派台积电美国厂是上上签过来人老实说peter98 [新闻] 黄崇仁：应视核电为清洁能源hvariables [请益] 雷虎科技业务储备干部风评Alkali [新闻] 美撤销出口许可禁止英特尔、高通芯片卖createlight [请益] 兆普风评hoho080205 Re: [新闻] 外派台积电美国厂是上上签过来人老实说nuhciewc [新闻] 瑞昱美国控联发科反托辣斯案驳回jeff0025 [请益] 海外offer请益 RD/FAEyoyoger [新闻] 外派台积电美国厂是上上签过来人老实说godofsex [新闻]HBM4 成韩系内存下个战场，三星自认有优pl132