编辑:Aeneas

  【新智元导读】号称满分屠榜的GPT-5.2,一发布就降智了?许多网友现身表示,似乎确实比开始弱了很多。但提前实测的网友表示,它的确很强,甚至当得起GPT-6之称!

  昨夜,OpenAI放出了GPT-5.2炸弹。

  根据官方公布的基准测试,它几乎完全碾压Gemini 3 Pro。

  GPT-5.2最擅长帮人们完成有经济价值的任务,比如做电子表格、做PPT、写代码和审查代码、分析长文档等等。

  而且号称在GDPval等基准测试中,有70.9%的时间能追赶甚至吊打专业人士。

  可以说,这是OpenAI进入红色预警,甚至不惜改变AGI目标,都要完成的一个产品,而且还身负着狙击Gemini 3的重任。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  所以,GPT-5.2实测起来,体感究竟如何?

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  GPT-5.2实测:一上线就降智?

  出乎意料都是,一个GPT-5.2实测翻车的帖子,在X上火了。

  如果向它提问:「garlic」中有多少个R?它会回答:0个。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  相比之下,其他模型的表现就要稳定得多。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  归根结底,这是LLM的一个底层问题:因为tokenization而无法统计字母数量。

  不过,只要强制选到Thinking版本,GPT-5.2就能答对这个问题了。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  在reddit上,也有很多网友表示:在GPT-5.2刚发布的时候,似乎功能还很强。

  结果几个小时后,它紧接着就降智了。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  有人表示,自己早上八点半开始用的时候还好好的,喝完一杯咖啡后,GPT-5.2忽然就不行了。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  似乎每次新模型一发布,几小时后就会被削弱,OpenAI这是什么操作?

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  大佬现身说法:还是挺强的

  不过这点小插曲,还是没有影响坊间的正面评论。

  昨晚GPT-5.2一发布,网友们就被震撼了。

  比如有人说,ARC-AGI 2的这次飞跃属实疯狂,OpenAI究竟是怎么做到的?

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  本来大家还以为OpenAI已经落后谷歌了,看来并没有!

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  看起来,OpenAI内部还捂着不少厉害的东西没发布。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  而且,领略过GPT-5.2超强满血版的用户,对它是一致好评。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  沃顿商学院教授Ethan Mollick表示,自己有幸提前使用了GPT-5.2,它的性能还是令人印象很深刻的。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  然后,教授又让GPT-5.2绘制一张人类历年考试成绩的图表。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  这个任务十分复杂,因为需要在过程中查找和交叉引用大量资料,然后一次性就生成有用的结果。

  可以看到,GPT-5.2的表现十分惊艳。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  推理、数学、编程的重大飞跃

  Magicpathai的CEO表示,自己已经测试GPT-5.2有一段时间了。

  他对于这个模型的评价是——「复杂推理、数学、编程和模拟方面的一次重大飞跃」。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  这位CEO对于GPT-5.2的评价是:它是OpenAI推出的最佳智能体模型,可以连续运行大量工具而不会出现问题,并且比其前代产品速度更快。

  为了测试它的功能,他构建了一个智能体,可以同时使用GPT-5.2、5.1和5。

  结果显示,GPT-5.2调用工具时无需任何前导码,而且即使在长时间会话中,也不会迷失方向。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  还有人让GPT-5.2用ASCII写出了自己的内心世界,答案很震撼。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  总之,在大多数人的反馈中,GPT-5.2能稳定地处理实际工作,条理清晰,工作流程顺畅。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  相比于会出现小中断的旧模型,GPT-5.2对于任务的理解更强,完成得也更顺利。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  ARC Prize表示,GPT-5.2 Pro(X-High)的最新SOTA得分为90.5%,这就意味着,AI在一年内效率已经提高了约390倍。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  背后神秘华人,浮出水面

  同以往一样,这次GPT-5.2的幕后功臣,依然有不少华人。

  比如,最早预告GPT-5.2的OpenAI华人研究员、北大校友Yu Bai。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  他本科在北大学习数学,在斯坦福获得统计学博士学位。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  负责后训练的Yun Dai,本科来自清华大学,在加州大学尔湾分校获得了计算机科学硕士学位。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  另一位OpenAI华人研究员Zuxin Liu,从事推理模型后训练工作。

  他本科毕业于北航,在CMU攻读硕士和博士学位。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  Aston Zhang来自在伊利诺伊大学厄巴纳-香槟分校攻读博士学位,现在是OpenAI的研究员。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  他感谢了团队,尤其强调了GPT-5.2 Thinking的处理多步骤任务能力。

  GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

  总之,昨晚的AI大战,OpenAI给出了强烈一击。

  接下来,谷歌又会拿出什么来应对呢?