OpenAI o3-alpha 曝光，前端能力大提升，神秘新模型斩获 IMO 2025 金牌-duidaima 堆代码

OpenAI o3-alpha 曝光，前端能力大提升，神秘新模型斩获 IMO 2025 金牌

发布于 1天前
 15 热度

 0 评论

徒步旅行
1 粉丝 47 篇博客

7 月 20 日，有网友曝出，OpenAI 正在内部测试名为「o3-alpha-responses-2025-07-17」的新模型。尽管该模型尚未正式发布，但其惊人的前端代码生成能力已经引发广泛热议，甚至被不少开发者称为目前「最强 AI 编程模型」。该模型以「Anonymous-Chatbot」的身份在 WebDev Arena（一个前端开发测试竞技场）首次现身。

不少网友通过关键词提示发现，o3-alpha 在生成网页、交互逻辑和动画效果方面远胜于现有顶尖模型，包括 OpenAI 自家的 o3、Anthropic 的 Claude Sonnet、Gemini 2.5 Pro 以及 xAI 的 Grok 4。其中一位开发者 Peter Gostev 使用提示词「用 Three.js 创建一个程序生成的星球」测试该模型，o3-alpha 给出的渲染质量与交互能力远超其他模型。目前该模型疑似已下线，官方未回应其具体用途或发布时间。

就在同一时间，OpenAI 官方宣布，其全新推理模型在今年的国际数学奥林匹克竞赛（IMO 2025）中取得重大突破：成功解出 6 道题中的 5 道，以 35 分拿下金牌成绩，远超以往任何 AI 模型。OpenAI 联合创始人 Greg Brockman、研究员 Alexander Wei 以及 Sam Altman 均发文庆祝，Altman 公开表示：「这是我们首次以通用语言模型参与 IMO，而不是形式化数学系统。这标志着我们在通用智能道路上的一次重大飞跃。」

Alexander Wei 透露，这款模型在与人类选手完全一致的考试条件下完成挑战——两场 4.5 小时的闭卷测试、无联网、无辅助工具，仅凭自然语言写出完整证明过程，并由三位 IMO 奖牌得主评审评分。不过，这款模型不是 GPT-5，而是尚未公开命名的实验性推理系统。OpenAI 强调，IMO 所需的思维时间远超现有评测基准，从 GSM8K（约 0.1 分钟）、MATH（约 1 分钟）、AIME（约 10 分钟）逐级攀升至 IMO 的 100 分钟级别。这种深度推理与持续创造性思维，过去被认为是语言模型难以跨越的障碍。

Altman 特别指出：「这是我们从创建 OpenAI 起的梦想之一，但那时我们并未认为它现实。它是 AI 在过去十年中取得进步的重要标志。」Altman 表示，虽然 GPT-5 将在近期发布，但这次夺得 IMO 金牌的模型是新研究技术的实验成果，不会被立刻公开。

OpenAI 已在 GitHub 上放出该模型完整解答前五题的证明过程，供学术界研究和验证。仓库链接：https://github.com/aw31/openai-imo-2025-proofs

 用户评论

AI大模型
 101 成员 |  659 话题
+我要提问 +随便写写

可能感兴趣的话题

OpenAI 表示将使用 Google Cloud 支持 ChatGPT

Cursor为何暂停了中国大陆地区AI模型的供应？

Claude-code 是否真的可以投入生产？

我用gemini直接从0撸了个系统出来