• OpenAI o3-alpha 曝光,前端能力大提升,神秘新模型斩获 IMO 2025 金牌
  • 发布于 1天前
  • 15 热度
    0 评论
7 月 20 日,有网友曝出,OpenAI 正在内部测试名为「o3-alpha-responses-2025-07-17」的新模型。尽管该模型尚未正式发布,但其惊人的前端代码生成能力已经引发广泛热议,甚至被不少开发者称为目前「最强 AI 编程模型」。该模型以「Anonymous-Chatbot」的身份在 WebDev Arena(一个前端开发测试竞技场)首次现身。

不少网友通过关键词提示发现,o3-alpha 在生成网页、交互逻辑和动画效果方面远胜于现有顶尖模型,包括 OpenAI 自家的 o3、Anthropic 的 Claude Sonnet、Gemini 2.5 Pro 以及 xAI 的 Grok 4。其中一位开发者 Peter Gostev 使用提示词「用 Three.js 创建一个程序生成的星球」测试该模型,o3-alpha 给出的渲染质量与交互能力远超其他模型。目前该模型疑似已下线,官方未回应其具体用途或发布时间。

就在同一时间,OpenAI 官方宣布,其全新推理模型在今年的国际数学奥林匹克竞赛(IMO 2025)中取得重大突破:成功解出 6 道题中的 5 道,以 35 分拿下金牌成绩,远超以往任何 AI 模型。OpenAI 联合创始人 Greg Brockman、研究员 Alexander Wei 以及 Sam Altman 均发文庆祝,Altman 公开表示:「这是我们首次以通用语言模型参与 IMO,而不是形式化数学系统。这标志着我们在通用智能道路上的一次重大飞跃。」


Alexander Wei 透露,这款模型在与人类选手完全一致的考试条件下完成挑战——两场 4.5 小时的闭卷测试、无联网、无辅助工具,仅凭自然语言写出完整证明过程,并由三位 IMO 奖牌得主评审评分。不过,这款模型不是 GPT-5,而是尚未公开命名的实验性推理系统。OpenAI 强调,IMO 所需的思维时间远超现有评测基准,从 GSM8K(约 0.1 分钟)、MATH(约 1 分钟)、AIME(约 10 分钟)逐级攀升至 IMO 的 100 分钟级别。这种深度推理与持续创造性思维,过去被认为是语言模型难以跨越的障碍。

Altman 特别指出:「这是我们从创建 OpenAI 起的梦想之一,但那时我们并未认为它现实。它是 AI 在过去十年中取得进步的重要标志。」Altman 表示,虽然 GPT-5 将在近期发布,但这次夺得 IMO 金牌的模型是新研究技术的实验成果,不会被立刻公开。


OpenAI 已在 GitHub 上放出该模型完整解答前五题的证明过程,供学术界研究和验证。仓库链接:https://github.com/aw31/openai-imo-2025-proofs
用户评论