• 硬钢OpenAI 谷歌正式发布全新升级的“Gemini深度研究”智能体
  • 发布于 1小时前
  • 4 热度
    0 评论
堆代码讯 周四,全球科技界见证了一场人工智能领域的“双雄会”。谷歌正式发布了全新升级的“Gemini深度研究”智能体,而同一天其竞争对手OpenAI也推出了备受期待的GPT-5.2模型。这场近乎同步的发布,将两大巨头在AI赛道上的竞争推向了新的高度。

新版Gemini深度研究基于谷歌最新的Gemini 3 Pro基础模型构建,被公司称为“重新构想”的研究智能体。与之前版本相比,它不仅能够生成综合研究报告,更突破性地允许开发者通过全新的Interactions API,将谷歌先进的SATA模型研究能力集成到自己的应用程序中。“这标志着我们正从提供AI工具转向提供可编程的AI能力,”谷歌在声明中表示。这项改进使开发者能够在即将到来的智能体AI时代获得更强的控制力,为第三方应用注入深度研究功能。

该智能体擅长处理海量信息和超长上下文提示,目前已在多个专业领域投入使用。谷歌透露,客户正将其用于金融尽职调查、药物毒性安全研究等需要复杂推理的任务。公司计划进一步将其整合到谷歌搜索、谷歌财经、Gemini应用及NotebookLM等核心产品中,推动从“人工搜索”向“AI代理研究”的范式转变。

谷歌特别强调,新智能体依托的Gemini 3 Pro是其“事实准确性最高”的模型,专门针对AI“幻觉”问题进行了优化——即大语言模型凭空捏造信息的现象。在需要长时间自主推理的任务中,任何微小的虚构都可能导致整个结论失效,这一改进对深度研究任务至关重要。为验证性能,谷歌推出了名为DeepSearchQA的新基准测试并已开源,专门评估智能体在复杂多步骤信息检索中的表现。测试显示,Gemini深度研究在DeepSearchQA和独立基准“人类终极考试”中领先,但OpenAI的ChatGPT 5 Pro以微弱差距紧随其后,甚至在浏览器智能体测试BrowserComp中略胜一筹。

这些比较结果很快被赋予新的语境——就在谷歌发布数小时后,OpenAI正式推出代号“大蒜”的GPT-5.2模型,并宣布其在多项基准测试中“全面超越竞争对手,尤其是谷歌”。这种刻意的发布时机选择,被业界解读为两大巨头在AI主导权争夺中的战略博弈。

此次双重发布凸显了AI发展的明确趋势:从对话生成转向能够执行复杂、长周期任务的自主智能体。随着这类技术逐渐融入搜索引擎、办公软件和专业研究平台,人机协作的方式正在发生根本性变革。这场周四的技术交锋,或许正是未来智能体普及时代的一个重要序幕。

用户评论