硬钢OpenAI 谷歌正式发布全新升级的“Gemini深度研究”智能体-堆代码网

硬钢OpenAI 谷歌正式发布全新升级的“Gemini深度研究”智能体

发布于 2个月前
 287 热度

 0 评论

清浅旧时光
0 粉丝 41 篇博客

堆代码讯周四，全球科技界见证了一场人工智能领域的“双雄会”。谷歌正式发布了全新升级的“Gemini深度研究”智能体，而同一天其竞争对手OpenAI也推出了备受期待的GPT-5.2模型。这场近乎同步的发布，将两大巨头在AI赛道上的竞争推向了新的高度。

新版Gemini深度研究基于谷歌最新的Gemini 3 Pro基础模型构建，被公司称为“重新构想”的研究智能体。与之前版本相比，它不仅能够生成综合研究报告，更突破性地允许开发者通过全新的Interactions API，将谷歌先进的SATA模型研究能力集成到自己的应用程序中。“这标志着我们正从提供AI工具转向提供可编程的AI能力，”谷歌在声明中表示。这项改进使开发者能够在即将到来的智能体AI时代获得更强的控制力，为第三方应用注入深度研究功能。

该智能体擅长处理海量信息和超长上下文提示，目前已在多个专业领域投入使用。谷歌透露，客户正将其用于金融尽职调查、药物毒性安全研究等需要复杂推理的任务。公司计划进一步将其整合到谷歌搜索、谷歌财经、Gemini应用及NotebookLM等核心产品中，推动从“人工搜索”向“AI代理研究”的范式转变。

谷歌特别强调，新智能体依托的Gemini 3 Pro是其“事实准确性最高”的模型，专门针对AI“幻觉”问题进行了优化——即大语言模型凭空捏造信息的现象。在需要长时间自主推理的任务中，任何微小的虚构都可能导致整个结论失效，这一改进对深度研究任务至关重要。为验证性能，谷歌推出了名为DeepSearchQA的新基准测试并已开源，专门评估智能体在复杂多步骤信息检索中的表现。测试显示，Gemini深度研究在DeepSearchQA和独立基准“人类终极考试”中领先，但OpenAI的ChatGPT 5 Pro以微弱差距紧随其后，甚至在浏览器智能体测试BrowserComp中略胜一筹。

这些比较结果很快被赋予新的语境——就在谷歌发布数小时后，OpenAI正式推出代号“大蒜”的GPT-5.2模型，并宣布其在多项基准测试中“全面超越竞争对手，尤其是谷歌”。这种刻意的发布时机选择，被业界解读为两大巨头在AI主导权争夺中的战略博弈。

此次双重发布凸显了AI发展的明确趋势：从对话生成转向能够执行复杂、长周期任务的自主智能体。随着这类技术逐渐融入搜索引擎、办公软件和专业研究平台，人机协作的方式正在发生根本性变革。这场周四的技术交锋，或许正是未来智能体普及时代的一个重要序幕。

 用户评论

IT那些事
 350 成员 |  4717 话题
+我要提问 +随便写写

可能感兴趣的话题

Alphabet计划筹集800亿美元用于人工智能建设

谷歌首家美国外旗舰店落地东京表参道

Apple Arcade新增九款游戏，包括《家庭问答口袋版》

Airbnb CEO切斯基筹建新AI实验室，直面OpenAI竞争