闽公网安备 35020302035485号
堆代码讯 在周二举行的谷歌年度I/O开发者大会上,谷歌正式推出全新AI模型Gemini 3.5 Flash,该模型被谷歌定位为在编程和自主AI智能体领域表现最为出色的产品,不仅能独立执行编码流水线、管理研究项目,更在内部测试中实现了从零开始构建一个完整操作系统的突破,展现出强大的自主工作能力。此次Gemini 3.5 Flash的发布,标志着谷歌在AI领域的战略发生重大转变:从以往将AI定位为单纯的对话工具,转向将其打造为能够自主完成实际工作的智能体工具。这意味着AI不再局限于回答用户的各类问题,而是能够在最少人工输入的情况下,自主完成规划、构建、迭代等一系列实际工作任务,真正实现“AI干活”的核心目标。
DeepMind首席技术官科拉伊·卡夫库奥格鲁(Koray Kavukcuoglu)在该模型公开发布前的周一,就向记者介绍了其核心优势:“3.5 Flash在质量和低延迟方面提供了令人难以置信的组合。它在几乎所有基准测试中——包括编码、智能体任务和多模态推理——都超越了我们的最新前沿模型3.1 Pro。”据其补充,这款模型的速度比其他前沿模型快4倍,这种高效性对于编码和智能体任务而言至关重要,而谷歌还在此基础上开发了优化版本,在保持同等质量的前提下,将速度进一步提升至12倍,大幅提升了任务执行效率。
卡夫库奥格鲁强调,速度是Gemini 3.5 Flash面向智能体工作设计的关键,因为在智能体工作场景中,多个AI智能体需要同时在长时间运行的任务上协同作业,高速响应才能确保任务高效推进。在I/O大会的现场演示中,谷歌工程师瓦伦·莫汉(Varun Mohan)直观展示了这一优势:多个智能体被派生出分别处理不同组件,随后协同汇聚,在谷歌旗下的智能体开发平台及IDE——Antigravity内部,成功构建出一个完整的操作系统。与此同时,卡夫库奥格鲁还透露,Gemini 3.5 Flash与Antigravity是协同开发的,目的就是为AI智能体提供一个“可以生存、工作和执行的原生环境”,实现软硬件的深度适配。
与Gemini 3.5 Flash同步发布的,还有Antigravity 2.0版本,这是一款围绕智能体优先开发而设计的独立桌面应用程序,进一步完善了智能体的工作生态,为开发者提供了更便捷的操作平台。Gemini 3.5 Flash的强大能力并非只停留在演示层面,其智能体能力已为众多合作伙伴带来了实际价值。谷歌表示,目前银行和金融科技公司借助该模型,实现了原本需要数周完成的工作流程自动化,数据科学团队也能在复杂的数据环境中快速挖掘有价值的洞察,大幅提升了工作效率。
值得注意的是,这款模型虽然可以自主运行数小时,但并非完全脱离人类管控。谷歌高级总监兼产品主管图尔西·多希(Tulsee Doshi)表示,当模型遇到需要人类判断的决策点或权限相关问题时,会自动暂停并请求用户输入,确保任务执行的安全性和准确性。对于Gemini系列模型的布局,谷歌有着清晰的规划。多希在接受TechCrunch采访时表示,当谷歌后续发布3.5 Pro模型时,两款模型将设计为协同工作模式:“3.5 Pro成为你的编排者和规划者,然后它可以实际利用Flash作为各个子智能体。我认为这归根结底取决于你真正想要推理能力的地方——你真正需要那个能够在推理方面发力的大模型——与那些确实值得使用强大的蛮力工具使用能力的任务之间的权衡。”这种协同模式,将实现不同模型优势的互补,满足多样化的使用需求。
目前,Gemini 3.5 Flash已正式成为Gemini应用程序以及谷歌搜索中AI模式的默认模型,全面融入用户的日常使用场景。在此次I/O大会上,谷歌还宣布,搜索功能将引入智能体能力,允许用户直接在搜索平台上创建、定制和管理AI智能体,让智能体服务更贴近普通用户。此外,该新模型还将为谷歌全新的个人AI智能体Gemini Spark提供支持,这款个人智能体旨在7x24小时不间断运行,帮助消费者高效管理自己的数字生活。
不过,将如此强大的AI能力向普通消费者普及,也伴随着诸多审视和潜在风险。据悉,谷歌目前正面临一起诉讼,起因是去年一名男子在与Gemini聊天数周后,险些制造大规模伤亡事件并最终自杀身亡。随着强大的自主智能体被更广泛地使用,其潜在危害也可能随之增加。对此,谷歌表示,Gemini 3.5系列模型强化了网络安全和CBRN(化学、生物、放射性和核)方面的保障措施,同时在处理敏感问题时进行了更好的校准,摒弃了以往直接拒绝回答的方式,在保障安全的同时提升了用户体验。