闽公网安备 35020302035485号
堆代码讯 为应对日益频发的AI安全风险,强化用户数据防护能力,OpenAI正式推出全新安全功能——锁定模式,专门针对隐蔽性极强的提示注入攻击提供更强防护,助力用户规避敏感数据泄露隐患。所谓提示注入攻击,是当下针对AI模型的典型恶意攻击手段。攻击者会将恶意指令隐藏在网页内容、各类文档等外部素材中,在用户使用ChatGPT读取、解析相关内容时,诱导AI模型执行恶意指令,篡改输出逻辑、窃取对话中的敏感信息,对企业和个人的数据安全造成极大威胁。
据OpenAI介绍,开启锁定模式后,ChatGPT将主动限制多项高危外部交互功能,从源头缩减攻击入口、降低安全风险。具体来看,该模式会禁用实时网页浏览能力,仅允许模型访问已缓存的网页内容;关闭从网页检索、展示图像的功能,但不会限制AI自主生成图像的能力;同时彻底停用深度研究、代理模式等高权限、高风险功能,最大程度减少外部恶意指令的可乘之机。
值得注意的是,锁定模式并非绝对的安全屏障,无法完全杜绝提示注入攻击。OpenAI坦诚该功能存在防护边界,即便开启锁定模式,若用户上传的文件、模型调取的缓存网页中暗藏恶意指令,依旧可能触发提示注入攻击,进而影响ChatGPT的回复准确性,甚至干扰模型响应行为。尽管存在防护局限,但该功能的核心价值十分明确,能够大幅降低用户在处理隐私、机密等敏感数据时,发生信息外泄的概率,为高安全需求场景筑牢防护底线。同时,OpenAI特别强调,锁定模式并非面向所有普通用户的通用功能,而是一款针对性的高级安全工具,专为日常处理敏感数据、需要严格防范提示注入攻击、规避数据外泄风险的个人与组织机构量身打造。