• 抵御提示注入攻击,OpenAI为ChatGPT推出高级锁定安全模式
  • 发布于 12小时前
  • 11 热度
    0 评论

堆代码讯 为应对日益频发的AI安全风险,强化用户数据防护能力,OpenAI正式推出全新安全功能——锁定模式,专门针对隐蔽性极强的提示注入攻击提供更强防护,助力用户规避敏感数据泄露隐患。所谓提示注入攻击,是当下针对AI模型的典型恶意攻击手段。攻击者会将恶意指令隐藏在网页内容、各类文档等外部素材中,在用户使用ChatGPT读取、解析相关内容时,诱导AI模型执行恶意指令,篡改输出逻辑、窃取对话中的敏感信息,对企业和个人的数据安全造成极大威胁。

据OpenAI介绍,开启锁定模式后,ChatGPT将主动限制多项高危外部交互功能,从源头缩减攻击入口、降低安全风险。具体来看,该模式会禁用实时网页浏览能力,仅允许模型访问已缓存的网页内容;关闭从网页检索、展示图像的功能,但不会限制AI自主生成图像的能力;同时彻底停用深度研究、代理模式等高权限、高风险功能,最大程度减少外部恶意指令的可乘之机。


值得注意的是,锁定模式并非绝对的安全屏障,无法完全杜绝提示注入攻击。OpenAI坦诚该功能存在防护边界,即便开启锁定模式,若用户上传的文件、模型调取的缓存网页中暗藏恶意指令,依旧可能触发提示注入攻击,进而影响ChatGPT的回复准确性,甚至干扰模型响应行为。尽管存在防护局限,但该功能的核心价值十分明确,能够大幅降低用户在处理隐私、机密等敏感数据时,发生信息外泄的概率,为高安全需求场景筑牢防护底线。同时,OpenAI特别强调,锁定模式并非面向所有普通用户的通用功能,而是一款针对性的高级安全工具,专为日常处理敏感数据、需要严格防范提示注入攻击、规避数据外泄风险的个人与组织机构量身打造。


目前,OpenAI已启动锁定模式的灰度推送工作,正面向自助式ChatGPT Business账户以及符合平台资质条件的个人账户逐步开放上线。这一功能的落地,填补了ChatGPT在高敏感场景的专项防护空白,进一步完善了OpenAI的AI安全防护体系,为企业及专业用户安全使用AI工具、处理核心数据提供了重要保障。
用户评论