抵御提示注入攻击，OpenAI为ChatGPT推出高级锁定安全模式-堆代码网

抵御提示注入攻击，OpenAI为ChatGPT推出高级锁定安全模式

发布于 1个月前
 201 热度

 0 评论

静默的薄暮
1 粉丝 60 篇博客

堆代码讯为应对日益频发的AI安全风险，强化用户数据防护能力，OpenAI正式推出全新安全功能——锁定模式，专门针对隐蔽性极强的提示注入攻击提供更强防护，助力用户规避敏感数据泄露隐患。所谓提示注入攻击，是当下针对AI模型的典型恶意攻击手段。攻击者会将恶意指令隐藏在网页内容、各类文档等外部素材中，在用户使用ChatGPT读取、解析相关内容时，诱导AI模型执行恶意指令，篡改输出逻辑、窃取对话中的敏感信息，对企业和个人的数据安全造成极大威胁。

据OpenAI介绍，开启锁定模式后，ChatGPT将主动限制多项高危外部交互功能，从源头缩减攻击入口、降低安全风险。具体来看，该模式会禁用实时网页浏览能力，仅允许模型访问已缓存的网页内容；关闭从网页检索、展示图像的功能，但不会限制AI自主生成图像的能力；同时彻底停用深度研究、代理模式等高权限、高风险功能，最大程度减少外部恶意指令的可乘之机。

值得注意的是，锁定模式并非绝对的安全屏障，无法完全杜绝提示注入攻击。OpenAI坦诚该功能存在防护边界，即便开启锁定模式，若用户上传的文件、模型调取的缓存网页中暗藏恶意指令，依旧可能触发提示注入攻击，进而影响ChatGPT的回复准确性，甚至干扰模型响应行为。尽管存在防护局限，但该功能的核心价值十分明确，能够大幅降低用户在处理隐私、机密等敏感数据时，发生信息外泄的概率，为高安全需求场景筑牢防护底线。同时，OpenAI特别强调，锁定模式并非面向所有普通用户的通用功能，而是一款针对性的高级安全工具，专为日常处理敏感数据、需要严格防范提示注入攻击、规避数据外泄风险的个人与组织机构量身打造。

目前，OpenAI已启动锁定模式的灰度推送工作，正面向自助式ChatGPT Business账户以及符合平台资质条件的个人账户逐步开放上线。这一功能的落地，填补了ChatGPT在高敏感场景的专项防护空白，进一步完善了OpenAI的AI安全防护体系，为企业及专业用户安全使用AI工具、处理核心数据提供了重要保障。

 用户评论

IT那些事
 350 成员 |  4716 话题
+我要提问 +随便写写

可能感兴趣的话题

谷歌首家美国外旗舰店落地东京表参道

印度马恒达未来车型将适配Apple Wallet

苹果Siri AI落地，走出最聪明的AI突围之路

企业支出管理巨头Ramp完成7.5亿美元融资，押注AI成本管控新赛道