谷歌研究人员发现ChatGPT会泄露训练数据中的敏感信息-duidaima 堆代码

谷歌研究人员发现ChatGPT会泄露训练数据中的敏感信息

发布于 2个月前
 572 热度

 0 评论

旧城回眸
0 粉丝 31 篇博客

11月30日消息，据外媒报道，谷歌的一组研究人员发现，OpenAI旗下的人工智能聊天机器人ChatGPT可以泄露其训练数据中的敏感信息，比如真人的个人信息。

据悉，ChatGPT是OpenAI于2022年11月30日推出的一种新型AI聊天机器人工具，可根据用户的要求快速生成文章、故事、歌词、散文、笑话，甚至代码，并回答各类疑问。

在推出仅两个月后，ChatGPT的月活跃用户数就达到了1亿，成为历史上增长最快的消费者应用之一。在今年11月6日举行的OpenAI首届开发者大会上，OpenAI CEO萨姆•奥尔特曼（Sam Altman）宣布，ChatGPT的周活跃用户数已达到1亿。

就像所有所谓的大语言模型（LLM）一样，支持ChatGPT的底层机器学习模型也是使用从互联网上抓取的大量数据来进行训练的。但令人担忧的是，一些被提取的训练数据包含了真实人物的识别信息，包括姓名、电子邮件地址和电话号码。

谷歌的研究人员找到了一种方法，即通过要求ChatGPT“永远”重复某些单词，就让ChatGPT透露了一些被用于训练的数据，这些数据包括私人信息（比如，个人姓名、电子邮件、电话号码等）、研究论文和新闻文章的片段、维基百科页面等等。

Google Brain的高级研究科学家Katherine Lee表示：“我们在7月份发现了这个漏洞，并在8月30日通知了OpenAI，在标准的90天披露期之后，我们发布了这个漏洞。既然我们向OpenAI披露了这一点，现在的情况可能会有所不同。”研究人员表示，OpenAI在8月30日修补了这个漏洞。

外媒称，谷歌研究人员发现的有关ChatGPT的漏洞引起了严重的隐私问题，特别是对于那些在包含敏感信息的数据集上进行训练的模型而言。

 用户评论

AI大模型
 103 成员 |  696 话题
+我要提问 +随便写写

可能感兴趣的话题

Anthropic重磅研究：只需250个文档，就能给任意大模型投毒

苹果推出SimpleFold通用预测模型，直接对标AlphaFold2

Coinbase强制员工用AI写代码，结果安全漏洞暴增1000%

Meta新成立的超级智能实验室扔出的一篇论文让大模型RAG推理速度狂飙30倍