• 新报告曝光ChatGPT整合Apple Health功能存在缺陷
  • 发布于 2天前
  • 74 热度
    0 评论
堆代码讯 《华盛顿邮报》一位记者将其十年的苹果手表数据导入ChatGPT新推出的可选苹果健康(Apple Health)整合功能进行实测,结果多少有点让人失望。本月初,OpenAI宣布推出“ChatGPT健康”专区,用户可以在此询问健康相关问题,该体验与主聊天功能完全隔离。为了获得更个性化的回答,用户可以连接多种健康数据服务,如Apple Health、Function、MyFitnessPal、Weight观察者、AllTrails、Instacart和Peloton。

ChatGPT健康还能整合用户的医疗记录,从而分析化验结果和病史等其他方面,为其回答健康问题提供依据。出于这一考量,记者杰弗里·福勒向ChatGPT健康开放了他苹果健康应用中2900万步和600万次心跳的测量数据,并要求该人工智能评估他的心脏健康状况。结果,AI给他打了F(不及格)。福勒自然感到担忧,于是咨询了他的真实医生。医生明确无误地完全否定了人工智能的评估。医生表示,福勒罹患心脏问题的风险极低,低到他的保险可能甚至不会承保额外的检查来反驳聊天机器人的结论。

斯克里普斯研究所的心脏病专家埃里克·托波尔同样对大型语言模型的评估不以为然。他称ChatGPT的分析“毫无根据”,并表示人们应该忽略其医疗建议,因为它还远未成熟。然而,最令人不安的发现或许是ChatGPT的不一致性当福勒多次提出相同问题时,他的评分在F和B之间剧烈波动。尽管已完全访问其记录,ChatGPT还反复忘记他的基本个人信息,包括性别和年龄

Anthropic的Claude聊天机器人表现稍好——但也只是略好。这个大语言模型将福勒的心脏健康评为C,但也未能恰当考虑苹果手表数据的局限性。两家公司均表示,其健康工具并非旨在取代医生或提供诊断。托波尔恰当地指出,如果这些机器人无法准确评估健康数据,那么它们根本不应该提供评分。但似乎没有什么能阻止它们。美国食品药品监督管理局(FDA)本月早些时候表示,该机构作为监管者的职责是 “让开道路”以促进创新。一位机构专员对人工智能在未经FDA审查的情况下做出 “医疗或临床主张” 划出了红线,但ChatGPT和Claude辩称它们仅仅是提供信息。

“这样做的人会对自己的健康感到非常恐慌,”托波尔说,“它也可能走向反面,给不健康的人一种错误的安心感,让他们以为自己做的一切都很好。”

ChatGPT的苹果健康整合功能目前仅限于一组测试版用户。针对该报道,OpenAI回应称正在努力改进聊天机器人回答的一致性。“通过排队等候访问的方式推出ChatGPT健康,使我们能在广泛开放之前,不断学习并优化体验。”OpenAI副总裁阿什利·亚历山大在一份声明中对媒体表示。
用户评论