闽公网安备 35020302035485号
堆代码讯 近日,美国加利福尼亚北区联邦地区法院迎来了一起直指 AI 训练版权问题的新诉讼:三家 YouTube 频道的所有者,正式起诉科技巨头苹果,指控苹果绕过平台保护措施,偷偷爬取他们的原创视频,用来训练苹果内部的 AI 模型,却没有给创作者任何形式的补偿。
这起集体诉讼在 4 月 3 日正式提交,由知名内容公司 Ted Entertainment 牵头 —— 这家公司正是知名 YouTube 频道 h3h3Productions 以及相关播客的母公司,另外两家原告则是高尔夫领域的头部频道 MrShortGameGolf 和 Golfholics。三个频道加起来,累计拥有超过 320 万的订阅用户。根据原告提交的诉状,苹果的侵权行为,其实是被自己的研究人员 “曝了光”。原告指出,苹果曾经发布过一篇学术论文,其中提到他们训练 “Apple AI Video” 模型时,使用了一个名为 Panda-70M 的数据集。而这个 Panda-70M,本质上就是一个完全由 YouTube 视频组成的数据库,所有内容,全都是通过非法爬取 YouTube 平台获得的。
原告核查后发现,自己的原创内容,大量出现在了这个盗版数据集里:Ted Entertainment 的内容,有 438 个视频被爬取收录;Golfholics 的内容有 62 个,就连内容量相对少的 MrShortGameGolf,也有 8 个视频被偷偷拿走。
更过分的是,苹果为了拿到这些数据,还专门使用了工具规避 YouTube 的反爬保护:他们用带有轮换 IP 地址的计算机来抓取数据,这种手段是普通用户根本做不到的,正常用户使用 YouTube,都必须遵守平台的访问限制,而苹果却直接绕开了所有的保护机制,这已经违反了《数字千年版权法》(DMCA)的相关条款。
在原告看来,这起案子的核心,远不止普通的版权侵权那么简单。诉状里直言,苹果的这种行为,是 “对内容创作者群体的无耻攻击”:价值数万亿美元的生成式 AI 产业,靠着创作者们的原创内容飞速发展,但是这些贡献了核心数据的创作者,却没有拿到任何一分钱的补偿。
为了给所有被侵权的创作者维权,原告把这起案子定性为集体诉讼,代表所有作品被苹果偷偷爬取、用来训练 AI 的 YouTube 创作者,向苹果发起追责。他们的诉求非常明确:希望法院认证这起集体诉讼的效力,出具禁令禁止苹果继续这种侵权行为,同时索要最高法定损害赔偿、律师费和诉讼费,还有相关的利息,以及法院能够给出的其他合法救济。
有意思的是,发起这次诉讼的 Ted Entertainment,早已经不是第一次针对 AI 公司的侵权行为发起诉讼了。在此之前,他们已经起诉过字节跳动、Meta、英伟达等多家科技巨头,指控的内容几乎一模一样:都是这些公司偷偷爬取 YouTube 视频,用来训练自己的 AI 模型。而苹果,其实在整个 AI 行业里,本来算是相对注重伦理合规的那一个。早在 2023 年,苹果就一直在尝试用合法合规的方式获取训练数据,比如主动和康泰纳仕、IAC、NBC News 等媒体机构洽谈合作,想要拿到正版的内容授权,用来训练自己的 AI 模型,避免侵权的问题。