谷歌被指控窃取数百万用户数据训练人工智能工具
日前,谷歌面临一项广泛的侵权诉讼,指控这家科技巨头未经用户同意,窃取了数百万用户的数据,并违反版权法来训练和开发其人工智能产品。
这起对谷歌、其母公司 Alphabet 和其人工智能子公司 DeepMind 的集体诉讼于周二在加利福尼亚州的联邦法院提起,由克拉克森律师事务所提出。该律所上个月曾对 ChatGPT 制造商 OpenAI 提起类似诉讼。
该投诉指控谷歌 “一直在秘密窃取数以百万计的美国人在互联网上创造和分享的一切内容”,并利用这些数据来训练其人工智能产品,例如其聊天机器人 Bard。投诉还声称,谷歌获取了 “我们数字足迹的几乎全部内容”,包括 “创意和受版权保护的作品”,以构建其人工智能产品。
谷歌、Alphabet 和 DeepMind 的代表尚未作出回应。
投诉引用了谷歌最近的隐私政策更新,明确指出公司可能使用公开可访问的信息来训练其人工智能模型和工具,如 Bard。该公司表示,其政策 “一直都明确表示谷歌使用来自开放网络的公开可获得信息来训练诸如 Google 翻译之类的语言模型。此次更新只是明确了新服务如 Bard 也包含在内。”
这起诉讼是在最近几个月新一批人工智能工具因其能够根据用户提示生成文字和图像而引起极大关注之际提起的。支撑这一新技术的大型语言模型通过在大量在线数据中进行训练来实现的。
然而,据谷歌诉讼指出,这一过程中,公司也因从这些数据集中涉及版权问题的作品以及其明显使用普通用户(包括儿童)的个人和可能涉及敏感信息的数据而受到越来越多的法律审查。
克拉克森律师事务所的律师之一蒂姆乔达诺(Tim Giordano)表示:“谷歌需要明白‘公开可获得’从来不意味着可以免费用于任何目的。我们的个人信息和数据是我们的财产,它具有价值,没有人有权拿走它并将其用于任何目的。”
该诉讼请求采取措施冻结谷歌的生成型人工智能工具(如 Bard)的商业访问和商业开发,以获得临时救济。它还寻求对谷歌据称不当使用其数据的人们提供未指定的损害赔偿和支付金钱补偿。该律所表示已经有八名原告,其中包括一名未成年人。
乔达诺将谷歌通常索引在线数据以支持其核心搜索引擎的好处与其据称窃取数据来训练人工智能工具的新指控进行了对比。他说,通过搜索引擎,谷歌可以 “提供一个带有对作品的属性链接,实际上可以促使某人购买或与之互动”。然而,用于训练人工智能工具的数据爬取正在创建 “作品的一种替代版本,从根本上改变了任何人购买作品的动机”。
该律所合伙人瑞安克拉克森(Ryan Clarkson)表示,谷歌需要 “为人们提供拒绝的机会”,即不让他们的数据用于训练人工智能,同时仍然保持其日常使用互联网的能力。
- 0000
- 0001
- 0001
- 0000
- 0000