图书出版商寻求参与谷歌人工智能版权争议

主要书籍出版商哈切特书籍集团和Cengage集团于周四提交了一项动议，要求介入去年针对谷歌提起的现有集体诉讼，指控这家科技巨头策划了“历史性的版权侵犯”，以建立其Gemini平台。

在加利福尼亚联邦法院提交的投诉中，指控谷歌“选择从原告和集体中窃取大量内容来训练其AI模型”，而不是获得适当的许可，在开发的“每个阶段”都进行了故意侵权。

该合并案件最初是由个人作者于2023年提起的，作为一项提议的版权集体诉讼，指控谷歌复制书籍以训练其生成性AI模型。

出版商声称，谷歌从盗版网站下载书籍，然后在AI训练过程中反复复制这些书籍，首先进入计算机内存，然后转换为AI系统可以读取的格式，再次进入每个新模型版本的训练集。

诉讼称，谷歌的C4训练数据集包含从Z-Library抓取的受版权保护的作品，该盗版集合已被当局查封超过350个网站和网络域名。

出版商指出，书籍是从b-ok.org复制的，该Z-Library域名现在显示联邦查封通知，以及OceanofPDF和WeLib，“另一个拥有大量未经授权的版权内容的网站”。

投诉指出，C4数据集包含至少28个被美国政府认定为盗版和假冒市场的网站的作品。

“版权符号（©）在C4数据集中出现超过2亿次，”投诉中写道，指出谷歌 allegedly 排除了“政策通知”和“使用条款”警告，但包括了“大量类别的受版权保护的作品、盗版作品和从付费墙后获取的作品”。

出版商指控谷歌从基于订阅的图书馆如Scribd.com复制作品，规避合法的许可协议。

当被问及这一做法时，非营利数据集提供商Common Crawl allegedly 以“责怪受害者的心态”回应，声称“如果你不想让你的内容出现在互联网上，就不应该把它放在互联网上。”

诉讼称，Gemini现在产生的输出“替代了受版权保护的作品”，包括逐字复制、详细摘要和“抄袭原作品创意元素的仿制品”。

Decrypt 已联系谷歌和出版商的法律顾问。

AI与出版商

谷歌同时正在为其AI概述功能辩护反对反垄断指控，彭斯基媒体公司声称，展示AI生成的摘要构成“合法的产品改进，而不是反竞争行为”。

出版商寻求法定赔偿、停止进一步侵权的禁令，以及要求谷歌销毁所有未经授权的作品副本并披露用于训练Gemini的书籍的命令。

介入动议是在2023年作者对AI公司提起的一系列版权诉讼之后提出的，联邦法官对Meta和Anthropic做出了部分胜利的裁决，裁定他们使用受版权保护的书籍训练模型构成了版权法下的合理使用，但批评这些公司维护盗版书籍的永久图书馆。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。