OpenAI被命令在纽约时报版权案中交出2000万条ChatGPT日志

CN
Decrypt
关注
1小时前

一名联邦地方法官已命令OpenAI向《纽约时报》和其他原告交出大约2000万条去标识化的ChatGPT日志,这加深了这家人工智能开发公司在一系列版权和数据治理争议中的风险。

该命令于周三在纽约发布,命令拒绝了OpenAI阻止用户聊天记录生产的请求,并指示该公司在保护框架下交出日志。

这一结果可能会影响OpenAI、Anthropic和Perplexity等科技公司如何获取训练数据、许可内容以及围绕其系统输出内容建立保护措施。

美国地方法官Ona T. Wang写道,尽管法院“承认OpenAI用户的隐私考虑是诚恳的”,但这些考虑“只是比例分析中的一个因素,在明显相关且负担最小的情况下不能占主导地位”。

Decrypt已联系双方以获取评论。

该命令源于《纽约时报》正在进行的诉讼,该诉讼指控OpenAI的模型在未获许可的情况下使用了受版权保护的新闻内容进行训练。该诉讼最早于2023年12月提出。

去年1月,OpenAI挑战了《纽约时报》的指控,并提起反诉,声称该出版物没有“讲述完整的故事”。

法院后来发现,涉及的2000万条聊天记录样本“与案件的需要成比例”,以评估ChatGPT的输出是否复制了《纽约时报》的材料。

在过去的一年中,争议加剧,原告们要求广泛访问输出数据,而OpenAI警告称,广泛生产这些材料将增加隐私和运营负担。

在6月,OpenAI面临另一个挫折,法院命令该公司保留一系列ChatGPT用户数据用于诉讼,包括用户可能已经删除的聊天记录。

几个月后,在10月,争议再次浮现,法院标记了OpenAI在10月20日提交的文件(ECF 679),该文件挑战了2000万条日志样本的生产,并命令双方提交澄清说明为何存在分歧。

当时,法官要求双方解释这场争斗与之前关于删除日志的担忧有何关系,以及OpenAI是否已放弃之前声称会交出的协议。

上个月底,OpenAI正式提出异议,请求地区法官推翻地方法官的发现命令。

该公司辩称,该裁决“明显错误”且“比例失衡”,因为这将迫使公司披露数百万条私人用户对话,根据OpenAI代表与Decrypt分享的法院文件。

这一争议是针对人工智能实验室的更广泛攻势的一部分,作者、新闻机构、音乐出版商和代码库正在寻求测试现有版权法在模型摄取和再现受保护材料时的适用范围。

美国和欧洲的法院现在正在处理类似的索赔

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接