慕尼黑法院裁定，ChatGPT使用歌曲歌词侵犯版权

德国国家音乐版权组织在慕尼黑法院裁定ChatGPT的基础模型非法复制德国歌曲歌词后，获得了部分但决定性的胜利。

该裁决命令OpenAI停止复制，披露相关的训练细节，并赔偿权利持有者。该裁决尚未最终确定，OpenAI可能会提出上诉。

如果裁决得到维持，可能会重塑AI公司在欧洲获取和许可创意材料的方式，因为监管机构正在考虑对模型透明度和训练数据来源的更广泛义务。

此案标志着欧洲法院首次发现大型语言模型因记忆受保护作品而侵犯版权。

在其裁决中，慕尼黑地区法院第42民事庭表示，GPT-4和GPT-4o包含来自九首知名歌曲的“可复制”歌词，包括Kristina Bach的《Atemlos》和Rolf Zuckowski的《Wie schön, dass du geboren bist》。

法院认为，这种记忆构成了模型参数中原始作品的“固定”，满足了欧盟信息社会指令第2条和德国版权法对复制的法律定义。

“至少在个别情况下，当相应提示时，模型生成的输出内容至少部分与早期训练数据集中的内容相同，”慕尼黑法院提供给Decrypt的书面判决翻译副本中写道。

法院写道，该模型“生成的标记序列在统计上看似合理，因为例如，它以特别稳定或频繁出现的形式包含在训练过程中”，并补充说，由于该“标记序列出现在大量公开可访问的网站上”，这意味着它“在训练数据集中出现了多次”。

在诉状中，GEMA辩称，当提示时，模型输出的歌词几乎是逐字相同的，证明OpenAI的系统保留并复制了这些作品。

OpenAI反驳称，其模型并不直接存储训练数据，任何输出都是用户提示的结果，而不是故意复制的结果。

该公司还援引文本和数据挖掘的例外，允许出于分析用途进行临时复制。

“我们不同意这一裁决，并正在考虑下一步措施，”OpenAI的一位发言人告诉Decrypt。“该裁决仅针对有限的歌词集，并不影响每天使用我们技术的数百万德国人、企业和开发者。”

OpenAI声称，像他们这样的系统不存储或包含训练数据，因此不持有歌词或其他文本的副本。相反，这些模型学习模式并基于模式生成新的输出，OpenAI表示。

该公司告诉Decrypt，将模型视为包含存储作品反映了对技术工作原理的误解。

法院驳回了这些辩护，裁定嵌入模型结构中的完整复制超出了数据挖掘例外的范围。

“训练模型不应被视为权利持有者必须预见的通常和预期的使用形式，”法院写道。“当——如本案所示——作品在模型中被复制时，这一点尤其适用，甚至被告自己也认为这是不希望的，并采取了对策。”

Decrypt单独联系了GEMA以获取评论，但截至发稿时尚未收到回复。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Decrypt的精选文章