五家出版商联合起诉Meta,Llamas训练数据版权争议升级
5月10日,据美联社报道,五家出版商联合起诉Meta与首席执行官马克·扎克伯格,指控其非法使用数百万册版权作品训练Llamas人工智能模型,这一AI训练数据版权纠纷再度引发业界高度关注。
此次集体诉讼由爱思唯尔(Elsevier)、圣智(Cengage)、阿歇特(Hachette)、麦克米伦(Macmillan)和麦格劳希尔(McGraw Hill)五大出版集团联合发起,畅销书作家斯科特·图罗(Scott Turow)亦加入原告行列。诉讼文件指出,Meta通过BT下载、网络爬取等手段,从Library Genesis和Anna’s Archive等盗版网站批量获取受版权保护的学术论文、教科书及小说,用于训练其Llamas大语言模型。原告方特别指控扎克伯格本人“亲自授权并积极鼓励”上述侵权行为,遵循“快速行动,打破常规”的企业信条,在明知违法的情况下持续进行版权侵权。
Meta在回应声明中表示将“积极抗辩”,强调法院已在相关案件中认定使用版权材料训练AI可构成合理使用。然而,此次诉讼与此前Kadrey诉Meta案的背景有所不同。2025年6月,加州北区联邦地区法院在Kadrey案中曾以“未能证明市场损害”为由驳回作家对Meta的索赔。但出版商此次比作家群体更具优势:集体管理机制便于举证系统性市场损害,学术与教育内容的高度结构化特征使侵权判定更为直接,出版商的行业资本也为诉讼提供了充足资源。
美国出版商协会主席玛丽亚·帕兰特严词指出:“若科技企业将盗版网站置于学术创作之上,AI将永远无法被恰当实现”。随着AI版权合规压力持续升级,专家建议出版机构尽快建立版权数据库用于AI溯源管理,并关注Anthropic于2025年达成的版权诉讼和解——该公司最终向作家支付了15亿美元作为赔偿。END
