近400家美国报纸集体起诉OpenAI与微软，AI版权博弈再升级

近日，代表近400家美国报纸的出版商联盟在曼哈顿联邦法院提交了一份长达55页的诉状，将OpenAI和微软告上法庭。原告名单中既有《纽约每日新闻》等知名媒体，也包括阿肯色州民主党公报、田纳西州查塔努加时报自由报等大量地方小报。出版商要求OpenAI和微软为其使用新闻内容训练AI模型的行为承担法律责任。

诉讼核心：系统性地「白嫖」

原告律师、新泽西州前总检察长马修·普拉特金在诉状中写道：「这些生成式AI产品建立在出版商长期投入的内容之上，给被告带来了数十亿美元的市场价值，而出版商一分钱都没拿到。」他认为，如果不追究责任，这轮AI热潮将成为地方新闻业的「丧钟」。

OpenAI的回应延续其一贯立场：模型推动创新，训练数据来自公开渠道，属于合理使用。微软方面则暂未公开回应。

AI侵权并非孤例

此次诉讼并非AI版权纠纷的首例。2023年12月，《纽约时报》率先起诉生成式AI公司。此后，版权方与AI公司之间的诉讼持续增加：

2025年9月，迪士尼、环球影业和华纳兄弟起诉中国AI公司的视频生成工具，指控其未经许可使用受版权保护的电影和动画内容。
2025年11月，德国慕尼黑法院判决OpenAI侵权，因其模型再现了德国音乐人的歌词。
2026年，CNN和Reddit分别起诉Perplexity AI；大英百科全书及韦氏词典加入起诉OpenAI的行列；约翰·格里沙姆等作家也因书籍被未经授权使用而提起诉讼。
2026年6月，音乐平台Jamendo起诉英伟达，指控其AI音乐模型在训练中使用了未经授权的数据集。

从新闻、电影、音乐到文学、图片，AI的「数据饥渴」正全面撞上各内容行业的版权墙。

利益天平严重倾斜

理解这场冲突，需要看清AI的商业模式。OpenAI创始人萨姆·奥尔特曼曾在英国上议院承认：「不使用受版权保护的材料，训练今天领先的AI模型是不可能的。」

问题的核心在于：AI公司的整个商业模式建立在免费获取数据的前提之上，而内容的创造者（记者、作家、音乐人）依赖这些内容为生。

数字最能说明问题：

OpenAI 2023年收入约20亿美元，2024年约60亿美元，2025年约131亿美元。截至2026年2月底年化收入已突破250亿美元，2026年3月完成1220亿美元融资后估值达8520亿美元。
微软2026财年第三季度营收829亿美元，同比增长18%；净利润318亿美元，同比增长23%。AI业务年化收入运行率达370亿美元，同比增长123%。
诉状披露，OpenAI仅从一家出版商就提取了138144篇文章。

出版商在诉状中表示，他们花费了数十亿美元保护自己的内容（包括设置付费墙），结果全部付诸东流。

对行业与用户的潜在影响

这场诉讼的结果将直接影响AI行业的游戏规则。华东政法大学教授王迁指出，建立语料库需对海量作品进行复制，无论复制目的是人类学习还是机器学习，若未经许可且未产生新价值，单纯以「学习」为由主张「合理使用」在法理上难以自洽。

如果法院最终判定AI公司的大规模数据抓取不构成「合理使用」，AI公司将面临两条路：支付巨额赔偿（《纽约时报》律师已提及「数百亿美元」），或逐一与版权方谈授权——这在操作上几乎不可能完成。无论哪种结果，合规成本最终都将转嫁到用户身上，AI工具可能变得更贵。

另一个值得关注的现象是，内容平台正在加速「筑墙」。如果AI公司无法通过合法途径获取数据，未来高质量训练数据将越来越稀缺。

这场诉讼提出的本质问题是：当AI把整个内容产业的数据「搬」走之后，原创内容的价值由谁来保障？过去十年间，美国已有超过2500家报纸倒闭。正如诉状所言：「地方记者报道市议会、社区会议、本地犯罪和腐败，报道新餐馆开业。AI系统不做这些事。」AI是内容的「消费者」而非「生产者」，如果原创者都无法生存，AI将来还能「吃」什么？

司法系统正在回应这一挑战。中国相关部门已在2026年5月宣布，「十五五」期间将研究制定涉人工智能案件和数据产权司法保护的规范性文件。美国的这起诉讼，无论结果如何，都将成为AI版权法律史上的标志性案例。AI不会消失，版权也不会消失——冲突的终点是找到技术创新与内容创作共存的新的平衡。