近400家美国报纸出版商在曼哈顿联邦法院起诉OpenAI和微软,指控其未经授权抓取内容训练AI,AI版权争议进入新阶段。
近日,代表近400家美国报纸的出版商联盟在曼哈顿联邦法院提交了一份长达55页的诉状,将OpenAI和微软告上法庭。原告名单中既有《纽约每日新闻》等知名媒体,也包括阿肯色州民主党公报、田纳西州查塔努加时报自由报等大量地方小报。出版商要求OpenAI和微软为其使用新闻内容训练AI模型的行为承担法律责任。
出版商在诉状中指控OpenAI和微软「系统性地、秘密地」爬取了数百家新闻网站的内容,包括付费墙后的付费文章,并将内容复制到自家服务器上,用于训练ChatGPT和微软Copilot。更具争议性的是,AI公司在使用过程中还删除了版权管理信息,包括作者署名、版权声明和使用条款。
原告律师、新泽西州前总检察长马修·普拉特金在诉状中写道:「这些生成式AI产品建立在出版商长期投入的内容之上,给被告带来了数十亿美元的市场价值,而出版商一分钱都没拿到。」他认为,如果不追究责任,这轮AI热潮将成为地方新闻业的「丧钟」。
OpenAI的回应延续其一贯立场:模型推动创新,训练数据来自公开渠道,属于合理使用。微软方面则暂未公开回应。
此次诉讼并非AI版权纠纷的首例。2023年12月,《纽约时报》率先起诉生成式AI公司。此后,版权方与AI公司之间的诉讼持续增加:
从新闻、电影、音乐到文学、图片,AI的「数据饥渴」正全面撞上各内容行业的版权墙。
理解这场冲突,需要看清AI的商业模式。OpenAI创始人萨姆·奥尔特曼曾在英国上议院承认:「不使用受版权保护的材料,训练今天领先的AI模型是不可能的。」
问题的核心在于:AI公司的整个商业模式建立在免费获取数据的前提之上,而内容的创造者(记者、作家、音乐人)依赖这些内容为生。
数字最能说明问题:
出版商在诉状中表示,他们花费了数十亿美元保护自己的内容(包括设置付费墙),结果全部付诸东流。
这场诉讼的结果将直接影响AI行业的游戏规则。华东政法大学教授王迁指出,建立语料库需对海量作品进行复制,无论复制目的是人类学习还是机器学习,若未经许可且未产生新价值,单纯以「学习」为由主张「合理使用」在法理上难以自洽。
如果法院最终判定AI公司的大规模数据抓取不构成「合理使用」,AI公司将面临两条路:支付巨额赔偿(《纽约时报》律师已提及「数百亿美元」),或逐一与版权方谈授权——这在操作上几乎不可能完成。无论哪种结果,合规成本最终都将转嫁到用户身上,AI工具可能变得更贵。
另一个值得关注的现象是,内容平台正在加速「筑墙」。如果AI公司无法通过合法途径获取数据,未来高质量训练数据将越来越稀缺。
这场诉讼提出的本质问题是:当AI把整个内容产业的数据「搬」走之后,原创内容的价值由谁来保障?过去十年间,美国已有超过2500家报纸倒闭。正如诉状所言:「地方记者报道市议会、社区会议、本地犯罪和腐败,报道新餐馆开业。AI系统不做这些事。」AI是内容的「消费者」而非「生产者」,如果原创者都无法生存,AI将来还能「吃」什么?
司法系统正在回应这一挑战。中国相关部门已在2026年5月宣布,「十五五」期间将研究制定涉人工智能案件和数据产权司法保护的规范性文件。美国的这起诉讼,无论结果如何,都将成为AI版权法律史上的标志性案例。AI不会消失,版权也不会消失——冲突的终点是找到技术创新与内容创作共存的新的平衡。