纽约时报第三次修改诉状,将微软从「被动受益方」推向「促成侵权方」;近400家美国地方报纸同期起诉,指控OpenAI使用工…
2026 年 6 月 25 日,《纽约时报》在针对 OpenAI 和微软的版权诉讼中申请提交第三次修订诉状,把矛头进一步指向微软,指控其并非只是被动受益于 OpenAI 使用版权内容训练模型,而是通过构建定制化超级计算系统,「主动诱导、帮助并促成了大规模版权侵权」。几乎与此同时,代表近 400 家美国地方报纸的出版方也对微软和 OpenAI 提起诉讼。两组案件释放出清晰的信号:AI 版权诉讼不再只盯着模型公司,而是沿着技术链条、商业链条和责任链条向外扩散。
过去讨论 AI 训练版权争议,核心通常集中在 OpenAI 这类模型开发者身上:训练数据是否包含受版权保护作品?训练行为是否构成复制?模型输出是否替代原作品?能否适用合理使用?
《纽约时报》此次修改诉状的重点,是把微软放到一个更主动的位置。原告试图证明,微软并不是远离训练过程的投资方,也不是单纯出售算力的云服务提供者,而是通过深度定制的超级计算系统,为 OpenAI 的大规模训练提供了关键条件。
据此,原告将案件焦点从「直接侵权」进一步推向「帮助侵权」「诱导侵权」或「共同侵权」的边界。如果一个主体没有直接抓取文章、没有直接训练模型,但它明知或应知相关训练依赖大规模版权内容,仍然提供专门设计的算力、系统和商业支持,它是否可能成为 AI 侵权责任链条的一部分?这将是法院未来需要回答的问题。
《纽约时报》在诉状中披露,OpenAI 使用的这套超级计算系统包含超过 285,000 个 CPU 核心和 10,000 个 GPU,是为大规模模型训练专门搭建的设施。这一定制属性,正是原告论证微软「实质性贡献」的关键证据。
微软与 OpenAI 的关系也并非普通供应商与客户关系。微软同时扮演三重角色:OpenAI 的重要投资方、云计算与算力基础设施提供方,以及将 OpenAI 模型能力整合进 Copilot、Bing、Office、Azure 等产品中的分发方。这一深度绑定,使微软很难将自己描述成一个完全中立、完全不知晓下游用途的基础设施提供者。
如果说《纽约时报》的诉讼代表头部媒体的强势维权,那么近 400 家地方报纸的集体诉讼,则代表新闻行业更广泛的生存焦虑。
地方报纸不是技术巨头,也不是流量平台。它们的价值来自长期采编、地方调查、社区报道、事实核查和公共记录维护。这些内容一旦被 AI 系统无偿抓取并用于训练,再通过 ChatGPT、Copilot 等产品重新包装输出,地方媒体面对的就不只是版权损失,而是入口损失、流量损失、订阅损失和广告损失。
原告在诉讼中主张,OpenAI 使用「Dragnet」「Newspaper」等文本提取工具处理新闻文章时,故意剥离了作者署名、版权声明和使用条款,可能违反美国《数字千年版权法》(DMCA)中关于版权管理信息保护的规定。
AI 并不只是「学习」了新闻内容,还可能改变用户获取新闻的路径:过去用户访问报纸网站、阅读原文、产生点击与订阅;现在可能直接向 AI 提问,得到摘要与整理后的信息。内容生产者投入成本,AI 产品拿走入口,平台获得商业价值,新闻机构却被挤出分配链条。
这批地方报纸诉讼中,DMCA 相关主张尤其值得关注。原告并不只是说自己的文章被复制,还主张 OpenAI 在数据处理过程中移除了文章中的作者署名、版权声明和使用条款等版权管理信息。
普通版权侵权关注的是「你有没有拿走作品」,而 DMCA 版权管理信息规则关注的是「你是不是在拿走作品之前,先把权利标签撕掉」。在 AI 训练场景下,大规模数据处理通常需要经历抓取、清洗、去重、切片、标注、向量化等环节,许多工程系统会把作者、来源、版权声明、网站条款视为「噪声」一并删除。但从版权合规角度看,这些信息恰恰不是噪声,而是权利边界。
微软和 OpenAI 很可能继续主张合理使用:大模型训练不是为了复制原文,而是为了学习语言规律和知识关联;训练具有转换性;如果禁止使用公开互联网内容训练 AI,将阻碍技术创新。这一抗辩仍有空间,但内容方也在强化反击逻辑:新闻作品具有高投入、高时效和高市场价值;AI 产品可能生成摘要、替代阅读、截流访问;如果训练数据包含付费墙内容、访问限制内容,甚至存在版权管理信息被剥离的情况,那么「合理使用」的正当性就会被削弱。AI 版权案正在从价值争论,变成证据工程。
这组案件对中国企业的提醒相当直接。今天很多企业并不自己从零训练大模型,而是与模型公司、云厂商、数据供应商、行业客户共同开发垂直 AI 应用。合作链条越复杂,越容易出现责任错位。技术团队关心模型效果,业务团队关心上线速度,法务团队如果只在合同末端补一条「对方保证数据合法」,远远不够。
AI 合规不是产品上线前的包装动作,而是数据进入系统前的基础工程。未来的 AI 竞争,不只比模型参数,也比数据来源;不只比算力规模,也比权利链条;不只比产品速度,也比合规底座。