US Ban Benchmark 更新：OpenAI 与 Anthropic 打成平手

近日，有 Reddit 用户在 r/LocalLLaMA 板块发帖称，OpenAI 在「US Ban Benchmark」最新更新中与 Anthropic 打成平手，并称这一变化发生在 OpenAI 预览「GPT 5.6」之后。帖子同时表示，Gemini 的相关数据尚未更新，并断言中国模型「永远没有追赶上的希望」。

事件来源与可信度

需要指出的是，该消息仅来自 Reddit 一条简短帖子，原始链接指向的 benchmark 具体内容、分数、方法论均未在帖中给出。帖中出现的「GPT 5.6」命名与目前 OpenAI 公开产品线并不完全吻合，真实性存疑。因此，以下信息均应以「社区传闻」对待，不宜作为正式报道引用。

所谓「US Ban Benchmark」

「US Ban Benchmark」字面含义与美国的出口管制或对华技术竞争相关，常被业内用于衡量美国主流厂商的模型在特定任务上的相对能力。该类 benchmark 通常包含推理、安全、代码或长上下文等子项，但本次帖文未披露任何子项分数或对比表格。

当前格局与悬念

OpenAI 据称已与 Anthropic 持平；
Gemini 数据「待更新」，尚未加入最新对比；
中国厂商在该基准上的表现被发帖者判定为「难以追赶」，但同样缺乏具体数据支撑。

小结

在没有官方分数、详细排行与权威媒体确认之前，这一结果更适合作为社区讨论参考。若后续有 OpenAI、Anthropic 官方博客或一线科技媒体发布完整榜单与说明，可再行追踪与核实。