行业动态
US Ban Benchmark 更新:OpenAI 与 Anthropic 打成平手
Reddit 讨论称 GPT 5.6 预览后,OpenAI 在 US Ban Benchmark 上追平 Anthrop…
2026.06.28 · 周日约 2 分钟阅读评分 25
评分细项加权总分 25
- 重要性
- 28
- 新颖性
- 32
- 影响面
- 22
- 可信度
- 20
- 实质性
- 10
近日,有 Reddit 用户在 r/LocalLLaMA 板块发帖称,OpenAI 在「US Ban Benchmark」最新更新中与 Anthropic 打成平手,并称这一变化发生在 OpenAI 预览「GPT 5.6」之后。帖子同时表示,Gemini 的相关数据尚未更新,并断言中国模型「永远没有追赶上的希望」。
事件来源与可信度
需要指出的是,该消息仅来自 Reddit 一条简短帖子,原始链接指向的 benchmark 具体内容、分数、方法论均未在帖中给出。帖中出现的「GPT 5.6」命名与目前 OpenAI 公开产品线并不完全吻合,真实性存疑。因此,以下信息均应以「社区传闻」对待,不宜作为正式报道引用。
所谓「US Ban Benchmark」
「US Ban Benchmark」字面含义与美国的出口管制或对华技术竞争相关,常被业内用于衡量美国主流厂商的模型在特定任务上的相对能力。该类 benchmark 通常包含推理、安全、代码或长上下文等子项,但本次帖文未披露任何子项分数或对比表格。
当前格局与悬念
- OpenAI 据称已与 Anthropic 持平;
- Gemini 数据「待更新」,尚未加入最新对比;
- 中国厂商在该基准上的表现被发帖者判定为「难以追赶」,但同样缺乏具体数据支撑。
小结
在没有官方分数、详细排行与权威媒体确认之前,这一结果更适合作为社区讨论参考。若后续有 OpenAI、Anthropic 官方博客或一线科技媒体发布完整榜单与说明,可再行追踪与核实。
