桃子桃子 AI 快讯
返回首页
行业动态

US Ban Benchmark 更新:OpenAI 与 Anthropic 打成平手

Reddit 讨论称 GPT 5.6 预览后,OpenAI 在 US Ban Benchmark 上追平 Anthrop…

2026.06.28 · 周日2 分钟阅读评分 25
评分细项加权总分 25
重要性
28
新颖性
32
影响面
22
可信度
20
实质性
10

近日,有 Reddit 用户在 r/LocalLLaMA 板块发帖称,OpenAI 在「US Ban Benchmark」最新更新中与 Anthropic 打成平手,并称这一变化发生在 OpenAI 预览「GPT 5.6」之后。帖子同时表示,Gemini 的相关数据尚未更新,并断言中国模型「永远没有追赶上的希望」。

事件来源与可信度

需要指出的是,该消息仅来自 Reddit 一条简短帖子,原始链接指向的 benchmark 具体内容、分数、方法论均未在帖中给出。帖中出现的「GPT 5.6」命名与目前 OpenAI 公开产品线并不完全吻合,真实性存疑。因此,以下信息均应以「社区传闻」对待,不宜作为正式报道引用。

所谓「US Ban Benchmark」

「US Ban Benchmark」字面含义与美国的出口管制或对华技术竞争相关,常被业内用于衡量美国主流厂商的模型在特定任务上的相对能力。该类 benchmark 通常包含推理、安全、代码或长上下文等子项,但本次帖文未披露任何子项分数或对比表格。

当前格局与悬念

  • OpenAI 据称已与 Anthropic 持平;
  • Gemini 数据「待更新」,尚未加入最新对比;
  • 中国厂商在该基准上的表现被发帖者判定为「难以追赶」,但同样缺乏具体数据支撑。

小结

在没有官方分数、详细排行与权威媒体确认之前,这一结果更适合作为社区讨论参考。若后续有 OpenAI、Anthropic 官方博客或一线科技媒体发布完整榜单与说明,可再行追踪与核实。

信源