Claude Sonnet 5 发布:百万上下文、默认开启思考、英文实际成本涨约 40%
Anthropic 推出 Claude Sonnet 5,性能接近 Opus 4.8;新 tokenizer 使英文输入…
Anthropic 推出 Claude Sonnet 5,定位为性能接近 Opus 4.8、价格更亲民的中端主力模型。该版本带来多项 API 调整与能力升级,但同时启用新 tokenizer,英文输入的实际成本较上一代增加约 40%,中文场景则基本持平。
核心定位与安全声明
Anthropic 在官方说明中称,Sonnet 5 的性能「接近 Opus 4.8,但价格更低」。在系统卡(system card)中,公司解释了能够在不触发更高等级限制的情况下发布该模型的原因:Sonnet 5 在网络任务上的能力显著弱于公司内部代号为 Mythos 5 的更强模型,因此其安全防护标准与 Opus 4.7、Opus 4.8 一致,而非按最高风险等级处理。
API 与能力变化
新版本对开发者接口进行了若干调整:
- 移除对采样参数 temperature、top_p、top_k 的支持。
- 上下文窗口扩展至 100 万 token,单次最大输出为 12.8 万 token。
- 平台功能与 Sonnet 4.6 保持一致。
- 默认开启自适应思考(adaptive thinking),可通过设置
thinking: { type: "disabled" }手动关闭。
定价与 tokenizer 影响
Sonnet 5 标价与 Sonnet 4.6 持平:输入 3 美元/百万 token、输出 15 美元/百万 token,至 8 月 31 日前享有 2/10 美元的入门折扣。但模型启用了新 tokenizer,相同文本产出的 token 数较 Sonnet 4.6 约多 30%,按官方提示相当于一次隐性的价格上调。
Simon Willison 使用其自制的 Claude Token Counter 工具,对多份文档做了跨语种实测对比:
- 英文《世界人权宣言》:token 数约为 1.42 倍
- 西班牙文《世界人权宣言》:约 1.33 倍
- 简体中文《世界人权宣言》:约 1.01 倍(基本无变化)
- Python 代码文件(4279 行):约 1.28 倍
按新 tokenizer 折算,英文场景下使用 Sonnet 5 的实际成本约为 Sonnet 4.6 的 1.4 倍,西班牙文约 1.33 倍,Python 代码约 1.28 倍,中文输入因分词效率接近则总开销基本持平。
小结
Sonnet 5 在性能上进一步逼近 Opus 系列,并带来百万级上下文与默认思考能力。但对英文和代码场景的开发者而言,实际账单将明显抬升;中文输入为主的用户受影响较小,迁移成本更低。
