Claude Sonnet 5 发布：百万上下文、默认开启思考、英文实际成本涨约 40%

Anthropic 推出 Claude Sonnet 5，定位为性能接近 Opus 4.8、价格更亲民的中端主力模型。该版本带来多项 API 调整与能力升级，但同时启用新 tokenizer，英文输入的实际成本较上一代增加约 40%，中文场景则基本持平。

核心定位与安全声明

Anthropic 在官方说明中称，Sonnet 5 的性能「接近 Opus 4.8，但价格更低」。在系统卡（system card）中，公司解释了能够在不触发更高等级限制的情况下发布该模型的原因：Sonnet 5 在网络任务上的能力显著弱于公司内部代号为 Mythos 5 的更强模型，因此其安全防护标准与 Opus 4.7、Opus 4.8 一致，而非按最高风险等级处理。

API 与能力变化

新版本对开发者接口进行了若干调整：

移除对采样参数 temperature、top_p、top_k 的支持。
上下文窗口扩展至 100 万 token，单次最大输出为 12.8 万 token。
平台功能与 Sonnet 4.6 保持一致。
默认开启自适应思考（adaptive thinking），可通过设置 thinking: { type: "disabled" } 手动关闭。

定价与 tokenizer 影响

Sonnet 5 标价与 Sonnet 4.6 持平：输入 3 美元/百万 token、输出 15 美元/百万 token，至 8 月 31 日前享有 2/10 美元的入门折扣。但模型启用了新 tokenizer，相同文本产出的 token 数较 Sonnet 4.6 约多 30%，按官方提示相当于一次隐性的价格上调。

Simon Willison 使用其自制的 Claude Token Counter 工具，对多份文档做了跨语种实测对比：

英文《世界人权宣言》：token 数约为 1.42 倍
西班牙文《世界人权宣言》：约 1.33 倍
简体中文《世界人权宣言》：约 1.01 倍（基本无变化）
Python 代码文件（4279 行）：约 1.28 倍

按新 tokenizer 折算，英文场景下使用 Sonnet 5 的实际成本约为 Sonnet 4.6 的 1.4 倍，西班牙文约 1.33 倍，Python 代码约 1.28 倍，中文输入因分词效率接近则总开销基本持平。

小结

Sonnet 5 在性能上进一步逼近 Opus 系列，并带来百万级上下文与默认思考能力。但对英文和代码场景的开发者而言，实际账单将明显抬升；中文输入为主的用户受影响较小，迁移成本更低。