模型发布
OpenAI 启动 GPT-5.6 系列限量预览
OpenAI 发布 GPT-5.6 系列三款模型 Sol/Terra/Luna,主打更低成本与缓存优化。
2026.06.27 · 周六约 3 分钟阅读评分 79
评分细项加权总分 79
- 重要性
- 82
- 新颖性
- 72
- 影响面
- 80
- 可信度
- 85
- 实质性
- 78
OpenAI 宣布启动 GPT-5.6 系列的限量预览(limited preview),一次性推出三款定位不同的模型:旗舰款 Sol、面向日常工作的均衡款 Terra,以及主打高速与低成本的 Luna。公司表示将在未来数周内向更广泛的用户开放正式可用版本(GA)。
三款模型定位与性能
GPT-5.6 系列采用「一鱼三吃」的分层产品策略,覆盖从高强度任务到高频低成本调用的不同场景:
- Sol(旗舰):定位最强性能,面向对能力上限要求最高的复杂任务。
- Terra(均衡):官方称其性能与上一代 GPT-5.5 相当,但成本降至后者的一半(2x cheaper),定位主力通用模型。
- Luna(轻量):强调在 OpenAI 最低价格区间提供「足够强的能力」,适合对成本敏感的大批量调用场景。
这种分层使开发者在同一 API 体系内即可按需选择,无需切换厂商。
API 定价
GPT-5.6 三款模型均按每百万 token 计费,定价梯度清晰:
- Sol:输入 5 美元 / 输出 30 美元(每 1M tokens)
- Terra:输入 2.50 美元 / 输出 15 美元
- Luna:输入 1 美元 / 输出 6 美元
对比来看,Luna 的输入成本仅为 Sol 的五分之一,输出成本约为五分之一,对于需要大量调用轻量模型的场景具有显著吸引力。
提示缓存(Prompt Caching)改进
GPT-5.6 在开发者最关心的缓存机制上做了多项升级:
- 引入「显式缓存断点(explicit cache breakpoints)」,开发者可精确控制缓存命中位置,提升命中率的可预测性。
- 缓存最短生命周期延长至 30 分钟,降低长会话场景下的失效风险。
- 缓存写入按未缓存输入价的 1.25 倍计费,缓存读取继续享受 90% 的折扣。
这套定价与缓存组合,意在让高频、长上下文的 Agent 类应用获得更稳定的成本结构。
上线节奏与政府协作
值得注意的是,本次发布采用「先小范围预览、后逐步开放」的节奏。OpenAI 透露,作为与美国政府持续沟通的一部分,其在发布前已向政府通报了路线图与模型能力,并应要求先向一小批「与政府共享参与信息」的可信合作伙伴开放,再向更广用户推出。这一安排凸显出当前头部模型厂商在监管合规方面正面临更前置的审查。
