OpenAI 推出 GPT-5.6 三模型预览;DeepSeek 梁文锋署名新论文开源
OpenAI 开启 GPT-5.6 系列限量预览;DeepSeek 梁文锋署名新论文开源;Anthropic Fable…
- 重要性
- 70
- 新颖性
- 62
- 影响面
- 72
- 可信度
- 73
- 实质性
- 63
6 月 27 日,AI 行业多条重磅消息集中披露:OpenAI 宣布开启 GPT-5.6 系列限量预览,包含旗舰模型 Sol、均衡模型 Terra 与轻量模型 Luna;DeepSeek 联合北京大学发布推测解码新论文 DSpark,创始人梁文锋位列作者;美国政府拟解除对 Anthropic 最新大模型 Fable 5 的访问限制。
OpenAI 发布 GPT-5.6 系列:Sol、Terra、Luna 三款齐发
OpenAI 于 6 月 27 日宣布开启 GPT-5.6 系列的限量预览。该系列共包含三款模型:
- Sol:旗舰模型,主打最强能力
- Terra:均衡模型,性能与 GPT-5.5 相当,但价格便宜一半
- Luna:轻量模型,主打最低成本下的较强能力
OpenAI 表示,计划在未来几周内全面开放三款模型。值得关注的是,在正式发布前 OpenAI 已与美国政府沟通了模型能力及发布计划,应美方要求,此次先向少量经审核的可信合作方进行预览,显示出美国监管对前沿大模型管控力度的持续加强。
DeepSeek 梁文锋署名论文发布,配套开源 DeepSpec 代码库
6 月 27 日,DeepSeek 团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》。该工作并非模型版本迭代,而是在 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 基础上新增推测解码模块,重点在工程落地层面的推理加速。
随论文一同开源的 DeepSpec,是一个用于训练和评估推测解码草稿模型的全栈代码库,涵盖数据准备、草稿模型实现、训练代码与评估脚本,采用 MIT 许可。DeepSpec 目前已内置 DSpark、DFlash 和 Eagle3 三种实现,开发者可直接复用。
值得注意的是,DeepSeek 创始人梁文锋亲自参与论文署名。在 DeepSeek 于 6 月中旬完成 500 亿元首轮融资后,创始人仍投入精力参与技术论文撰写,这在当前 AI 行业中并不多见,也从侧面反映出 DeepSeek 对基础工程优化的持续投入。
美国拟解除对 Anthropic Fable 5 的访问限制
据报道,美国政府即将允许 Anthropic 恢复其最新大模型 Fable 5 的访问权限。此前 6 月 12 日,美国政府以国家安全为由向 Anthropic 发出紧急出口管制指令,要求其立即禁止外国主体访问 Fable 5 和 Mythos 5。
该消息一度引发市场对 AI 与算力概念股的广泛担忧。Anthropic 于今年 5 月底完成 H 轮 650 亿美元融资,投后估值达 9650 亿美元,是目前全球估值最高的 AI 初创企业。此次美方拟解除限制,意味着美国在 AI 出口管制方面可能做出阶段性调整,后续政策走向值得持续关注。
谷歌对 Meta 使用 Gemini 设限,算力供需矛盾加剧
谷歌近期对 Meta 使用 Gemini 模型进行了设限,原因是 AI 需求增长过快导致自身算力吃紧。这一事件反映出头部 AI 厂商之间在算力资源上的竞争与博弈正在加剧,也预示着算力供需矛盾可能进一步影响大模型的分发节奏与跨界合作模式,未来类似的算力配额调整或将成为常态。
