OpenAI 据传推理成本减半,Anthropic Claude 全面登陆 Azure
OpenAI 通过系统优化将推理成本降低 50% 以上;Anthropic Claude 正式登陆 Microsoft…
7 月 1 日,多家媒体披露 AI 行业最新动向:OpenAI 据称通过底层系统优化将模型推理成本降低 50% 以上;Anthropic 旗下 Claude 模型正式登陆 Microsoft Foundry(Azure AI Foundry),同时宣布 Fable 5 于美国时间 7 月 1 日在 Claude 平台全球上线;亚马逊云科技宣布投入约 68 亿元人民币设立新 AI 部门;Meta 则被曝计划将过剩算力对外销售。
OpenAI 据传推理成本降低 50% 以上
据界面新闻报道,6 月 30 日有消息指出,OpenAI 工程师在内部透露,公司已通过一系列全新的系统底层优化,成功将 AI 模型的推理(运行)成本降低 50% 以上。该信息尚未得到 OpenAI 官方博客或论文的正式确认,但若属实,将对依赖 OpenAI 接口的下游应用与竞争对手的定价策略产生直接影响。
Anthropic Claude 全面登陆 Microsoft Foundry
当地时间 6 月 29 日,Anthropic 宣布 Claude 模型即日起在 Microsoft Foundry(Azure AI Foundry)全面可用,企业用户可在 Azure 环境中直接部署和调用 Claude 模型,并沿用现有 Azure 的身份认证、计费及治理体系。当前支持的具体型号为 Claude Opus 4.8 和 Claude Haiku 4.5,覆盖提示缓存(Prompt Caching)、扩展思考(Extended Thinking)等能力,适用于编程、智能体及复杂推理场景。Anthropic 表示,推理运行可在 Azure 或 Anthropic 托管环境间灵活选择。
Fable 5 全球上线,Pro / Max 用户可用
Anthropic 同时宣布,Fable 5 将于美国时间 7 月 1 日在 Claude 平台全球上线。Pro、Max、Team 和 Select Enterprise 用户可获得访问权限,单周使用量上限为 50%,有效期至 7 月 7 日。公司表示将继续与美国政府协调,扩大「Glasswing」计划下 Mythos 5 模型的开放范围,并尽快在 AWS、Google Cloud 与 Microsoft Foundry 上恢复 Fable 5 访问。
亚马逊云科技投入 68 亿元设立新 AI 部门
当地时间 6 月 30 日,亚马逊云科技宣布投入约 10 亿美元(约合 68 亿元人民币)成立全新 AI 部门,专门协助客户搭建并落地 AI 系统。该部门预计配置数千名前线部署工程师,与客户的业务、研发、安全团队协作,目标在数周内交付可自主运维的完整 AI 解决方案。亚马逊云科技是全球营收规模第一的云服务商,也是首家推出该类驻场工程师专项业务的超大规模云厂商。
Meta 被曝将外售过剩 AI 算力
据外媒报道,Meta 正在制定一项云基础设施业务计划,准备将自身过剩的 AI 计算能力与模型访问权限对外销售,从而与 AWS、微软 Azure 和 Google Cloud 展开新竞争。知情人士透露,Meta 近期持续加大数据中心与基础设施投入以支撑自身 AI 发展,未来希望借此对外销售获得新增收入。
其他动态
- Anthropic 回应 Claude Code 暗藏代码检测中国用户:用户逆向分析发现 Claude Code 自今年 4 月起内置针对中国时区及 147 个特定域名的检测机制,并以隐蔽方式编码进请求。Anthropic 团队回应称这是为防止账户转售与模型蒸馏攻击的实验性措施,并将在新版本中删除。
- 特斯拉首台量产无人驾驶电动车 Cybercab 已在得州奥斯汀开启工程测试。
- 「大空头」迈克尔·伯里 6 月 30 日在 SubStack 宣布做空卡特彼勒、英伟达、特斯拉、应用材料及 iShares 半导体 ETF(SOXX),押注 AI 相关股票存在回调风险。
