36 氪 AI 日报:马斯克宣布 Grok 4.5 在 SpaceX 与特斯拉内部私测;DeepSeek V4 正式版将…
马斯克当地时间 6 月 28 日发文确认,旗下最新一代大语言模型 Grok 4.5 已在 SpaceX 与特斯拉内部开启私测。据马斯克透露,Grok 4.5 基于 1.5 万亿参数的 V9 基础模型打造,并在补充训练阶段加入了热门 AI 编程工具 Cursor 的数据。早期评测显示,该模型性能已接近甚至可能超越 Anthropic 的旗舰模型 Claude Opus。
马斯克还表示,强化学习仍在持续优化 Grok 4.5,配套的「GrokBuild」测试基准也在日趋完善。此外,SpaceX 在今年余下时间里将保持每月发布一款完全从头训练新模型的节奏,意味着 xAI 的模型迭代速度将进一步加快。
DeepSeek 团队宣布,DeepSeek V4 正式版计划于 7 月中旬上线,将带来更多功能优化和性能提升。值得关注的是,正式版发布后将同步调整 API 定价策略,引入峰谷定价机制:高峰时段价格是平时的 2 倍,高峰时段为每天 9:00–12:00 与 14:00–18:00。
这一机制在主流国产大模型中较为少见,意在通过价格信号引导用户错峰使用,缓解高峰时段推理资源的拥堵压力。峰谷定价能否被市场接受、是否会引发其他厂商跟进,仍有待观察。
百度正式发布并开源端到端 OCR 模型 Unlimited OCR,主打长文档解析场景。该模型总参数规模 3B,推理时激活参数仅约 570M,在效果与部署成本之间取得了较好的平衡。
开源次日,Unlimited OCR 即登顶 GitHub Daily Trending 榜与 Python 榜,同时在 HuggingFace 全球模型总趋势榜和多模态模型趋势榜均排名第一。在 OmniDocBench v1.6 基准测试中,该模型取得 93.92% 的综合成绩,刷新了端到端 OCR 的最新纪录。
谷歌已开始限制 Meta 对其大模型 Gemini 的调用,原因是 Meta 的算力需求超出了谷歌现有的承载能力。供给受限直接打乱了 Meta 多个内部 AI 项目的推进节奏,部分研发工作被迫推迟。
报道指出,这一举措直观暴露出算力供给仍是 AI 产业发展的核心瓶颈。即便谷歌持续加码 AI 基础设施投入,仍难以应对市场激增的需求。对 Meta 而言,原本依赖外部算力支持的部分 AI 研发进度可能因此延迟。
针对字节跳动旗下豆包大模型正在内测社交功能的传闻,豆包相关负责人 6 月 29 日回应称,在企业办公场景下,豆包确实在与飞书进行一些协同尝试,未来合作也会更紧密,但豆包并没有传闻中所说的社交功能计划。
这一回应划清了 C 端社交探索的边界,明确了豆包当前与飞书协同属于企业办公场景,与外界的「社交产品」猜测无关。
月之暗面发布严正声明称,近期市场上出现多起假借公司名义传播的不实融资及股权交易信息,部分机构和个人已涉嫌欺诈。公司所有融资活动由公司直接负责,未聘任或授权任何第三方机构作为财务顾问或融资顾问处理任何融资交易,包括新股交易和老股转让交易。未经内部批准的老股交易一律无效,公司将拒绝予以任何形式的确权登记,并保留采取法律手段追究违约责任的权利。
市场消息显示,快手社区科学线两位核心技术高管李晗与洪立印已完成岗位划转,正式加入可灵 AI 事业部。该事业部负责人为快手高级副总裁盖坤。两位推荐与电商算法领域的核心大将同步调入,被业内视为可灵冲刺资本市场的关键技术底盘补强。对上述消息,快手官方暂未回应。