Together AI 融资 8 亿美元,年化收入 11.5 亿美元
Together AI 完成 8 亿美元融资,估值 83 亿美元,年化收入 11.5 亿美元,主打开源大模型推理服务。
AI 推理基础设施公司 Together AI 近日宣布完成 8 亿美元(约合人民币 54 亿元)融资,估值达到 83 亿美元(约合人民币 564 亿元)。本轮融资由沙特阿美旗下 Aramco Ventures 领投,Vista Equity Partners、General Catalyst、Emergence Capital、英伟达、Salesforce Ventures 等参投。相比上一轮 33 亿美元的估值,本轮估值已翻倍有余。更值得关注的数字是,公司年化收入(ARR)已达到 11.5 亿美元(约合人民币 78 亿元)。
团队背景与公司定位
Together AI 成立于 2022 年,与 ChatGPT 同年诞生。创始团队具备扎实的学术和工程背景:
- 创始人兼 CEO Vipul Ved Prakash 出生于印度新德里,曾创办网络安全公司 Cloudmark 与社交媒体搜索公司 Topsy,后者被苹果收购,他随后在苹果负责 Siri 搜索与 AI 相关工作。
- CTO 张策 2008 年本科毕业于北京大学数学系,后在威斯康星大学麦迪逊分校获得博士学位,研究方向是让机器学习更便宜、更可信、更易用。
- 首席科学家 Tri Dao(越南裔)是普林斯顿大学计算机科学系助理教授,也是 FlashAttention 的主要作者之一。
- 斯坦福大学教授 Percy Liang 与 Chris Re 也深度参与公司事务,前者是斯坦福基础模型研究中心(CRFM)主任,长期关注开放模型与模型评测。
Together AI 最初因提供英伟达 GPU 访问而受到关注,随后逐步演变为帮助企业构建、定制和部署开源 AI 模型的综合平台,涵盖模型选择、训练、微调、推理、部署、评估、GPU 集群、专属端点和成本优化等环节。
收入两年暴增约 38 倍
Together AI 的收入增长极为陡峭:2024 年 2 月 ARR 约 3000 万美元,2025 年 2 月突破 1 亿美元,到本轮融资时已达 11.5 亿美元,两年增幅约 38.3 倍。其商业化路径主要有四条:
- 推理 API:企业按调用 token 量付费,DeepSeek、MiniMax、Kimi 等开源模型均有明确的输入、缓存输入和输出定价。
- 专属推理服务:为用量大、对延迟和安全性要求高的客户提供专属端点,按 GPU 资源计费。
- 模型微调:按训练和验证过程中处理的 token 量收费,帮助企业将通用模型改造为懂自身业务的行业模型。
- GPU 集群:支持 H100、H200、B200 等硬件,按每 GPU 每小时计费。
公司目前每月处理超过 400 万亿个开放模型推理 token,一年前这一数字仅约 300 亿,一年内调用量增长约 1.3 万倍。客户包括 Cursor、Cognition、Decagon 等 AI 原生公司。公司披露,企业使用开放模型通常可实现 6 到 20 倍的成本下降,Decagon 迁移到 Together AI 后推理成本下降了 6 倍。
推理赛道成为资本焦点
Together AI 并非孤例。上周,Baseten 宣布完成 15 亿美元融资,估值 130 亿美元,过去一年收入增长 20 倍;今年 5 月,Fireworks AI 被曝正在洽谈新一轮融资,目标估值或达 150 亿美元。这些公司的共同点是押注大模型推理层:随着 AI Agent、客服机器人、编程工具、销售自动化等场景规模化落地,持续产生账单的正是推理环节。
投资方构成也透露出产业信号:英伟达押注推理平台以拉动 GPU 需求;Salesforce 提前卡位企业 AI 工作流背后的算力入口;Aramco 代表能源资本进入;Schneider Electric 和 Pegatron 等基础设施和制造企业也在跟进。这表明 AI 基础设施的竞争正在从「谁能训练更大的模型」转向「谁能更便宜、更稳定地承接海量推理调用」。
