Together AI 融资 8 亿美元，年化收入 11.5 亿美元

AI 推理基础设施公司 Together AI 近日宣布完成 8 亿美元（约合人民币 54 亿元）融资，估值达到 83 亿美元（约合人民币 564 亿元）。本轮融资由沙特阿美旗下 Aramco Ventures 领投，Vista Equity Partners、General Catalyst、Emergence Capital、英伟达、Salesforce Ventures 等参投。相比上一轮 33 亿美元的估值，本轮估值已翻倍有余。更值得关注的数字是，公司年化收入（ARR）已达到 11.5 亿美元（约合人民币 78 亿元）。

团队背景与公司定位

Together AI 成立于 2022 年，与 ChatGPT 同年诞生。创始团队具备扎实的学术和工程背景：

创始人兼 CEO Vipul Ved Prakash 出生于印度新德里，曾创办网络安全公司 Cloudmark 与社交媒体搜索公司 Topsy，后者被苹果收购，他随后在苹果负责 Siri 搜索与 AI 相关工作。
CTO 张策 2008 年本科毕业于北京大学数学系，后在威斯康星大学麦迪逊分校获得博士学位，研究方向是让机器学习更便宜、更可信、更易用。
首席科学家 Tri Dao（越南裔）是普林斯顿大学计算机科学系助理教授，也是 FlashAttention 的主要作者之一。
斯坦福大学教授 Percy Liang 与 Chris Re 也深度参与公司事务，前者是斯坦福基础模型研究中心（CRFM）主任，长期关注开放模型与模型评测。

Together AI 最初因提供英伟达 GPU 访问而受到关注，随后逐步演变为帮助企业构建、定制和部署开源 AI 模型的综合平台，涵盖模型选择、训练、微调、推理、部署、评估、GPU 集群、专属端点和成本优化等环节。

收入两年暴增约 38 倍

Together AI 的收入增长极为陡峭：2024 年 2 月 ARR 约 3000 万美元，2025 年 2 月突破 1 亿美元，到本轮融资时已达 11.5 亿美元，两年增幅约 38.3 倍。其商业化路径主要有四条：

推理 API：企业按调用 token 量付费，DeepSeek、MiniMax、Kimi 等开源模型均有明确的输入、缓存输入和输出定价。
专属推理服务：为用量大、对延迟和安全性要求高的客户提供专属端点，按 GPU 资源计费。
模型微调：按训练和验证过程中处理的 token 量收费，帮助企业将通用模型改造为懂自身业务的行业模型。
GPU 集群：支持 H100、H200、B200 等硬件，按每 GPU 每小时计费。

公司目前每月处理超过 400 万亿个开放模型推理 token，一年前这一数字仅约 300 亿，一年内调用量增长约 1.3 万倍。客户包括 Cursor、Cognition、Decagon 等 AI 原生公司。公司披露，企业使用开放模型通常可实现 6 到 20 倍的成本下降，Decagon 迁移到 Together AI 后推理成本下降了 6 倍。

推理赛道成为资本焦点

Together AI 并非孤例。上周，Baseten 宣布完成 15 亿美元融资，估值 130 亿美元，过去一年收入增长 20 倍；今年 5 月，Fireworks AI 被曝正在洽谈新一轮融资，目标估值或达 150 亿美元。这些公司的共同点是押注大模型推理层：随着 AI Agent、客服机器人、编程工具、销售自动化等场景规模化落地，持续产生账单的正是推理环节。

投资方构成也透露出产业信号：英伟达押注推理平台以拉动 GPU 需求；Salesforce 提前卡位企业 AI 工作流背后的算力入口；Aramco 代表能源资本进入；Schneider Electric 和 Pegatron 等基础设施和制造企业也在跟进。这表明 AI 基础设施的竞争正在从「谁能训练更大的模型」转向「谁能更便宜、更稳定地承接海量推理调用」。