AI 评测平台 Arena 八个月 ARR 破 1 亿美元

AI 模型评测平台 Arena（原 LMSYS Chatbot Arena）在启动商业化服务仅八个月后，年化营收（ARR）已突破 1 亿美元。这家源自加州大学伯克利分校 2023 年研究项目的公司，凭借超过 1000 万次用户投票的众包评测榜单在 AI 社区中享有盛名，如今正快速成长为 AI 后训练与模型评估领域的重要供应商。

从学术项目到年化 1 亿美元

Arena 的核心产品是其免费开放的模型排行榜：用户输入提示词，系统将结果分别交给两个匿名模型生成，用户投票选出表现更优者。基于这一众包机制，Arena 持续发布被业界广泛引用的模型排名。

2024 年 9 月推出商用服务「AI Evaluations」，面向模型实验室与企业提供深度性能分析。
2025 年 1 月完成 1.5 亿美元 A 轮融资，投后估值 17 亿美元，当时年化营收约 3000 万美元。
八个月内年化营收从 3000 万跃升至 1 亿美元。

联合创始人兼 CEO Anastasios Angelopoulos 表示：「很多人甚至不知道我们在赚钱，大家仍把我们当作开源项目看待。」需要指出的是，Arena 将这一数字称为 ARR，但公司实际采用的是按消费量（consumption）计费的模式，并非传统意义上的可重复性收入。

赛道与竞争格局

Arena 的商业模式瞄准的是 AI 模型厂商在「后训练」（post-training）阶段不断膨胀的优化需求。

Arena 自称在这一领域没有直接对手——另一家众包模型评测初创公司 Yupp 已于今年 3 月关停。
Angelopoulos 表示，公司与 Scale AI、Mercor、Surge 等人工标注服务商争夺同一笔预算。
据 The Information 此前报道，Handshake 的 AI 训练业务年化营收从 1 月的 5.5 亿美元增长至近 10 亿美元；Mercor 年化营收也从去年 9 月的 5 亿美元升至今年早些时候的逾 10 亿美元。

后训练市场的整体增长，反映出头部模型厂商在性能优化上的投入持续扩大。

产品矩阵与团队

Arena 的评测覆盖文本、代码、视觉、图像生成以及近期上线的「Agent Mode」长链路复杂工作流。

联合创始人包括 CEO Anastasios Angelopoulos、CTO Wei-Lin Chiang，以及伯克利知名教授、Databricks 联合创始人 Ion Stoica。
项目于 2025 年 4 月正式注册为公司。
累计融资 2.5 亿美元，投资方包括 Felicis、Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners、Laude Ventures 以及 UC Investments。

随着评测任务从单一对话扩展至 Agent 模式与多模态场景，Arena 的数据资产正在成为头部模型厂商越来越有价值的参考依据。