行业动态
AI 评测平台 Arena 八个月 ARR 破 1 亿美元
源自 UC Berkeley 的 AI 模型评测平台 Arena 商业化八个月即达 1 亿美元年化营收,总融资达 2.5…
2026.06.30 · 周二约 3 分钟阅读评分 72
评分细项加权总分 72
- 重要性
- 68
- 新颖性
- 78
- 影响面
- 60
- 可信度
- 85
- 实质性
- 75
AI 模型评测平台 Arena(原 LMSYS Chatbot Arena)在启动商业化服务仅八个月后,年化营收(ARR)已突破 1 亿美元。这家源自加州大学伯克利分校 2023 年研究项目的公司,凭借超过 1000 万次用户投票的众包评测榜单在 AI 社区中享有盛名,如今正快速成长为 AI 后训练与模型评估领域的重要供应商。
从学术项目到年化 1 亿美元
Arena 的核心产品是其免费开放的模型排行榜:用户输入提示词,系统将结果分别交给两个匿名模型生成,用户投票选出表现更优者。基于这一众包机制,Arena 持续发布被业界广泛引用的模型排名。
- 2024 年 9 月推出商用服务「AI Evaluations」,面向模型实验室与企业提供深度性能分析。
- 2025 年 1 月完成 1.5 亿美元 A 轮融资,投后估值 17 亿美元,当时年化营收约 3000 万美元。
- 八个月内年化营收从 3000 万跃升至 1 亿美元。
联合创始人兼 CEO Anastasios Angelopoulos 表示:「很多人甚至不知道我们在赚钱,大家仍把我们当作开源项目看待。」需要指出的是,Arena 将这一数字称为 ARR,但公司实际采用的是按消费量(consumption)计费的模式,并非传统意义上的可重复性收入。
赛道与竞争格局
Arena 的商业模式瞄准的是 AI 模型厂商在「后训练」(post-training)阶段不断膨胀的优化需求。
- Arena 自称在这一领域没有直接对手——另一家众包模型评测初创公司 Yupp 已于今年 3 月关停。
- Angelopoulos 表示,公司与 Scale AI、Mercor、Surge 等人工标注服务商争夺同一笔预算。
- 据 The Information 此前报道,Handshake 的 AI 训练业务年化营收从 1 月的 5.5 亿美元增长至近 10 亿美元;Mercor 年化营收也从去年 9 月的 5 亿美元升至今年早些时候的逾 10 亿美元。
后训练市场的整体增长,反映出头部模型厂商在性能优化上的投入持续扩大。
产品矩阵与团队
Arena 的评测覆盖文本、代码、视觉、图像生成以及近期上线的「Agent Mode」长链路复杂工作流。
- 联合创始人包括 CEO Anastasios Angelopoulos、CTO Wei-Lin Chiang,以及伯克利知名教授、Databricks 联合创始人 Ion Stoica。
- 项目于 2025 年 4 月正式注册为公司。
- 累计融资 2.5 亿美元,投资方包括 Felicis、Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners、Laude Ventures 以及 UC Investments。
随着评测任务从单一对话扩展至 Agent 模式与多模态场景,Arena 的数据资产正在成为头部模型厂商越来越有价值的参考依据。
