桃子桃子 AI 快讯
返回首页
行业动态

AI 评测平台 Arena 八个月 ARR 破 1 亿美元

源自 UC Berkeley 的 AI 模型评测平台 Arena 商业化八个月即达 1 亿美元年化营收,总融资达 2.5…

2026.06.30 · 周二3 分钟阅读评分 72
评分细项加权总分 72
重要性
68
新颖性
78
影响面
60
可信度
85
实质性
75

AI 模型评测平台 Arena(原 LMSYS Chatbot Arena)在启动商业化服务仅八个月后,年化营收(ARR)已突破 1 亿美元。这家源自加州大学伯克利分校 2023 年研究项目的公司,凭借超过 1000 万次用户投票的众包评测榜单在 AI 社区中享有盛名,如今正快速成长为 AI 后训练与模型评估领域的重要供应商。

从学术项目到年化 1 亿美元

Arena 的核心产品是其免费开放的模型排行榜:用户输入提示词,系统将结果分别交给两个匿名模型生成,用户投票选出表现更优者。基于这一众包机制,Arena 持续发布被业界广泛引用的模型排名。

  • 2024 年 9 月推出商用服务「AI Evaluations」,面向模型实验室与企业提供深度性能分析。
  • 2025 年 1 月完成 1.5 亿美元 A 轮融资,投后估值 17 亿美元,当时年化营收约 3000 万美元。
  • 八个月内年化营收从 3000 万跃升至 1 亿美元。

联合创始人兼 CEO Anastasios Angelopoulos 表示:「很多人甚至不知道我们在赚钱,大家仍把我们当作开源项目看待。」需要指出的是,Arena 将这一数字称为 ARR,但公司实际采用的是按消费量(consumption)计费的模式,并非传统意义上的可重复性收入。

赛道与竞争格局

Arena 的商业模式瞄准的是 AI 模型厂商在「后训练」(post-training)阶段不断膨胀的优化需求。

  • Arena 自称在这一领域没有直接对手——另一家众包模型评测初创公司 Yupp 已于今年 3 月关停。
  • Angelopoulos 表示,公司与 Scale AI、Mercor、Surge 等人工标注服务商争夺同一笔预算。
  • 据 The Information 此前报道,Handshake 的 AI 训练业务年化营收从 1 月的 5.5 亿美元增长至近 10 亿美元;Mercor 年化营收也从去年 9 月的 5 亿美元升至今年早些时候的逾 10 亿美元。

后训练市场的整体增长,反映出头部模型厂商在性能优化上的投入持续扩大。

产品矩阵与团队

Arena 的评测覆盖文本、代码、视觉、图像生成以及近期上线的「Agent Mode」长链路复杂工作流。

  • 联合创始人包括 CEO Anastasios Angelopoulos、CTO Wei-Lin Chiang,以及伯克利知名教授、Databricks 联合创始人 Ion Stoica。
  • 项目于 2025 年 4 月正式注册为公司。
  • 累计融资 2.5 亿美元,投资方包括 Felicis、Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners、Laude Ventures 以及 UC Investments。

随着评测任务从单一对话扩展至 Agent 模式与多模态场景,Arena 的数据资产正在成为头部模型厂商越来越有价值的参考依据。

信源