两周连揽四将:Anthropic 招入伯克利 EECS 系主任 Jelani Nelson
理论计算机科学家、UC 伯克利 EECS 计算机科学系主任 Jelani Nelson 以休假方式加入 Anthropi…
美国时间 7 月 1 日,UC 伯克利电气工程与计算机科学系(EECS)计算机科学系主任、理论计算机科学家 Jelani Nelson 在 X 上宣布,自己已加入 Anthropic,并从大学休假。他在帖子中写道:「我已加入 Anthropic,并从大学休假。很高兴与许多有才华、有使命感的人一起,研究我们这个时代的决定性技术。」目前他的 X 简介已同步更新为「Anthropic 技术研究员(Member of Technical Staff)」。
Nelson 是谁:从 MIT 到伯克利的理论计算机「满配」履历
Nelson 的学术路径几乎覆盖了理论计算机科学最核心的方向。他本硕博均在 MIT 完成,2011 年获计算机科学博士学位,研究方向为海量数据的高效算法。博士毕业后,他先后在伯克利、普林斯顿大学和普林斯顿高等研究院做博士后,2013 年加入哈佛任教,2019 年转赴 UC 伯克利,2024 年秋天接任 EECS 计算机科学部主任。
他的主要研究集中在三类问题上:流式算法(streaming algorithms)、降维(dimensionality reduction)、随机算法(randomized algorithms)。通俗地说,他研究的是同一件事——数据大到装不下的时候,怎么算才最优。他与合作者证明了约翰逊-林登斯特劳斯引理(JL lemma)的最优性、为 count-distinct 等经典问题给出了渐近最优算法,还曾就「近似计数」问题给出内存下界证明,相关论文可在 arXiv 上公开查阅。这些工作为他赢得了斯隆研究奖、美国总统青年科学家与工程师奖(PECASE)等多项荣誉。
学术之外,Nelson 早在 2011 年就在 MIT 读博期间于埃塞俄比亚创办了免费编程夏令营 AddisCoder,十四年来培养了近 700 名学员,其中不少人进入哈佛、MIT、斯坦福等校读博;这一项目后来又催生了姊妹项目 JamCoders,他也因此获得 ACM Lawler 人道主义贡献奖。
Anthropic 要一位理论学者做什么:补课「大模型地基」
Nelson 的研究方向,恰好对应当下大模型训练与推理中最烧钱的几个环节:训练效率、数据压缩、计算复杂度。以其核心成果 JL 引理为例,它回答的是一个非常朴素的问题——高维数据最多能压到多小,还不失真,如今向量检索与嵌入压缩的底层直觉都建立在这条引理之上。
训练一个前沿模型,本质上就是在天文数字的数据流上做压缩与筛选;推理一侧,显存、缓存、上下文窗口同样在和内存、复杂度死磕。当模型规模撞上算力与数据的天花板,「省」的价值开始超过「堆」,AI 竞争的重心正在从「谁的模型更强」,转向「谁的底层算法更省」。从这个角度看,Anthropic 签下一位理论计算机科学家,更像是在模型、工程、对齐之外,把理论地基再打深一层。
值得注意的是,Nelson 并未辞职,而是以 leave of absence 的方式保留教职。他和 5 月加入的 Karpathy 一样,以「休假入职」模式进入公司。这是美国学界成熟的制度安排,对学者而言是一张保底船票,对 AI 公司而言则是一条低摩擦的引才通道——签下一位学者,往往也意味着签下他身后的学生、同行与整张学术网络。
两周四将:AI 巨头正在「长成第二研究机构」
Nelson 是过去两周 Anthropic 揽下的第四位重量级人才。此前一周,2024 年诺贝尔化学奖得主、AlphaFold 核心人物 John Jumper 官宣离开效力近九年的 DeepMind 加入 Anthropic;Jumper 在 DeepMind 的长期合作者、Gemini 核心研究员 Jonas Adler 和 Alexander Pritzel 也被曝将跟进加盟(受竞业条款约束,Jumper 可能要到 2025 年才正式到岗)。与此同时,6 月 18 日 Transformer 论文作者、Gemini 共同负责人 Noam Shazeer 宣布离开谷歌加入 OpenAI(其 2024 年才被谷歌以 27 亿美元从 Character.AI 买回);6 月 25 日,在伯克利任教 19 年的 AI 安全学者 Dawn Song 宣布加入 Meta 超级智能实验室,出任 AI 研究副总裁。
这一系列动作的背后,是 OpenAI 已秘密递交 IPO 文件、Anthropic 被多家信源指向临近上市的窗口期——对顶级研究者而言,此时入职意味着上市前股权,是高校与大厂都给不出的价码。而伯克利在这轮迁徙中的角色格外显眼:Simons 理论计算研究所、全美第一梯队的 EECS 共同坐落于此,理论、机器学习系统、AI 安全三条线持续向 Anthropic、OpenAI、DeepMind 输血。当顶级学者纷纷以休假方式涌入公司,AI 巨头事实上正在长成一套「第二研究机构体系」。AI 竞赛的争夺焦点,已经从模型能力下探到了算法理论的地基层。
