Transformer 原始论文八位作者已悉数离开谷歌,近期 Shazeer 投奔 OpenAI,Jumper 转投 A…
2025 年 6 月,谷歌在一周之内痛失两员大将:6 月 18 日,Transformer 论文共同作者 Noam Shazeer 在 X 上宣布离职、转投 OpenAI;两天后,2024 年诺贝尔化学奖得主、AlphaFold 团队负责人 John Jumper 也宣布离开 Google DeepMind,加盟 Anthropic。消息传出后,Alphabet 股价一度暴跌超过 7%,市值蒸发逾 3000 亿美元。D.A. Davidson 分析师 Gil Luria 直言,市场已开始担忧谷歌在 AI 人才争夺战中落于下风。
事实上,这两起人事变动只是更大故事的一角——2017 年那篇划时代论文《Attention Is All You Need》的八位共同作者,如今已悉数离开谷歌。这篇论文的引用量已超过 26 万次,是 21 世纪被引最多的论文之一,也奠定了此后所有大语言模型的架构基础。
2017 年,机器翻译领域的主流方案是循环神经网络(RNN),模型必须按词序处理句子,并行困难、训练又慢又贵。谷歌大脑的八位研究员决定做一个近乎冒进的想法:把循环结构整个扔掉,只留下「注意力机制」,让模型一次性看完整句话,自己判断词与词之间的关联。论文标题「Attention Is All You Need」化用了披头士的《All You Need Is Love》,此后也被无数论文效仿。
值得一提的是,论文脚注明确写道:所有作者贡献均等,排序随机,因此并不存在所谓的「第一作者」。从贡献说明来看,Jakob Uszkoreit 最先提出用自注意力取代循环结构并主导早期验证;Ashish Vaswani 与 Illia Polosukhin 一起设计并实现了最初的 Transformer 架构;Noam Shazeer 提出了缩放点积注意力、多头注意力以及无参数位置表示;Niki Parmar、Llion Jones、Łukasz Kaiser、Aidan N. Gomez 则在代码库、tensor2tensor 框架与系统搭建上承担了大量工程工作。
Shazeer 早在 2000 年就加入谷歌,曾修好过谷歌搜索的拼写纠错功能。2017 年后,他与同事 Daniel De Freitas 共同研发了聊天机器人 Meena,但谷歌出于审慎考虑没有公开发布。两人于 2021 年离职创办 Character.AI,一度从 a16z 等机构融资超 1.5 亿美元。
2024 年 8 月,剧情反转:谷歌以约 27 亿美元的授权协议将 Character.AI 收入囊中,Shazeer 重回 DeepMind 出任工程副总裁,与 Jeff Dean、Oriol Vinyals 共同领导 Gemini 项目。据估算,凭借手中约 30%–40% 的 Character.AI 股份,他个人套现规模在 7.5 亿到 10 亿美元之间;2026 年他还被选为美国国家工程院院士。
然而仅仅几个月后,他再次出走,这次选择了 OpenAI。Sam Altman 罕见公开表态,称 Shazeer「从 OpenAI 创立第一天起就是我最想合作的人之一」,并透露这次招聘「酝酿了整整十年」。据报道,Shazeer 将在 OpenAI 负责「架构研究」方向。对谷歌而言,这无疑是一次代价高昂的「回购未遂」。
Ashish Vaswani 与 Niki Parmar 在离开谷歌后,曾与 David Luan 等人共同创办 Adept AI,分别担任首席科学家与 CTO。Adept 一度融资超 4 亿美元、估值约 10 亿美元,但产品迟迟未能落地。两人先后退出后,2023 年初又联手创立 Essential AI。
Essential AI 融资节奏稳健:种子轮 830 万美元由 Thrive Capital 领投;2023 年底 A 轮 5650 万美元由 March Capital 领投,谷歌、英伟达、AMD 跟投;2026 年初完成 1.75 亿美元 B 轮,估值站上 10 亿美元,正式成为独角兽。2025 年底,公司还发布了以印度数学家拉马努金命名的开源模型系列 Rnj-1。
不过两人此后分道扬镳:Parmar 于 2024 年底悄悄离开 Essential AI,2025 年 2 月公开宣布加盟 Anthropic,参与了 Claude 3.7 Sonnet 的开发,目前专注于前沿能力研究与强化学习方向。而 Vaswani 继续执掌 Essential AI,直到本周——据报道,英伟达正在招募 Essential AI 核心团队,Vaswani 本人也在其中,未来有望参与英伟达开源模型 Nemotron 的研发。消息人士称,Essential AI 融资遇到瓶颈、且其长期依赖 AMD GPU,使英伟达的挖角变得划算。截至发稿,英伟达与 Essential AI 均未正式回应。
至此,Transformer 的「八大创始团队」已没有一个留在当初孕育这篇论文的谷歌——这或许是过去几年 AI 行业人才流动最具象征意义的一个注脚。