Noam Shazeer发了一条X,16个字。
“I’m leaving Google and joining OpenAI.”没有感谢前东家。
没有煽情回忆。没有提Character.AI,没有提Gemini,没有提他带的团队。
就是走了。这条X下面,Sam Altman秒回:”从OpenAI创立第一天,Noam就是我最想合作的人。等了十年,值得。”
Altman这句话不是客套。
2015年OpenAI成立时,Shazeer已经是Google最早关注AI的那批人。他在2000年加入Google,是最早的几百号员工之一。他的导师是Jeff Dean。
2017年,他和另外七个人发表了一篇论文:《Attention Is All You Need》。
这篇论文定义了Transformer。而Transformer,定义了今天整个AI行业。从GPT到Claude,从Gemini到几乎所有主流大模型,底层结构都绕不开它。
Transformer八子之一。这个头衔足以让任何AI公司为他腾出一个位置。
但Shazeer的故事,远比”Transformer之父”复杂。
Google留不住的人
这是Shazeer第三次离开Google。
2000年加入,2009年离开。2012年回归Google Brain,2021年又离开。2024年回归,2026年再次离开。
他自己在播客里开玩笑,”我似乎每隔12年就会重新加入一次Google。”
但玩笑背后是一个反复出现的模式:Shazeer在Google看到了未来,但Google没有让他把未来做出来。
2021年那次离开,导火索是一款叫Meena的聊天机器人。Shazeer和同事Daniel De Freitas开发了它,它能围绕各种话题自然对话。Shazeer在一份内部备忘录《Meena Eats the World》中预测:这款聊天机器人有可能取代Google搜索,创造数万亿美元收入。
Google没有发布它。高管给出的理由是安全性和公平性风险。
对Google来说,这是谨慎。对Shazeer来说,这是一个巨大机会被放下——而机会被放下,往往意味着被错过。
所以他走了。和De Freitas一起创办了Character.AI。
一年后,ChatGPT证明了Shazeer的判断。全世界意识到,聊天机器人就是普通人接触AI的第一入口。
Character.AI迅速起势。2023年3月完成1.5亿美元融资,估值10亿美元。
但创业不易。烧钱太快,盈利模式模糊。用户大量涌入浪漫角色扮演场景,偏离了创始团队的初衷。
2024年,Google出手了。
一笔约27亿美元的交易:Google获得Character.AI技术授权,把Shazeer、De Freitas和部分团队带回Google DeepMind。Shazeer持有Character.AI 30-40%股份,个人收益7.5亿到10亿美元。
Google用27亿美元追回了曾经流失的人。
消息传出时,Google内部士气大振。有员工形容,这就像”见证耶稣复活”。
然后呢?
不到两年。Shazeer又走了。
这一次,他去的是做出了ChatGPT的OpenAI。
OpenAI在抢什么
这不是一次普通的人事变动。
Shazeer在OpenAI的新头衔是架构研究负责人。
注意这个词:”架构研究”。不是”继续强化Transformer”,而是”寻找Transformer之后的东西”。
过去两年,AI行业越来越清楚地意识到一件事:单纯扩大预训练规模,边际收益在下降。Ilya Sutskever公开说过——预训练作为最重要的scaling配方,正在接近边界。把模型再放大100倍,不会自动带来下一次GPT-3到GPT-4式的跨越。
Transformer本身也开始暴露短板。
Google DeepMind今年发了一篇论文叫《The Topological Trouble With Transformers》,指出纯前馈Transformer在动态状态追踪上存在结构性缺陷。模型很擅长”回头看”上下文,却不善于维护一个持续更新的内部状态。
翻译成大白话:Transformer像一本很厚的笔记,模型每次都要翻回去查,而不是真正”记住”了什么。
长上下文不等于真正记忆。思维链不等于真正推理。
所以行业在找下一代架构。MoE、state-space model、递归结构、latent reasoning、test-time compute——各种方向都在试。
Shazeer在这个时间点加入OpenAI,意义很明确:一个定义了Transformer时代的人,现在要去定义Transformer之后的时代了。
人才战争的全面升级
把镜头拉远,Shazeer的跳槽只是一场更大战争的一个节点。
2026年6月,AI行业的人才流动已经白热化:
- OpenAI挖走Shazeer,同时还从Google挖走了Gemini联合负责人
- Anthropic请来Andrej Karpathy(OpenAI联合创始人),负责Claude预训练
- Anthropic挖来前Microsoft Azure AI高管Eric Boyd,负责基础设施
- Barret Zoph重返OpenAI仅5个月后再次离职
- Elon Musk诉OpenAI窃取商业机密,被法院驳回
这还不是全部。
就在Shazeer宣布加入OpenAI的同一天,Anthropic和OpenAI先后提交了IPO文件。两家公司几乎在同一时间把自己推向公开市场。
上市前的窗口期,人才就是最重要的筹码。
谁能招到最好的人,谁就能在下一代模型竞争中跑在前面。谁能找到Transformer之后的架构,谁就能打破现有的成本结构和能力天花板。
Shazeer不是第一个被高价争夺的人,也不会是最后一个。
但他是最特殊的一个。
Schmidt在2015年的一次斯坦福演讲中回忆:Shazeer曾向他要数千颗计算芯片的使用权限,说”我要在这个周末之前解决通用知识问题”。
那次尝试失败了。但Schmidt说:”如果说世界上有谁最有可能做到这件事,我能想到的就是他。”
十年后,Shazeer加入了一家和那个目标最接近的公司。
这一次,Google花27亿美元也没能留住他。
