闽公网安备 35020302035485号
听了张小珺对姚顺宇播客的访谈,脑子真的长东西了…
4 个小时的时长,把重点给大家罗列了出来。
硅谷 AI 圈有 两位清华同届毕业、英文都叫 Shunyu Yao 的研究者,中文媒体常混淆:
姚顺雨(另一位)
姚顺宇(本期嘉宾)
本科
清华姚班(计算机)
清华物理系(基科班/学堂物理班)
博士
Princeton(NLP)
Stanford(理论物理)
代表作
ReAct、Tree of Thoughts、《AI 下半场》
Non-Hermitian Skin Effect(非厄米趋肤效应)、Scramblon 理论
路径
OpenAI → 腾讯首席 AI 科学家(2025)
Anthropic → Google DeepMind(2025)
本期嘉宾姚顺宇的公开履历校核:
字幕中所有”顺宇”与”舜宇”、”Anthropic”被译为”人类学/人本主义/人形生物/人为因素/人猿科技/安特罗皮克”等均为同一指代;”双子座/双子星”即 Gemini。
姚顺宇主动介绍另一位姚顺雨:”我们的主要职业发展道路有一些重叠,所以看起来可能很难把我们区分开来。”他强调两人最大区别是: 另一位从一开始就做计算机科学,而自己是物理出身,只是”某种意义上走到了这一步”。
两人清华本科同届(姚顺雨在姚班,他在基科班),研究生一个去了 Princeton,一个去了 Stanford——“很奇怪,全世界都觉得 Stanford 是 CS 圣地,Princeton 才是物理圣地,我们俩恰好反着来。”
关于 OpenClaw(字幕原文,疑为某款 2026 年初爆火的智能体 Wrapper 产品)的产品判断:
这是他最反主流的判断之一。
为什么编程领域这一年半发展最快?他认为有两大结构性优势:
从产品角度,编码还有一个独特性: 好程序员写的代码风格高度相似(简洁、结构清晰、易扩展、抽象合理),所以不需要像社交/游戏那种推荐算法去适应每个用户的口味——这大大简化了产品形态。
对字节跳动 Seedance(字节系视频生成模型)的评价:
>对了。顺嘴提一句,技术大厂,前后端-测试机会,全国一线及双一线城市均有,待遇和稳定性还不错,感兴趣看看。
回应 Dario Amodei 最近公开指控三家中国公司蒸馏他们模型:
出生在宁夏大武口(一座因煤矿而生的城市),小学到高中在上海。性格自述:” 我总是喜欢做我不擅长的事情。 “
关键人生选择——高中择校:他本可以被上海四大名校(上中、华二、交大附中、复旦附中)的普通班录取,但为了进**”稍差一些”的格致中学的竞赛班** 而放弃—— “赤脚的不怕穿鞋的,值得一试。”
参加物理竞赛未能进国家集训队(没拿到保送),后来高考也考不上清华。但命运转折: 高三清华夏令营期间,听说清华对北京学生有独立招生,他当场给清华招生办老师发短信——“你给北京学生考试,凭什么不让上海学生也考?”——争取到考试机会,考过后签了”第一档降分”协议,最终录取清华。
人生最大的经验: “大胆一些。如果你不争取,就永远得不到。即使你争取,也未必能得到。但如果你不争取,就肯定得不到。”
对父母的评价:”中国家长能做到让孩子’讨论’已经不错了, 我一般只是通知他们。我父母最好的地方是,当他们无法理解我在做什么时,他们选择不干涉。”
性格:”在意自己想做的事,别试图阻止我,我会竭尽全力;但我不想做的事,你逼也没用。”、”我更多是和自己竞争,不太愿意和别人竞争——当然如果你也很在乎,那我一定要比你厉害。”
选择凝聚态理论”就是命运的安排”。清华基科班传统是”学生可以做物理以外的事,鼓励早进实验室做研究”—— “基科班三分之二的学生最后都不做物理。”
本科导师是 王中(Zhong Wang)(字幕写作”王忠”),当时还很年轻、学生不多。王中的博士导师是 张首晟(Shoucheng Zhang)(字幕写作”张守成/寿城”,斯坦福著名凝聚态物理学家,2018 年去世)。”王老师话不多,但很擅长把问题看清楚。”
非厄米系统工作的通俗讲解(他自己给出的进度条提示:不想听可以跳过):
为什么没继续做下去?
对”挑战难事”的反思: “说得好听点是挑战自己,说得难听点就是自虐。”、”如果一个人只为受虐而受虐,那是心理问题;但如果是为了获得信息、丰富经验和能力,那值得。”
本科学物理最大的收获: “把事情想清楚、做深度阅读、不要过分相信纯理论。”——因为非厄米那个发现本身就源于”数值计算和理论不符,深入追查才找到问题”。
承认博士阶段” 对世界没有贡献 “:
物理学家做 AI 的优势:
关于 AI 是不是黑箱:
为什么最终选 AI 而不是量子计算?
这是贯穿访谈的核心观点之一:
“个人英雄主义在语言模型领域可能已经过去了——也就是 Transformer 那个时刻之后。”
“现在大家都是冲浪的人,本质上是那个浪,而不是你那个冲浪的人。”
“没有英雄,有时候甚至觉得旧时代的英雄有点蠢。”
“我对任何模型的贡献,我的 statement 永远是:我自己对那件事没那么重要;更多是我很幸运,有机会在那时候加入了一个重要项目,做了一些事。”
他特别指出:编程上 Anthropic 的成功确实还有”公司级英雄主义”(敢不敢赌、赌得够不够快),但模型内部的每个技术细节都是集体的。
对 AI Safety 的批评(非常犀利):
核心命题: “AI 本质是简单的。”(他强调这是 statement 不是 conclusion)
解释:
简短、尖锐: “我不理解。他们一直都挺动荡的。”(笑)
“Long horizon.(长时程)”
离职 Anthropic 原因的对照:姚顺宇在个人博客(alfredyao.github.io)的说法与访谈一致——强调”不想让自己的经验被特定实验室局限,尤其现在核心研究很少发表论文”。访谈中他直接说出 约 40% 是反对 Dario 反华立场,这在其博客和 36kr、新智元等公开报道中也有交叉证据。
参与的模型的可靠性:36kr 报道证实他参与了 Claude 3.7(agentic coding)和 Claude 4 family(RL numerics);Gemini 3 Deep Think 的参与也有谷歌自家公告确认。
非厄米趋肤效应:访谈中他描述的”周期/开放边界结果完全对不上、本征态全部堆积在边界”正是 PRL 论文
Edge States and Topological Invariants of Non-Hermitian Systems
(Yao & Wang 2018)的核心发现,与本人描述完全吻合——字幕里的”王忠”实为 王中(Zhong Wang), 张守成 /寿城实为张首晟(Shoucheng Zhang)。
博士导师:Douglas Stanford 和 Stephen Shenker 是 Stanford Institute for Theoretical Physics 的顶级高能/量子引力学家,访谈中他特别说 Douglas Stanford “比我聪明得多”——是真诚的敬畏。
“Claude 3.6 其实是 3.5 new”:这点与 Anthropic 官方命名历史一致,外部社区确实因 Claude 3.5 出了两个版本而自发叫后者”3.6”。
节目录制时间(2026 年 3 月)与发布时间(2026 年 5 月)之间 已发生:Meta 对 Manus 收购被撤销、Cursor 可能被 SpaceX 收购、xAI 并入 SpaceX——文中相关表述按录制时状态保留,访谈中嘉宾对 xAI 的吐槽(”一直挺动荡”)反而被事态坐实。
维度
姚顺宇的判断
预训练
远没到头,过去几个月一直在变强;觉得撞墙多半是代码 bug 没找到
后训练
真正大规模化始于 Claude 3.7;关键在数据分布是窄而精
Coding
爆发源于奖励信号清晰 + GitHub 数据基座;已是 AI-native 唯一大规模成功场景
机器人 / 多模态生成
都还没到 GPT-1 阶段,还在特征工程时代
Chatbot 形态
蠢,远不是终极形态,需要产品经理解锁
Wrapper 生存
要么成长够快(Cursor),要么市场够小(Midjourney);否则都被收购
AI 安全
Anthropic 的"造最强模型才有话语权"太天真;真正的机制类比是核武器多方威慑
蒸馏
硬蒸可耻且蠢;软蒸是 multi-agent 训练的先驱,技术上有趣
组织
系统稳固 > 个人英雄闪耀;OpenAI 是反例
英雄主义
语言模型领域已经过去;现在都是冲浪者,本质是那个浪
AI 本质
简单——因为可以做实验,受限的只是算力和 infra,无根本困难
给年轻人
语言模型蓝海已过;做没人做的事
个人风格
直接、可以喷人、"老登不是你亲戚"、拒绝模糊表述
——转载自:cxuanAI