首页 > 科技快讯 > 字节 Seed 大模型人才外溢

字节 Seed 大模型人才外溢



被动成为新一代 AI 黄埔军校的字节跳动。

文丨申远

编辑丨刘梓元

字节 Seed 是对大模型人才最具吸引力的团队之一,同时也有很多人正在离开字节跳动,最新一个目的地是腾讯。随着腾讯重新整合大模型组织架构,字节在 Infra 与数据方面的核心人员被招募,除了《智能涌现》报道过的肖学峰、张弛和黄启,据悉还有负责数据处理的团队被成批挖走。

这是腾讯在大模型领域的补课,在姚顺雨入职之前,腾讯大模型业务分散在不同业务群,这种松散让大模型研发的多个环节无法紧密衔接,导致训练数据质量参差不齐、标注不规范,更重要的是底层工程能力欠佳。

这是字节的长处。曾有对字节模型基础设施建设比较了解的人士表示,字节的工程化能力 “比国内任何一家公司都要强”,这支精干的 Infra 团队目前由项亮负责,他是一位已经加入字节 10 年的老兵,早在这一轮 AI 浪潮之前,他就负责字节推荐算法研究。

大模型浪潮带给人们一种错觉,那就是大模型技术和过往算法有本质不同,但实际上,这种本质区别更多是思路上的而不是技术本身。经验仍然重要,特别是在基础设施领域。大量搜广推背景工程师正在大模型领域,而字节在此已经有了十多年积累。正因如此,这成了外界挖人的重点领域——有这样规模化丰富经验的人才实在是太少。

这样的人员流动不仅局限在国内,据晚点了解,在 OpenAI 和 Meta 的 Infra 团队中同样有前字节 Infra 员工的身影。曾属于 Infra 基础设施方向重要成员的蒋子恒入职 Meta,早期曾在字节 AML (Applied Machine Learning 应用机器学习,字节负责搜广推的核心机器学习平台)工作的 Youlong Cheng 则加入 OpenAI。还有一位负责强化大语言模型训练扩展与加速的研究员据信已加入 Safe Superintelligence,后者由前 OpenAI 首席科学家 Ilya Sutskever 创建,有一支人数约为 50 人的精简研究团队。

字节的另一个优势领域视觉模型,同样出现了批量人员流动。晚点此前报道过,视觉多模态生成负责人杨建朝、视觉基础模型研究负责人冯佳时都已离职。冯佳时 2021 年从新加坡国立大学加入字节,坊间关于他的一个趣闻是在 ChatGPT 爆发后,冯佳时曾给张一鸣讲解 AI 前沿技术,他的下一站同样是腾讯。

从 Linkedin 上可以看到,海外大厂也延揽了不少字节视频生成与多模态理解图团队的研究人员。包括在 OpenAI 语音和多模态方向的 黄清清,Google Deepmind 多模态理解方向的 Chunyuan Li,Meta 多模态模型研发的乔思远,以及曾在字节负责视频模型生成的蒋路,现已入职苹果。

视觉领域成为字节的模型长板并不让人意外,更早之前从字节视觉技术负责人岗位离职的王长虎创立的爱诗科技刚刚完成 3 亿美元的 C 轮融资,这是中国视频生成领域最大的单笔融资。

除了 Infra 与视频模型团队外,事实上字节大模型人才的足迹遍布整个行业。DeepSeek 首位员工李宇琨来自字节搜索团队,去年底离职的月之暗面强化学习负责人宋鸿涌,有近三年时间在字节做游戏 AI 强化学习研究,阶跃星辰联创和 CTO 朱亦博,同样也曾在字节从事 infra 相关内容。

从技术到产品,大模型人才流失复刻了字节产品和运营人才出走的景象,投资人手里流传着一本花名册,上面涵盖字节业务体系关键点位的负责人 —— 抖音、今日头条、剪映和飞书的产品运营曾被认为是最具确定性的投资标的。前抖音产品负责人、PICO 副总裁任利峰创办了数美万物,Manus 的联创之一是飞书海外产品负责人张涛,剪映商业化负责人陈冕创办了 LiblibAI,以及曾一度在大模型六小龙任职的张心皓、张前川与明超平。

现在还要加上大模型从业者了,豆包 PC 端业务负责人齐俊元的创业项目,GUI Agent 智能终端投后估值达到数亿美元,曾任字节 AI 陪伴产品 “猫箱” 产品负责人的梁琛奇的创业项目也拿到了包括 IDG 和美团在内的投资。

他们是字节人才外溢效应囊括的最新群体。

极致执行与饱和式出击

三年前字节的 AI 还远不是这番景象。昆仑万维创始人周亚辉在 24 年初评价字节过去一年半的 AI 战略是 40 分,但 9 个月后这个分数就变成了满分。

这是一个非常 “字节” 的故事,寻找好想法,然后把它执行到极致。过去十多年字节是这样颠覆许多领域的,最开始是新闻资讯,然后是短视频,再到小说和短剧,它们围绕的重点无外乎两个,极致用户体验,还有最高商业化效率。

“AI 是一个能影响世界的机会”,2023 年字节高层判断,当下这个时代操作系统级别的机会就是 AI + 计算,这是一个怎么夸大都不为过的 “好想法”,因此,它需要字节执行得更极致。在 2023 年中决定靠自有团队做 AI 后,字节饱和式出击,从算力芯片到云,从模型研发再到应用。

应用侧很好体现了所谓 “饱和”,字节的布局堪称一超多强。豆包的日活在 2025 年底已经过亿,稳居第一,海外版 Dola 日活已经过千万。除了 AI 助手,字节还推出了 AI Coding 工具 Trae 和 智能体平台 Coze。

饱和出击的另一个是发挥协同作用与规模效应,这被写进了 2025 年字节的 AI 目标中。字节有 50 多条业务线,在 AI 来之前,各个业务部门的孤立状态正在形成,一个标志是招聘的停滞,2022 年,HR 被告知要控制组织增长的规模。All IN AI 很大程度上串联起了字节的各条业务线,而大模型本来就是一个比移动互联网 APP 开发链条长得多的行业,受益最大的是云。

2020 年上线的火山引擎比主要的竞争对手晚了 10 年进入这个领域,很长时间都处于不温不火的状态。也正因如此,它成了最先最坚决转向 MaaS(模型即服务)的云厂商,而饱和式投入 AI 给了火山引擎弯道超车的机会。

字节有中国最大的推荐算法模型,早在大模型时代之前,火山就有把数千张 GPU 做成单一集群的经验。火山引擎有专门团队参与 Seed 模型研发,而产品部门开发的 AI 应用都通过火山引擎调用自家的模型,这让火山的 MaaS 服务在最初就有了规模效应。

25 年火山引擎两次上调收入目标,26 年 MaaS 收入超百亿的目标也已经再次上调。4 月,火山引擎宣布豆包大模型调用量超过了 120 万亿 tokens 每天,这个数据在去年 9 月还是 30 万亿,半年增长了 4 倍。

用人才而不是过去的成功经验,来解决 AI 的本质问题

有些问题不是靠极致执行和饱和式出击就能解决问题的,在大模型的用户体验上,字节就遭遇了瓶颈,原有的方法并不完全奏效。

用户反馈让产品更好用这是基本的常识,字节过去的厉害之处是通过算法与产品设计让这件事在不知不觉中最高效完成,产品从设计上就自带数据反馈飞轮,每一次下划、点赞和喜欢按钮都在实时优化推荐模型,随着用户规模的扩大,产品会更加了解用户,字节和快手这样的顶尖公司能把反馈压缩到几秒钟内,用户下划两次就能遇到更符合自己口味的新视频。

字节自己也确实想把这一点也复用在模型开发上。豆包 1.5 Pro 发布的时候官方宣称:“依托字节在推荐、搜索和广告领域的 AB Test 经验,构建了基于大规模用户反馈的闭环优化系统”。

然而 “模型实际体验” 和 “模型能力” 不是一回事。应用体验可以优化,但模型在上线之后参数是固定的,用户的反馈不能实时更新到模型中去,只能等待下一次模型训练。每次训练都是从头来过,换句话说,移动互联网时代字节最熟悉的那种产品飞轮效应在大模型领域不存在。

同样不存在的还有规模化效应,App 的分发边际成本为 0,但用户和大模型的每一次互动都在消耗算力,这受制于物理规则、无法被平摊。

上述限制让字节很难复制移动互联网时代的成功。丰富的玩法和运营策略,以及大规模投流让豆包在 2024 年底就成为了 AI 产品中的第一名,然而 2025 年春节,DeepSeek 横空出世,它的成功牵涉了更本质的东西:模型能力可以让一个名不见经传的组织不花一分市场预算就蜚声全球。实际上 OpenAI 也是靠同样的逻辑,ChatGPT 爆火甚至让它们内部始料未及,这本是个实验性质更多的项目。

在用户体验飞轮并不能充分转动的情况下,极致的商业化效率自然无从谈起。最终,关于 AI 的竞争回归原点,最朴素的基准只有一个,那就是模型能力。某种程度上,不管是大厂还是 “小龙”,所有大模型玩家位于同一起跑线。为此,字节成立一个内部独立的研究组织,Seed 正是字节人才外溢效应发生的容器。

Seed 与 “最高 AI 人才密度”

Seed 最初是从字节 AI Lab、AML 和搜索团队等部门抽调人手组建的,它不属于字节原有业务体系,从最初设计上就直接向字节集团管理层汇报。从一开始,字节就为 Seed 定了一个严格标准,保持战略耐心,坚持不走捷径(比如蒸馏现成的模型),而是聚焦基础问题的本质,拿出高水准的模型成果。耐心意味着坚定不移地投入,Seed 仅自有数据团队就有近千人。

这种坚持很少出现在一个盈利性企业的内部。25 年初,字节挖来了 Google 的吴永辉担任一号位,他进一步细化了 Seed 的内部结构。Seed Edge 就是在这个时候提出的,它聚焦于需要长期攻关的 AGI 课题。Seed Edge 考核期是三年,相比之下 Seed 本身是半年,而一度坚定奉行 OKR 战略的字节其他部门则是两个月。

这种类似国中之国的架构,目标是回归字节价值观 “始终创业”,而创业这个词在字节的心目中和人才紧密相关。字节战略部门的人士曾对晚点说过,张一鸣认为 “很多事表面上是战略问题,本质上是人才问题。” 而对处于创业阶段的组织来说,对人才的如饥似渴非常重要。

Seed 恰好就是这样饥渴的组织。23 年底开始,字节开始密集招人,最开始目标集中在高阶人才。晚点曾经报道过,当时许多顶尖论文作者都和张一鸣聊过,最终字节招募了来自 Google 的蒋路、面壁的秦禹嘉、零一万物的黄文灏、智谱的丁铭,以及阿里通义千问模型的前负责人周畅。

周畅博士毕业就加入阿里,是达摩院内部培养起来的应届生,离职时是通义千问的负责人,那是 2024 年中,一位接近周畅的人士告诉晚点,字节高层一对一和周畅聊过,表达了追求顶尖 AI 技术的决心,而字节在技术布局上的思路也和周畅的观点更契合,他的研究兴趣更多集中在视觉与多模态模型,而不是单纯大语言模型,这恰好是字节擅长的领域。

除了高层人才之外,为了快速健全 Seed 架构,字节 HR 在招揽 AI 人才时甚至会相对宽松地批量发放 offer,这是字节招聘的肌肉记忆。字节是组织成长最快的互联网巨头,人数达到十万人用时仅 8 年,相比之下阿里是 19 年,腾讯则长达 23 年,诀窍之一就是开足马力的 HR 体系,很长一段时间内字节 HR 的唯一工作就是招人,高峰时,字节 HR 对中国最头部 20 所大学核心专业的学生触达率在 80% 以上。

2024 年 5 月,字节面向应届博士生发起 Top Seed 计划,一年时间延揽 30 多名博士生,他们年薪可达数百万人民币。实际上,由于组织架构相对独立,即使没有入选 Top Seed,相比字节其他部门,进入 Seed 依旧划算,在 Seed 更容易获得更高职级和薪水,甚至还有针对大模型人才发放的津贴,每月最高达 10 余万。另外,字节还针对头部高校提供 500 多个大模型相关的实习岗位。

这场剧烈的招聘行动持续了两年,迅速提升了 Seed 的人才密度。MiniMax 创始人闫俊杰曾说,“客观来说,字节的 AI 人才密度是最高的。”

人为什么离开?

高速成长的技术人才组织,往往伴随着活跃的人员流动。一些人选择离开,去探索新的可能性,这是 Seed 也无法避免的问题。

Seed 自成立以来一直在经历各种组织架构调整,最初 Seed 只是吸收了 AI Lab 中做 NLP 自然语言处理的小组,随后是视频生成相关团队,Seed 最终整合了原本分散在不同小组的视频和多模态研发小组,负责人是前面提到的周畅。直到 2025 年底,AI for Science 、具身智能和 Reponsible AI 等小组才彻底并入 Seed。原 AI Lab 负责人,曾经华为诺亚实验室主任的李航退休返聘,向吴永辉汇报,而具身小组的负责人孔涛则在 2025 年中去职。

外部的竞争更加激烈,随着越来越多大厂的加入,人工智能行业的人才流动速度显著加剧。字节的大模型研究人员成为了绝佳标的,事实上几乎每家公司的高级研究人员都遭遇过挖角,和移动互联网时代不同的是,同样的职位,对方能给出的薪资待遇往往是翻倍,职级也会升高一级不止,同时,目标人选越来越年轻。

对大模型行业来说,前沿研究人员的年轻化是一个普遍而明显的趋势,他们往往精力充沛,野心勃勃,极度自驱,“每个人都想成就一番事业。” 这个年龄区间甚至下探到了高中,月之暗面 3 月刚刚发表了一篇关于注意力残差的论文,作者之一是只有 17 岁的高中生陈光宇。

字节恰好拥有许多年轻人,因此面临更激烈的挖角。

重用年轻人是吴永辉的思路。2025 年初,吴永辉入职,他在内部沟通时表示,加入字节的原因一方面是想做第一流的研究,同时也想打造第一流的 AI 研究团队。对吴永辉看来,Seed 的人才供给已经不是问题,但重要的是如何才能把人用好,于是解法顺理成章变成了培养年轻人。

吴永辉到来之后,Seed 几乎不再从外部招聘中高级技术管理者,而更多针对年轻人的计划陆续出炉。去年 3 月,Top Seed 研究实习生计划公布,最高薪资每天 2000 元,条件下探到本科生和高中生。今年 3 月,字节启动最大规模实习生招聘,面向全球招聘 7000 人,研发岗位占比近 7 成,而 4 月 Seed 启动了自己的校招计划,打算招聘 100 名 27 届毕业生。

在 Seed 官方对校招计划的介绍中,毕业不到一年的校招生和尚未毕业的实习生都在深度参与核心模型的技术攻关,我们了解到,一位 2024 年从清华大学毕业的博士生现在同时向周畅和吴永辉汇报,Seedance 2.0 算法负责人就是 2021 年作为校招生入职字节的,他们正逐渐成为大模型研究的主力,与此同时,Seed 组织扩张阶段结束,算法和工程技术人员稳定在 1000 多人。

字节的野心

字节不是没有意识到人员流失的问题。去年底,字节宣布在全球范围涨薪,而针对大模型人才的豆包股同时曝光。这套虚拟股权激励体系专门针对大模型人才,透过类似字节期权的回购机制,加强对人才的长期吸引和激励。

但阻止人员流失更重要的或许是在选择做一流研究组织和保证产出之间找到更为恰当的平衡,这对每一个 AI 机构来说都是挑战,Google DeepMind CEO 德米斯·哈萨比斯(Demis Hassabis)曾说,希望组织同时有初创企业的专注活力以及学术界天马行空的思维,在字节的语境里,或许还应该加上一条,那就是同产品运营之间高效的衔接合作,尽管许多人都认为,高效是创新的敌人。

2026 年 1 月底,字节 CEO 梁汝波在全员会上把 2026 年目标关键词定为勇攀高峰,短期内高峰指的就是豆包,在已经取得 DAU 第一后,豆包的重中之重是 AI 模型能力要做到行业前列,并通过助手整合好已有的产品和服务。2 月,Seedance 2.0 震撼全网,似乎人员流失短期内并没有影响字节在视频模型领域的统治力。实际上,就在那篇 Seed 校招的推文中,字节自豪地宣称,“我们的 AI 业务在 C 端和 B 端均已取得领先优势。”

当一个组织人才密度足够高、足够庞大的时候,人才流动是不可避免的,现在 AI 竞争远没有到分出胜负的时候,旅程还在继续。

题图来源:《星际迷航》

相关推荐

字节Seed挖来千问大将
独家|字节Seed多个业务招一号位,成立独立公司
字节跳动启动探索AGI计划,代号“Seed Edge”
晚点独家丨字节启动 Seed Edge,加码 AGI 研究
晚点独家丨字节 Seed 又有核心成员离职,今年陆续走了 7 位
晚点独家丨吴永辉接管字节 Seed 这一年
字节大模型团队全员会:朱文佳和吴永辉首度同台
字节AI团队大变阵
腾讯挖来多位字节Seed团队骨干,向姚顺雨汇报
字节跳动Seed研究员任赜宇多次泄密被开除

网址: 字节 Seed 大模型人才外溢 http://m.xishuta.cn/newsview148559.html

所属分类:人工智能