首页 > 科技快讯 > 百度抛出 AI 时代的新度量衡

百度抛出 AI 时代的新度量衡

晰数塔互联网快讯
2026-05-14 20:20

百度重新定义 AI 竞赛积分规则的最新尝试。

文丨江思远

在早期的中国科技互联网的阵营中，百度一直是布局 AI 等前沿技术最坚定的公司之一。正因如此，一直以来，百度会在产业发展的关键时刻主动抛出自己对 AI 的前瞻判断，它们逐渐变成了在 AI 发展历程的许多关键节点上精准命中、自我实现的预言。

26 年初现象级的 AI 节点显然是龙虾的爆火出圈，而百度的判断依旧先人一步：在李彦宏看来，龙虾这件事最具标志性意义的地方在于，这是第一次 AI 因应用而不是模型受到广泛的关注，这代表了 AI 在某个维度上的全面成熟：智能体不只是一个被人类触发的工具，它应该能自主执行任务、在执行中学习、在学习中变得更强。

于是下一个问题接踵而来，当智能体开始自我进化，拿什么来衡量这个飞快进化的崭新生态？

AI 行业又一次站在了岔路口，所有人都意识到旧的衡量标准不管用了，但新的度量衡应该长什么样呢？李彦宏率先给出一个答案。

衡量智能体价值的百度算法

李彦宏给出的回答是一个新的指标， DAA——Daily Active Agents，日活智能体数。这是 Create 2026 开幕式上李彦宏正式抛出的概念。含义很直接：不要数有多少人在用 AI，要数有多少智能体在替人干活、并且交付了结果。

如果只看这三个字母，会觉得它像又一个 AI 营销概念，为了发布而发明的缩写，但如果把它放回李彦宏过去两年的公开表态里，会看到一条暗线贯穿其中，主轴就是智能体的自我进化。

2024 年 7 月，上海 WAIC 大会。彼时全行业的主流叙事是寻找 AI 时代的 “微信”，达到十亿级 DAU 的超级应用被认为是大模型价值兑现的标志，而李彦宏提出了他的不同看法：“要避免掉入 ‘超级应用陷阱’，觉得一定要出现一个 10 亿 DAU 的 App 才叫成功，这是移动时代的思维逻辑。”

他把自己看好的方向说得很明确——智能体。“只要用人话把工作流说清楚，再配以专有知识库，即可做出一个很有价值的智能体，比互联网时代制作一个网页还简单。” 李彦宏甚至预测了规模：未来将涌现数百万量级的智能体，形成庞大的生态。

在当时，这还只是一个看着有些理想化的预言。四个月后的百度世界 2024 大会上，李彦宏沿着这个思路继续加码：“智能体是 AI 应用的最主流形态，即将迎来爆发点。” 就是在同一场大会上，秒哒发布，百度宣称它是一个不需要写代码就能实现任意想法的软件——被李彦宏称为 “迄今为止人类历史上最复杂的多智能体协作工具”。秒哒成了百度智能体想象力的孵化器，想要帮助更多人打造数以百万计的 “超级应用”。

到 2025 年 11 月的百度世界大会，李彦宏的判断再往前推了一步：当 AI 被内化成一种原生能力，智能就不再是成本，而是生产力。新的提法出现了：“效果涌现” 和 “AI 内化”，为此百度发布了伐谋，一个借鉴进化算法、能模拟甚至超越顶尖算法专家、根据条件变化自动迭代方案的智能体。这是 “自我演化” 这个词第一次出现在百度的 AI 产品叙事中。

然后就是现在的 DAA。李彦宏并不是每一个判断都准确，但在智能体这件事上，百度确实比行业共识早。2024 年中他在台上讲智能体时，多数人还在为 “谁家的 ChatBot DAU 更高” 争论不休。实际上，这种争论反映的那种所谓 “移动互联网时代” 的思路一直延续到了 2026 年的春节 AI 大战。

龙虾结束了这种争论。李彦宏在 Create 上把这个节点的意义概括得很精确：以前每一次 AI 出圈，火的都是模型——2023 年的 ChatGPT，2024 年的 Sora，2025 年的 DeepSeek。龙虾第一次不同，它火不是因为用了哪一款模型，而是在模型之上做出了真正能帮人完成任务的智能体。“这是历史上第一次智能体替代了模型，出圈了。第一次，AI 的主角不是模型，而是应用。”

这意味着 AI 的竞争从智力转向了执行力。过去几年行业比的是谁更聪明、谁推理更强，龙虾证明了用户真正买单的不是 “你会不会做”，而是 “你能不能帮我把事做完”。

于是，终于没人再吵谁是下一个 “微信” 了，也没人争论 “要不要做智能体” 了，共识收敛到应该如何衡量智能体的价值。

这正是这次大会上李彦宏用 DAA 这个指标试图回答的问题。移动互联网时代，DAU 衡量的是 “多少人打开了 App”，这对一个 7×24 小时在后台运行、调用十几个工具、全程不需要用户点击任何按钮的 agent 几乎没有意义。

在李彦宏的框架里，DAA 是智能体 “自我进化” 的必然结果——当 agent 不再是一个被人类手动触发的工具，而是能够自主执行任务、在执行中学习、在学习中变得更强的实体，那么衡量 AI 价值的尺度就必须跟着变。

黄仁勋的算法是 Token 的消耗量，甚至人为把它分成了几档不同的价格：最聪明的，次一级的，日常使用的…… 在黄仁勋心目中，Token 的消耗量就是 AI 时代的 GDP，这通俗易懂，易于传播，但作为算力供应商的英伟达完全不衡量产出：一个 agent 烧了 100 万 Token 没完成任务，另一个用 10 万 Token 交付了结果，在黄仁勋 Token 经济学的算法上，前者反而 “效果更好”。

李彦宏用他自己的话说得更直白：“Token 只是代表成本，并不代表收益；它衡量的是投入，而不是产出。Token 消耗有没有效率、产出了什么价值——这些 Token 本身无法回答。”

DAA 的提议实际上是一个隐含的质疑：如果 Token 是投入，agent 交付的结果才是产出，那么只看 Token 就像只看一个国家的电力消耗量来评估经济水平，有相关性，但远远不够。

一个真正在 “自我进化” 的智能体生态，应该被一把衡量产出的尺子来度量。DAA 就是李彦宏给出的那把尺子。

能自我进化的产品是什么样的

从 DAA 的概念延展开，百度在 Create 2026 上发布了多款产品，试图从不同的维度诠释智能体 “自我进化” 的含义，其中的枢纽是 DuMate。

李彦宏提的一个判断是：聊天机器人和通用智能体是两代入口。“第一代入口是以 ChatGPT 为代表的聊天机器人，主要解决信息获取问题；第二代入口是通用智能体，解决的是任务完成问题。” 很显然，通用智能体的价值天花板比聊天机器人高得多，而 DuMate 正是百度 3 月上线的所谓通用智能体。

DuMate 的定位是 “AI 办公搭子”，如果只看这个定位，它听起来像又一个 AI 助手，市面上这类产品实在是太多了。但 DuMate 的真正野心藏在它的架构里：它不只是一个 agent，它是一个能调用其他 agent 的 agent。秒哒、伐谋、搜索、文件管理、数据分析，一些百度独有的核心产品和功能，不是作为模块被集成在 DuMate 体内，而是作为独立的智能体被 DuMate 调度。

这是一个按照李彦宏的 DAA 指标设计出来的产品。在 DuMate 的架构下，一个用户的一次任务请求，可能触发多个 agent 同时工作——DuMate 自身做任务理解和分配，秒哒负责生成需要的应用或页面，伐谋在后台做决策推演，搜索 agent 去抓取外部信息。每一个被调起的 agent 都是一个活跃智能体。如果用 DAU 来衡量这个过程，只能看到一条线性的工作流，但用 DAA 来衡量，看到的是 “四个 agent 在同时干活并交付结果”。

在典型的运营场景里，DuMate 同时处理客服、数据分析和营销三条线——过去需要三个人或至少三个工具分别完成的工作，现在由一个人加一组 agent 就能做到，百度内部会把它叫做 “人机混编”。有意思的地方不止于此，DuMate 还会通过每天生成工作日报反思当天的任务完成情况，从中提炼下一步的优化方向。这是 agent 自我管理的一种最朴素简化的版本，恰好对应 “自我进化” 的字面含义。

面向不同人群的智能体矩阵

在所有可供 DuMate 调用的智能体里，秒哒和伐谋是最重要的两个。前者面向完全 0 代码经验的用户，后者则恰好相反，针对的是被认为最难被 AI 替代的那群人：决策专家。

秒哒从 2024 年底发布以来，根据官方数据，已经服务了超过 1000 万用户，其中 81% 的用户是非技术人员。它做的事情很简单也很激进：让不会写代码的人用自然语言做出完整的商业应用。3.0 版本在 Create 上升级了两个关键能力——直接生成可部署的 App，以及支持多人协作开发。它是从 DAA 逻辑中自然生长出来的产品，预设的前提是：如果门槛足够低，就会有足够多的人创造出足够多的 agent，而 DAA 这个指标自然就会增长。

Create 2026 大会现场来了一位温州的 8 岁小朋友扑满，二年级的他也是秒哒的开发者，他做的应用叫 “哒哒打伞”，灵感来自一个非常小的校园场景：放学下雨时同学们会拼伞回家。扑满把这件事做成了一个 app。打开 “哒哒打伞”，选 “我想搭伞” 或 “我来打伞”，再选好时间、起点、终点、独立打伞还是拼伞，就能发单。

它甚至设计了一个积分系统。帮别人打伞越多积分越高，最高升级到 “王者”。一个 8 岁孩子不会写一行代码，但他有一个具体的问题和一个具体的想法，秒哒把中间所有的技术环节抹平了。

扑满自己把秒哒形容成机器猫：我只要对着它说出我想要的，它就能从口袋里掏出来，甚至比我想要的还要神奇。

秒哒这样的代码智能体打穿了两道墙：高门槛与高成本。不是只有足够通用和足够大的需求才值得被开发，李彦宏在台上描述了一个有点矛盾的现象：代码能力越来越重要，但代码本身正在变得不值钱了。

面对 “零基础” 用户的秒哒之外，专业领域百度拿出了伐谋 2.0，它的上一个版本在 2025 年百度世界大会上发布时，还是一个偏技术侧的算法优化工具，核心能力是 “自我演化式地寻找全局最优解”。到 2.0 版本，伐谋最大的变化是交互方式：它不再要求企业一次性把所有业务规则和约束条件讲清楚，而是通过持续对话逐步逼近最优解。企业的业务专家可以像跟一个资深同事交流一样，把模糊的经验、直觉和判断告诉伐谋，而伐谋会在对话中不断推演、验证、迭代这些企业内部知识，最终做出判断，而判断往往是最稀缺的。

这非常适用于企业中的复杂场景，比如港口：集装箱调度涉及数百个动态变量——船期、潮汐、堆场容量、卡车排队时间，传统的优化模型需要运筹学专家花数周建模，而伐谋 2.0 通过对话式推演把这个过程大幅压缩。青岛港在引入伐谋后，全球领先的自动化码头调度系统 A-TOS 在绝对指标上实现了 10.21% 的进一步提升——对于一个已经连续第十三次刷新世界纪录的系统来说，这个增量不小。关键不在于速度提升了多少，而在于它改变了 “谁能使用优化工具” 这个前提——从运筹学博士变成了一线业务人员。

除了针对各种用户群的不同智能体产品之外，百度的智能体概念还包括了数字人，它像是介于现实与虚拟，具身与软件之间的一个节点，用李彦宏的话说，数字人是 “看得见的智能体”。百度一镜（原慧播星）可以实现全场景的真人数字内容，倚靠的同样是多 agent 协同能力。一条视频的生产过程中，剧本 agent 负责脚本，视频 agent 负责画面生成，剪辑 agent 负责后期——三个 agent 各自独立运作又相互配合，最终交付的是一个商业级的完整作品。一个人加上一组 agent 就能覆盖过去需要编导、摄像、剪辑、运营多个岗位才能完成的工作。

这些产品在不同维度上讲的是同一个故事：agent 不再是一个被动等待指令的工具，它在学习、在迭代、在协同、在独立交付结果。这就是智能体的 “自我进化”，衡量这种进化的指标，就是 DAA。

全栈布局共识的形成

DAA 的智能体论述背后是百度全栈的 AI 战略布局。这本来是个老生常谈、没什么新意的话题，大家都知道全链路技术能力的重要性，但互联网基础设施产业长久以来演化的规律是，不同的环节攫取各自的利润，从产品到模型，从芯片到云。

然而，AI 的演化带来真正的算力井喷式需求，分链条协作的效率比不上垂直整合。2026 年上半年，全球最重要的几家 AI 公司用实际行动，真金白银地诠释着这个结论。

三周前的 Google Cloud Next 2026 上，Google 发布了第八代 TPU 双芯片架构，一颗专攻模型训练，一颗专攻推理。Google 把针对大模型的技术布局垂直优化到了芯片层，用 Google Cloud CEO 托马斯·库里安（Thomas Kurian）的话说，所有的组件都是协同开发的，这件事 Google 已经做了十年。

几乎同一时间，Anthropic 在 5 月初公布了一连串 agent 产品，但最震撼的还是和马斯克的 SpaceX 签下了数据中心的算力协议，加上此前和 Amazon、Microsoft Azure、Google Cloud 签订的基础设施合作，Anthropic 正在极力扩充自己的算力储备，原因很简单，Dario Amodei 此前估计 Q1 的增长速度是 10 倍，然而实际的情况是 80 倍。

OpenAI 的路径也在向同一个方向收敛。Codex 正从与 Claude Code 竞争的代码工具转变成一个生产力 agent 平台，OpenAI 显然也意识到了，智能体的价值至少与 10 亿月活用户同样重要，如果不是更重要的话。

微软 5 月 1 日也上线了名为 Agent 365 的企业级智能体平台，设计了一整套管理智能体的流程。把这四家公司的动作叠在一起看，一个共识清晰可见：智能体是重要的，但做好智能体需要从芯片到云再到平台调度层的全套优化，它们之间的关系不是松散的，想要把它们紧密衔接起来就需要端到端的极致优化。

这也是百度的 “芯云模体” 战略。昆仑芯、百度智能云、文心大模型以及 DuMate/秒哒/伐谋/一镜，它们组成了百度的端到端 AI 链路。

从实际落地的方面看，B 端 agent 基础设施这一层，百度确实有可用的积累：昆仑芯 P800 已完成万片级交付，256 卡超节点计划 6 月问世，同时芯片企业主体正在筹备上市；百度智能云在第三方报告中的 AI 全栈服务市场份额排在中国市场前列。

它们都说明了在 B 端 agent 基础设施这一层，百度确实有可用的积累。然而，全球范围内，没有哪家公司真正跑通了 AI 智能体全栈的每一层。“芯云模体” 四个字暗示的那种端到端协同优化，目前更多还是一个架构愿景和发展方向，大家对方向都没有异议，但关键是怎么执行。

书写新答案的时间

当然，敢先出牌不等于牌一定能赢。

DAA 能否从百度的一家之言变成行业语言，尚取决于几个先决条件。首先，agent 本身要足够成熟——当前全球范围内，大多数 agent 产品还处在从 Demo 到稳定产品的过渡期，能真正 7×24 小时可靠运行并交付结果的 agent 仍然是少数。

其次，DAA 的定义也需要可量化——如何标准化地衡量一个智能体交付的成果？在 Create 大会上，李彦宏给出了一个大胆的预测：未来全球日活智能体数量可能超过 100 亿，如何统计它们的成果将是一个非常复杂的题目：当组织里每个人都有成倍于之前的效率时，金字塔型的管理结构将不再必要，管理的主要功能将从监督、指挥、激励，变成对齐，不是盯着他做事，而是确认他在做对的事。

这个关于组织进化的判断，不只是关于技术。它暗示的终局是：衡量一家企业竞争力的方式，从 “你有多少员工” 变成 “你有多少智能体”。DAA 不只是一个产品指标，它隐含了百度关于劳动和组织全新形态的一种认知。在这种新形态中，AI 在提升每个人的能力边界，而传统组织的层级、分工与控制手段都在压制创造力。

回到李彦宏 2024 年 WAIC 上说的那句话：“不是只有 10 亿 DAU 才叫成功。” 两年后的 Create 2026 上，他给出了这个回答的下半部分：成功的标准，应该是有多少智能体在真正替人干活、交付结果。百度把这个标准叫 DAA，把驱动它迭代的路径叫 “自我进化”，把支撑它的全栈技术体系概括成 “芯云模体”。

DAA 是否会成为行业通行标准现在下定论还为时过早，但至少，在所有人都在做 agent、却没人认真衡量 “agent 时代该怎么计分” 的 2026 年上半年，百度是第一个开始回答这个问题的组织。

书写答案还需要时间。

题图来源：百度