首页 > 科技快讯 > 李彦宏想压下的“Token热”,又被黄仁勋添了把火

李彦宏想压下的“Token热”,又被黄仁勋添了把火

研究员|卢杨 邱慧

“从产业的角度来看,Token就是资产,已经成为获利的营收单位,因为它可以制造利润。”

6月1日,黄仁勋在GTC 台北活动上表达了这一观点。

半个月前,百度创始人李彦宏公开称,“Token 只是代表成本,并不代表收益”。两番言论形成隔空对立。

01

英伟达把Token做成“钞票”

“古有美猴王,今有Token王。”

今年3月,黄仁勋在英伟达年度GTC大会上首次提出“Token产业”概念。他说,未来的数据中心不再是存储文件的仓库,而是生产Token的工厂。

“Token 是新的大宗商品,生成 Token 的成本与效率,决定科技企业的营收与生死。”他说,在这个Token工厂里,你的吞吐量和Token生成速度,将直接转化为你明年的精确收入。

他还提到,随着架构升级,单位功耗可产生的Token数量持续提升。Token成本不断下降,从而显著放大整体收入空间。

中国市场同样兴起了Token热,部分厂商把Token消耗量等同于衡量AI实力的关键指标。58 同城创始人姚劲波在采访中称,Token 用得越多越好,不计成本;昆仑万维要求所有技术部门的开发方式全部转入 AI Coding 的模式。董事长方汉在采访中称:“我那个朋友一个月是(消耗)600亿(tokens),我一个月才(消耗)20多亿(tokens),很惭愧。”

这场狂欢里也有字节、阿里、小米等中国大模型头部厂商的身影,Token用量或是投入量一度成了较量的维度之一。

今年3月,阿里成立了 Token Hub 事业群,由吴泳铭带队;字节跳动称,豆包大模型日均Token用量达120万亿,年算力成本438亿元;腾讯开发者社区消息称,混元Hy3 preview的Token调用量,发布两周后超过上一代版本模型Hy2的10倍;小米则通过降价以及发放100万亿免费Token的方式,向开发者提供“补贴换市场”式的规模补贴。

然而,市场上的Agent 越多,Token 消耗越大,对于老黄来说,英伟达的芯片就不愁市场了。

在中国台北的演讲台上,他还预测,AI芯片到2027年的需求将达到至少1万亿美元。这一数值相较于他在2025年10月给出的5000亿美元销售预测,翻了一倍。

老黄解释说,这一预期的提升源于计算需求的爆炸式增长:“我相信,在过去两年里,计算需求增长了一百万倍。”

02

企业开始算账了

作为模型厂商,未能跟上这波“Token消耗”节奏的百度,却想按住这股热浪。

5月中旬,李彦宏在Create大会上直言“Token只代表成本,不代表收益;它衡量的是投入,而不是产出”。

他提出日活智能体数(DAA)概念,并宣称要用智能体交付的价值来重新锚定AI的商业成果。

李彦宏以移动互联网时代的“日活用户数”(DAU)作类比指出,DAA关注的不再是人的点击与停留,而是智能体的活跃与产出,“未来,衡量一个平台和生态的繁荣,不该看消耗了多少Token,而要看有多少Agent 在给人类干活,并交付结果。”

而在过去的两个月里,全球科技圈内,因为激增的消耗量,Token体量的瓶颈也逐渐显现。

据报道,一家科技巨头因忘记设置员工使用Claude的许可证上限,1个月内就“烧掉”了5亿美元。Uber也称,仅2026年前4个月,公司就耗尽了全年的“Token预算”。OpenAI在3月关停Sora时,也提到算力的高成本,“入不敷出”。

中国厂商也试图调整策略来节流。比如,腾讯云开源Agent Memory技术,可降低61%的Token消耗;阿里云则将激励与“解决刚需”等高质量Token挂钩,不再单纯追求消耗的Token总量。

豆包也拟推出付费订阅模式。此前,一位接近豆包的知情人士告诉我们,推出付费版的出发点就是平衡算力支出成本。

不过,可以肯定的是,AI产品迈入“能干活”的阶段后,比起Token消耗量,大众更关注的是智能体的“办事能力”——这是产品获得受众群的关键指标。

编辑|邱慧

发布于:北京

相关推荐

李彦宏想压下的“Token热”,又被黄仁勋添了把火
黄仁勋的“Token生意”,关键还在中国市场
李彦宏置身事内
黄仁勋台北“夜宴”:汇聚近40位台企高管,胜宏董事长在列
李彦宏,AI原生应用的秋收时刻
李彦宏,西二旗新卷王
刚刚,黄仁勋又让整个硅谷睡不着了
李彦宏,重磅发声!
黄仁勋即中本聪
《时代》周刊首次发布全球 AI 百大人物:李彦宏为唯一上榜中国大陆企业家

网址: 李彦宏想压下的“Token热”,又被黄仁勋添了把火 https://m.xishuta.cn/newsview150129.html

所属分类:行业热点