最近,Token这个词被频繁提起。3月23日,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏将To-ken译作“词元”。国家数据局数据称,我国日均词元调用量已从2024年初的1000亿跃升至2025年底的100万亿,到今年3月突破140万亿。自1月底以来,已有模型企业在20天里取得超过2025年全年的收入。
过去围绕大模型,人们先问的是某个模型能做到哪一步,几乎陷在“唯Benchmark分数论”里;如今更常被追问的,却是“烧不烧Token”。随着智能体越来越多地进入真实工作流,成本不再藏在后台,而是开始一笔笔出现在账单上。一句提示词看上去不过几行字,后台却要读取上下文、拆解任务、调用工具、回滚重试。AI每多走一步,费用就往上跳一截。
Token背后,无非是芯片、服务器和电费。如今AI后端越来越像基础设施,用户用得越多,上游烧掉的算力和电也越多,最后这笔账总得有人先扛着,而眼下最先扛账的,通常还是基础模型公司。
对OpenAI这类既卖订阅也卖API服务的公司来说,难处就在这里。只是证明模型够强、产品够好用,已经不够了,更关键的是证明自己扛得住这样一门高度烧钱的生意。2026年开年以来,OpenAI一边继续寻求千亿美元级融资,一边筹备更严格的资本市场检验。Token经济学也就在这个时候,成了一个值得单独讨论的问题。
在英伟达创始人黄仁勋看来,To-ken早已不是聊天框里吐出来的几个字符,而是“下一个商品”。今年3月的GTC2026大会上,他甚至说,未来英伟达的工程师都会有自己的“年度Token预算”;如果一个高薪工程师一年下来没消耗多少Token,反倒显得奇怪。
黄仁勋的意思是,未来Token不会再只是模型公司对外计费的单位,也会变成企业内部的一种生产要素,像云资源,也像电力配额。公司买的不只是一次回答,而是一种可以持续调用的智能能力。一个团队用了多少Token,换回多少效率,值不值得继续投,都会落进同一张表里。
在这个框架里,Token成了一种被持续生产、计量和调度的产出。数据中心是工厂,芯片和电力是原料,推理吞吐量则类似于产能。只要企业相信未来对智能的需求足够大,就会继续扩建数据中心、提升集群密度、优化推理效率,把单位Token的成本不断压低。
但单位成本下降,并不意味着总消耗会跟着下降。这更接近经济学里的杰文斯悖论。技术越高效,资源总使用量反而可能更大。放到AI上,道理并不复杂。以前的模型只能做简单问答,现在的智能体已经能通读几百页财报、分析数据、调用工具、执行复杂代码任务。模型一旦跨过“能用”的门槛,企业就会把越来越多原本由人完成的复杂工作交给机器。单价在降,总量却可能涨得更快。
OpenAI的奥特曼,近两年来对模型本身谈得越来越少,更愿意谈论的是算力、渠道和资本。OpenAI在2月的融资公告里反复提到这三样东西;更早之前,他也多次把未来的智能比作水和电。
不过,相比之下,黄仁勋关心的是怎么把Token生产出来,奥特曼关心的是怎么把Token稳定地卖出去。前者看供给,后者看需求。市场的犹豫正在这里。Token当然会越来越便宜,但便宜之后能不能成为一门好生意,还是另一回事。
2月27日,OpenAI宣布完成1100亿美元新融资,估值达到7300亿美元,投资方包括亚马逊、英伟达和软银。钱当然很多,但市场现在盯着OpenAI,早已不只是盯它的模型还强不强,而是盯它能不能把这门生意做成一门真正算得过来的生意。
这家公司已经走到了一个很尴尬的位置。模型继续往前推,要靠更大的算力投入、更密的数据中心和更重的资本开支。可问题是,模型越强,推理越频繁,账单越厚。它不是卖一套软件就结束,而是在不断卖Token,不断消耗算力。每一次调用背后,都是额外的电力消耗和持续累积的成本。
谷歌也烧钱,DeepMind也烧钱,但谷歌背后有广告、搜索、云服务这些成熟业务,可以长期输血。OpenAI没有这个条件。微软给了它云资源和资金支持,但合作伙伴的托底,终究代替不了自己长出稳定的利润来源。微软能帮它把跑道拖长,却不能替它把商业模式跑通。
今年初,笔者和金融史学家塞巴斯蒂安·马拉比聊起OpenAI的上市前景。在他看来,与其说这是广义的AI泡沫,不如说更像“OpenAI泡沫”。他的关切也不复杂,不是估值是不是太高,而是钱到底够不够烧。2025年,OpenAI一轮私募就拿到了410亿美元,规模甚至超过当年沙特阿美创纪录的IPO募资额。可这笔钱放进AI的资本开支里,未必够用。
马拉比甚至觉得,OpenAI最后被一家科技巨头吸收,并不是什么很离谱的想象。这个判断未必会发生,但它碰到的是一个很实际的问题:独立基础模型公司的资本开支,很可能更适合放进大公司的利润池里慢慢消化。
外部分析援引OpenAI向投资者披露的预测估算,到2029年,这家公司累计负自由现金流可能达到1430亿美元。这个数字以后也许还会变,但光看量级,也知道这不是一门轻松的生意。哪怕手握1100亿美元融资,扔进这个庞大的“Token制造厂”里,也未必见得宽裕。更何况,这些投资里还有一部分是算力和云服务额度,不是真金白银。
OpenAI成了整个行业的压力测试,不是因为它最受关注,而是因为这门生意最难算的那本账,先在它这里摊开了。如果连OpenAI都证明不了这门生意能赚钱,那么被重新定价的就不会只是一家公司,而会是整个AI产业链的商业预期。
往上游看,芯片、云服务、电力和数据中心的投资价值都会被重算;往下游看,使用AI的企业也会更精打细算,重新衡量每一次模型调用到底值不值。模型再强,融资再大,最后也可能只是代价高昂的资源消耗。
Token变便宜,几乎是确定的事。芯片会更强,推理框架会更省,数据中心的利用率也会继续提高。只要工程效率还在往前走,单位Token的成本就会往下掉。但成本往下掉,不等于利润就会上来。这是两回事。
过去不少人把大模型想成另一场“补贴战”:先把价格打下来,圈一波用户,盈利以后再说。可这套想法现在已经站不太住了。国内大模型市场这两年的风向已经很明显,单纯靠低价换规模、用补贴换规模的价格竞争正在收缩。不少头部企业都开始重新调整相关云服务和API的定价。
这笔账其实并不难算。企业客户开始尝试把AI更多地接进客服、研发、法务、风控这些日常流程,Token消耗就是持续发生的,很多时候甚至是量级增长的。模型公司继续按“白菜价”卖Token,等于燃烧自己的利润,甚至家底,替客户承担推理成本。再不刹车,这就是个无底洞。
所以,即使总体而言,Token的单价可以越来越便宜,但模型公司的策略选择,不可能再是“把所有Token都卖成一个价”,而只能是“精准定价”。
在机器那里,每个Token对应的算力开销差不多,但到了客户那里,每个Token创造的价值却差很多。拿它陪人闲聊、写摘要,和拿它审合同、做药物筛选、跑金融决策,根本不是一回事。后者替客户省下来的,不只是时间,还有人工、出错成本和组织摩擦。模型公司当然会很快发现这一点。
Anthropic公布的EconomicIndex报告也说明了这一点。最先大规模接住AI的,还是软件开发、技术写作这类结构清晰、容易拆分的工作。最先值钱的Token,并不会平均流向所有行业,而会先流向那些最容易把ROI算清楚的场景。对模型公司而言,真正能带来利润的,不是让机器做更多推理,而是让机器做“更值钱”的推理。决定这杯“水”能卖多少钱的,不只是造水的成本,更是它到底能帮客户赚回多少钱。模型公司想盈利,就得把最聪明的脑力,卖到最赚钱的行业里去。
走到这一步,分层定价几乎是必然。便宜的通用Token,可以去处理那些高频、低价值的日常琐事;中等价位的Token,卖给能明确替代部分人力的标准化流程;而那些高溢价、最贵的Token,则专门服务医药、法律、金融这些高端场景。真正决定Token定价的标准,取决于它替客户省下了多少人工、时间和犯错成本。
欧洲支付巨头Klarna的AI助手上线万次对线个全职客服的工作量,公司据此预计利润改善4000万美元。如果顺着这组数据粗算下去,这笔账就更直观了:230万次对线个全职岗位,平均下来,一个岗位要处理三千多次对线万美元利润改善,摊到这700个岗位上,接近每个岗位五万多美元。这里面不只是工资替代,也包括响应速度、处理效率和服务时长改善带来的收益。企业采购愿意继续买单,靠的正是这种能被换算、能被复核、也能被写进预算表的结果。Token一旦能和这些数字挂钩,它就不再只是技术单位,而成了财务语言。
反过来,如果一个产品既贵,又说不清替企业省了多少钱,还时不时出错,采购就会停下来。微软的办公Copilot在不少企业推进缓慢,问题就出在这里。
便宜当然重要,但更重要的是,中国的大模型公司更早被企业客户追着问一个很硬的问题:你到底能不能接进我的流程,替我省下真金白银?预算紧,ROI考核硬,试错窗口短,这是中国企业客户最真实的约束。很多时候,他们并不先问谁家模型分数最高,而是先问能不能接进客服、研发、法务、风控这些现有流程,能不能稳定跑起来,值不值得继续花钱。
月之暗面创始人杨植麟在2026年GTC官方论坛上说过一句话,Token效率不仅关乎效率,也关乎智能的上限。如果只从商业角度理解,这句话很容易被看成“降本增效”。但放到AI模型的前沿探索里,效率本身就是能力的一部分。高质量数据、训练资源和推理预算都不是无限的,谁能用更少的Token学到更多东西,谁就可能在同样的约束下,把模型推到更高的上限,也更有可能在价格竞争里活下来,把利润留住。
真实调用数据已经给出了一部分答案。第三方平台OpenRouter的数据长期显示,MiniMax、DeepSeek、月之暗面、智谱等中国模型的调用量排在前面。客户买单看的不是单项冠军,而是整体性价比。价格、响应速度、稳定性、接入难度,缺一不可。模型再强,接不进流程,进不去预算,最后也只是发布会上的明星产品。
真正可能改变商业的,不是模型榜单上的座次,而是它能不能替企业把那些看不见、摸不着、却又极其昂贵的沟通和协调成本打下来。如果一个工具只能在发布会上展示自己有多聪明,却很难接入真实的审批、客服、代码或检索流程里,那它的价值就会一直停留在演示阶段。只有当AI能稳定替企业减少交接、找人、等待和返工这些内耗时,它才算真正开始创造利润。
换成经济学家科斯的语言,这说的就是“交易成本”:AI要证明自己值钱,得证明它减少的不是PPT里的想象劳动,而是企业内部真实存在的沟通、交接、确认、审查和返工。
未来能赚到钱的,未必是那些把模型做得最强的公司。模型当然重要,但真正能吃到最大红利的,很可能是那些掌握了企业入口、把接入难度降到最低、甚至重塑了公司工作流程的平台。
到这里,这笔账才算真正算完。开发者盯着的是一张账单,资本市场盯着的是一张总账。谁既能把Token卖出价格,又能让产品在企业现有流程里稳定跑起来,谁才更有可能在下一轮AI竞争里留下来。九游娱乐-官方入口