Token经济学这笔账到底怎么算

日期：2026-03-30 浏览：　

Token经济学这笔账到底怎么算(图1)

　　最近，Token这个词被频繁提起。3月23日，在中国发展高层论坛2026年年会上，国家数据局局长刘烈宏将To－ken译作“词元”。国家数据局数据称，我国日均词元调用量已从2024年初的1000亿跃升至2025年底的100万亿，到今年3月突破140万亿。自1月底以来，已有模型企业在20天里取得超过2025年全年的收入。

　　过去围绕大模型，人们先问的是某个模型能做到哪一步，几乎陷在“唯Benchmark分数论”里；如今更常被追问的，却是“烧不烧Token”。随着智能体越来越多地进入真实工作流，成本不再藏在后台，而是开始一笔笔出现在账单上。一句提示词看上去不过几行字，后台却要读取上下文、拆解任务、调用工具、回滚重试。AI每多走一步，费用就往上跳一截。

　　Token背后，无非是芯片、服务器和电费。如今AI后端越来越像基础设施，用户用得越多，上游烧掉的算力和电也越多，最后这笔账总得有人先扛着，而眼下最先扛账的，通常还是基础模型公司。

　　对OpenAI这类既卖订阅也卖API服务的公司来说，难处就在这里。只是证明模型够强、产品够好用，已经不够了，更关键的是证明自己扛得住这样一门高度烧钱的生意。2026年开年以来，OpenAI一边继续寻求千亿美元级融资，一边筹备更严格的资本市场检验。Token经济学也就在这个时候，成了一个值得单独讨论的问题。

　　在英伟达创始人黄仁勋看来，To－ken早已不是聊天框里吐出来的几个字符，而是“下一个商品”。今年3月的GTC2026大会上，他甚至说，未来英伟达的工程师都会有自己的“年度Token预算”；如果一个高薪工程师一年下来没消耗多少Token，反倒显得奇怪。

　　黄仁勋的意思是，未来Token不会再只是模型公司对外计费的单位，也会变成企业内部的一种生产要素，像云资源，也像电力配额。公司买的不只是一次回答，而是一种可以持续调用的智能能力。一个团队用了多少Token，换回多少效率，值不值得继续投，都会落进同一张表里。

　　在这个框架里，Token成了一种被持续生产、计量和调度的产出。数据中心是工厂，芯片和电力是原料，推理吞吐量则类似于产能。只要企业相信未来对智能的需求足够大，就会继续扩建数据中心、提升集群密度、优化推理效率，把单位Token的成本不断压低。

　　但单位成本下降，并不意味着总消耗会跟着下降。这更接近经济学里的杰文斯悖论。技术越高效，资源总使用量反而可能更大。放到AI上，道理并不复杂。以前的模型只能做简单问答，现在的智能体已经能通读几百页财报、分析数据、调用工具、执行复杂代码任务。模型一旦跨过“能用”的门槛，企业就会把越来越多原本由人完成的复杂工作交给机器。单价在降，总量却可能涨得更快。

　　OpenAI的奥特曼，近两年来对模型本身谈得越来越少，更愿意谈论的是算力、渠道和资本。OpenAI在2月的融资公告里反复提到这三样东西；更早之前，他也多次把未来的智能比作水和电。

　　不过，相比之下，黄仁勋关心的是怎么把Token生产出来，奥特曼关心的是怎么把Token稳定地卖出去。前者看供给，后者看需求。市场的犹豫正在这里。Token当然会越来越便宜，但便宜之后能不能成为一门好生意，还是另一回事。

　　2月27日，OpenAI宣布完成1100亿美元新融资，估值达到7300亿美元，投资方包括亚马逊、英伟达和软银。钱当然很多，但市场现在盯着OpenAI，早已不只是盯它的模型还强不强，而是盯它能不能把这门生意做成一门真正算得过来的生意。

　　这家公司已经走到了一个很尴尬的位置。模型继续往前推，要靠更大的算力投入、更密的数据中心和更重的资本开支。可问题是，模型越强，推理越频繁，账单越厚。它不是卖一套软件就结束，而是在不断卖Token，不断消耗算力。每一次调用背后，都是额外的电力消耗和持续累积的成本。

　　谷歌也烧钱，DeepMind也烧钱，但谷歌背后有广告、搜索、云服务这些成熟业务，可以长期输血。OpenAI没有这个条件。微软给了它云资源和资金支持，但合作伙伴的托底，终究代替不了自己长出稳定的利润来源。微软能帮它把跑道拖长，却不能替它把商业模式跑通。

　　今年初，笔者和金融史学家塞巴斯蒂安·马拉比聊起OpenAI的上市前景。在他看来，与其说这是广义的AI泡沫，不如说更像“OpenAI泡沫”。他的关切也不复杂，不是估值是不是太高，而是钱到底够不够烧。2025年，OpenAI一轮私募就拿到了410亿美元，规模甚至超过当年沙特阿美创纪录的IPO募资额。可这笔钱放进AI的资本开支里，未必够用。

　　马拉比甚至觉得，OpenAI最后被一家科技巨头吸收，并不是什么很离谱的想象。这个判断未必会发生，但它碰到的是一个很实际的问题：独立基础模型公司的资本开支，很可能更适合放进大公司的利润池里慢慢消化。

　　外部分析援引OpenAI向投资者披露的预测估算，到2029年，这家公司累计负自由现金流可能达到1430亿美元。这个数字以后也许还会变，但光看量级，也知道这不是一门轻松的生意。哪怕手握1100亿美元融资，扔进这个庞大的“Token制造厂”里，也未必见得宽裕。更何况，这些投资里还有一部分是算力和云服务额度，不是真金白银。

　　OpenAI成了整个行业的压力测试，不是因为它最受关注，而是因为这门生意最难算的那本账，先在它这里摊开了。如果连OpenAI都证明不了这门生意能赚钱，那么被重新定价的就不会只是一家公司，而会是整个AI产业链的商业预期。

　　往上游看，芯片、云服务、电力和数据中心的投资价值都会被重算；往下游看，使用AI的企业也会更精打细算，重新衡量每一次模型调用到底值不值。模型再强，融资再大，最后也可能只是代价高昂的资源消耗。

　　Token变便宜，几乎是确定的事。芯片会更强，推理框架会更省，数据中心的利用率也会继续提高。只要工程效率还在往前走，单位Token的成本就会往下掉。但成本往下掉，不等于利润就会上来。这是两回事。

　　过去不少人把大模型想成另一场“补贴战”：先把价格打下来，圈一波用户，盈利以后再说。可这套想法现在已经站不太住了。国内大模型市场这两年的风向已经很明显，单纯靠低价换规模、用补贴换规模的价格竞争正在收缩。不少头部企业都开始重新调整相关云服务和API的定价。

　　这笔账其实并不难算。企业客户开始尝试把AI更多地接进客服、研发、法务、风控这些日常流程，Token消耗就是持续发生的，很多时候甚至是量级增长的。模型公司继续按“白菜价”卖Token，等于燃烧自己的利润，甚至家底，替客户承担推理成本。再不刹车，这就是个无底洞。

　　所以，即使总体而言，Token的单价可以越来越便宜，但模型公司的策略选择，不可能再是“把所有Token都卖成一个价”，而只能是“精准定价”。

　　在机器那里，每个Token对应的算力开销差不多，但到了客户那里，每个Token创造的价值却差很多。拿它陪人闲聊、写摘要，和拿它审合同、做药物筛选、跑金融决策，根本不是一回事。后者替客户省下来的，不只是时间，还有人工、出错成本和组织摩擦。模型公司当然会很快发现这一点。

　　Anthropic公布的EconomicIndex报告也说明了这一点。最先大规模接住AI的，还是软件开发、技术写作这类结构清晰、容易拆分的工作。最先值钱的Token，并不会平均流向所有行业，而会先流向那些最容易把ROI算清楚的场景。对模型公司而言，真正能带来利润的，不是让机器做更多推理，而是让机器做“更值钱”的推理。决定这杯“水”能卖多少钱的，不只是造水的成本，更是它到底能帮客户赚回多少钱。模型公司想盈利，就得把最聪明的脑力，卖到最赚钱的行业里去。

　　走到这一步，分层定价几乎是必然。便宜的通用Token，可以去处理那些高频、低价值的日常琐事；中等价位的Token，卖给能明确替代部分人力的标准化流程；而那些高溢价、最贵的Token，则专门服务医药、法律、金融这些高端场景。真正决定Token定价的标准，取决于它替客户省下了多少人工、时间和犯错成本。

　　欧洲支付巨头Klarna的AI助手上线万次对线个全职客服的工作量，公司据此预计利润改善4000万美元。如果顺着这组数据粗算下去，这笔账就更直观了：230万次对线个全职岗位，平均下来，一个岗位要处理三千多次对线万美元利润改善，摊到这700个岗位上，接近每个岗位五万多美元。这里面不只是工资替代，也包括响应速度、处理效率和服务时长改善带来的收益。企业采购愿意继续买单，靠的正是这种能被换算、能被复核、也能被写进预算表的结果。Token一旦能和这些数字挂钩，它就不再只是技术单位，而成了财务语言。

　　反过来，如果一个产品既贵，又说不清替企业省了多少钱，还时不时出错，采购就会停下来。微软的办公Copilot在不少企业推进缓慢，问题就出在这里。

　　便宜当然重要，但更重要的是，中国的大模型公司更早被企业客户追着问一个很硬的问题：你到底能不能接进我的流程，替我省下真金白银？预算紧，ROI考核硬，试错窗口短，这是中国企业客户最真实的约束。很多时候，他们并不先问谁家模型分数最高，而是先问能不能接进客服、研发、法务、风控这些现有流程，能不能稳定跑起来，值不值得继续花钱。

　　月之暗面创始人杨植麟在2026年GTC官方论坛上说过一句话，Token效率不仅关乎效率，也关乎智能的上限。如果只从商业角度理解，这句话很容易被看成“降本增效”。但放到AI模型的前沿探索里，效率本身就是能力的一部分。高质量数据、训练资源和推理预算都不是无限的，谁能用更少的Token学到更多东西，谁就可能在同样的约束下，把模型推到更高的上限，也更有可能在价格竞争里活下来，把利润留住。

　　真实调用数据已经给出了一部分答案。第三方平台OpenRouter的数据长期显示，MiniMax、DeepSeek、月之暗面、智谱等中国模型的调用量排在前面。客户买单看的不是单项冠军，而是整体性价比。价格、响应速度、稳定性、接入难度，缺一不可。模型再强，接不进流程，进不去预算，最后也只是发布会上的明星产品。

　　真正可能改变商业的，不是模型榜单上的座次，而是它能不能替企业把那些看不见、摸不着、却又极其昂贵的沟通和协调成本打下来。如果一个工具只能在发布会上展示自己有多聪明，却很难接入真实的审批、客服、代码或检索流程里，那它的价值就会一直停留在演示阶段。只有当AI能稳定替企业减少交接、找人、等待和返工这些内耗时，它才算真正开始创造利润。

　　换成经济学家科斯的语言，这说的就是“交易成本”：AI要证明自己值钱，得证明它减少的不是PPT里的想象劳动，而是企业内部真实存在的沟通、交接、确认、审查和返工。

　　未来能赚到钱的，未必是那些把模型做得最强的公司。模型当然重要，但真正能吃到最大红利的，很可能是那些掌握了企业入口、把接入难度降到最低、甚至重塑了公司工作流程的平台。

　　到这里，这笔账才算真正算完。开发者盯着的是一张账单，资本市场盯着的是一张总账。谁既能把Token卖出价格，又能让产品在企业现有流程里稳定跑起来，谁才更有可能在下一轮AI竞争里留下来。九游娱乐-官方入口

九游（NINEGAME）娱乐·官方网站-中国AI娱乐科技领导者

Token经济学这笔账到底怎么算