一条新的线索越来越清晰:Token正在从技术计量单位,变成商业计价单位,再迈向社会分配单位。
这意味着,人工智能不再只是一个新工具,而是在孕育一种新的价值尺度。
这种变化并不只发生在硅谷。
公开数据显示,中国日均Token调用量已在两年间增长超千倍。
国家数据局也已明确将Token视为连接技术供给与商业需求的“结算单位”。
这说明,Token正在从技术语言加速转化为产业语言。
很多人对Token的理解,还停留在技术名词层面。
它是模型处理信息的基本计量单位,今天,主流大模型服务早已经普遍按Token计费。
但真正值得关注的,不在于它如何计费,而在于一种计量...
但真正值得关注的,不在于它如何计费,而在于一种计量单位一旦走出后台、进入市场,就不会停留在“技术便利”这一步。
它会嵌入企业成本核算,进入产品定价逻辑,渗入组织激励机制,最终甚至触及社会分配秩序。
工业时代按工时计量劳动,互联网时代按流量衡量平台价...
工业时代按工时计量劳动,互联网时代按流量衡量平台价值,到了人工智能时代,价值越来越可能按Token来折算。
黄仁勋把大规模数据中心比作“Token工厂”,这个比喻很关键。
它提醒我们,数据中心不再只是提供算力的仓库,而是持...
它提醒我们,数据中心不再只是提供算力的仓库,而是持续将电力、芯片、数据和算法,转化为可消费、可计价、可交易的标准化产出:Token。
换句话说,数据中心不只是基础设施,更像新工业时代的生产车间。
而Token,就是车间里源源不断下线的新产品。
一旦这样理解,很多现象就连起来了。
为什么企业越来越在意模型调用额度?
为什么招聘时开始有人问岗位可分配多少Token、多少推理预算?
为什么各家争夺的,不只是模型排行榜上的名次,而是芯片、算力和推理能力?
因为在这个体系里,谁掌握Token的生产能力,谁就...
因为在这个体系里,谁掌握Token的生产能力,谁就掌握新的价值出口;谁拥有Token的配置权,谁就掌握新的分配权。
过去几年,人们更关心模型会不会更聪明、会不会替代人、能不能写文章、能不能画图。
但对企业和资本而言,更关键的问题已经变成:智能究竟如何计量,如何定价,如何配置,如何分配。
Token之所以重要,不是因为它神秘,而是因为它正在成为那把新的尺子。
而一种新的价值尺度,只有真正写入预算表和工资单,才会从产业趋势变成组织现实。
如果说前面的变化主要发生在机房和资本市场,那么硅谷...
如果说前面的变化主要发生在机房和资本市场,那么硅谷招聘市场上的新动向,则说明Token逻辑已经开始进入企业内部。
过去,科技公司争夺人才,主要靠三件事:薪资、奖金和股权。
如今,算力正在成为硅谷薪酬的第四极。
OpenAI总裁格雷格·布罗克曼直言,可获取的算力将直接影响软件开发效率。
风险投资机构Theory Ventures进一步预...
风险投资机构Theory Ventures进一步预测,到2026年,人工智能推理成本可能成为工程师薪酬的第四组成部分,与薪资、奖金和股权并列。
这件事的意义,不在于公司多发了一项福利,而在于企业开始把生产资料的一部分,直接配置给核心知识劳动者。
免费午餐、健身房、保险,是生活福利;Copilot...
免费午餐、健身房、保险,是生活福利;Copilot、GPT配额、Cursor企业版、专属推理额度,则是生产福利。
薪资解决当期收入,奖金绑定短期绩效,股权绑定长期预期,而算力预算直接作用于当下产出。
传统办公室时代,公司给你电脑、工位、邮箱;人工智能...
传统办公室时代,公司给你电脑、工位、邮箱;人工智能时代,公司还要给你“第二大脑”、“代码副驾”和“推理燃料”。
同样值得注意的是,中国头部企业也开始围绕Token重构内部组织。
阿里近期成立Alibaba Token Hub,整...
阿里近期成立Alibaba Token Hub,整合模型、MaaS、应用等核心板块,背后折射的正是同一种变化:组织配置资源的基本单位,正从“产品”逐步转向“Token”。
说到底,AI时代,最重要的员工福利,不再是让你过得更舒服,而是让你干得更强。
这一变化也会迅速抬升顶级人才的综合成本。
按照相关测算,如果一名工程师每年新增10万美元推理...
按照相关测算,如果一名工程师每年新增10万美元推理成本,总人力成本可达到47.5万美元,意味着未来超过20%的薪酬成本可能来自人工智能使用支出。
这说明,人工智能未必会让高端工程师更便宜,反而可能让他们更贵。
因为生成式人工智能并不是简单替代工程师,而是在放大顶级工程师的杠杆。
越优秀的人,越能把高质量模型转化为更高产出,公司也就越愿意在他们身上叠加更高额度的Token预算。
结果很可能是,普通工程师岗位被挤压得更厉害,头部工程师和高效团队的综合成本却被抬得更高。
公司内部对算力资源的倾斜,最终也会外溢到劳动市场,形成新的分层。
未来公司争夺的,不只是某个工程师本身,而是“工程师+模型能力+推理预算”的组合体。
表面上看,大家都在做同一类工作;实际上,不同员工背后的“数字外脑”并不处于同一层级。
有人配企业级Copilot、专属API额度和高性能模型调用权,有人只能使用受限版本。
未来劳动市场的新鸿沟,可能不只是会不会编程,而是有没有资格调用更强的算力。
当然,算力进入工资单,并不只带来激励,也会带来治理难题。
一旦推理预算成为正式资源,企业就必须回答几个新问题:谁配得上更多Token?
是平均发,还是按贡献度倾斜?
谁在高效使用Token,谁又在浪费Token?
未来绩效考核,看的恐怕不只是人效,还可能是“单位Token产出”。
这意味着,Token正在从采购问题变成管理问题。
谁能把有限Token配置到最高价值任务上,谁能把高...
谁能把有限Token配置到最高价值任务上,谁能把高成本推理留给高回报场景,谁就更可能在下一轮竞争中胜出。
而当企业内部已经开始分配算力,社会层面围绕算力展开讨论,也就不再意外。
长期以来,人们围绕“全民基本收入”讨论技术替代后的...
长期以来,人们围绕“全民基本收入”讨论技术替代后的兜底机制(可参考拙文《奥特曼三部曲:一台智能引擎,一颗人造太阳,一份全民收入》,2026-01-20,澎湃商学院)。
如今,奥特曼则试图把问题改写为:与其发钱,不如发算力;与其只保障消费能力,不如赋予生产能力。
这未必很快成为现实,却已经透露出一个值得重视的变化...
这未必很快成为现实,却已经透露出一个值得重视的变化:未来社会真正稀缺的,可能不只是收入,而是生成能力。
一个人能否高效写作、编程、学习、创业,越来越取决于他能否低成本调用强大的模型能力。
工业社会的核心公平,主要表现为收入公平与机会公平。
社会更关心一个人有没有工作、有没有收入、有没有基本保障。
而在智能社会里,公平的内涵也许会悄悄变化,越来越体...
而在智能社会里,公平的内涵也许会悄悄变化,越来越体现为算力可及性公平、模型使用权公平、数字生产力公平。
所谓普惠,未必只是发一笔钱,更可能是给普通人一张进入新生产方式的门票。
不过,设想再宏大,最终还是要接受现实检验。
微软CEO纳德拉的提醒,恰恰点中了问题的要害。
人工智能必须在医疗、教育等领域带来真实改善,否则社会不会长期接受如此高能耗的Token生产。
真正的问题是,这些Token最终转化成了什么:是更...
真正的问题是,这些Token最终转化成了什么:是更精准的辅助诊断,更普惠的教育服务,更高效的研发协同,还是只是在制造平台账单和资本故事。
社会不会因为你生产了海量Token,就自动认可这种技术进步。
这也是今天人工智能产业最需要警惕的地方:Token越来越像一种“新电费”。
表面上看,按量计费合理透明;但一旦企业真正把人工智能嵌入研发、客服、办公、营销、代码生成等关键环节,Token消耗就会从一笔可控支出,迅速膨胀为持续吞噬预算的变量成本。
很多企业以为自己接入的是智能,最终先装上的却是一套持续计费系统。
若缺乏任务分层、模型路由、缓存复用、提示词治理和成本监测,所谓全面拥抱人工智能,很可能变成全面暴露在人工智能成本曲线之下。
所以,真正值得追问的,不只是Token会不会成为工资的一部分,也不只是它能不能替代“全民收入”,而是更根本的问题:谁来定义Token的价值,谁来决定Token的分配,谁来约束Token的成本;谁又来确保Token最终能够转化为广泛的公共收益,而不是少数平台的收益表。
未来社会的竞争,表面上看是模型竞争,深一层是算力竞争,再深一层,其实是围绕Token展开的治理竞争。
一个技术词汇之所以值得写进专栏,不是因为它新,而是因为它正在穿透不同层级的系统:从机房穿透到公司,从公司穿透到市场,从市场穿透到社会。
Token开始只是算法内部的计量单位,后来变成商业世界的结算单位,如今又隐约有了迈向社会分配单位的趋势。
若干年后,我们回头再看黄仁勋和奥特曼今天这些关于Token、推理预算和“薪酬第四极”的讨论,或许会发现,他们讨论的从来不只是一个技术单位,而是社会开始用一种新的尺度,重新衡量能力,重新配置资源,重新安排分配。
(作者胡逸为数据工作者,著有《未来可期:与人工智能同行》一书)
: