随着人工智能的广泛应用,企业开始对AI带来的高昂费用感到担忧。2026年,Uber在四月份就花光了全年AI编码预算;微软在几个月后撤销了开发者的Claude Code许可证;Priceline的一名员工透露,常规的Cursor合同续约费用上涨了4到5倍。
尽管每个代币的价格有所下降,但随着AI应用的推广和自主代理的增加,代币的消耗量持续攀升。那些在2025年初购买无限制订阅的公司,如今正努力追踪资金流向,控制开支,并尝试从预算混乱中挽回投资回报。
与此同时,市场也在快速形成,初创企业、成熟供应商以及新的标准机构都在竞相为企业提供监控支出和管理成本的工具和标准。
OpenAI企业负责人Alexander Embiricos在纽约的一次活动中告诉TechCrunch:“六个月前,客户关注的是‘它能做什么?够好吗?’现在我们讨论的都是‘我们花费太多了,你们有什么可视化、审计和代币控制手段?模型效率如何?’”
正是在这样的背景下,Linux基金会本周宣布成立Tokenomics Foundation,一个旨在为AI代币使用建立成本管理标准的新机构,类似于FinOps对云计算支出的规范。
FinOps基金会执行董事J.R. Storment表示:“今年四五月,我听到很多公司说‘天哪,我们已经花了三倍于2026年全年代币预算的费用,而现在才四月。’整个行业的对话从‘快速发展’转向‘我们需要监管措施,如何控制成本?’”
这种焦虑源于CEO们推动团队使用最先进模型、快速迭代,几乎不顾成本。去年11月发布的Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和谷歌的Gemini 3 Pro等新模型显著提升了代理工具的能力,导致代币消耗激增。有报道称,一家公司因未设置员工使用上限,导致Claude账单高达5亿美元。
Priceline的IT财务高级总监Chris Reed形象地比喻:“这就像毒品上瘾,先让你尝试,之后你就离不开它了。”公司已经开始对部分团队设置代币使用限制。
工程运营平台Faros AI的CEO Vitaly Gordon分享了一个CTO的故事:“我有个工程师上个月花了4万美元买代币,我真不知道是该阻止他,还是让其他人都像他一样。”
Faros发布的一项为期两年的研究显示,虽然开发者的产出增加,但代码中的错误和重写也在增加。工程管理平台Jellyfish发现,使用代币最多的工程师生产力是使用较少者的两倍,但代币消耗却是后者的十倍。
Jellyfish研究负责人Nicholas Arcolano表示,AI支出激增主要是因为代理功能,九个月内每位开发者的代币消耗增长了约18.6倍。但这些数据也让生产力的提升变得不那么明确。
“极端的支出是否值得,取决于最终交付代码的商业价值(如收入),而大多数公司仍无法准确衡量。”Arcolano说。
AI使用规模之大也带来了测量难题。
Storment指出:“云成本追踪是每月数亿行数据的问题,而代币成本追踪则是每月数万亿行数据的问题。你不能简单地用电子表格或基础工具处理,必须重新设计工具、规范和会计系统。”
Priceline的Reed也发现了供应商报告的使用数据与公司内部数据不符的问题。

“我职业生涯开始于电信费用管理,看到从电信到云再到AI的相似问题。每当引入新事物时,账单错误、审计和优化的机会就会出现。”
围绕这一问题,市场正在形成。Pay-i等专注公司提供生成式AI投资的成本跟踪和优化服务;Paid则帮助开发者基于实际价值而非订阅费来计费。
Jellyfish、Waydev和Faros AI等公司提供AI代理监控,帮助证明开发工具的投资回报。Storment表示,FinOps基金会内的180家供应商大多聚焦这一领域。
已有分销渠道的公司也在新增功能以抢占市场。Ramp进入AI支出管理领域;Datadog和New Relic增加了云成本管理、代币级可观测性和GPU监控等服务。AWS预计将在下周的FinOps X大会上推出针对企业AI支出的财务管理新功能。
NEA合伙人Tiffany Luck认为,代币效率和可观测性可能会集成在“应用层”或“管理层”。她提到企业AI代理初创公司Factory,本周推出了自动为每个任务选择合适模型的路由器。
Gordon预计前沿实验室和模型供应商将采用类似OpenRouter的优化技术,将查询引导至成本最低的模型,这一趋势已在企业Claude账单中显现。
“即使你调用Opus模型,部分费用也会分摊到Sonnet或Haiku模型,因为它们足够智能。”Gordon说,“我认为这将越来越普遍。”
但所有这些工具的开发都缺乏统一的语言和标准,无法统一定义代币成本、产出及跨供应商的支出比较。Tokenomics Foundation正致力于解决这一问题。
该基金会正在制定“代币经济学”的权威定义和框架,开放AI代币使用和计费的标准、规范和指标,以及新的AI经济指标,如每智能单位成本或每瓦代币数。同时计划定义代币工厂效率和消耗效率的指标。该组织计划于7月正式启动,并将在下周的FinOps X大会上公布更多成员。
Salesforce首席可用性官Nishant Gupta表示:“代币经济学比我们之前管理的任何规模都更抽象和不透明,需要与云计算不同的运营能力。”
高盛预测,到2030年全球代币使用量将增长24倍。已经超预算的公司迫切需要解决方案,而基金会的首个成果仍需数月才能推出。
Gordon感慨:“也许我们造出了蒸汽机,但还没弄明白装配线。”
Arcolano建议,明智的策略是广泛且适度地采用AI。
“最佳投资回报来自将大多数中等使用者从低使用提升到中等,而不是推动重度用户更高。”他说。


