AI热潮一直基于一个基本假设:模型越大,能力越强,最强大的模型将赢得胜利。如今,行业即将见证当这一假设开始动摇时会发生什么。
不断攀升的成本已经促使用户重新审视更小、更便宜的模型。这种以成本为导向的模型选择尚属新鲜事物,其对行业的影响尚不明朗,但很可能会带来深远变化。
Coinbase联合创始人Brian Armstrong提出的一个预测是,大多数任务将在未来12到18个月内转向成本低99%的廉价模型。
他在社交平台X上写道:“对智能的需求几乎是无限的,但80%的工作负载将在成本降低99%的模型上运行。剩余20%的工作负载仍将使用最新一代模型,以追求最高智商表现。”
如果Armstrong的预测成真,这将是AI行业的一次重大转变。
迄今为止,大多数AI公司都在质量上竞争,默认选择最先进的模型。如果廉价模型能够在不影响质量的前提下完成相同任务,这将极大改变AI的经济格局。更重要的是,这种节省将直接影响大型实验室的收入,对OpenAI和Anthropic等正准备上市的公司构成财务冲击。
这可能是行业的一次地震式变化,关键问题是:企业是否准备好转向更小的模型?

初步测试显示,在合理配置下,廉价模型可以替代高价模型而不牺牲质量。法律AI工具Harvey最近的一次测试中,公司在不降低质量的情况下,将推理成本降低了3倍。该测试由推理平台Fireworks AI协作完成,结合了Claude Opus和Fireworks的GLM 5.1模型,并将最密集的任务交给Opus处理,显著降低了服务器负载和总体成本。
Harvey联合创始人Gabe Pereyra向TechCrunch表示:“质量始终是第一位的,尤其是在法律领域。然而,质量的定义正在从简单地使用最强大的模型,转变为使用最有效率地给出正确答案的最佳模型。”
这一趋势常被描述为大型实验室与中国模型或开源权重模型的竞争,但这忽略了更重要的分界线:大型模型与小型模型之间的差异。无论是从GPT-5.5切换到DeepSeek的V4 Flash,还是转向GPT-5.4-mini,都能实现成本节约且效果相当。
目前,大型实验室的内部推理服务与独立提供的开源权重模型之间正展开激烈的价格战。对于小型模型与大型模型的较量,具体哪种小型模型胜出其实并不关键。
虽然这一切看似显而易见——当然不应使用超过必要的计算资源——但它与迄今为止主导行业的“规模优先”策略背道而驰。受“苦涩教训”的启发,实验室一直致力于训练计算密集度最高的模型,推动AI模型能力的极限。由于投资者大量补贴,客户没有理由选择非最先进的选项。
随着令牌价格上涨和补贴减少,用户首次面临成本压力。我们尚不确定这种成本压力是否会真正促使企业用户转向更小的模型。他们也可能通过减少调用次数、缩减上下文使用,或放弃效果最差的应用来节省开支。
但如果大多数应用都能在更小的模型上同样良好运行,这将严重抑制推理需求的增长,并引发如何合理化训练前沿模型成本的新问题。


