“给我代币。快给我代币。我要便宜的代币,我要马上得到。”

这几乎成了基于生成式AI模型开发软件的开发者们的口头禅,至少Parasail的CEO Mike Henry是这么听到的。Parasail为运行AI推理模型的企业提供云计算服务,Henry告诉TechCrunch,他们每天生成5000亿个代币。这就是所谓的tokenmaxxing。

Henry曾是专注于大语言模型芯片制造商Groq的高管,他负责搭建公司的云服务,早早意识到开发者在AI模型软件开发中需要专门定制的云计算资源。如今,Parasail在一年前公开亮相后,已完成3200万美元的A轮融资,准备大规模扩展服务。

虽然Henry有芯片设计背景,但Parasail并不打算自研芯片。公司部分GPU是自有的,但主要通过全球15个国家40个数据中心租用计算资源,并从流动性市场购买更多资源,幕后协调调度以降低推理请求成本。

通过智能分配工作负载和避免需求高峰,Parasail希望与拥有自有芯片且受限于现有客户和工作负载的公司竞争。

公司的潜力依赖于开源模型和智能代理在前沿实验室之外的持续普及。Parasail的管理层和投资者认为,这一趋势源于使用Anthropic和OpenAI等公司服务成本和摩擦的增加。

Elicit的CEO Andreas Stuhlmüller表示,混合架构正在兴起。Elicit是一家获得2200万美元A轮融资的初创公司,开发用于科学文献研究的助手工具,其客户包括顶级制药公司,利用基于大语言模型的工具审阅和分析成千上万的科学论文数据。

“我们更多地转向开源模型,因为向API端点发送数十万个请求非常困难,”Stuhlmüller告诉TechCrunch。尤其是当公司依赖代理来提升服务,将任务拆分并在更长时间范围内更有策略地工作时,开源模型负责初步筛选以降低成本,最终由更强大的前沿模型给出答案。

随着代理成为软件开发中越来越普遍的组成部分,模型查询数量激增,推动了像Parasail这样提供廉价推理基础设施公司的投资。Touring Capital合伙人Samir Kumar表示,他预计推理成本未来将占软件开发成本的至少20%。

那么Parasail能抢占多少市场份额?Henry认为,在竞争激烈的云计算领域,公司专注于推理(不做训练)且愿意接受没有长期承诺的初创客户,这使其区别于专注企业业务的大型云计算公司,以及资金更充足的云推理竞争对手如Fireworks AI和Baseten。

当然,所有客户都是处于不确定AI领域的种子轮和A轮初创企业,这带来了不同的风险。

Kindred Ventures合伙人Steve Jang是本轮融资的另一位联合领投者,他表示,模型部署的经济性将需要Parasail提供的计算资源经纪服务。这还不包括模型在内容生成和机器人领域的广泛应用。

“大家都以为有AI泡沫,但实际上没有,”他告诉TechCrunch。“推理需求远远超过供应。”