AI行业虽然蓬勃发展,但背后却存在大量昂贵计算资源的浪费。GPU闲置、工作负载配置过度,云计算成本持续攀升。ScaleOps认为,问题不在于资源短缺,而是管理不善。

这家初创公司开发的软件能够实时自动管理和重新分配计算资源。ScaleOps周一宣布完成1.3亿美元融资,估值达8亿美元。本轮C轮融资由Insight Partners领投,现有投资者Lightspeed Venture Partners、NFX、Glilot Capital Partners和Picture Capital也参与其中。公司表示,其软件能将云和AI基础设施成本降低高达80%。

ScaleOps由前Run:ai工程师Yodar Shafrir于2022年共同创立。Run:ai是一家GPU编排初创公司,已被Nvidia收购。Shafrir亲眼见证了企业管理日益复杂的AI工作负载的困难。虽然Kubernetes等工具帮助在大规模集群上运行应用,但它们通常依赖静态配置,难以应对快速变化的需求,导致GPU利用率低下、性能问题和高昂的资源浪费。

“在Run:ai工作期间,我接触了许多客户,尤其是DevOps团队,”现任ScaleOps CEO的Shafrir告诉TechCrunch。“他们虽然认可Run:ai的产品,但在管理生产环境的工作负载时仍面临挑战,尤其是推理工作负载在AI时代变得更为普遍。放眼全局,我发现问题不仅仅是GPU,还涉及计算、内存、存储和网络。资源管理效率低下的模式反复出现。”

DevOps团队常常需要协调多个利益相关者来解决问题,但多数努力未能奏效。现有工具虽然能提供问题可视化,但缺乏实际解决方案,这暴露了巨大的市场机会。

ScaleOps的软件能够实时连接应用需求与基础设施决策,提供端到端的全自动管理解决方案。

“Kubernetes是一个优秀的系统,灵活且高度可配置,但这也是它的问题所在,”Shafrir说。“Kubernetes严重依赖静态配置,而现代应用高度动态,需团队持续手动调整。我们需要一种能够理解每个应用上下文——它的需求、行为及环境变化——的解决方案。”

目前市场上已有多家竞争者,如Cast AI、Kubecost和Spot等。尽管许多公司推出了自动化工具,但它们往往缺乏完整的上下文理解,可能导致性能问题甚至停机,降低了生产环境团队的信任度。

ScaleOps表示,其平台从零开始专为生产环境设计,具备完全自治、上下文感知能力,开箱即用,无需手动配置,这些特性使其区别于竞争对手。

总部位于纽约的ScaleOps服务全球企业客户,尤其是运行基于Kubernetes基础设施的企业,客户遍布大型组织及欧洲和印度等地。其客户包括Adobe、Wiz、DocuSign、Salesforce和Coupa等。

此次C轮融资距ScaleOps去年11月完成的5800万美元B轮融资约一年半时间。Shafrir表示,自那以后,市场对云基础设施自动化管理解决方案的需求强劲,公司仍处于早期增长阶段。公司发言人透露,累计融资约为2.1亿美元。

ScaleOps称,过去12个月内公司实现了超过450%的年增长率,员工人数翻了三倍,并计划在年底前再次实现三倍增长。

凭借新资金,ScaleOps计划推出新产品并扩展平台。随着AI推动计算需求增长,基础设施管理变得愈发关键。该初创公司表示,将继续致力于打造完全自治的基础设施。