云基础设施长期以来都是围绕人类设计的,人们通过搜索、点击、滚动和流媒体以稳定且可预测的方式使用互联网。然而,人工智能代理的行为截然不同。它们能够迅速激增活动,启动多个子代理,在几秒钟内查询数百个数据库、搜索文档并调用API,然后又像来时一样迅速消失。

基于这一前提,亚马逊正在重新设计其云基础设施的核心部分。周四,AWS推出了下一代OpenSearch Serverless,这是一种完全托管的搜索和向量数据库系统,专为代理工作负载设计。AWS表示,该系统能够在代理触发任务时即时扩展,并在空闲时缩减至零。

这一发布反映了科技行业日益增长的共识:最初为人类驱动的互联网设计的基础设施,在日益由代理主导的世界中表现不佳。

虽然AI代理目前仅占互联网活动的一小部分,但机器生成的流量已经相当可观,并且有望持续增长。Cloudflare数据显示,过去六个月内,机器人流量占HTTP总流量的31%。其中,AI爬虫、搜索引擎和助手约占所有机器人请求的四分之一。

Cloudflare高级产品经理赖怡奥尔森向TechCrunch表示:“非人类流量将在2027年上半年超过人类流量。”

在谷歌上周举行的I/O开发者大会上,谷歌宣布用户将能够开始将任务委托给AI系统,比如研究购物、预订旅行、浏览网页和与应用互动。但AI代理的应用不仅限于消费者领域,企业也在内部及面向客户部署代理,产生了新的机器生成流量。

因此,云服务提供商和基础设施公司正努力调整原本为人类设计的系统,以适应不断自主检索信息、调用工具并生成机器间流量的代理世界。

这正是AWS新推出的OpenSearch Serverless的用武之地。

亚马逊OpenSearch服务总经理蒂娅·怀特告诉TechCrunch:“时机非常明确。代理正从试验阶段进入生产阶段,它们产生的流量模式是以往基础设施无法应对的。它们会突然激增,也会无预警地进入空闲状态,企业需要能够跟上这种变化的搜索服务,同时避免为闲置计算资源付费。”

这代新系统的关键技术改进在于将计算与存储解耦,计算资源可以在几秒内扩展以应对代理流量激增,也能缩减至零,代理空闲时客户无需付费。

怀特说:“之前即使是我们之前的Serverless版本,也必须至少保持一个实例运行,因为存储和计算是耦合的。你无法根据需求自动启动计算资源,因此总会有闲置的计算资源被保留,无论是否使用。”

这就像总是为停车位付费,即使你没有使用它。而AWS升级后的Serverless则更像是按需计费的计时停车位。

发布时,OpenSearch Serverless将与Vercel和Kiro等AI开发平台原生集成,开发者可以无需管理基础设施,直接部署面向代理的生产级搜索和向量后端。

这种转变正在云行业普遍展开。Databricks和Snowflake正将自身定位为企业数据的AI记忆和检索系统。微软推出了针对AI代理激增和代理间共享记忆的Azure更新。Cloudflare也在类似亚马逊的方向上发展,上个月推出了旨在为代理提供持久环境和即时扩展能力的基础设施。

随着越来越多公司部署AI代理,围绕机器生成工作负载重构基础设施的压力将持续增加,这反过来又会使代理部署更便宜、更容易实现大规模应用。