La infraestructura de la nube se ha diseñado durante mucho tiempo en torno a seres humanos que buscan, hacen clic, se desplazan y transmiten de forma constante y predecible. Los agentes de IA se comportan de manera diferente. Pueden desatar una oleada de actividad, activando múltiples subagentes que consultan cientos de bases de datos, buscan documentos y llaman a API en segundos y luego desaparecen tan rápido como llegaron.
Bajo esa premisa, Amazon está rediseñando una pieza central de su infraestructura en la nube. El jueves, AWS lanzó su próxima generación de OpenSearch Serverless, una base de datos vectorial y de búsqueda totalmente administrada, esencialmente un sistema para almacenar y recuperar información a escala, diseñada específicamente para cargas de trabajo agentes. AWS dice que el nuevo sistema puede ampliarse instantáneamente cuando los agentes activan tareas y reducirse a cero cuando está inactivo.
El lanzamiento refleja una creciente comprensión en toda la industria tecnológica: la infraestructura originalmente diseñada para una Internet impulsada por humanos no funciona tan bien en un mundo cada vez más poblado por agentes.
Si bien los agentes de IA todavía representan una porción relativamente pequeña de la actividad en Internet, el tráfico generado por máquinas ya es significativo y está a punto de crecer. Cloudflare dice que los bots representaron el 31% del tráfico HTTP total durante los últimos seis meses. Los rastreadores de IA, los motores de búsqueda y los asistentes representaron aproximadamente una cuarta parte de todas las solicitudes de bots durante ese período.
«El tráfico no humano superará al tráfico humano en algún momento de la primera mitad de 2027», dijo Li Yi Ohlsen, gerente senior de productos de Cloudflare, a TechCrunch.
En la conferencia de desarrolladores I/O de Google la semana pasada, la compañía dijo que los usuarios podrán comenzar a delegar tareas a sistemas de inteligencia artificial, como investigar compras, reservar viajes, navegar por la web e interactuar con aplicaciones. Pero la responsabilidad no se limita a los agentes de IA centrados en el consumidor. Las empresas están implementando cada vez más agentes internamente y para sus clientes, creando nuevos tipos de tráfico generado por máquinas entre bastidores.
Como resultado, los proveedores de nube y las empresas de infraestructura han estado analizando cómo adaptar los sistemas creados para humanos a un mundo de agentes que recuperan información de forma constante y autónoma, invocan herramientas y generan tráfico de máquina a máquina.
Ahí es donde entra en juego el nuevo OpenSearch Serverless de AWS.
«El momento es sencillo. Los agentes están pasando de la experimentación a la producción y crean patrones de tráfico para los que la infraestructura anterior simplemente no estaba diseñada», dijo a TechCrunch Tia White, gerente general de Amazon OpenSearch Service. «Se disparan sin previo aviso, quedan inactivos sin previo aviso y las empresas necesitan búsquedas que se mantengan al día sin pagar por computación vacía o inactiva».
El cambio técnico clave con esta nueva generación es que desacopla la computación del almacenamiento, lo que permite que la computación aumente en segundos para adaptarse a las ráfagas de tráfico de los agentes y se reduzca a cero, de modo que los clientes paguen $0 cuando los agentes están inactivos.
«Anteriormente, incluso en nuestra versión anterior sin servidor, tenías que tener al menos una instancia operativa y en ejecución porque el almacenamiento y la computación estaban acoplados», dijo White. “No se podía simplemente girar automáticamente [compute] al ritmo que necesitabas, por lo que siempre tenías computación inactiva reservada para tu carga de trabajo, ya sea que la estuvieras usando o no”.
Piense en ello como si pagara siempre por una plaza de aparcamiento, incluso cuando no la esté utilizando. Con Serverless actualizado de AWS, es más como pagar por un lugar de estacionamiento medido.
En el lanzamiento, OpenSearch Serverless se integrará de forma nativa con plataformas de desarrollo de inteligencia artificial como Vercel y Kiro, para que los desarrolladores puedan implementar motores de búsqueda y vectores listos para producción para agentes sin administrar la infraestructura.
El cambio está surgiendo en toda la industria de la nube. Databricks y Snowflake se están reposicionando como sistemas de recuperación y memoria de IA para datos empresariales. Microsoft ha lanzado actualizaciones para Azure diseñadas para manejar ráfagas de agentes de IA y compartir memoria entre agentes. Cloudflare, en una línea similar a Amazon, introdujo el mes pasado una infraestructura destinada a brindar a los agentes entornos persistentes y escalabilidad instantánea.
Cuantas más empresas implementen agentes de IA, más presión habrá para rediseñar la infraestructura en torno a cargas de trabajo generadas por máquinas, lo que a su vez podría hacer que los agentes sean más baratos y fáciles de implementar a escalas mayores.
Cuando compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta nuestra independencia editorial.



