Más barata, más rápida y culturalmente consciente, la IA de video de Avataar está diseñada para la escala de la India


La producción del modelo de IA de la India ha sido lenta en comparación con la de Estados Unidos, Europa y China. Solo unas pocas empresas emergentes están lanzando modelos, y la mayoría de ellos son modelos de lenguaje o modelos de voz a gran escala. Para fomentar un mayor desarrollo, el gobierno lanzó la India AI Mission, una iniciativa de aproximadamente 1.200 millones de dólares que, entre otras cosas, brinda a empresas emergentes seleccionadas acceso a computación GPU subsidiada a cambio de lanzar sus modelos públicamente. Una de las 12 nuevas empresas seleccionadas para el programa, Avataar AI, lanzó un nuevo modelo de video llamado Varya que está diseñado para comprender el contexto local, como identificar diferentes festivales, comida y ropa.

La startup respaldada por Peak XV, que se centra en la creación de herramientas de vídeo para el comercio electrónico, no creó Varya desde cero. Comenzó con Wan 2.2, un modelo de generación de video disponible públicamente lanzado por Alibaba, y utilizó una técnica llamada destilación, que esencialmente comprime las capacidades del modelo en una versión más ágil y rápida optimizada para los casos de uso específicos de Avatar. El resultado es un modelo que se ejecuta en cuatro pasos en lugar de los 50 de Wan 2.2, produciendo video 10 veces más rápido y a una fracción del costo.

Para ponerlo en términos concretos: usando una GPU NVIDIA H200, Varya puede generar un clip de 720p de 5 segundos en 45 segundos, en comparación con los 1230 segundos de Wan 2.2.

El aspecto más llamativo de Varya puede que sea su precio. La compañía planea cobrar ₹0,48 ($0,005) por segundo de video en su servicio alojado, mucho más barato que modelos como Veo, Kling, Luma y Runway, que normalmente cobran $0,10 o más por segundo. Esa es una diferencia de precio de aproximadamente 20 veces.

«India es un mercado en el que el vídeo es lo primero. Vemos esto en todos los grandes productos de Internet de consumo en la India: el vídeo gana al texto. Los modelos actuales de vídeo con IA son demasiado caros para su uso a escala poblacional en la India. Si el vídeo con IA va a llegar a estudiantes, profesores, mipymes, creadores, empresas y servicios públicos, los costos tienen que reducirse drásticamente. El coste es el mayor desbloqueo para la adopción de la IA en la India», dijo a TechCrunch el director general de Peak XV, Rajan Anandan.

Los modelos de generación de imágenes y videos a menudo pasan por alto matices culturales y producen resultados estereotipados o genéricos, un problema sobre el que TechCrunch ya ha informado antes. Avatar AI dice que ha utilizado datos seleccionados para entrenar a Varya para que reconozca matices culturales que incluyen comida, ropa, arquitectura y festivales.

Varya se lanzará como un modelo de peso abierto en el portal AI Kosh de la India, el repositorio centralizado del gobierno indio para modelos y conjuntos de datos de IA disponibles públicamente, junto con sus datos de entrenamiento, lo que significa que los desarrolladores pueden autohospedarlos o modificarlos según sus propias necesidades. Avataar también planea poner el modelo a disposición de sus clientes empresariales y dice que está abierto a asociaciones con herramientas de vídeo como Higgsfield y Adobe Firefly. Cualquiera puede probarlo ahora en su sitio web mediante indicaciones de texto o imágenes de referencia.

El lanzamiento de Varya refleja una compensación fundamental en las ambiciones de IA de la India. Los veteranos de la industria han señalado que India puede dejar su huella en la IA mediante la creación de aplicaciones y un ecosistema de desarrolladores sólido en lugar de competir con modelos básicos. Y hay una razón para ese pragmatismo: el desarrollo de modelos ha sido más lento en India que en sus rivales globales debido a la falta de computación y la disponibilidad limitada de datos de calidad.

La Misión de IA en India también es parte de un esfuerzo gubernamental más amplio para cerrar esa brecha. El año pasado, seleccionó 12 nuevas empresas, entre ellas Avataar AI, para desarrollar modelos de IA y les proporcionó computación rentable. A principios de este año, el ministro de TI, Ashwini Vaishnaw, dijo que India pretende atraer 200.000 millones de dólares en inversiones en IA para 2028 y más del doble de su capacidad de GPU en seis meses.

Cuando compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta nuestra independencia editorial.



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here