A medida que la IA comienza a interactuar con el mundo físico, nuevos tipos de laboratorios están trabajando para construir modelos mundiales que podrían usarse para operar robótica física o modelar objetos en el espacio físico. A diferencia de los grandes modelos de lenguaje, no existe una fuente fácil de datos para esos modelos, lo que ha dejado a muchos laboratorios luchando por ensamblar los conjuntos de entrenamiento necesarios.
Ahora, está surgiendo una startup con una fuente de datos poco probable: la industria de los videojuegos.
Esa es la premisa de Origin Lab, que acaba de anunciar una ronda de financiación inicial de 8 millones de dólares liderada por Lightspeed Ventures. También participaron SV Angel, Eniac, Seven Stars y FPV, con financiación ángel del cofundador de Twitch, Kevin Lin, y del fundador de Cruise, Kyle Vogt.
«Los sistemas de inteligencia artificial que se están construyendo ahora deben comprender cómo funciona el mundo físico y cómo se mueven las cosas», dijo a TechCrunch la codirectora ejecutiva y cofundadora Anne-Margot Rodde. «Esos datos esencialmente viven en los videojuegos».
En términos simples, Origin Lab servirá como un mercado donde los laboratorios centrados en modelos mundiales, como AMI Labs de Yann LeCun o World Labs de Fei-Fei Li, podrán comprar datos con licencia de alta calidad. En el otro lado del negocio, las empresas de videojuegos pueden obtener ingresos adicionales de los activos digitales que ya han creado. En el medio, Origin Lab convertirá los recursos del videojuego en una forma que funcione como datos de entrenamiento, algo que podría ser tan simple como una ejecución de renderizado o tan complejo como automatizar horas de metraje de recorrido.
«Quedó claro que la industria de los videojuegos contaba con datos increíblemente valiosos, pero no había una forma o infraestructura real para conectar básicamente los laboratorios de inteligencia artificial y la industria de los videojuegos», dice Rodde. “Básicamente, construimos ese puente”.
Los laboratorios han estado interesados durante mucho tiempo en las imágenes de videojuegos como fuente de datos, pero los problemas de licencia y calidad de los datos a menudo se han interpuesto en el camino. En diciembre de 2024, OpenAI provocó un escándalo menor cuando la primera versión de su modelo de generación de vídeo Sora pareció regurgitar imágenes de videojuegos y transmisores populares, presumiblemente porque había sido entrenado en transmisiones de Twitch. Amazon ha sido abierto sobre su interés en utilizar imágenes de Twitch para entrenar modelos.
El éxito de Origin en la recaudación de fondos es una señal de un mercado en crecimiento, no sólo para los datos de capacitación, sino también para las nuevas empresas que pueden servir como proveedores esenciales para los principales laboratorios de IA. Faraz Fatemi, socio de Lightspeed que dirigió la inversión en Origin, dice que el éxito de empresas como Scale.AI ha hecho que la oportunidad sea imposible de ignorar.
«Hemos visto cuán pronunciado puede ser el aumento de los ingresos para los proveedores de datos que prestan servicios a los principales laboratorios», dijo Fatemi a TechCrunch. «Se trata de empresas muy bien capitalizadas y el cuello de botella para todas ellas son los datos».
Cuando compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta nuestra independencia editorial.



