Elon, deja de intentar hacer que Grok suceda.


Hay una dura verdad sobre Grok, el chatbot de inteligencia artificial que “busca la verdad” de Elon Musk: no es muy bueno y no mucha gente lo usa. Esa es la conclusión de una nueva Reuters informe, que encontró que Grok apenas aparece en los registros federales sobre cómo el gobierno de EE. UU. utilizó la IA el año pasado. No es la única señal de que el chatbot exclusivo de xAI está en problemas, incluso cuando Musk lo sitúa en el centro de lo que podría ser la mayor IPO de la historia.

Reuters revisó más de 400 ejemplos de uso de IA gubernamental en los que se nombraron proveedores específicos. Descubrió que Grok o xAI aparecían solo en tres, cada uno de ellos para usos básicos como redacción de documentos o gestión de redes sociales, y siempre junto a competidores como Microsoft y OpenAI. En comparación, los modelos de OpenAI aparecieron en más de 230 ejemplos, mientras que Google y Anthropic aparecieron cada uno docenas de veces.

Un patrón similar apareció en otra base de datos de proyectos gubernamentales de IA más ambiciosos con un número menor de usuarios. Grok apareció sólo tres veces: dos para tareas administrativas de rutina en la Comisión de Asistencia Electoral y una vez en un piloto del Departamento de Energía en el Laboratorio Nacional Lawrence Livermore para resúmenes de documentos e investigaciones generales. Reuters Encontré 140 entradas relacionadas con Microsoft y OpenAI, mientras que mi breve revisión encontró al menos 10 entradas para Anthropic y docenas para Gemini de Google.

Las listas son una medida incompleta y desigual de la adopción gubernamental. Se enumeran muchos más ejemplos sin un proveedor específico, y está claro que no existe una definición universal de lo que se considera IA. Los datos tampoco capturan a las agencias de inteligencia ni al Pentágono, donde xAI obtuvo un contrato de 200 millones de dólares el año pasado y recientemente recibió autorización para operar en redes clasificadas después de la inclusión de Anthropic en la lista negra.

Aún así, las cosas no pintan bien para Grok. Aparece mucho menos que sus rivales, y cuando aparece, es principalmente para trabajo administrativo básico, algo que no corresponde al modelo de frontera de clase mundial del que Musk ha pasado años alardeando.

«Simplemente no es el mejor modelo que existe».

personas que hablaron con Reuters sugirió que la explicación era simple: Grok no es tan bueno como sus rivales. «Simplemente no es el mejor modelo que existe», dijo una fuente anónima del Pentágono, añadiendo que el personal tiende a preferir Gemini o Claude. Las tablas de clasificación públicas que clasifican los modelos de IA dan peso a esa opinión. Anthropic, Google y OpenAI dominan los primeros puestos, mientras que Grok rara vez se sitúa entre los 10 primeros fuera de la categoría ocasional de imágenes o vídeos.

Esto es incómodo para Musk, y aún más incómodo para SpaceX, que absorbió xAI a principios de este año. La presentación de la oferta pública inicial de la empresa de cohetes muestra que la compañía ha puesto a la IA, y específicamente a Grok, en el centro de su propuesta ante los inversores. SpaceX afirma haber identificado “el mercado total abordable procesable más grande de la historia de la humanidad”: una asombrosa oportunidad de 28,5 billones de dólares, aunque, lamentablemente, no ofrece un calendario para llegar allí. Prácticamente todo este valor estimado proviene de la IA, en particular de la IA empresarial, no de cohetes ni satélites.

Reuters señala que el desempeño de Grok en agencias gubernamentales también podría indicar qué tan bien le va en otros lugares de trabajo. Como parte del impulso de xAI para los clientes empresariales, se informa que Musk ha obligado a los bancos a comprar suscripciones de Grok si desean participar en la oferta pública inicial de SpaceX, pero si no obtienen el valor de su dinero, estos acuerdos podrían ser una solución a corto plazo.

Como si su triste desempeño no fuera lo suficientemente incómodo, Musk admitió recientemente que xAI ha utilizado los modelos de OpenAI para ayudar a entrenar y mejorar a Grok. El proceso, conocido como destilación, es estándar cuando las empresas utilizan sus propios modelos, pero mucho más polémico cuando implica utilizar el sistema de un rival. Grok ni siquiera puede vencer a los modelos con los que entrena.

En su versión pública para el consumidor, Grok es deliberadamente desagradable. Musk ha calificado el chatbot como una alternativa menos sesgada y menos censurada a herramientas como ChatGPT, pero eso se traduce en un producto con estándares probatorios laxos, una obsesión enfermiza con Musk y un largo historial de resultados ofensivos, conspirativos y sexualizados. Incluso si las barreras de seguridad en el lugar de trabajo son diferentes, puede que no sea el tipo de cosa que una empresa agradecería. El ilustre historial de Grok incluye elogiar a Adolf Hitler, arrojar dudas sobre el número de muertos en el Holocausto, colocar millones de deepfakes sexualizados no consensuados en todo X, incluidos los de niños, y potenciar una imitación racista y transfóbica de Wikipedia y una picante novia de anime. Y no olvidemos la época en que se llamó a sí mismo “MechaHitler”. Si Grok fuera un empleado humano, creo que RR.HH. no tardaría en involucrarse.

SpaceX parece entender el problema. En su presentación, la compañía advirtió que los modos «picantes» o «desquiciados» de Grok conllevan «mayores riesgos», incluidos daños a la reputación, escrutinio regulatorio y demandas. En lenguaje corporativo: este chatbot hará que nos demanden.

En lenguaje corporativo: este chatbot hará que nos demanden.

Grok toma su nombre del proyecto de Robert A. Heinlein. Extraño en tierra extrañadonde aproximadamente significa una comprensión profunda y profunda de algo. Lo que hay que entender aquí no es particularmente complejo: Musk ha gastado miles de millones en la construcción de un chatbot que no es muy bueno, no es muy popular y de alguna manera es clave para justificar la valoración astronómica de SpaceX. Buena suerte con eso.

Seguir temas y autores de esta historia para ver más como esto en el feed personalizado de su página de inicio y recibir actualizaciones por correo electrónico.




Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here