Es posible que las advertencias de seguridad de Anthropic hayan resultado contraproducentes: el gobierno ha desconectado su IA más poderosa


El viernes, el gobierno de Estados Unidos ordenó a Anthropic cerrar inmediatamente el acceso a dos de sus modelos de inteligencia artificial más poderosos, Claude Fable 5 y Claude Mythos 5, citando preocupaciones de seguridad nacional. Anthropic anunció en X que había cumplido, pero dejó claro que cree que el gobierno se equivocó.

La directiva, que Anthropic dijo haber recibido el viernes a las 5:21 pm ET, obliga a la compañía a desactivar ambos modelos para todos los usuarios en todo el mundo, no solo para los extranjeros a los que nominalmente estaba dirigida la orden de control de exportaciones del gobierno. El acceso a los demás modelos de Anthropic no se ve afectado.

¿Por qué importa todo esto? Mythos es el modelo de IA más capaz de Anthropic, uno que la compañía presentó a principios de abril y que ha mantenido estrictamente restringido desde entonces debido a lo que Anthropic describió como su capacidad excepcional para encontrar vulnerabilidades de seguridad en el software. Según Anthropic, Mythos identificó fallas en todos los principales sistemas operativos y navegadores web que probó, por lo que en lugar de lanzarlo ampliamente, la compañía lanzó un programa controlado llamado Proyecto Glasswing, compartiéndolo con aproximadamente 50 organizaciones examinadas, incluidas Amazon, Apple, Google, Microsoft y CrowdStrike, para usarlo en trabajos de ciberseguridad defensiva.

Fable 5, lanzado hace apenas tres días, fue la respuesta de Anthropic a la obvia presión comercial: una versión de Mythos equipada con barreras de seguridad que bloquean las respuestas en áreas de alto riesgo como la ciberseguridad y la biología, lo que lo hace lo suficientemente seguro para su lanzamiento general, argumentó la compañía. Inmediatamente se convirtió en el modelo de IA más capaz disponible para el público, según las pruebas comparativas de Vals AI, una empresa que rastrea el desempeño de la tecnología de IA.

Créditos de imagen:Vals AI /

La directiva del gobierno se enmarca como una acción de control de exportaciones, restringiendo el acceso de ciudadanos extranjeros a los modelos. Pero en una extensa publicación de blog, Anthropic dice que entiende que la preocupación subyacente es una supuesta fuga de Fable 5. Hasta ahora, dice la compañía, el gobierno ha proporcionado solo evidencia verbal de una “posible fuga estrecha y no universal”, una que, como lo describe Anthropic, equivale a incitar al modelo a leer una base de código específica e identificar fallas de software. Y, por cierto, añade la empresa, es un «nivel de capacidad» que ya está ampliamente disponible en otros modelos de acceso público, incluido el GPT-5.5 de OpenAI. También lo utilizan habitualmente los profesionales de la ciberseguridad con fines defensivos, dice Anthropic.

El argumento más amplio de Anthropic es que sus salvaguardas más fuertes operan a través de sistemas de clasificación independientes que funcionan por separado del modelo en sí, lo que significa que incluso si alguien convence a Fable de seguir hablando después de una negativa, las protecciones subyacentes contra los resultados más peligrosos permanecen vigentes.

Claramente, nada de eso fue suficiente para impedir que el gobierno actuara, y Anthropic no oculta su frustración. «No estamos de acuerdo con que el hallazgo de un potencial de fuga limitado deba ser motivo para retirar un modelo comercial implementado a cientos de millones de personas», escribió la compañía. «Si este estándar se aplicara en toda la industria, creemos que esencialmente detendría todas las implementaciones de nuevos modelos para todos los proveedores de modelos fronterizos».

Se espera que Anthropic realice una oferta pública inicial este año y ha apostado gran parte de su identidad pública por ser la alternativa consciente de la seguridad frente a sus rivales. A los observadores no se les escapa la ironía de que la misma cautela que Anthropic mostró al restringir Mythos -que promovió como un modelo tan peligroso que no podía ser divulgado públicamente- ahora aparentemente ha atraído exactamente el tipo de escrutinio gubernamental que podría perturbar más su negocio.

Sam Altman de OpenAI debe estar disfrutando esto, al menos. En abril, le dijo a la podcaster Ashlee Vance que el manejo de Mythos por parte de Anthropic equivalía a un «marketing basado en el miedo». «Es claramente un marketing increíble decir: ‘Hemos construido una bomba. Estábamos a punto de dejarla caer sobre tu cabeza. Te venderemos un refugio antiaéreo por 100 millones de dólares'», dijo Altman. Altman, cuya empresa también se espera que realice una oferta pública inicial lo antes posible, no predijo un cierre del gobierno, pero identificó algo que ha vuelto a afectar a Anthropic por ahora, y es que cuando pasas meses diciéndole al mundo que tu IA es excepcionalmente peligrosa, el mundo (incluido el gobierno de EE. UU.) tiende a escuchar.

Cuando compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta nuestra independencia editorial.



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here