Anthropic dice que desconectará Claude Fable 5 para cumplir con la orden del gobierno de EE. UU.


Antrópico dice que es deshabilitar dos modelos de IA que lanzó a principios de esta semana, Claude Fable 5 y Mythos 5, para cumplir con una directiva de control de exportaciones que recibió el viernes por la tarde del gobierno de EE. UU. citando preocupaciones de seguridad nacional.

El incidente sin precedentes marca el último punto crítico entre Anthropic y la administración Trump. Si bien la compañía dice que la orden le pedía suspender el acceso a “cualquier ciudadano extranjero, ya sea dentro o fuera de los Estados Unidos, incluidos los empleados extranjeros de Anthropic”, ha eliminado el acceso a todos sus clientes para garantizar el cumplimiento.

A principios de este año, el Departamento de Defensa de Trump calificó a Anthropic como un «riesgo para la cadena de suministro» después de que el fabricante de Claude intentara trazar líneas rojas sobre cómo el ejército estadounidense podría usar su tecnología. La designación prohibió efectivamente a las agencias gubernamentales y a los contratistas utilizar la tecnología de Anthropic. Anthropic respondió presentando demandas contra la administración Trump.

El martes, Anthropic lanzó públicamente Claude Fable 5, una versión del modelo Mythos AI de la compañía con salvaguardas que le impiden responder preguntas sobre ciberseguridad, biología y química. Antes del lanzamiento público, que Anthropic dijo que había realizado en colaboración con el gobierno de EE. UU., el modelo Mythos Preview AI tuvo un lanzamiento limitado en abril. El objetivo era brindar a las empresas y organizaciones la oportunidad de utilizar sus poderosas capacidades de ciberseguridad para mejorar sus defensas y aliviar las preocupaciones de que la tecnología pudiera ser explotada por malos actores para desarrollar poderosas herramientas de piratería.

En una publicación de blog del viernes, Anthropic dice que recibió una carta del gobierno de EE. UU. a las 5:21 p.m. ET. «La carta no proporcionó detalles específicos de su preocupación por la seguridad nacional», escribió Anthropic.

«Tenemos entendido que el gobierno cree que se ha dado cuenta de un método para eludir o ‘hacer jailbreak’ a Fable 5», añadió la empresa. «Revisamos una demostración de esta técnica específica que se utiliza para identificar una pequeña cantidad de vulnerabilidades menores previamente conocidas. Todas estas vulnerabilidades parecen relativamente simples, y hemos descubierto que otros modelos disponibles públicamente también pueden descubrirlas sin necesidad de omitirlas».

En la publicación del blog, la compañía argumentó que ha implementado fuertes medidas de seguridad para reducir la probabilidad de uso indebido de Claude Fable 5. Anthropic también afirmó que el jailbreak que el gobierno de EE. UU. encontró para Claude Fable 5 era limitado y no habría hecho que un atacante fuera significativamente más peligroso de lo que lo habría sido con otro modelo de IA.

«Hasta la fecha, el gobierno sólo nos ha dado evidencia verbal de un posible jailbreak limitado y no universal, que esencialmente consiste en pedirle al modelo que lea una base de código específica y corrija cualquier falla de software», dijo la compañía en su blog. «Tenemos entendido que una posible fuga fue compartida con el gobierno».

Los portavoces de la Casa Blanca y el Departamento de Comercio de Estados Unidos no respondieron de inmediato a la solicitud de comentarios de WIRED.

El director ejecutivo de Anthropic, Dario Amodei, dijo en un ensayo de política a principios de esta semana que él y la compañía apoyan un proceso gubernamental justo, estructurado y transparente que bloquearía la liberación de modelos de IA inseguros. En la publicación del blog de la compañía el viernes, Anthropic argumentó que «esta acción no se adhiere a esos principios».



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here