Anthropic sigue en desacuerdo con la Casa Blanca por Claude Fable 5


funcionarios de la administración Trump concluyó las conversaciones con Anthropic el lunes sin levantar los controles de exportación que se impusieron la semana pasada a los modelos de inteligencia artificial más avanzados de la compañía en respuesta a preocupaciones sobre el jailbreak, según tres personas informadas sobre el asunto.

La administración continúa creyendo que hay formas de desactivar algunas de las barreras de seguridad en Claude Fable 5 de Anthropic, permitiendo efectivamente a los usuarios acceder a las capacidades de ciberseguridad más poderosas del modelo Mythos de la compañía, dijeron las personas.

Anthropic ha dicho durante días que las preocupaciones de la administración son exageradas, una posición que reiteró en reuniones del grupo de trabajo celebradas en el Departamento de Comercio con investigadores gubernamentales del Centro de Estándares e Innovación de IA y la Oficina del Director Cibernético Nacional, Sean Cairncross, dijo una de las personas.

A las reuniones también asistió el secretario de Comercio, Howard Lutnick, quien se comunicó mediante conferencia telefónica desde la cumbre del G7 en Evian, Francia. El propio Cairncross no participó, dijo la persona.

Por parte de Anthropic, el cofundador y director de computación Tom Brown y la jefa de asuntos externos Sarah Heck han estado liderando las discusiones. El jefe del equipo rojo fronterizo de Anthropic, Logan Graham, y el investigador senior de seguridad Nicholas Carlini volaron a Washington, DC, para las conversaciones.

«Ambas partes están trabajando rápidamente para resolver esto», dijo un portavoz de Anthropic en un comunicado a WIRED. Un portavoz de la Casa Blanca declinó hacer comentarios.

No quedó claro de inmediato cómo se desarrollarían los próximos pasos. El Departamento de Comercio expresó su voluntad de encontrar una manera de volver a poner Fable 5 en línea para uso del consumidor, pero probablemente dependería de que Anthropic resuelva completamente las preocupaciones sobre el jailbreak, dijo la persona.

Sonar la alarma

Las conversaciones de emergencia se produjeron en un momento político tenso para Anthropic, que ya estaba en una lucha prolongada con el Pentágono sobre si sus modelos de IA podrían usarse para ciertas aplicaciones militares.

La administración Trump fue alertada por primera vez sobre las preocupaciones sobre la fuga de la cárcel la semana pasada. El director ejecutivo de Amazon, Andy Jassy, ​​llamó directamente al secretario del Tesoro, Scott Bessent, sobre las supuestas vulnerabilidades, que contribuyeron a asustar a la administración, dijeron las personas. La conversación de Jassy con la administración Trump fue reportada por primera vez por The Information.

Los alarmados funcionarios de la Casa Blanca encargaron a la NSA que ayudara a revisar las vulnerabilidades. La NSA respondió que creía que era posible quitar las barreras de seguridad de Fable 5, lo que llevó a la administración a imponer restricciones al modelo.

Luego, Lutnick habló con el director ejecutivo de Anthropic, Dario Amodei, el viernes, mientras el Departamento de Comercio redactaba su carta imponiendo controles de exportación a Fable 5. Durante el fin de semana, después de que Anthropic cortara el acceso al modelo a todos los usuarios, Lutnick estuvo en múltiples llamadas con Brown y Heck, según una persona con conocimiento de los hechos.

No está claro por qué Amazon, uno de los mayores inversores en Anthropic, hizo sonar la alarma sobre Fable 5. «Como proveedor líder de nube que atiende a un gran número de clientes del sector público y privado, no es raro que los gobiernos busquen nuestro asesoramiento sobre posibles riesgos de seguridad», le dice a WIRED un portavoz de Amazon. «Cuando ocurren, no compartimos los detalles de estas discusiones».

Desconexión de seguridad

En el centro de las conversaciones entre Anthropic y la administración hay un desacuerdo sobre la gravedad de las preocupaciones sobre el jailbreak de Claude Fable 5.

En una publicación de blog del viernes, Anthropic dio a entender que las caracterizaciones que hace la administración de los riesgos potenciales son exageradas. Algunos investigadores de ciberseguridad reiteraron esta posición a los funcionarios el lunes y enviaron una carta abierta argumentando que las medidas de control de exportaciones tomadas contra Anthropic estaban injustificadas.

«Los modelos de clase Mythos de Anthropic son bastante buenos para encontrar fallas y explotar exploits. Sin embargo, no son excepcionalmente buenos en estas tareas, y muchas de las personas abajo firmantes usan regularmente otros modelos básicos y de código abierto para auditorías de seguridad y equipos rojos todos los días», se lee en la carta abierta. «Como resultado, esta acción ha quitado los mejores modelos a los defensores, ha creado incertidumbre en el mercado y ha puesto en riesgo el liderazgo de la IA de Estados Unidos sin ningún riesgo real que lo justifique».



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here