El nuevo modelo de Claude es más ‘honesto’ cuando se equivoca


Anthropic lanzará Claude Opus 4.8 el jueves y la compañía promociona la «honestidad» del modelo.

Según Anthropic, entrena “a todos [its] «Los modelos deben ser honestos, por ejemplo, para evitar hacer afirmaciones que no pueden respaldar». Pero señala que “un problema general con los modelos de IA es que a veces sacan conclusiones precipitadas, presentando con seguridad que su trabajo avanza a pesar de la escasa evidencia”.

El laboratorio de IA afirma que los primeros evaluadores descubrieron que Opus 4.8 «es más probable que señale incertidumbres sobre su trabajo y menos probable que haga afirmaciones sin fundamento». En las evaluaciones de la compañía, Opus 4.8 tiene «aproximadamente 4 veces menos probabilidades que su predecesor de permitir que las fallas en el código que está escrito pasen desapercibidas».

Además de las mejoras en honestidad, con Opus 4.8, los usuarios pueden dirigir la cantidad de esfuerzo que Claude pone en una tarea. Las respuestas de mayor esfuerzo utilizarán más tokens, lo que brindará a los usuarios la opción de respuestas de menor esfuerzo si no quieren superar sus límites de velocidad tan rápido.

Anthropic también está lanzando una función llamada «flujos de trabajo dinámicos» en la vista previa de la investigación, que según la compañía permitirá a Claude «asumir tareas aún más grandes». Con flujos de trabajo dinámicos, «Claude puede planificar el trabajo y luego ejecutar cientos de subagentes paralelos en una sola sesión (y con Opus 4.8, los agentes pueden funcionar durante incluso más tiempo). Luego verifica sus resultados antes de informar al usuario».



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here