El CEO de Microsoft AI, Mustafa Suleyman, dice que es «realmente peligroso» que Anthropic especule sobre la conciencia de Claude dentro de su «constitución», o las instrucciones que le dicen al modelo cómo comportarse. Durante un episodio de DescifradorSuleyman sostiene que este tipo de especulación puede haber hecho que el chatbot actuara como si fuera consciente:
Creo que es casi como si algunas de las personas de Anthropic hubieran antropomorfizado tanto el diseño de Claude que luego los hubieran manipulado y engañado haciéndoles creer que tiene estos destellos de conciencia que le pusieron en primer lugar.
Suleyman añade que “no queremos tener que lidiar con una superinteligencia que tiene ideas sobre su propio sufrimiento o ideas sobre sus propios sentimientos”.
La constitución de Claude hace referencia directa a la incertidumbre de Anthropic sobre si el modelo de IA tiene bienestar y si experimenta cosas como «satisfacción» o «malestar». Anthropic también dice que la compañía «entrevistará» los modelos de IA cuando queden obsoletos y documentará cualquier «preferencia» que tengan sobre lanzamientos futuros.
mientras está en DescifradorSuleyman llama a esto un “fracaso filosófico”, ya que Anthropic hizo de la constitución de Claude “un lugar para la especulación como lo harías en un artículo académico en lugar de un manual de capacitación”. Esto ha llevado a Claude a internalizar estas “ideas sobre sí mismo y su propia formación”, dice Suleyman.
«Esto es exactamente lo que no queremos de las IA», afirma Suleyman. «Queremos que las IA sean herramientas controlables, contenidas, responsables y alineadas que sirvan a la humanidad».



