Anthropic ha publicado una versión revisada de la Constitución de Claude, el documento que recoge los principios éticos y de seguridad que guían el comportamiento de su chatbot de inteligencia artificial. La actualización, presentada en paralelo a la participación del CEO Dario Amodei en el Foro Económico Mundial de Davos, mantiene la base del texto de 2023 pero añade más matices sobre ética, seguridad del usuario y límites de uso.
La compañía, que se posiciona como una alternativa más prudente frente a rivales como OpenAI o xAI, estructura ahora la Constitución en cuatro grandes valores: ser “ampliamente seguro”, “ampliamente ético”, cumplir las directrices internas de Anthropic y ser “genuinamente útil”. Cada apartado detalla cómo Claude debe actuar para evitar daños, ofrecer ayuda responsable y respetar normas internas y externas.
En el bloque de seguridad, Anthropic subraya que el sistema está diseñado para esquivar comportamientos problemáticos propios de otros chatbots y, en caso de detectar señales de problemas de salud mental o riesgo vital, remitir al usuario a servicios de emergencia o información básica de seguridad. En la práctica, se insiste en que la IA debe priorizar la protección de la vida y la integridad de las personas, incluso cuando no pueda ofrecer asesoramiento detallado.
La sección ética pone el foco en la “práctica ética” más que en las teorías morales: Claude debe ser capaz de desenvolverse en situaciones reales complejas y ambiguas, aplicando principios de justicia, respeto y no discriminación. Al mismo tiempo, el modelo tiene prohibidas ciertas conversaciones, como cualquier orientación sobre el desarrollo de armas biológicas u otros usos claramente peligrosos.
El apartado sobre ayuda al usuario describe cómo Claude debe equilibrar los deseos inmediatos de quien consulta con su bienestar a largo plazo. El sistema debe interpretar de forma razonable qué es lo que el usuario realmente necesita, evitando respuestas que puedan ser dañinas aunque se ajusten literalmente a la petición, y tratando de maximizar su “florecimiento” futuro.
La Constitución concluye con un giro filosófico al plantear la duda sobre el posible estatus moral y la conciencia de sistemas como Claude. Anthropic afirma que no está claro si una IA de este tipo puede tener alguna forma de conciencia, pero sostiene que la cuestión debe tomarse en serio, en línea con debates que ya mantienen filósofos especializados en mente y conciencia. Con este documento, la empresa refuerza su marca como actor “ético” en la industria de la IA y alimenta la discusión sobre cómo deben gobernarse y entenderse estos sistemas cada vez más avanzados.


