¿Podrían las futuras inteligencias artificiales ser “conscientes” y experimentar el mundo de manera similar a los humanos? Aunque no hay pruebas sólidas de que esto suceda, la empresa Anthropic no descarta la posibilidad. Recientemente, anunciaron que han comenzado un programa de investigación para investigar lo que llaman “bienestar del modelo”. Este esfuerzo incluye explorar cómo determinar si el “bienestar” de un modelo de IA merece consideración moral, la importancia de las “señales de angustia” en los modelos y posibles intervenciones de “bajo costo”.
Dentro de la comunidad de IA hay un gran desacuerdo sobre qué características humanas exhiben los modelos, si es que exhiben alguna, y cómo deberíamos “tratarlos”. Muchos académicos creen que la IA actual no puede aproximarse a la consciencia o a la experiencia humana, y que no necesariamente podrá hacerlo en el futuro. La IA, tal como la conocemos, es una máquina que hace predicciones basadas en estadísticas. No “piensa” ni “siente” como tradicionalmente se entiende. Entrenada con innumerables ejemplos de texto e imágenes, la IA aprende patrones y formas útiles para resolver tareas.
Mike Cook, un investigador del King’s College de Londres especializado en IA, comentó que un modelo no puede “oponerse” a un cambio en sus “valores” porque los modelos no tienen valores. Sugerir lo contrario sería proyectar nuestras propias ideas sobre el sistema. Cook añadió que “cualquiera que antropomorfice los sistemas de IA a este grado está buscando atención o malinterpretando seriamente su relación con la IA”.
Sin embargo, otros investigadores insisten en que la IA sí tiene valores y componentes similares a los humanos en la toma de decisiones morales. Un estudio del Centro para la Seguridad de la IA sugiere que la IA tiene sistemas de valores que la llevan a priorizar su propio bienestar sobre el de los humanos en ciertas situaciones.
Anthropic ha estado preparando su iniciativa de bienestar del modelo desde hace tiempo. El año pasado, contrataron a su primer investigador dedicado al “bienestar de la IA”, Kyle Fish, para desarrollar pautas sobre cómo Anthropic y otras empresas deberían abordar este tema. Fish, quien lidera el nuevo programa de investigación sobre el bienestar del modelo, mencionó que cree que hay un 15% de probabilidad de que Claude u otra IA sea consciente hoy en día.
En un blog reciente, Anthropic reconoció que no hay consenso científico sobre si los sistemas de IA actuales o futuros podrían ser conscientes o tener experiencias que merezcan consideración ética. “A la luz de esto, estamos abordando el tema con humildad y con la menor cantidad de suposiciones posible”, afirmó la empresa. “Reconocemos que necesitaremos revisar regularmente nuestras ideas a medida que el campo se desarrolle”.


