A principios de este mes, Adrian Holovaty, fundador de la plataforma de enseñanza musical Soundslice, resolvió un misterio que lo había estado preocupando durante semanas. Imágenes extrañas de sesiones de ChatGPT seguían siendo subidas al sitio. Al investigar, se dio cuenta de que ChatGPT se había convertido en uno de los mejores promotores de su empresa, pero también estaba engañando a la gente sobre lo que su aplicación podía hacer. Holovaty es conocido por ser uno de los creadores del proyecto de código abierto Django, un popular marco de desarrollo web en Python, aunque dejó de gestionar el proyecto en 2014. En 2012, lanzó Soundslice, que sigue siendo “orgullosamente autofinanciada”, según cuenta. Actualmente, se enfoca en su carrera musical tanto como artista como fundador.
Soundslice es una aplicación para enseñar música, utilizada por estudiantes y profesores. Se destaca por su reproductor de video sincronizado con las notaciones musicales que guían a los usuarios sobre cómo deben tocar las notas. También ofrece una función llamada “escáner de partituras” que permite a los usuarios subir una imagen de una partitura en papel y, utilizando inteligencia artificial, la convierte automáticamente en una partitura interactiva, completa con notaciones. Holovaty supervisa cuidadosamente los registros de errores de esta función para identificar problemas y áreas de mejora. Fue en este contexto donde comenzó a notar las sesiones de ChatGPT subidas.
Estas imágenes generaban numerosos registros de errores. En lugar de imágenes de partituras, eran imágenes de palabras y un cuadro de símbolos conocido como tablatura ASCII, un sistema básico de notación textual utilizado para guitarras que emplea un teclado normal. La cantidad de estas imágenes de sesiones de ChatGPT no era tan abrumadora como para costarle dinero a su empresa por almacenarlas o afectar el ancho de banda de su aplicación. Holovaty se mostró confundido y escribió sobre la situación en un blog. “Nuestro sistema de escaneo no estaba diseñado para soportar este estilo de notación. ¿Por qué, entonces, estábamos siendo bombardeados con tantas capturas de pantalla de tablaturas ASCII de ChatGPT? Estuve desconcertado durante semanas, hasta que experimenté con ChatGPT yo mismo”.
Así fue como vio que ChatGPT decía a la gente que podían escuchar esta música abriendo una cuenta en Soundslice y subiendo la imagen de la sesión de chat. Sin embargo, eso no era cierto; subir esas imágenes no traduciría la tablatura ASCII en notas de audio. Se enfrentó a un nuevo problema. “El principal costo era reputacional: nuevos usuarios de Soundslice entraban con una expectativa falsa. Les habían dicho con confianza que haríamos algo que en realidad no hacemos”, explicó a TechCrunch. Él y su equipo discutieron sus opciones: colocar avisos en el sitio que dijeran “No, no podemos convertir una sesión de ChatGPT en música audible” o desarrollar esa función en el escáner, aunque nunca antes había considerado soportar ese sistema de notación musical poco convencional. Finalmente, optó por desarrollar la función. “Mis sentimientos al respecto son contradictorios. Estoy feliz de añadir una herramienta que ayude a la gente. Pero siento que nuestra mano fue forzada de una manera extraña. ¿Deberíamos realmente desarrollar funciones en respuesta a la desinformación?”, escribió. También se preguntó si este era el primer caso documentado de una empresa que tuvo que desarrollar una función porque ChatGPT seguía repitiendo, a muchas personas, su alucinación al respecto. Otros programadores en Hacker News tuvieron una opinión interesante al respecto: varios dijeron que no era diferente a un vendedor humano demasiado entusiasta prometiendo el mundo a los prospectos y luego forzando a los desarrolladores a entregar nuevas funciones. “¡Creo que esa es una comparación muy acertada y divertida!”, coincidió Holovaty.


