Una nueva startup de inteligencia artificial llamada Perplexity está siendo acusada de acceder y extraer contenido de sitios web que han dejado claro que no quieren ser “raspados”. Según Cloudflare, una empresa que proporciona infraestructura de internet, Perplexity ha ignorado las restricciones y ha ocultado sus actividades de rastreo.
Cloudflare informó que Perplexity ha estado tratando de eludir las preferencias de los sitios web al cambiar la forma en que se identifica en línea. Esto significa que la startup modifica su “agente de usuario”, que es una señal que indica qué tipo de dispositivo está utilizando una persona para visitar un sitio. También ha cambiado sus redes para evitar ser detectada.
La investigación de Cloudflare reveló que esta actividad se ha observado en decenas de miles de dominios y millones de solicitudes por día. Utilizando técnicas de aprendizaje automático, Cloudflare pudo identificar a este rastreador.
Un portavoz de Perplexity, Jesse Dwyer, desestimó las afirmaciones de Cloudflare, calificándolas de “estrategia de ventas” y afirmó que las capturas de pantalla mostradas no demuestran que se haya accedido a contenido. Además, Dwyer aseguró que el bot mencionado no pertenece a su empresa.
Cloudflare notó el comportamiento después de que varios de sus clientes se quejaron de que Perplexity estaba accediendo a sus sitios, incluso después de que implementaron reglas para bloquear a los bots de Perplexity. Tras realizar pruebas, Cloudflare confirmó que Perplexity estaba eludiendo estas restricciones.
Cloudflare también ha tomado medidas para bloquear a los bots de Perplexity y ha lanzado un mercado donde los propietarios de sitios web pueden cobrar a los raspadores de IA que visitan sus páginas. El CEO de Cloudflare, Matthew Prince, ha expresado su preocupación por cómo la inteligencia artificial está afectando el modelo de negocio de internet, especialmente para los editores.
Esta no es la primera vez que Perplexity enfrenta acusaciones de raspado no autorizado. El año pasado, medios como Wired acusaron a la empresa de plagiar su contenido. En una entrevista, el CEO de Perplexity no pudo proporcionar una definición clara de plagio cuando se le preguntó.


