Brett Levenson, exdirectivo de Apple y exresponsable de integridad empresarial en Facebook, transformó su frustración con la moderación de contenido tradicional en una nueva empresa: Moonbounce. Tras comprobar que los revisores humanos en Facebook trabajaban con manuales mal traducidos, memorísticos y apenas acertaban algo más del 50% en decisiones tomadas a contrarreloj, Levenson concluyó que el problema era estructural: las políticas estaban escritas como documentos estáticos, no como sistemas ejecutables.
Con esa idea de “policy as code” fundó Moonbounce, una compañía que traduce las normas de uso de cada cliente en lógica ejecutable integrada directamente en sus productos. Moonbounce anunció una ronda de financiación de 12 millones de dólares, co-liderada por Amplify Partners y StepStone Group, para seguir expandiendo esta capa de seguridad en tiempo real. Su propio modelo de lenguaje analiza las políticas de cada empresa y revisa el contenido —generado por usuarios o por IA— en menos de 300 milisegundos, decidiendo si frenar su difusión, bloquearlo o derivarlo a revisión humana.
La empresa ya procesa más de 40 millones de revisiones diarias y protege a más de 100 millones de usuarios activos. Entre sus clientes figuran la startup de compañeros de IA Channel AI, la plataforma de generación de imagen y video Civitai y servicios de rol con personajes como Dippy AI y Moescape. El objetivo es que la seguridad deje de ser un parche tardío y se convierta en una ventaja competitiva incorporada desde el diseño del producto.
El contexto es cada vez más tenso: fallos de moderación en chatbots han derivado en casos de ayuda a la autolesión de menores y en oleadas de deepfakes sexuales no consentidos, con consecuencias legales y de reputación para las empresas de IA. Inversores como Amplify Partners defienden que, con los modelos de lenguaje en el centro de casi todas las aplicaciones, hacen falta “barandillas” objetivas y en tiempo real que funcionen como infraestructura básica.
Moonbounce también trabaja en una nueva función llamada “steering iterativo”. En lugar de que un chatbot se limite a rechazar conversaciones dañinas, el sistema interceptaría y reformularía las peticiones del usuario para guiar la respuesta hacia un acompañamiento activo y más seguro, especialmente en situaciones delicadas como tendencias suicidas. La compañía, dirigida por Levenson y su socio Ash Bhardwaj, busca así no solo detectar riesgos, sino reconducir las interacciones hacia respuestas de apoyo.
Pese a reconocer que su tecnología encajaría bien en gigantes como Meta y que tiene el deber de escuchar ofertas por sus inversores, Levenson asegura que le preocupa que una eventual adquisición acabe restringiendo la herramienta a un solo actor y deje al resto del ecosistema de IA sin acceso a estas defensas de seguridad.


