En plena polémica por el uso de cámaras inteligentes para vigilar a la población —desde la red de Flock utilizada por el servicio de inmigración de EE. UU. hasta las críticas a Ring por facilitar a la policía el acceso a grabaciones de vecindarios—, una nueva startup se abre paso en el sector prometiendo potencia tecnológica y cierto control ético.
Se trata de Conntour, una empresa de videovigilancia fundada hace menos de dos años que ha desarrollado una plataforma basada en modelos de visión y lenguaje. Su sistema permite buscar en tiempo real entre miles de cámaras de seguridad usando lenguaje natural, como si fuera un “Google” para vídeos de vigilancia: por ejemplo, localizar “a alguien con zapatillas deportivas pasando una bolsa en el vestíbulo” y obtener de inmediato los fragmentos relevantes, tanto en grabaciones como en directo.
La herramienta también genera alertas automáticas según reglas predefinidas y responde preguntas sobre lo que ocurre en las imágenes, acompañando las respuestas de texto con los vídeos correspondientes y resúmenes tipo informe de incidentes. Según la compañía, su gran ventaja es la escalabilidad: aseguran que pueden analizar hasta 50 cámaras simultáneamente con una sola GPU de consumo como la Nvidia RTX 4090, gracias a un sistema que combina varios modelos y elige en cada consulta la opción más eficiente.
Conntour ya cuenta con grandes clientes, entre ellos el Buró Central de Estupefacientes de Singapur, y afirma ser muy selectiva a la hora de decidir con quién trabaja. Su cofundador y CEO, Matan Goldner, sostiene que el tener gobiernos y grandes empresas en cartera les permite rechazar usos que consideren inmorales o ilegales, y asegura que evalúan caso por caso para mantener el control sobre cómo se usa la tecnología.
El interés inversor ha acompañado este enfoque: la startup ha cerrado una ronda semilla de 7 millones de dólares con General Catalyst, Y Combinator, SV Angel y Liquid 2 Ventures. Goldner afirma que el acuerdo se completó en apenas 72 horas, tras concentrar cerca de 90 reuniones en poco más de una semana.
No obstante, la compañía reconoce las limitaciones estructurales de la videovigilancia: si la cámara es mala o el lugar está mal iluminado, la calidad del análisis se resiente. Para ello, el sistema ofrece una puntuación de confianza en cada resultado, advirtiendo cuando la imagen de origen no permite estar seguros de la detección.
De cara al futuro, el mayor reto técnico que identifica Goldner es combinar la flexibilidad total del lenguaje natural propia de los grandes modelos de IA (LLM) con la eficiencia necesaria para procesar miles de señales de vídeo a la vez. Esa tensión entre capacidad y consumo de recursos, en un contexto de creciente preocupación por la privacidad y el control social, marcará el desarrollo de Conntour y del sector de la videovigilancia inteligente en los próximos años.


