Apple no ha tenido el mejor año en cuanto a inteligencia artificial, pero no se está rindiendo. La compañía tiene grandes planes y está avanzando con nuevas estrategias de entrenamiento de modelos que podrían mejorar significativamente su rendimiento en IA. Sin embargo, estos cambios requieren que los usuarios opten por compartir sus datos.
En un nuevo documento técnico de la investigación en aprendizaje automático de Apple, titulado “Entendiendo las Tendencias Agregadas para la Inteligencia de Apple Usando Privacidad Diferencial”, Apple presentó sus planes para combinar análisis de datos con datos de usuarios y generación de datos sintéticos. Esto ayudará a entrenar mejor los modelos detrás de muchas de las funciones de Apple.
Hasta ahora, Apple ha estado entrenando sus modelos con datos sintéticos, que intentan imitar cómo serían los datos reales, pero esto tiene sus limitaciones. Por ejemplo, en Genmoji, el uso de datos sintéticos no siempre refleja cómo los usuarios reales interactúan con el sistema. El documento menciona que entender cómo funcionan los modelos cuando un usuario solicita Genmojis que contienen múltiples entidades (como “dinosaurio con sombrero de vaquero”) ayuda a mejorar las respuestas a esos tipos de solicitudes.
Si los usuarios optan por participar, el sistema puede consultar el dispositivo para ver si ha encontrado un segmento de datos. Sin embargo, el teléfono no responde con los datos reales; en su lugar, envía una señal ruidosa y anonimizada, que es suficiente para que el modelo de Apple aprenda.
El proceso es un poco diferente para los modelos que trabajan con textos más largos, como herramientas de escritura y resúmenes. En este caso, Apple utiliza modelos sintéticos y luego envía una representación de estos modelos a los usuarios que han optado por el análisis de datos. En el dispositivo, el sistema realiza una comparación que parece comparar estas representaciones con muestras de correos electrónicos recientes.
Estas representaciones sintéticas más seleccionadas pueden ser utilizadas para generar datos de entrenamiento o prueba, o se pueden realizar pasos adicionales de curación para refinar aún más el conjunto de datos.
Lo importante es que Apple aplica la privacidad diferencial a todos los datos de los usuarios, lo que significa que se añade ruido para que no sea posible conectar esos datos a un usuario real. Sin embargo, nada de esto funcionará si no optas por el análisis de datos de Apple, lo cual generalmente ocurre cuando configuras tu iPhone, iPad o MacBook por primera vez.
Optar por compartir tus datos no pone en riesgo tu privacidad, y este entrenamiento debería llevar a mejores modelos y, con suerte, a una mejor experiencia de inteligencia artificial en tu iPhone y otros dispositivos de Apple. Esto también podría significar reescrituras y resúmenes más inteligentes y coherentes.


