¿Y si están usando fotos de su hijo para entrenar una inteligencia artificial?

Una investigación revela que una herramienta ha procesado sin permiso imágenes de niños brasileños y australianos. Los expertos no descartan que pueda pasar también en Europa

La mitad de la humanidad recibió el pasado 22 de mayo un email que no pasó desapercibido. Facebook, que tiene más de 3.000 millones de usuarios activos mensuales, e Instagram, que atesora otros 2.000 (aunque probablemente parte de ellos tengan también Facebook), informaron a sus usuarios de que sus datos serían usados para entrenar los modelos de inteligencia artificial (IA) en los que trabaja Meta, la empresa matriz de estas redes sociales.

Meta habilitó una forma para que quienes quisieran pudiesen ejercer su derecho a no participar en ese juego. Sin embargo, el proceso era farragoso y, en ocasiones, no daba resultado. La autoridad de protección de datos de Irlanda, país en el que tiene su sede europea, pidió a la compañía fundada por Mark Zuckerberg que congelase su iniciativa. Finalmente, Meta cedió y lo paralizó en Europa el 14 de junio.

Cuatro días antes, la ONG Humans Rights Watch (HRW) publicó una investigación en la que revelaba que se estaban usando fotografías de menores sacadas de internet sin consentimiento alguno para entrenar “poderosas herramientas de IA”. El repositorio de imágenes LAION-5B, al que recurren varios desarrolladores para alimentar sus bases de datos, “contiene enlaces a fotos identificables de niños brasileños”, aseguraba la ONG. “Los nombres de algunos de ellos figuran en el pie de foto o en la URL donde está almacenada la imagen. En muchos casos, sus identidades son fácilmente rastreables, incluida la información sobre cuándo y dónde estaba el niño en el momento en que se tomó la foto”, concluye HRW.

La organización detectó al menos 170 fotos de menores brasileños introducidas en la base de datos sin permiso. Tras el aviso de HRW, LAION-5B reconoció que tenían esas imágenes y procedió a retirarlas de su repositorio. “Los niños no deben vivir con el temor de que les roben sus fotos y las utilicen en su contra”, dijo Hye Jung Han, investigadora de HRW especializada en infancia y tecnología. Poco después, Hye encontró 190 fotos de niños y niñas australianas introducidas también en LAION-5B sin el consentimiento de sus padres. Algunas de ellas habían sido sacadas de YouTube.

¿Son Brasil y Australia casos aislados? El análisis de Hye invita a pensar que no. Solo examinó unas 5.000 imágenes de niños de cada país, lo que supone en torno al 0,0001% del repositorio LAION-5B. “No nos consta que en Europa se utilicen imágenes de niños en el entrenamiento de IA. Sin embargo, es muy probable que esas imágenes se estén recopilando y utilizando en modelos de IA en nuestro continente”, señala Felix Mikolasch, abogado especializado en protección de datos de NOYB (acrónimo de None of Your Business, no es asunto tuyo), una organización austriaca dedicada a defender los derechos digitales de los ciudadanos europeos.

¿Qué tipo de consentimiento se requiere para poder usar fotos de niños? “Los menores de 14 años no pueden prestar un consentimiento válido a esos efectos. Por debajo de esa edad hace falta el consentimiento de ambos padres, del tutor o similar”, explica Jorge García Herrero, abogado especializado en protección de datos.

“Los modelos no memorizan imágenes, solo aprenden los patrones matemáticos subyacentes para fabricar imágenes sintéticas precisas a las de la base de datos de entrenamiento”, precisa García Herrero, que es delegado de protección de datos (la figura que vela por el cumplimiento de la normativa) de una empresa que tiene un importante banco de imágenes. “Si haces bien las cosas, pides el consentimiento a los modelos menores o a sus padres para el uso de la imagen y eliminas el contexto de las fotos”, dice en referencia a los metadatos (como la fecha o el lugar en que se hizo la foto) que puedan ayudar a identificar a los sujetos.

¿Qué debemos hacer si descubrimos la foto de algún conocido en uno de estos repositorios? “Los ciudadanos pueden solicitar su supresión directamente. También pueden dirigirse a la AEPD. Además, existe la posibilidad de reclamar daños y perjuicios ante los tribunales”, indica Mikolasch.

Denuncias a Meta

Horas después de que Meta mandara el correo electrónico a todos los usuarios de Instagram y Facebook diciéndoles que la compañía quería usar sus datos para entrenar su IA, el abogado Luis Gervás de la Pisa puso dos denuncias. Una ante la Agencia Española de Protección de Datos (AEPD), y la otra ante la autoridad de Irlanda. “La medida vulnera mi derecho de acceso y de supresión. Es decir, quiero saber si efectivamente se usan mis datos para esa tarea y no me están pidiendo consentimiento para hacer lo que dicen que quieren hacer”, señala. Las denuncias están ahora paradas, en tanto que Meta decidió congelar su decisión.

La organización NOYB, por su parte, presentó otras 11 denuncias ante las autoridades de protección de datos de varios países de la UE. “Meta está diciendo básicamente que puede utilizar cualquier dato de cualquier fuente para cualquier propósito y ponerlo a disposición de cualquier persona en el mundo, siempre y cuando se haga mediante tecnología de IA. Esto es claramente lo contrario a cumplir el Reglamento General de Protección de Datos”, dijo entonces el abogado Max Schrems, fundador de NOYB.

Facebook e Instagram no son las únicas redes sociales que quieren aprovechar los datos de sus usuarios para entrenar las IA de su matriz. X, la antigua Twitter, también lo hace por defecto. Quienes no quieran que sus tuits y mensajes privados sirvan para entrenar a Grok, la herramienta de IA generativa de Elon Musk, tienen que desactivar esa función (que está activada por defecto) en la configuración de la plataforma.