El generador de imágenes por IA de Meta ha sido entrenado con 1.100 millones de fotos de Instagram
Meta, la empresa matriz de Facebook e Instagram, ha dado un paso significativo en el mundo de la inteligencia artificial con el lanzamiento de su sitio web gratuito de generación de imágenes, «Imagine with Meta AI» (no disponible en España por el momento).
Esta plataforma, basada en el modelo de síntesis de imágenes Emu, utiliza una asombrosa cantidad de 1.100 millones de imágenes públicamente visibles de Facebook e Instagram para entrenar su modelo de inteligencia artificial.
Lo fascinante de esta herramienta es su capacidad para generar imágenes a partir de un simple texto descriptivo. Anteriormente, la tecnología similar de Meta solo estaba disponible en aplicaciones de mensajería y redes sociales como Instagram. Ahora, con «Imagine with Meta AI», cualquier persona puede acceder a esta experiencia de generación de imágenes de manera independiente.
El proceso de entrenamiento de este modelo AI plantea algunas reflexiones interesantes sobre la privacidad y el uso de datos en la era digital. Como se dice comúnmente, «si no pagar por el producto, entonces tú eres el producto2.
En este caso, las imágenes públicas compartidas en plataformas como Instagram y Facebook formaron parte del conjunto de datos utilizado para el entrenamiento del modelo. Sin embargo, Meta asegura que solo emplea imágenes públicas para el entrenamiento, lo que implica que configurar la privacidad de tus fotos en estas redes sociales podría evitar que sean incluidas en futuros modelos de IA.
La generación de imágenes con «Imagine with Meta AI» requiere una cuenta de Meta, que puede vincularse desde una cuenta existente de Facebook o Instagram. Cada sesión de generación produce cuatro imágenes de 1280×1280 píxeles, las cuales pueden guardarse en formato JPEG. Estas imágenes incluyen un pequeño logotipo de «Imaginado con IA» en la esquina inferior izquierda.
Es importante destacar que este modelo de Meta, aunque capaz de crear imágenes fotorrealistas, presenta limitaciones en la renderización de texto y en la manipulación de diferentes medios como acuarelas, bordados y dibujo a tinta.
Emu, el modelo AI detrás de esta herramienta de Meta, se destaca por su enfoque en la «alineación estética» en lugar de depender de grandes cantidades de pares de imágenes y texto para su entrenamiento. Su capacidad para generar imágenes de alta calidad se basa en un proceso llamado «ajuste de calidad», utilizando un conjunto de imágenes visualmente atractivas después de una fase inicial de pre-entrenamiento.