, Forma parte de la Historia

En enero de 2021, el consorcio OpenAI, fundado por Elon Musk y respaldado financieramente por Microsoft, presentó su proyecto más ambicioso hasta la fecha, el sistema de aprendizaje automático DALL-E. Esta ingeniosa IA multimodal era capaz de generar imágenes (aunque bastante caricaturescas) basadas en los atributos descritos por un usuario: piense en «un gato hecho de sushi» o «una radiografía de un carpincho sentado en un bosque». El miércoles, el consorcio dio a conocer la próxima iteración de DALL-E que cuenta con una resolución más alta y una latencia más baja que el original.

IA abierta

El primer DALL-E (un acrónimo de «Dalí», como en el artista, y «WALL-E», como en el personaje animado de Disney) podía generar imágenes, así como combinar múltiples imágenes en un collage, proporcionar diferentes ángulos de perspectiva , e incluso inferir elementos de una imagen, como efectos de sombreado, a partir de la descripción escrita.

«A diferencia de un motor de renderizado 3D, cuyas entradas deben especificarse sin ambigüedades y con todo detalle, DALL·E a menudo puede ‘llenar los espacios en blanco’ cuando el pie de foto implica que la imagen debe contener un cierto detalle que no se indica explícitamente». escribió el equipo de OpenAI en 2021.

IA abierta

DALL-E nunca tuvo la intención de ser un producto comercial y, por lo tanto, sus capacidades estaban algo limitadas, dado que el equipo de OpenAI se centró en él como una herramienta de investigación. desinformación. Su secuela se ha protegido de manera similar con imágenes potencialmente objetables eliminadas de forma preventiva de sus datos de entrenamiento y una marca de agua que indica que es una imagen generada por IA aplicada automáticamente. Además, el sistema evita activamente que los usuarios creen imágenes basadas en nombres específicos. Lo siento, la gente se pregunta cómo sería «Christopher Walken comiendo un churro en la Capilla Sixtina».

Te puede interesar  Necesitarás Apple Music para escuchar los álbumes de J. Cole en audio espacial

DALL-E 2, que utiliza el sistema de reconocimiento de imágenes CLIP de OpenAI, se basa en esas capacidades de generación de imágenes. Los usuarios ahora pueden seleccionar y editar áreas específicas de imágenes existentes, agregar o eliminar elementos junto con sus sombras, combinar dos imágenes en un solo collage y generar variaciones de una imagen existente. Además, las imágenes de salida son cuadrados de 1024 px, frente a los avatares de 256 px que generó la versión original. El CLIP de OpenAI fue diseñado para mirar una imagen dada y resumir su contenido de una manera que los humanos puedan entender. El consorcio invirtió ese proceso, construyendo una imagen a partir de su resumen, en su trabajo con el nuevo sistema.

IA abierta

«DALL-E 1 simplemente tomó nuestro enfoque GPT-3 del lenguaje y lo aplicó para producir una imagen: comprimimos imágenes en una serie de palabras y aprendimos a predecir lo que viene después», dijo Prafulla Dhariwal, científica investigadora de OpenAI. Borde.

A diferencia de la primera, con la que cualquiera podía jugar en el sitio web de OpenAI, esta nueva versión actualmente solo está disponible para que la prueben socios examinados que están limitados en lo que pueden cargar o generar con ella. Solo se pueden utilizar fuentes familiares y todo lo que involucre desnudez, obscenidad, ideología extremista o «grandes conspiraciones o eventos relacionados con importantes eventos geopolíticos en curso» está descartado. Nuevamente, lo siento por la gente que espera generar «Donald Trump montando a una Nancy Pelosi desnuda y afectada por COVID como un caballo a través del Senado de los EE. UU. el 6 de enero mientras hace un saludo nazi».

Te puede interesar  'Don't Look Up' es un grito repleto de estrellas contra el apocalipsis climático

IA abierta

La cosecha actual de evaluadores también tiene prohibido exportar sus trabajos generados a una plataforma de terceros, aunque OpenAI está considerando agregar las capacidades de DALL-E 2 a su API en el futuro. Si quieres probar DALL-E 2 por ti mismo, puede inscribirse en la lista de espera en el sitio web de OpenAI.

Todos los productos recomendados por Engadget son seleccionados por nuestro equipo editorial, independiente de nuestra empresa matriz. Algunas de nuestras historias incluyen enlaces de afiliados. Si compra algo a través de uno de estos enlaces, podemos ganar una comisión de afiliado.