La inteligencia artificial promete marcar un antes y un después en muchas áreas, pero una en particular se está llevando casi todo el protagonismo este año. En abril hablábamos de las enormes posibilidades de DALL-E 2, una IA capaz de generar imágenes a partir de un texto. Más tarde llegaba
DALL-E Mini, un generador que nos sorprendía con sus delirantes creaciones. Ahora es el turno de
Parti, una alternativa que apuesta por un nuevo y prometedor modelo para generar imágenes fotorrealistas.
A diferencia de DALL-E y sus variantes, que utilizan un modelo de generación de imágenes desde texto de "difusión",
Parti (Pathways Autoregressive Text-to-Image) apuesta por un modelo autorregresivo que permite entradas de texto más extensas y es capaz de hacer composiciones complejas. Como podemos ver en la imagen destacada, los resultados de
Parti se parecen más a una obra de arte que a las figuras amorfas como las que nos ofrece
DALL-E Mini (imagen siguiente).
Los investigadores de
Google cuentan en una publicación de Blog que pusieron a prueba a
Parti en cuatro escalas (350M, 750M, 3B y 20B) bajo los mismos parámetros, es decir, con las mismas entradas de texto. Tras la prueba, descubrieron que la última escala sobresale especialmente en indicaciones que son abstractas, requieren conocimiento del mundo, perspectivas específicas y representación de símbolos.