
Stability AI acaba de revelar el lanzamiento de Stable Diffusion 2.0, la nueva y optimizada versión de su modelo de generación de imágenes de código abierto. La comunidad de programadores en inteligencia artificial sigue esforzándose por un futuro que se llene de creatividad y comunicación.
Específicamente, son Robin Rombach y Katherine Crowson quienes están al frente de este nuevo proyecto para potenciar las capacidades del modelo del que dependen herramientas como Dreamstudio o Wepik.
Stable Diffusion 2.0, mejoras y nuevas funcionalidades
Al igual que su predecesor, Stable Diffusion 2.0 será de código abierto. La intención de Stability AI es fomentar el acceso a esta tecnología de vanguardia, brindando a las personas la oportunidad de aprovechar y explorar su propio potencial y habilidades. Como ellos mismos han manifestado «cuando millones de individuos tienen en sus manos estos modelos, colectivamente crean cosas realmente impresionantes«.
Esta nueva versión incluye nuevas características como el depth2img, que es capaz de generar imágenes con mayor calidad o mejorar su resolución, entre otras funciones.
Nuevos modelos de conversión de texto a imagen
Para entrenar esta versión actualizada de Stable Diffusion, se ha implementado un nuevo codificador de texto denominado OpenCLIP, desarrollado conjuntamente por Stability AI y LAION. Esta innovadora tecnología ha contribuido a alcanzar una mayor calidad en las imágenes creadas por la herramienta. Con el modelo 2.0, será posible generar imágenes con resoluciones estándar de 512×512 píxeles y 768×768 píxeles.
Superresolución
Otra de las características novedosas es la inclusión del modelo Upscaler Diffusion, que optimiza la resolución de las imágenes. Ahora será factible crear imágenes con resoluciones superiores a 2048×2048 píxeles. Además, será posible, por ejemplo, transformar una imagen de baja resolución (128×128) en una de mayor resolución (512×512).
Profundidad a partir de una imagen inicial
Depth2img es el nombre que se le ha asignado al nuevo modelo de difusión guiado por profundidad. Este permite extender las características de una imagen ya existente, facilitando la creación de nuevas obras al mismo tiempo que se conserva parte de la información y el sentido de la fuente original.
Modelo de pintura de interiores guiada por texto
Gracias a esta característica es posible alterar elementos de una composición de forma rápida y eficiente. Así podrás utilizar una imagen para crear distintos contextos o realizar los cambios que desees.
Desde Stability AI han comunicado que en los días venideros incorporarán Stable Diffusion 2.0 en Dreamstudio y en su plataforma oficial. Mientras tanto, tienes la oportunidad de disfrutarlo descargándolo e instalándolo en tu computadora siguiendo unos simples pasos.
Imagen: generada en Dreamstudio bajo la descripción «Un alienígena verde conduciendo una nave espacial, pintura mate en tendencia en artistation HQ»