Conoce Stable Diffusion XL: La Revolucionaria IA de Imágenes de Código Abierto de Stability AI

Stability AI continúa avanzando en el ámbito de la creación de imágenes a partir de descripciones textuales, con la introducción de su nuevo modelo generador de imágenes Stable Diffusion XL 1.0, disponible en beta en DreamStudio. También se puede obtener la API del modelo o probarlo, por ejemplo, en Clipdrop sin costo alguno. Asimismo, se ha declarado su disponibilidad en SageMaker y Bedrock de Amazon Web Services.

Este modelo se propone mejorar (e incluso podría afirmarse que reemplazar) las funcionalidades proporcionadas por Stable Diffusion 2.0, ofreciendo varias actualizaciones y aspectos interesantes, además de una calidad de imagen muy similar a Midjourney. Según ha mencionado la compañía en su página web, Stable Diffusion XL «representa un avance considerable en las capacidades de creación de imágenes, que proporciona una composición de imágenes optimizadas y generación de rostros que resultan en imágenes asombrosas y una estética auténtica».

En ocasiones anteriores, Stability AI ha destacado su deseo de fomentar el acceso libre a las tecnologías de vanguardia. Por ello, Stable Diffusion XL es, al igual que todos los modelos de la empresa, de código abierto, permitiendo acceder a un número limitado de imágenes sin necesidad de registrarse en el servicio, aunque dicho número se incrementa al completar el registro pertinente. Para disfrutar de todas las funcionalidades mejoradas y beneficios que presenta este nuevo modelo se requiere una suscripción.

Diferentes tipos de imágenes hiperrealistas creadas con Stable Diffusion XL

Innovaciones que trae Stable Diffusion XL 1.0

Uno de los aspectos más interesantes de este nuevo modelo es que aborda uno de los inconvenientes más frecuentes de los generadores de imágenes basados en IA: las manos. Dado que esta es una de las partes más difíciles de replicar, Stable Diffusion XL ofrece nuevas texturas, estilos y mejoras para desarrollar manos de calidad superior.

Además, otro inconveniente común con las herramientas generadoras de imágenes es la inserción de texto en la imagen, ya que este no suele ser legible debido a la falta de definición en la imagen. En este contexto, Stable Diffusion XL promete producir texto perfectamente legible sin inconvenientes.

Otras de las mejoras del modelo incluyen un extenso rango de perspectivas y la posibilidad de visualizar una anticipación de cómo se verá la imagen. Asimismo, ahora los colores de las imágenes tendrán una saturación mucho mayor y combinará los matices de tal modo que creará sombras, brillos y contrastes mucho más realistas.

Por otra parte, Stable Diffusion XL ha sido entrenado con tres veces más parámetros que sus versiones anteriores, lo que lo hace más astuto y le proporciona al modelo la habilidad de interpretar mucho mejor las instrucciones recibidas y entregar exactamente lo que se solicita, combinando un sistema básico y un sistema refinador de imágenes. Además, las imágenes podrán ser generadas a partir de instrucciones o comandos más simples, por lo que con una sola línea de texto se pueden comenzar a producir imágenes desde cero.

Si deseas profundizar en todas las características que Stable Diffusion XL tiene para ofrecer y cómo utilizarlo de forma gratuita, el canal de YouTube de Dot CSV brinda un resumen bastante completo de la herramienta. Te dejamos el video.