Stability AI vypustilo do světa novou verzi své obrázkové generativní neuronky Stable Diffusion XL. Zatím je to tedy jen betaverze, SDXL ale slibuje, že budou jeho výtvory fotorealističtější, měla by si lépe poradit s kresbou tváře, čitelným textem a to vše dokáže s méně komplexními prompty než u svých předchůdců.

Zatímco Midjourney vrací docela hezké kresbičky i při jednoslovném povelu, neuronka Stable Diffusion vždy potřebovala mnohem větší péči. Pokud tedy bude blbuvzdornější, je to skvělá zpráva.

SD se zlepšuje a dohání Midjourney

Stability AI se chlubí dechberoucími kresbičkami z SDXL, které společně s našimi vlastními výtvory najdete v galerii. V praxi je to ale mnohem složitější. Někde si SDXL vede velmi dobře, někde při přímém srovnání s Midjourney stále ztrácí v preciznosti.



SDXL slibuje lepší práci s lidským obličejem a fotorealističností

Na stranu druhou, pokrok je to ohromný a s tímto tempem se oba hlavní hráči na scéně dost možná brzy vyrovnají. Do bitvy snad konečně vstoupí také OpenAI s novou verzi DALL-E, ta současná je totiž příšerná.

Na DALL-E nicméně běží Bing Image Creator, který na tom tak špatně není, takže má Microsoft zjevně přístup k nějaké lepší a zatím neveřejné podobě.

Zatím jen skrze web a API, open-source později

V první fázi se bude SDXL orientovat především na profesionální sféru – platícího zákazníka – skrze API a oficiální editory.



Cyklista v SDXL a editoru DreamStudio

V plánu je nicméně stejně jako u předchozích generací také open-source verze SDXL, kterou si každý bude moci stáhnout, spustit na své vlastní počítačové infrastruktuře a dále vylepšovat.



Vektorová Škoda Fabia v SXDL a editoru DreamStudio

Právě v tomto se Stability AI liší od Midjourney, které je i nadále dostupné jen skrze robota na Discordu bez možnosti automatizace pomocí API. O komunitní verzi modelu nemluvě.



A pro srovnání podobný prompt v Midjourney v5

SDXL si můžete vyzkoušet zdarma

Stable Diffuison XL si můžete vyzkoušet v těchto službách přímo od Stability AI:

K dispozici je u všech omezený provoz zdarma. Buď si počkáte, nebo postupně vyčerpáte přidělený kredit. SDXL zároveň zatím neumí některé běžné funkce. Třeba nastavit poměr stran. V betaverzi proto počítejte jen se čtvercovými rozměry.

Tyto kousky Midjourney neumí

S generátorem SD se pracuje trošku jinak než s Midjourney. Vedle pozitivního promptu (co se má generovat) můžete v DreamStudiu použít i ten negativní (co se generovat nemá).

Generátor také nabízí tvorbu v několika režimech od fotografie po komiksovou kresbičku. A také dokáže dokreslovat obsah do existujících fotografií. Tímto způsobem jsem už ve starší verzi SD vytvořil fiktivní výbuch nad Brnem a promítl jej do sférického panoramatického snímku z dronu.