Stable Diffusion kreslí obrázky podle zadání. Oproti jiným si jej můžete nainstalovat a nespoléhat se na cloud

Zadáte textový popis, ono se to samo se to a voilá dostanete umělecké dílo. Hit posledních dnů, kdy se jména Dall-E nebo Midjourney stávají všeobecně známými pojmy.

Další členem této rodiny je Stable Diffusion, který přichází s lákavou nabídkou: můžete si ho nainstalovat na svůj vlastní počítač a vyhnout se tak placení za přístup do cloudu. Navíc získáte větší kontrolu nad výsledkem a dokážete obejít NSFW filtry (NSFW ukázky).

Stable Diffusion dokáže generovat velmi zajímavé výsledky, které překonávají již zaběhnutá jména. Tady máte třeba srovnání složitějšího zadání z pohledu Stable Diffusion a Midjourney.

image.pngimage.png
Zadání: Ultra realistic photo, princess peach in the mushroom kingdom, beautiful face, intricate, highly detailed, smooth, sharp focus, art by artgerm and greg rutkowski and alphonse mucha. Vlevo DreamStudio využívající Stable Diffusion, vpravo Midjourney

Lokální provoz upřímně zatím není jednoduchý na obsluhu a ani to nepojede na každém počítači. Budete hlavně potřebovat grafiku Nvidia minimálně s 6 GB paměti. A i když mám RTX 2060 Super s 8 GB paměti, stejně jsem dokázal v příkazové řádce generovat jen obrázky o velikosti 256 × 256 bodů. Tedy raději mějte 8 GB a víc.

Příkazová řádka nebo GUI

Instalace není zcela triviální, ale když dodržíte docela logický postup, k cíli se dostanete. Hlavně ale narazíte při stažení 5GB souboru s modely sd-v1-4.ckpt. Odkaz uváděný v postupech nefunguje a tak ho budete hledat jinde. Kvůli zájmu nejspíš přetekly limity pro přenos dat a původní zdroj jej schoval za login.

S využitím alternativního zdroje jsem sice dokázal na konci generovat obrázky, ale zcela s mizernou kvalitou stěží odpovídající zadání. Proto na tento zdroj ani nebudu odkazovat. Zkuste tento torrent (magnet link).

image.png
Existuje i GUI verze generátoru Stable Diffusion

Pokud se bojíte postupné instalace a příkazové řádky, spíš doporučím NMKD Stable Diffusion GUI - AI Image Generator. Sám si stáhne problematický soubor s modely a místo příkazové řádky nastavujete parametry v běžném prostředí aplikace pro Windows.

Jde to i bez instalace v cloudu

Pokud to chcete jen vyzkoušet, úplně nejjednodušší bude otevření DreamStudio Lite v prohlížeči, za kterým stojí stability.ai – jeden z tvůrců Stable Diffusion. Po přihlášení dostanete zdarma 200 generování obrazů (zaplatit můžete víc) v rozměru 512 × 512 px. Generovat můžete i větší, ale spotřebuje to více kreditů na jeden obrázek.

DreamStudio přitom využívá už novější verzi 1.5, zatímco na lokální počítač si stahujete verzi 1.4.

Na co je to dobré?

Aktuálně probíhá rychlý vývoj všech podobných služeb a zlepšuje se kvalita obrazu a porozumnění dotazům. Stable Diffusion má aktuálně hodně velký rozptyl mezi kvalitním a mizerným výsledkem, což je známkou překotného a raného vývoje. 

image.pngimage.png
Oba obrazy vygeneroval Stable Diffusion, ten vpravo je ale zcela nepoužitelný a Emmě Watson se omlouváme

Pro zatím si tak asi nejspíš pohrajte s webovou verzí, vyzkoušejte reakci na vaše dotazy, a pokud se vám to bude zdát použitelné, zvolte pro jednoduchost GUI verzi nebo pro větší kontrolu variantu pro příkazovou řádku. Zatím ale potřebujete alespoň 8GB grafickou kartu Nvidie (chystá se podpora pro AMD i procesory Apple). Na výkonu grafické karty tolik nezáleží, hlavní požadavek je na co největší objem paměti.

Diskuze (12) Další článek: Plán Windows 11. V září velká aktualizace, v říjnu menší update „Moment 1“, další pak příští rok

Témata článku: , , , , , , , , , , , , , , , , , ,