Midjourney je americká firma a současně název služby, která pomocí umělé inteligence generuje obrázky na základě textového zadání. Do většího povědomí se dostala před dvěma lety a dnes jde nejspíš o nejlepší službu tohoto typu, pokud jde o kombinaci kvality výstupů a jednoduchého ovládání.
Psát o uživatelské přívětivosti ve spojení se starším ovládáním prostřednictvím komunikační aplikace Discord by asi bylo příliš odvážné. Discord lze sice s Midjourney stále používat, už dlouho ale existuje také web alpha.midjourney.com, na kterém lze všechno dělat v mnohem příjemnějším prostředí.
Může se proto hodit návod, jak s touto službou pracovat.
Na stránce alpha.midjourney.com zvolte Sign Up, nebo Log In a vyberte si přihlášení účtem Discordu, nebo Googlu.
Galerie nejlepších
Když web Midjourney Alpha spustíte, uvidíte galerii vybraných obrázků, které uživatelé prostřednictvím služby vygenerovali. Standardně jsou zde dnešní nejlepší, můžete si zobrazit i týdenní nebo měsíční žebříček. Ukazují se zde obrázky, které jejich tvůrci uvolnili ke zveřejnění a jsou to často velmi inspirující kousky.
Galerie nejlepších při otevření webu
Když na obrázek kliknete, v jeho pravé části se ukážou informace. Je to hlavně tzv. prompt – textové zadání, které autor pro vygenerování obrázku použil. Můžete ho zkopírovat, sami použít, případně před tím upravit.
Detail vybraného obrázku s podrobnostmi včetně použitého promptu
Nekopírujte ale text přímo na stránce, raději postupujte přes ikonu menu > Copy > Prompt. Tímto způsobem totiž do schránky dostanete také parametry, které autor při generování použil. V základním pohledu jsou zmíněné jen jako štítky pod textem. Obrázek můžete přes tuto nabídku také uložit, nebo ho zkopírovat do schránky.
Všimněte si ještě malé ikony pod textem. Je to tzv. Style Reference. Při tvorbě obrázků se totiž parametrem můžete odkázat na jiný obrázek, jehož styl chcete převzít. V případě této kočky byl zjevně také generovaný pomocí AI, může to ale být i normální fotka nebo jiný obrázek.
V Midjourney je už tolik obrázků, že web Alpha můžete použít jako fotobanku. Vpravo nahoře je vyhledávací pole. Protože výstupy AI nejsou autorská díla, nejsou proto ani chráněna autorskými právy a každý je může použít.
Vyhledávám ilustraci srdce
Napište prompt
Když chcete vytvořit vlastní obrázek, zadejte prompt do velkého pole nahoře. Midjourney ale neumí česky, zadání musíte napsat anglicky. Nemusí to být stylisticky dokonalá věta, vyhněte se ale překlepům.
Překladač se často hodí i v případech, kdy s angličtinou nemáte problém. Česky se totiž i tak zřejmě dokážete vyjádřit lépe, když chcete podrobně popsat, jak má výsledek vypadat.
Prompt je textové zadání, kterým AI říkám, co má udělat
Můžete samozřejmě zadat i jedno slovo a Midjourney si s ním poradí. Ale čím budete popisnější, tím víc výsledek dopadne tak, jak jste chtěli.
Po odeslání se zdánlivě nic nestane, ale v levém svislém pruhu s ikonami si u druhé všimněte jedničky. To je sekce Create, která ukazuje, že právě vzniká jeden obrázek. Klikněte na ni, uvidíte jeho postupné generování.
Při generování se z rozmazaných fleků postupně stává ostrý obrázek
Jakmile bude po pár desítkách sekund hotovo, dostanete čtyři obrázky podle původního zadání.
Midjourney z každého zadání vytvoří vždy čtveřici obrázků
Vpravo vedle pole pro zadání promptu si všimněte ikony. Rozvine panel s mnoha dalšími možnostmi, kterými můžete obrázek ovlivnit. Dříve na Discordu je bylo nutné zadávat pomocí mnoha parametrů, jako je třeba --ar 16:9 pro poměr stran atd. Tady na webu je to uživatelsky příjemnější. Ale když chcete zrovna přesný poměr stran, bez parametru, který připíšete do pole pro prompt, se neobejdete.
Panel s možnostmi pro ovlivnění obrázku
Upravujeme hotový obrázek
S vygenerovaným obrázkem můžete dál pracovat. Klikněte na něj, aby se zobrazil v detailu, a prozkoumejte panel v pravém spodním rohu. Pravděpodobně v něm uvidíte méně položek, já jsem přidal další prostřednictvím možnosti More options.
Vpravo dole je panel s možnostmi pro úpravy
Co znamenají jednotlivé volby:
Vary: Tlačítka obrázek mírně změní, přičemž zůstane zachované původní zadání i předchozí výsledek. Subtle udělá menší změny, Strong větší. Je to dobrá cesta k tomu, jak získat víc variant, ze kterých se dá vybírat.
Varianty původního obrázku, použil jsem volbu Subtle
Upscale: Zvětšení. Často stačí původní velikost, ale když chcete víc, můžete obrázek zvětšit. Výsledek nemusí být úplně stejný jako zdroj, zejména s použitím tlačítka Creative. Možnost Subtle je větší jistota.
Remix: Je to podobné jako u Vary, v tomto případě ale můžete před odesláním upravit prompt. S funkcí Remix nemám moc dobré zkušenosti. Byla první, kterou se obrázek dal trochu upravovat, ale nefungovala dobře tenkrát, ani teď. Už jsou lepší možnosti.
Pan: Obrázek můžete protáhnout v nastaveném směru. Tady jsem klik na šipku doprava a z formátu na výšku je teď čtverec.
Pomocí Pan dopočítáte scénu v obrázku ve směru šipky
Zoom: Podobně můžete obrázek „odzoomovat“, nechat k němu domyslet okraje. Můžete si vybrat mezi zoomem 1,5× a 2×, kliknutím na ikonu tužky u pravého tlačítka ale můžete zadat i jinou hodnotu.
Odzoomování si představte jako fotku z větší vzdálenosti
Rerun: Stejný prompt pustíte ještě jednou.
Editor: Můžete s ním dělat několik kouzel. Je to zejména interaktivní odzoomování a panování, kdy můžete nastavit okraje, jaké potřebujete. A také tzv. inpainting. Štětcem označíte oblasti, které se mají přegenerovat. Mohou to být třeba takové, kde je nějaká chyba. Anebo místa, která chcete nějak změnit a v takovém případě můžete změnu dopsat do promptu.
V obrázku jsem označil oblast očí a dopsal, že chci černé sluneční brýle
Výhodou inpaintingu oproti možnostem Vary a Remix je, že sahá pouze na označenou oblast. Co je mimo ni, nechá v původní podobě. Tímto způsobem tak můžete obrázek postupně opravovat a dokreslovat.
Výsledek inpaintingu, přidal jsem sluneční brýle
Poslední volby v panelu se týkají kopírování stylu, promptu a celého obrázku.
Inspirace stylem a konzistence postav
Vlevo u pole prompt si všimněte ikony obrázku. Když na ni kliknete, web vám dovolí nahrát z disku obrazový soubor, nebo použít některý z už nahraných. Obrázek pak s promptem můžete propojit několika způsoby, mezi kterými volíte miniaturními ikonami ve spodní části náhledu vybraného obrázku
Prostřední možnost je tzv. Style reference. Midjourney použije vaše textové zadání, výsledek ale přizpůsobí stylu vloženého obrázku. U příkladu s plakátem filmu Kill Bill jsem ze zadání smazal, že chci černobílou fotografii, to by pak výsledek nebyl dobře patrný. Ani vizuálně velmi typický plakát tady nebyl vhodnou volbou, ale pro ukázku této funkce snad stačí.
Z obrázku pro inspiraci se Midjourney snaží převzít styl
Ikonka pod vloženým obrázkem vlevo slouží jako Character reference. V tomto případě byste měli nahrát obrázek obličeje (nebo i obrázky, stejně jako u Style reference jich může být víc) a Midjourney potom tento obličej použije. Tímto způsobem vytváříme obrázky našeho aiťáka, podívejte se na tento článek:
Tip: Zajímavé vizuální styly najdete třeba na síti X. Hledejte tam slova midjourney --sref nebo použijte přímo tento odkaz. Když ve svém promptu použijete parametr --sref (před slovem jsou dva spojovníky) následovaný číslem stylu, bude mít potom váš obrázek také tento styl.
V celém článku používám stále stejné zadání, ale v tomto případě s parametrem --sref a číslem stylu
Za předplatné
Práce v Midjourney vyžaduje zkušenost. Služba samozřejmě pokaždé vygeneruje obrázek podle zadání. Ale aby byl výsledek takový, jak potřebujete, a zajímavý, musíte zjistit, co funguje a jak, co má smysl dělat a kudy vedou slepé cesty. Je také potřeba objevit různé finty. Hotový obrázek je často výsledek mnoha a mnoha pokusů, oprav a ladění.
Přesto je Midjourney zřejmě nejlepší nástroj, který dnes pro generování můžete použít. Málokde se tak jednoduchou cestou dostanete k takovým výsledkům. Zejména možnosti ovlivňování obrázku a generování jeho nových verzích podle upřesněných představ jsou zde velmi rozsáhlé.
Midjourney je ale placená služba. Výjimečně nabídne možnost vyzkoušet si generování na několika obrázcích, jinak ale nabízí několik variant předplatného. Základní stojí 10 dolarů na měsíc, všechny programy najdete na této stránce.
Konkurence ale samozřejmě nespí a jiné služby se k Midjourney začínají dotahovat. Zajímavý je například projekt FLUX.1, který ve své AI Grok používá sociální síť X. Nad Midjourney vede například ve schopnosti generovat čitelný text podle zadání.