Na světě je nová verze obrázkového generátoru Midjourney. K označení sice přidává jen desetinu, ale hodně zajímavé funkce navíc. Zejména tzv. outpainting, který vygenerovaný obrázek rozšíří a dopočítá k němu okolí.
Tak co ta Emma?
V první části galerie nad článkem najdete srovnání tří posledních verzí Midjourney. Se stejnými prompty jsme vygenerovali obrázky ve verzích V5, V5.1 a v aktuální V5.2. Můžete přímo porovnat rozdíly, v popiscích vždy najdete použité textové zadání.
Midjourney od prvních verzí zkoušíme na scéně s Emmou Watson a nemůžeme si to samozřejmě odpustit ani teď. U minulé V5.1 jsme si všimli, že služba začíná mít problémy problémy s věrným zobrazením známých osobností. Nejde jen o naši oblíbenou testovací Emmu, stejné to bylo třeba i s Elonem Muskem a dalšími známými jmény.
V nové verzi V5.2 nenastala žádná změna. Konkrétně u Emmy Watson sice máme dojem, že se Midjourney trochu víc trefila, u Musků v galerii je to ale stejné jako dřív. Generátor se tak možná brání zneužívání známých osobností.

Něco tam je, ale předchozí verze Midjourney umělo známé tváře lépe
Autoři Midjourney ve výčtu změn uvádějí vylepšenou estetiku a ostřejší snímky. A také zvýšenou rozmanitost, kde upozorňují, že někdy bude potřeba udělat víc pokusů, než získáte to, co chcete. Je to vidět i na ukázkách, kdy některé varianty ujedou oproti zadání mnohem víc než dřív. Podívejte se třeba na poslední obrázek u ledňáčka, kde Midjourney místo něj vygenerovalo rybu. To se dřív nestávalo.
Zoom
V Midjourney V5.2 se objevila funkce outpainting. Říká se jí tady zoom a dokáže dopočítat-rozšířit okraje obrázku. Jako byste se vzdálili od scény, nebo pro ni použili víc širokoúhlý objektiv.
Když si ze čtyř náhledů vyberete jeden obrázek a necháte ho zvětšit, ukážou se pod ním nová tlačítka.

Jsou zde dvě předpřipravené úrovně zoomu, k tomu možnost zadat i vlastní číslo v intervalu 1 až 2. Poslední tlačítko obrázek ořeže do čtverce a taky trochu odzoomuje.
Je to skvělá funkce, protože často se stane, že získáte výborný obrázek, jen nějak oříznutý. Dřív to znamenalo, že ho musíte zahodit a začít od začátku, protože možnosti úprav jsou velmi omezené. Teď stisknete Zoom a Midjourney okolí dopočítá.
V původním obrázku chyběla část hlavy


Tady je výsledek po zoomu: vlevo ve variantě 1,5, vpravo dvojnásobný
A tady ještě ukázka, co udělá ořezání do čtverce. Nejde jen o osekání okrajů původního obrázku ve formátu 2:1, i tady proběhlo dopočítání
Na širší obrázek můžete použít další Zoom a takhle se postupně od scény vzdalovat. Mimochodem tohle měl být Arnold Schwarzenegger, když jsme zkoušeli, jak si Midjourney poradí se známými jmény. Nějaké rysy tam jsou, ale…




Postupné odzoomování obrázků
Scéna na posledních obrázcích se nám zdála příliš tmavá, zkusili jsme proto použít tzv. remix. To je už starší funkce, kdy mírně upravíte prompt a Midjourney se má pokusit vygenerovat stejný obrázek jen s těmito úpravami. Ale od verze 5 remixování nějak nefunguje, tohle byl výsledek:
Remix je často nepoužitelný
Zpět k zoomu. Použili jsme některé obrázky z galerie a aplikovali na ně dvojnásobné „oddálení“. Podívejte se, jak dopadly. Je to dobré, že?












Hned nás napadlo, jestli takhle bude možné dokreslovat i nahrané fotky, použít u toho tzv. image prompty. Ale ne, zoom je k dispozici pouze u obrázků vygenerovaných přímo v Midjourney.
Analýza promptů
Další zajímavou novinkou je funkce /shorten. Vložíte do ní svůj text, podle kterého chcete vygenerovat obrázek. Midjourney příkaz projde a označí, která slova jsou v něm nejdůležitější a která zbytečná. Může se takhle naučit, jak efektivně psát prompty, co je v nich důležité a co ne.
Důležitá slova jsou vytučněná, zbytečná škrtnutá
Ostrost a detaily
Obrázky z Midjourney V5.2 jsou ještě ostřejší než dřív. Současně ale nezmizela práce s hloubkou ostrosti, takže fotorealistické snímky jsou znovu o něco přirozenější. Jen občas návrhy ujedou trochu jinam a bude potřeba víc zkoušet.
Funkce zoom pro outpainting je vynikající. I kdyby ve V5.2 nenastala žádná další změna, tohle by stačilo.
Jestli půjdou věci tak, jak mají jít, o prázdninách by Midjourney mělo vydat velkou novou verzí 6. Slibuje do ní lepší porozumění promptům, vyšší rozlišení, lepší kvalitu obrazu, lepší práci s kompozicí. A jakýsi zcela nový estetický systém. Je možné, že mezi tím vyjde ještě menší verze V5.3.
Šušká se také o inpaintingu, kdy by bylo možné vygenerovaný obrázek upravovat na úrovni různých detailů. Mohlo by to třeba nahradit dnes málo použitelný remix. Midjourney by také mělo získat vlastní aplikaci a opustit Discord (nebo budou funkční oba způsoby práce).