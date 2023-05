Obrázková AI Midjourney zpřístupnila nový model V5.1. Označení se oproti předchozímu modelu V5 změnilo jen o desetinu, změny jsou ale větší. Nový model můžete nastavit jako standardní prostřednictvím /settings. Případně ho volit manuálně pomocí parametru --v 5.1 v zadání.

Lépe rozumí kratším povelům a je ostřejší

Midjourney jako nejdůležitější výhodu nové verze uvádí jednodušší použití s kratšími prompty. U V5 bylo někdy nutné podrobně popsat, jak má scéna vypadat, abyste dostali, co chcete. Teď by to AI měla lépe pochopit i z kratšího zadání.

Na pohled je pak vidět větší ostrost vygenerovaných obrázků. Velmi zřetelné je to třeba u portrétů, které jsou detailnější než dřív a ještě víc realistické. Ve výstupech by se také mělo objevovat méně nežádoucích obrázků nebo zbytků textu.

Vedle toho je k dispozici také režim raw. Volí se parametrem --style raw a jeho porozumění zadání by se mělo víc blížit předchozí verzi 5. Tedy té, která upřednostňovala podrobné prompty. Tohle nemohu potvrdit, ale jeho výstupy jsou jiné než standardní V5.1.

Srovnávací ukázky v galerii

Nemá smysl dlouho psát, raději se podívejte do galerie. Vybrali jsme různé typické obrázky, které jsme v Midjourney v poslední době generovali ve verzi V5. Úplně stejný prompt jsme teď použili s modelem V5.1 a potom ještě jednou s V5.1 ve variantě raw.

V galerii jsou obrázky vždy v pořadí V5 – V5.1 – V5.1 raw. U nových modelů pro lepší představu vždy ukazujeme čtveřici náhledů. U staré verze V5 často jen jeden obrázek. V popisku pokaždé najdete přesný prompt.

Proč neumí Emmu?

Nový model je velice detailní, to je asi největší rozdíl. Je také často barevnější, výstupy jsou víc saturované. Obrázky jsou také někdy víc komplexní, je v nich více prvků. Nejde ale o generační změnu, jaká nastala třeba mezi verzemi 3 a 4, jen o postupné zlepšování.

Midjourney má ale teď mnohem větší problémy s věrným zobrazením známých osobností. Nejde jen o naši oblíbenou testovací Emmu Watson, kterou trápíme už od prvních verzí. Ale třeba také Elon Musk, u kterého se Midjourney ve V5 téměř pokaždé trefilo do vystihující fotky a teď se na obrázcích místo něj někdy objevují cizí lidé. Anebo Arnold Schwargenegger s kytarou na jednom z obrázků v galerii.



Tohle přece není Emma Watson. A to ji Midjourney v přechozích verzích dokázalo zobrazit velmi věrně. V galerii najdete další ukázky

Že by to byl záměr a obrázková AI chtěla cíleně zabránit zneužívání známých osobností?

Další novinkou z poslední doby je změna moderování. Dřív probíhalo jen na základě blokovaných klíčových slov, dnes Midjourney zapojuje AI, které se snaží pochopit kontext. Zásahy jsou ale zvláštní. AI nám dnes nedovolilo vygenerovat papeže Františka v podobě posteru GTA; s tím dřív nebyl problém. Oproti tomu prompt „Pope Francis as a gangster“ bez problémů prošel.



Midjourney V5 nemělo s papežem v GTA problém. Teď už automatický moderátor protestuje



Papež František jako gangster přitom nevadí

Podívejte se ještě na toto porovnání. Použili jsme stejné zadání a vygenerovali obrázek v každé z verzí Midjourney. Ještě před rokem, v květnu 2022, byla dostupná pouze verze V2 a fotorealistickou V4 jsme v alfaverzi mohli začít používat až v listopadu. Posun v kvalitě je neskutečný.