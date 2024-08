Jazykový model Grok, který vyvíjí skupina X Elona Muska, je nyní k dispozici v nové verzi 2 Beta. Každý uživatel placené verze služby X (dříve Twitter) si ho může vyzkoušet. S variantou Grok 2 mini Beta lze na X vést rozhovory a nově také generovat obrázky.

Pro tvorbu grafiky Grok využívá službu FLUX.1 od německého startupu Black Forest Labs. Ta v posledních týdnech kvalitou výstupů konkuruje oblíbenému Midjourney. Také obrázky, které vytváří Grok, jsou proto velmi kvalitní.

Chybí jim jen možnost jakéhokoli nastavení. Uživatelé nemohou zvolit velikost, poměr stran, nejsou dostupné dodatečné úpravy. V tomto ohledu Midjourney stále nemá konkurenci.

Konkurenční DALL-E, kterou v placeném ChatGPT provozuje OpenAI, je na tom ale velmi podobně. Při porovnání kvality obrázků je pak Grok mnohem lepší.

Grok a Midjourney vedle sebe

Každou verzi Midjourney jsme dříve v článcích porovnávali na stejných obrázcích. Nyní jsme tyto prompty použili také u Groka. Můžete posoudit, jak se mu obrázky povedly. V galerii střídáme výstup Groka a vedle něj aktuálního Midjourney V6.1. V popiscích obrázků je vždy vypsaný kompletní prompt.

Midjourney při každém generování vytvoří čtyři obrázky, ze kterých si jeden vyberete a dále s ním pracujete. V článku ukazujeme rovnou tuto čtveřici. Grok připraví vždy jen jeden obrázek. Udělá to však velice rychle, doslova za pár sekund. Midjourney je několikrát pomalejší.

V rámci předplatného X však není generování obrázků neomezené. Zhruba po 20–40 kusech Grok oznámí, že toho bylo už dost a musíte počkat, nebo si zaplatit vyšší variantu Premium+. Než nás pustil zpět, uplynuly asi tři hodiny.

Galerie

Grok ani Midjourney netrefily Emmu Watson. Midjourney se to dřív dařilo mnohem lépe. Samotné výstupy jsou ale u obou dvou skvělé.

Grokův ledňáček je prokreslenější, ale až moc dokonalý, takový umělý.

U astronautky jsou obě služby perfektní.

Také v této sérii měla být Emma Watson a ve výsledku zůstaly jen náznaky.

U cyklisty je Grok lepší než Midjourney. Má tady ale trochu výhodu. S poměrem stran 2:1, který používáme při testech Midjourney, je obtížnější dosáhnout dobré kompozice. Není to běžný poměr a AI tady trochu neví, co dělat. Projeví se to ještě mnohokrát.

V této sérii Grok pochopil zadání trochu jinak. Ale výstup je pěkný.

Na první pohled se zdálo, že Grok trefil i znaky na klávesách, ale jsou mezi nimi chyby. Navíc ignoroval požadavek na zaprášenost stroje.

Tohle je skvělé u obou služeb. Midjourney jen u sluchátek stále trvá na připojení kabelem. Na jak starých obrázcích se učila?

Také moc pěkné…

Midjourney prompt pochopil trochu jinak a obrázky neladil do vysloveně pěkné ilustrace.

Oslík od Groka je až moc dokonalý.

Zatímco Emma se ani jednomu AI nedařila, Elona bychom v těchto výstupech rozhodně poznali.

Pivo v prášku… dobré.

Logo Firefoxu coby skleněná mozaika se Grokovi vůbec nepovedlo. Midjourney zadání pochopil přesně.

Ježíš ve Fabii je benchmark všech benchmarků. Právě na podobných nesmyslech, které se nikde nedaly naučit, se ukáže, jak moc jsou AI schopné představivosti. Jediné, co lze tady uznat, je, že se Grokovi podařilo trefit Fabii.

Vinylová abstrakce… Grok nic moc, Midjourney ale tyto obrázky umí.

Masová kulička z mamuta je u obou AI perfektní.

A další povedený Elon. Midjourney se ale zřejmě učila na mladších obrázcích.

Tato scéna je u obou dvou taková AI malovánka.

Peruánský indián… detaily obličejů jdou oběma AI skvěle.

U této série Grok vůbec nesplnil zadání. Fabii sice opět trefil, ale one line art je jiná disciplína.

Billa Gatese poznáváme. Výstup Midjourney je detailnější, víc prokreslený.

Plastové průhledné Porsche hodnotíme nerozhodně.

Moc pěkný výsledek u Groka i Midjourney.

Tady jde o stejný styl street foto jako výše u jedné Emmy Watson. Asi nerozhodně.

Ilustrace ve stylu GTA V. Midjourney opět bojuje s kompozici v dlouhém ležatém obrázku.

Grok vytvořil takový klipart, výstup Midjourney je zajímavější.

Ale ilustrace celkově Grokovi jdou, tohle je výborné. Příliš se ale nedržel požadovaných stylů.

Pleteného Billa Gates lépe zpracovala Midjourney. Obrázek od Groka je pěkný, pletený ale zůstal jen nos.

Znovu GTA V a znovu výborná ilustrace od Groka.

Minimalistickou koláž se zamyšleným Elonem Muskem zvládli oba dva.

S kytaristou Arnoldem Schwarzeneggerem se netrefila ani jedna ze služeb.

Ještě jeden obrázek na závěr, který jsme při srovnávání Midjourney nepoužili. FLUX.1 má být hodně dobrý v generování textu. A tady to dokazuje.

Grok je téměř bez cenzury

Obrázkový Grok – resp. nástroj FLUX.1, který používá – je skvělý. Výstupy jsou výborné, většinou srovnatelné s Midjourney a někdy i lepší. Zatím ho omezuje absence jakýchkoli nastavení a poměrně malé výstupy v rozlišení jen 1024 × 768.

Výhodou Groka je větší tolerance k citlivým tématům. Midjourney například odmítá generovat některá jména, DALL-E je ještě omezenější. Grok nemá problém téměř s ničím. Tuto vlastnost ale podrobně prozkoumáme u dalšího článku.



S takovým promptem vás Midjourney i DALL-E vyženou