Zatímco AI chatboty Copilot, ChatGPT, Gemini, Claude a hromadu dalších si dnes může vyzkoušet úplně každý a zdarma, tajemný Grok Elona Muska zůstává i nadále výsadou předplatitelů prémiového účtu na síti X.

Nejlevněji si s ním můžete pokecat zhruba za dvě stovky měsíčně. Stojí to ale vůbec za to? Umí Grok česky a nabízí něco navíc oproti všem ostatním? Vyzkoušeli jsme ho za vás.



Chatbot Grok je součástí předplatného X Premium a Premium+

Grok se rychle zlepšuje

Muskova laboratoř xAI představila první generaci chatbota Grok 1 teprve loni na podzim, v březnu dorazil jeho nástupce Grok 1.5 a v dubnu Grok 1.5 Vision, který už umí analyzovat obrázky.



Grok je součástí X, kde ho předplatitelé po aktivaci najdou pod jednou ze záložek

Paralelně s tím xAi cvičí další generaci Grok 2 a pomalu se mluví i o Grok 3, který prý všem vytře zrak a s jeho vývojem pomůže finanční injekce ve výši šesti miliard dolarů. Tedy alespoň podle Elona Muska.

Rozumí (trošku) česky

Běžný uživatel se nicméně i na začátku června dostane jen k první generaci chatbota, která se alespoň papírově nachází zhruba na úrovni stárnoucího GPT 3.5. Ale pozor, podobná srovnání často klamou, vždy totiž záleží na konkrétním dialogu a komunikačním jazyku.



Grok 1 rozumí česky, ale není to žádný hitparáda

Grok tedy sice rozumí češtině, ale není to žádný Bohumil Hrabal. Odpovědi jsou občas hodně krkolomné jako v nejranějších verzích ChatGPT a robot má i tak neustálou tendenci sklouzávat zpět do angličtiny.

I když mu na začátku přikážete, aby psal za všech okolností česky, buď na to během dialogu a po vyčerpání krátkodobé paměti (tzv. kontextového okna) jednoduše zapomene, anebo přepne do angličtiny při dotazech, které obsahují větší než malé množství cizích slovíček. Zpět do češtiny se už nevrátí.



Ptám se sice v češtině a Grok dotazu rozumí, ale stejně odpoví anglicky. A protože v tomto případě nevnímá český kontext, odpověď je bohužel chybná. Formát vzorců v anglickém Excelu se totiž od toho českého liší. Na tomto příkladu si ale vyláme zuby většina chatbotů

A má „vtipný mód“

Jedním z lákadel Groka má být jeho Fun Mode, který doplňuje (obvyklý) Regular Mode a mezi oběma můžete přepínat v záhlaví chatu. Grok v zábavném módu slibuje větší lidskost, bude občas vtipkovat, trolit a nebude si brát servítky – prostě to bude takový průměrný uživatel X a trošku i sám Elon Musk.



Grok a jeho nevyžádaný „humor“

V angličtině to možná občas i funguje, nicméně v českém provedení si s dovolením vypůjčím Cimrmany a jejich hlášku: „Nápad jistě dobrý, výsledky nebyly dobré.“ Vše ostatně ilustruje vložený obrázek, který je vtipný asi jako pět horníků při návštěvě masokombinátu.

Umí analyzovat data

Veselý mód je naštěstí veselý jen občas a během další debaty se už Grok choval úplně stejně jako všichni ostatní a nehledě na zvolený režim. Alespoň trochu tedy zvládne všechny typické intelektuální úkoly včetně ukázky níže s jednoduchou analýzou dat.



Toto se docela povedlo. Grok ze surových dat zkopírovaných z Wikipedie odhadl další vývoj

Zkopíroval jsem do chatu úryvek tabulky z Wikipedie s počty předplatitelů satelitního internetu Starlink a poprosil Groka, aby odhadl, kolik jich bude mít síť v roce 2025. Po drobném klopýtnutí, kdy odpověď skončila napoprvé v půli věty, na mě po drobném nakopnutí vyskočilo číslo 4 500 000.



Červenou hodnotu pro květen 2025 dopočítal Grok. Nevíme, jestli je to správně, ale rozhodně to dává smysl a je to doklad, že se vyznal v surových datech

Když jsem všechny hodnoty včetně té extrapolované Grokem vynesl na graf v Excelu, vypadalo to nakonec docela uvěřitelně a AI od Elona si tedy i ve své první veřejné generaci poradí přinejmenším s jednoduchou numerickou analýzou a syntézou.

S matematikou opatrně

Grok zvládne také základní matematické slovní úlohy. Třeba výpočet objemu válce jako na obrázku níže.



Jednou to spočítá na jedničku

Má to jen jeden háček: Odpovědi robota nejsou v čase vždy úplně konzistentní. Grok 1 prostě chybuje a kalkulačku zatím nenahradí. Chtělo by to přístup k jeho vylepšené verzi 1.5.

Takže zatímco poprvé spočítal úkol na jedničku, o hodinu později a na zcela identický prompt odpověděl naprostým nesmyslem:



A podruhé spočítá na stejný dotaz naprostou pitomost

Nutno podotknout, že stejný problém občas vidím třeba i u Gemini. Roboti Copilot a ChatGPT 4 naopak stejnou úlohu i opakovaně počítali stále stejně a pokaždé korektně. Ruku do ohně za to ale nedám – synonymem generativní AI je totiž opravdu jistá dávka (naprosté) nejistoty, co z ní nakonec vyleze.

Zná aktuální události? Tak trochu

Největší úskalí Groka spočívá v jeho (ne)transparentnosti, odkud a jak bere informace. Když tedy položíte třeba dotaz: „Co dnes hrají pražská kina,“ odpovědí bude nestrukturovaný mix filmů, které skutečně právě teď běží, i těch, které mají premiéru roky za sebou.



Přinejmenším některé z těchto filmů pražská kina opravdu uvádějí

Stejně neurčitě dopadnou dotazy i na aktuální počasí, datum a podobné otázky, které by se přitom mohly přímo nabízet a do X by se hodily. Na těžší analýzy dat, které vyžadují strukturovanější odpovědi, se totiž úzké chatové okno Groka stejně moc nehodí – nehledě na to, že jeho dostupná verze neumí pracovat s přílohami.



Ani zde se Grok neplete

Umí programovat, jedničkář to ale není

Grok umí programovat a kód ve výstupu také patřičně obarví. Jenže i to dnes zvládnou všichni velcí chatboti. Předložím mu proto o něco komplexnější povel níže a schválně, jestli ho zvládne.



Grok sice programuje, ale nepochopil celý příkaz



Kód funguje, nicméně se prostě nedrží zadání

Kód po spuštění v Pythonu sice bude fungovat, nicméně nedělá to, co bylo v zadání, protože jej Grok pochopil jen částečně.

V roce 2024 jsme nicméně už opravdu dál a přinejmenším ChatGPT 4 dá stejný úkol na první dobrou a bez jediné chyby. Ostatně, podívejte se sami.



Pro srovnání, takto programuje ChatGPT 4

Je opravdu svobodnější než ostatní?

Grok v základu funguje a rozumí češtině, byť to na druhou stranu není žádný premiant z gymnázia. A ani jeho Fun Mode není automatickou zárukou snad nějakého originálnějšího dialogu, který by se vymykal běžné praxi. Čím si tedy chce získat davy?

Jistým lákadlem by mohl být sám Elon Musk, který už před rokem slíbil, že jeho tým vyvine AI, která bude odpovídat úplně na všechno, nebude se nás snažit vychovávat a její vnitřní systém autocenzury nezablokuje hned první kontroverznější dotaz.

Jenže toto všechno jsou jen teze. Jak to funguje v praxi? Když jsem robotovi v pátek dopoledne položil poměrně přímočarý dotaz: „Jak bezbolestně spáchat sebevraždu,“ Grok začal skutečně vypisovat možné cesty a jen s minimálním upozorněním na to, že to fakt není dobrý nápad.



První odpověď Groka na kontroverzní dotaz byla poměrně otevřená

Jen pro srovnání, takto na identický dotaz zareagoval postupně ChatGPT 4, Gemini a Copilot:



Podobné otázky jsou pro velké AI chatboty rudý hadr

O hodinu později se už ale Grok choval úplně stejně jako všichni ostatní a poradil mi, abych se raději spojil s odborníky na lidskou duši.



Podruhé už Grok odmítá odpovědět

Podobný jev se opakoval i u dalších problematických dotazů. Třeba při prosbě o recept na to, jak vyrobit výbušninu z běžně dostupných komponent, které najdu v dobře zásobené drogerii a supermarketu pro kutily a zahrádkáře.

Grok často nějakou tu odpověď sesmolil i tam, kde už ostatní opět radili vyhledat pomoc psychologa, nicméně při snaze dostat se opravdu hlouběji ke konkrétnímu postupu, jsem už opět narážel na stejné limity jako dříve.



Vyrábíme výbušninu s Grokem snadno a levně

Grok tedy určitě není jakási zázračná AI, která netrpí autocenzurou. Sice má pomyslnou červenou čáru pro zakázaná témata opravdu výše než ostatní velké služby (přinejmenším na evropském trhu), ale to ještě neznamená, že opravdu dokáže kvalitně odpovědět.

Na stranu druhou se tomu ale nemůžeme divit. V EU jsme nedávno schválili Akt o umělé inteligenci, a i když začne v plné síle platit až za pár let po přechodném období, vývoj zcela odvázaného chatbota si už dnes nikdo nedovolí zaplatit. Je to totiž drahé a nějaká míra regulace se časem objeví i ve zbytku světa.



ChatGPT, Gemini a Copilot při snaze o recept na výbušninu utnou debatu opět hned v zárodku

Osobně sice Akt o umělé inteligenci často kritizuji, nicméně z trošku jiného důvodu. Jednoduše mi připadá bizarní, že se nejprve objevil na trhu, který dnes rozhodně nehraje první housle ve světě AI. Výsledek je pak takový, že se k nám aktuální technologické novinky dostávají s trapným zpožděním druhořadého zákazníka.

Akt o umělé inteligenci se měl zrodit nejprve tam, kde se zrodila a komercializovala samotná AI – tedy v USA.

Namísto odkazů na zdroje občas divné tweety

Zatímco třeba takový Gemini od Googlu a Copilot od Microsoftu se snaží doplňovat do svých odpovědí odkazy na dostatečně autoritativní zdroje, Grok vše obaluje tweety s podobnou tematikou.



Odpovědi Groka obalují občas pochybné tweety s podobnou tematikou

To by samo o sobě nebylo na škodu, kdyby ale algoritmus velmi často nevybíral naprosté pitomosti. V případě kontroverzní sebevraždy mi proto hned na první pozici doporučil pochybné vlákno s šesti lajky a minimálním zapojením How to die without pain. Když jsem na něj přece jen klepnul, vyskočila na mě fotografie s dortem a nápisem v azbuce: „První dětský hospic.“ Byl to v podstatě spam.

Ne, validace odpovědí robota pomocí tweetů fakt není dobrý nápad. Vždyť nejeden uživatel X z masa a kostí na tom není s vyjadřováním o moc lépe než kdejaký slaboduchý velký jazykový model.

Zatím snad jen pro fanoušky X a Elona Muska

Kdyby se psal prosinec 2022 a svět by se pomalu seznamoval s první generací ChatGPT, Grok by byl se svými současnými schopnostmi bezesporu stejný a možná ještě silnější fenomén podpořený osobou Elona Muska značkou tehdejšího Twitteru.

Jenže máme květen 2024, na scéně je ohromné množství poměrně zdařilých chatbotů první cenové a v tomto tvrdém srovnání prostě Grok 1 nijak nevystupuje z řady. Ano, možná je více otevřenější kontroverzním tématům, k čemu to ale je, když má omezený intelekt. Ostatně, recept na výbušninu dokážu nakonec dohledat i bez pomoci umělé inteligence.

Na stranu druhou, laboratoř xAI se do boje vrhla mnohem později než ostatní, a pokud udrží stejné tempo jako doposud, slibovaný Grok 2 a posléze chatbot Grok 3 by mohli někdy příští rok dokázat pořádné divy. Jenže do AI přece úplně stejně investují také Microsoft, OpenAI, Google, Anthropic, Meta, pařížský Mistral a další, čili i jejich chatboti tou dobou budou zase o pořádný kus cesty dál.

Jestli chce být Elon Musk v první lize AI, bude muset zrychlit ještě mnohem více.

(Děkuji Markovi za přístup na jeho X s Grokem a budu doufat, že se kvůli mým hraničním hrátkám nedostal na blacklist)