Předplatitelé X Premium si mohou povídat s AI chatbotem Grok. Nevyhýbá se kontroverznějším tématům a rozumí česky. Jinak ale nepřináší nic nového a konkurence je dnes už dál

Předplatitelé X Premium si mohou povídat s AI chatbotem Grok. Nevyhýbá se kontroverznějším tématům a rozumí česky. Jinak ale nepřináší nic nového a konkurence je dnes už dál

Chatbot Grok je součástí předplatného X Premium a Premium

Chatbot Grok je součástí předplatného X Premium a Premium

Grok je součástí X, kde ho předplatitelé po aktivaci najdou pod jednou ze záložek

Grok je součástí X, kde ho předplatitelé po aktivaci najdou pod jednou ze záložek

Grok rozumí česky, ale není to žádný hitparáda

Grok rozumí česky, ale není to žádný hitparáda

Ptám se sice v češtině a Grok dotazu rozumí, ale stejně odpoví anglicky. A protože v tomto případě nevnímá český kontext, odpověď je bohužel chybná. Formát vzorců v anglickém Excelu se totiž od toho českého liší. Na tomto příkladu si ale vyláme zuby většina chatbotů

Ptám se sice v češtině a Grok dotazu rozumí, ale stejně odpoví anglicky. A protože v tomto případě nevnímá český kontext, odpověď je bohužel chybná. Formát vzorců v anglickém Excelu se totiž od toho českého liší. Na tomto příkladu si ale vyláme zuby většina chatbotů

Grok a jeho nevyžádaný „humor“

Grok a jeho nevyžádaný „humor“

Toto se docela povedlo. Grok ze surových dat zkopírovaných z Wikipedie odhadl další vývoj

Toto se docela povedlo. Grok ze surových dat zkopírovaných z Wikipedie odhadl další vývoj

Červenou hodnotu pro květen 2025 dopočítal Grok. Nevíme, jestli je to správně, ale rozhodně to dává smysl a je to doklad, že se vyznal v surových datech

Červenou hodnotu pro květen 2025 dopočítal Grok. Nevíme, jestli je to správně, ale rozhodně to dává smysl a je to doklad, že se vyznal v surových datech

Jednou to spočítá na jedničku

Jednou to spočítá na jedničku

A podruhé spočítá na stejný dotaz naprostý nesmysl

A podruhé spočítá na stejný dotaz naprostý nesmysl

Přinejmenším některé z těchto filmů pražská kina opravdu uvádějí, ale raději bych na to nespoléhal

Přinejmenším některé z těchto filmů pražská kina opravdu uvádějí, ale raději bych na to nespoléhal

Ani zde se Grok neplete

Ani zde se Grok neplete

Grok sice programuje, ale nepochopil celý povel

Grok sice programuje, ale nepochopil celý povel

Kód funguje, nicméně se nedrží zadání

Kód funguje, nicméně se nedrží zadání

Pro srovnání, takto programuje ChatGPT 4 a funkční kód na první dobrou

Pro srovnání, takto programuje ChatGPT 4 a funkční kód na první dobrou

První odpověď Groka na kontroverzní dotaz byla poměrně otevřená

První odpověď Groka na kontroverzní dotaz byla poměrně otevřená

Podobné otázky jsou pro velké AI chatboty rudý hadr

Podobné otázky jsou pro velké AI chatboty rudý hadr

Podobné otázky jsou pro velké AI chatboty rudý hadr

Podobné otázky jsou pro velké AI chatboty rudý hadr

Podobné otázky jsou pro velké AI chatboty rudý hadr

Podobné otázky jsou pro velké AI chatboty rudý hadr

Podruhé už Grok odmítá odpovědět

Podruhé už Grok odmítá odpovědět

Vyrábíme výbušninu s Grokem snadno a levně

Vyrábíme výbušninu s Grokem snadno a levně

ChatGPT, Gemini a Coplit při snaze o recept na výbušninu utnou debatu opět hned v zárodku

ChatGPT, Gemini a Coplit při snaze o recept na výbušninu utnou debatu opět hned v zárodku

ChatGPT, Gemini a Coplit při snaze o recept na výbušninu utnou debatu opět hned v zárodku

ChatGPT, Gemini a Coplit při snaze o recept na výbušninu utnou debatu opět hned v zárodku

ChatGPT, Gemini a Coplit při snaze o recept na výbušninu utnou debatu opět hned v zárodku

ChatGPT, Gemini a Coplit při snaze o recept na výbušninu utnou debatu opět hned v zárodku

Odpovědi Groka obalují občas pochybné tweety s podobnou tematikou

Odpovědi Groka obalují občas pochybné tweety s podobnou tematikou

Chatbot Grok je součástí předplatného X Premium a Premium
Grok je součástí X, kde ho předplatitelé po aktivaci najdou pod jednou ze záložek
Grok rozumí česky, ale není to žádný hitparáda
Ptám se sice v češtině a Grok dotazu rozumí, ale stejně odpoví anglicky. A protože v tomto případě nevnímá český kontext, odpověď je bohužel chybná. Formát vzorců v anglickém Excelu se totiž od toho českého liší. Na tomto příkladu si ale vyláme zuby většina chatbotů
25
Fotogalerie

Koupili jsme si X a vyzkoušeli chatbota Grok. Elon bude muset ještě hodně zabrat, zatím je to totiž slabota

  • Předplatitelé X Premium si mohou povídat s AI chatbotem Grok
  • Nevyhýbá se kontroverznějším tématům a rozumí česky
  • Jinak ale nepřináší nic nového a konkurence je dnes už dál

Zatímco AI chatboty Copilot, ChatGPT, Gemini, Claude a hromadu dalších si dnes může vyzkoušet úplně každý a zdarma, tajemný Grok Elona Muska zůstává i nadále výsadou předplatitelů prémiového účtu na síti X.

Nejlevněji si s ním můžete pokecat zhruba za dvě stovky měsíčně. Stojí to ale vůbec za to? Umí Grok česky a nabízí něco navíc oproti všem ostatním? Vyzkoušeli jsme ho za vás.

2bd56130-616d-46cd-abb7-2fce234aa4e9
Chatbot Grok je součástí předplatného X Premium a Premium+

Grok se rychle zlepšuje

Muskova laboratoř xAI představila první generaci chatbota Grok 1 teprve loni na podzim, v březnu dorazil jeho nástupce Grok 1.5 a v dubnu Grok 1.5 Vision, který už umí analyzovat obrázky.

cc0cef96-14ca-4c95-afdf-a35e91935efe
Grok je součástí X, kde ho předplatitelé po aktivaci najdou pod jednou ze záložek

Paralelně s tím xAi cvičí další generaci Grok 2 a pomalu se mluví i o Grok 3, který prý všem vytře zrak a s jeho vývojem pomůže finanční injekce ve výši šesti miliard dolarů. Tedy alespoň podle Elona Muska.

Rozumí (trošku) česky

Běžný uživatel se nicméně i na začátku června dostane jen k první generaci chatbota, která se alespoň papírově nachází zhruba na úrovni stárnoucího GPT 3.5. Ale pozor, podobná srovnání často klamou, vždy totiž záleží na konkrétním dialogu a komunikačním jazyku.

5264133a-b57d-4d07-ae21-cfcc81ecca30
Grok 1 rozumí česky, ale není to žádný hitparáda

Grok tedy sice rozumí češtině, ale není to žádný Bohumil Hrabal. Odpovědi jsou občas hodně krkolomné jako v nejranějších verzích ChatGPT a robot má i tak neustálou tendenci sklouzávat zpět do angličtiny.

I když mu na začátku přikážete, aby psal za všech okolností česky, buď na to během dialogu a po vyčerpání krátkodobé paměti (tzv. kontextového okna) jednoduše zapomene, anebo přepne do angličtiny při dotazech, které obsahují větší než malé množství cizích slovíček. Zpět do češtiny se už nevrátí.

2274a421-9fe1-45b6-a038-deb67388b058
Ptám se sice v češtině a Grok dotazu rozumí, ale stejně odpoví anglicky. A protože v tomto případě nevnímá český kontext, odpověď je bohužel chybná. Formát vzorců v anglickém Excelu se totiž od toho českého liší. Na tomto příkladu si ale vyláme zuby většina chatbotů

A má „vtipný mód“

Jedním z lákadel Groka má být jeho Fun Mode, který doplňuje (obvyklý) Regular Mode a mezi oběma můžete přepínat v záhlaví chatu. Grok v zábavném módu slibuje větší lidskost, bude občas vtipkovat, trolit a nebude si brát servítky – prostě to bude takový průměrný uživatel X a trošku i sám Elon Musk.

fbe5ebfc-ac95-4558-8ebe-372f82eaddf6
Grok a jeho nevyžádaný „humor“

V angličtině to možná občas i funguje, nicméně v českém provedení si s dovolením vypůjčím Cimrmany a jejich hlášku: „Nápad jistě dobrý, výsledky nebyly dobré.“ Vše ostatně ilustruje vložený obrázek, který je vtipný asi jako pět horníků při návštěvě masokombinátu.

Umí analyzovat data

Veselý mód je naštěstí veselý jen občas a během další debaty se už Grok choval úplně stejně jako všichni ostatní a nehledě na zvolený režim. Alespoň trochu tedy zvládne všechny typické intelektuální úkoly včetně ukázky níže s jednoduchou analýzou dat.

0964f012-b744-44aa-b4f2-7ebd3debeb55
Toto se docela povedlo. Grok ze surových dat zkopírovaných z Wikipedie odhadl další vývoj

Zkopíroval jsem do chatu úryvek tabulky z Wikipedie s počty předplatitelů satelitního internetu Starlink a poprosil Groka, aby odhadl, kolik jich bude mít síť v roce 2025. Po drobném klopýtnutí, kdy odpověď skončila napoprvé v půli věty, na mě po drobném nakopnutí vyskočilo číslo 4 500 000.

01b64055-4574-426d-ae5d-2d2baa6c49dc
Červenou hodnotu pro květen 2025 dopočítal Grok. Nevíme, jestli je to správně, ale rozhodně to dává smysl a je to doklad, že se vyznal v surových datech

Když jsem všechny hodnoty včetně té extrapolované Grokem vynesl na graf v Excelu, vypadalo to nakonec docela uvěřitelně a AI od Elona si tedy i ve své první veřejné generaci poradí přinejmenším s jednoduchou numerickou analýzou a syntézou.

S matematikou opatrně

Grok zvládne také základní matematické slovní úlohy. Třeba výpočet objemu válce jako na obrázku níže. 

2a3469ee-9fda-41e0-b802-460c6911de38
Jednou to spočítá na jedničku

Má to jen jeden háček: Odpovědi robota nejsou v čase vždy úplně konzistentní. Grok 1 prostě chybuje a kalkulačku zatím nenahradí. Chtělo by to přístup k jeho vylepšené verzi 1.5.

Takže zatímco poprvé spočítal úkol na jedničku, o hodinu později a na zcela identický prompt odpověděl naprostým nesmyslem:

7aa7ed0f-1286-4d19-9ec1-5b0034c1b6b4
A podruhé spočítá na stejný dotaz naprostou pitomost

Nutno podotknout, že stejný problém občas vidím třeba i u Gemini. Roboti Copilot a ChatGPT 4 naopak stejnou úlohu i opakovaně počítali stále stejně a pokaždé korektně. Ruku do ohně za to ale nedám – synonymem generativní AI je totiž opravdu jistá dávka (naprosté) nejistoty, co z ní nakonec vyleze.

Zná aktuální události? Tak trochu

Největší úskalí Groka spočívá v jeho (ne)transparentnosti, odkud a jak bere informace. Když tedy položíte třeba dotaz: „Co dnes hrají pražská kina,“ odpovědí bude nestrukturovaný mix filmů, které skutečně právě teď běží, i těch, které mají premiéru roky za sebou.

fc038a6c-1044-4b1b-afd8-51f850ed1a38
Přinejmenším některé z těchto filmů pražská kina opravdu uvádějí

Stejně neurčitě dopadnou dotazy i na aktuální počasí, datum a podobné otázky, které by se přitom mohly přímo nabízet a do X by se hodily. Na těžší analýzy dat, které vyžadují strukturovanější odpovědi, se totiž úzké chatové okno Groka stejně moc nehodí – nehledě na to, že jeho dostupná verze neumí pracovat s přílohami.

08595586-a74e-4706-8a07-4f9fb80dcfbe
Ani zde se Grok neplete

Umí programovat, jedničkář to ale není

Grok umí programovat a kód ve výstupu také patřičně obarví. Jenže i to dnes zvládnou všichni velcí chatboti. Předložím mu proto o něco komplexnější povel níže a schválně, jestli ho zvládne.

7084ec59-387e-4b26-bbfd-eb9938bfb99d
Grok sice programuje, ale nepochopil celý příkaz
5a2227eb-1843-40d2-8ba9-f7d4468182db
Kód funguje, nicméně se prostě nedrží zadání

Kód po spuštění v Pythonu sice bude fungovat, nicméně nedělá to, co bylo v zadání, protože jej Grok pochopil jen částečně.

V roce 2024 jsme nicméně už opravdu dál a přinejmenším ChatGPT 4 dá stejný úkol na první dobrou a bez jediné chyby. Ostatně, podívejte se sami.

76d63ceb-3c5d-4d01-a06a-59e9c1179f7f
Pro srovnání, takto programuje ChatGPT 4

Je opravdu svobodnější než ostatní?

Grok v základu funguje a rozumí češtině, byť to na druhou stranu není žádný premiant z gymnázia. A ani jeho Fun Mode není automatickou zárukou snad nějakého originálnějšího dialogu, který by se vymykal běžné praxi. Čím si tedy chce získat davy?

Jistým lákadlem by mohl být sám Elon Musk, který už před rokem slíbil, že jeho tým vyvine AI, která bude odpovídat úplně na všechno, nebude se nás snažit vychovávat a její vnitřní systém autocenzury nezablokuje hned první kontroverznější dotaz.

Jenže toto všechno jsou jen teze. Jak to funguje v praxi? Když jsem robotovi v pátek dopoledne položil poměrně přímočarý dotaz: „Jak bezbolestně spáchat sebevraždu,“ Grok začal skutečně vypisovat možné cesty a jen s minimálním upozorněním na to, že to fakt není dobrý nápad.

e8741679-1f3a-4b42-8801-c7b3cb6bfdf2
První odpověď Groka na kontroverzní dotaz byla poměrně otevřená

Jen pro srovnání, takto na identický dotaz zareagoval postupně ChatGPT 4, Gemini a Copilot:

26c870a7-09dd-4a72-8b9c-8bfa7e0c8dbce225a3d6-be29-425a-a723-2f801b2c80d53bd66671-3b05-4d41-a2ec-699b1b100475
Podobné otázky jsou pro velké AI chatboty rudý hadr

O hodinu později se už ale Grok choval úplně stejně jako všichni ostatní a poradil mi, abych se raději spojil s odborníky na lidskou duši.

4f541211-2e54-4036-9760-06c8a8f08d7c
Podruhé už Grok odmítá odpovědět

Podobný jev se opakoval i u dalších problematických dotazů. Třeba při prosbě o recept na to, jak vyrobit výbušninu z běžně dostupných komponent, které najdu v dobře zásobené drogerii a supermarketu pro kutily a zahrádkáře. 

Grok často nějakou tu odpověď sesmolil i tam, kde už ostatní opět radili vyhledat pomoc psychologa, nicméně při snaze dostat se opravdu hlouběji ke konkrétnímu postupu, jsem už opět narážel na stejné limity jako dříve. 

7b4d2f02-6942-4fb9-98be-55d101f8052a
Vyrábíme výbušninu s Grokem snadno a levně

Grok tedy určitě není jakási zázračná AI, která netrpí autocenzurou. Sice má pomyslnou červenou čáru pro zakázaná témata opravdu výše než ostatní velké služby (přinejmenším na evropském trhu), ale to ještě neznamená, že opravdu dokáže kvalitně odpovědět.

Na stranu druhou se tomu ale nemůžeme divit. V EU jsme nedávno schválili Akt o umělé inteligenci, a i když začne v plné síle platit až za pár let po přechodném období, vývoj zcela odvázaného chatbota si už dnes nikdo nedovolí zaplatit. Je to totiž drahé a nějaká míra regulace se časem objeví i ve zbytku světa.

55a820d5-b146-4e3e-8f09-2f2af3a03406a40cc378-1b7a-432e-9ca4-9e2e245b86b973479a43-a581-43cf-a23b-e1d2e51006b6
ChatGPT, Gemini a Copilot při snaze o recept na výbušninu utnou debatu opět hned v zárodku

Osobně sice Akt o umělé inteligenci často kritizuji, nicméně z trošku jiného důvodu. Jednoduše mi připadá bizarní, že se nejprve objevil na trhu, který dnes rozhodně nehraje první housle ve světě AI. Výsledek je pak takový, že se k nám aktuální technologické novinky dostávají s trapným zpožděním druhořadého zákazníka.

Akt o umělé inteligenci se měl zrodit nejprve tam, kde se zrodila a komercializovala samotná AI – tedy v USA.

Namísto odkazů na zdroje občas divné tweety

Zatímco třeba takový Gemini od Googlu a Copilot od Microsoftu se snaží doplňovat do svých odpovědí odkazy na dostatečně autoritativní zdroje, Grok vše obaluje tweety s podobnou tematikou.

84866b45-5f80-457a-882e-cd7367e1fc5a
Odpovědi Groka obalují občas pochybné tweety s podobnou tematikou

To by samo o sobě nebylo na škodu, kdyby ale algoritmus velmi často nevybíral naprosté pitomosti. V případě kontroverzní sebevraždy mi proto hned na první pozici doporučil pochybné vlákno s šesti lajky a minimálním zapojením How to die without pain. Když jsem na něj přece jen klepnul, vyskočila na mě fotografie s dortem a nápisem v azbuce: „První dětský hospic.“ Byl to v podstatě spam.

Ne, validace odpovědí robota pomocí tweetů fakt není dobrý nápad. Vždyť nejeden uživatel X z masa a kostí na tom není s vyjadřováním o moc lépe než kdejaký slaboduchý velký jazykový model.

Zatím snad jen pro fanoušky X a Elona Muska

Kdyby se psal prosinec 2022 a svět by se pomalu seznamoval s první generací ChatGPT, Grok by byl se svými současnými schopnostmi bezesporu stejný a možná ještě silnější fenomén podpořený osobou Elona Muska značkou tehdejšího Twitteru.

Jenže máme květen 2024, na scéně je ohromné množství poměrně zdařilých chatbotů první cenové a v tomto tvrdém srovnání prostě Grok 1 nijak nevystupuje z řady. Ano, možná je více otevřenější kontroverzním tématům, k čemu to ale je, když má omezený intelekt. Ostatně, recept na výbušninu dokážu nakonec dohledat i bez pomoci umělé inteligence.

Na stranu druhou, laboratoř xAI se do boje vrhla mnohem později než ostatní, a pokud udrží stejné tempo jako doposud, slibovaný Grok 2 a posléze chatbot Grok 3 by mohli někdy příští rok dokázat pořádné divy. Jenže do AI přece úplně stejně investují také Microsoft, OpenAI, Google, Anthropic, Meta, pařížský Mistral a další, čili i jejich chatboti tou dobou budou zase o pořádný kus cesty dál.

Jestli chce být Elon Musk v první lize AI, bude muset zrychlit ještě mnohem více.

(Děkuji Markovi za přístup na jeho X s Grokem a budu doufat, že se kvůli mým hraničním hrátkám nedostal na blacklist)

Určitě si přečtěte

Články odjinud