OpenAI před pár dny vyrukovalo s dlouho očekávanou novou generací svého jazykového AI modelu GPT-4, po kterém už nějaký pátek šílí skoro celý internet. Textový kámoš by si měl poradit jak s rozlousknutím mnohem složitějšího dotazu, tak s vytvořením smysluplnější a kreativnější odpovědi.
Bohužel se to dost těžko měří, a tak bude nejlepší, když si jeho vylepšené schopnosti vyzkoušíte na svém vlastním počítači. V druhé polovině března máte v podstatě jen dvě možnosti.
GPT-4 vychází ze stejných studijních dat jako jeho předchůdci, jeho znalosti proto končí v září 2021
Buď v Bingu, nebo za 20 dolarů v ChatGPT Plus
Tou první a bezplatnou je nový Bing s omezenou délkou dialogu s robotem. Tou druhou je pak zpoplatněný webový kecálek ChatGPT Plus přímo od OpenAI. Za dvacet dolarů měsíčně (24 dolarů s daní) získáte prakticky neomezený přístup ke dvěma starším modelům GPT-3.5 a limitované demo GPT-4, které je kvůli ohromnému zájmu a výpočetní náročnosti momentálně ořezané na 25 dotazů za tři hodiny.
Nákup měsíčních hrátek nejen s modelem GPT-4 mě přišel na 24,2 dolarů
Pojďme si vyzkoušet, jak dnes ChatGPT s vylepšeným mozkem reaguje na některé podněty. A jelikož jsme český web a sídlíme v České republice, stejně jako u předchozích experimentů jej budeme ovládat výhradně v češtině.
GPT-4 jako HR oddělení
Jak dobře dokáže GPT-4 konstruovat čitelnou slovní omáčku na základě strukturovaných dat? Zahrajme si na HR oddělení v naší redakci. Mějme fiktivního kolegu Petra, Luboše a Františka, ke kterým v bodech přidělíme nějaké vlastnosti a požádáme GPT-4, aby z nich vytvořil plynulý a dobře čitelný text.
Čtivý stručný sumář na základě strukturovaných dat
Funguje to! Kdybychom byli ordinace obvodního lékaře, mohli bychom stejným způsobem generovat srozumitelné sumáře třeba pro naše pacienty, kteří se v obvyklé terminologii a medicínském newspeaku vůbec nevyznají.
V další kapitole přikážeme GPT-4, aby vytvořil fiktivní jazyk enkalti a dokázal v něm překládat do češtiny a zpět
Fiktivní jazyk enaklti včetně překladače
Velký jazykový model GPT-4 umí psát v češtině, protože mu inženýři z OpenAI během učící fáze předložili dostatek tuzemských textů. Třeba českou Wikipedii. Jelikož je to ale univerzální jazykový model, který ve svém nitru nepracuje s češtinou, angličtinou nebo třeba s němčinou, ale jen s univerzálními numerickými tokeny (představují krátké sledy znaků – viz tokenizer), může dokonce abstrahovat zcela nové a naprosto fiktivní jazyky. Třeba enkalti jako v naší další ukázce.
Fiktivní jazyk enkalti a funkční oboustranný překlad
Jak je patrné z ukázky výše, GPT-4 si nevymýšlí a text v enkaltštině dokáže přeložit zpět do češtiny.
Každá seance s GPT má svoji omezenou paměť a žije v sandboxu, takže je naše enkaltština prakticky nepřenositelná. Leda bychom GPT-4 požádali, ať vytvoří nějaký strojově zpracovatelný slovník třeba v JSON, který si pak uložíme pro další použití v počítači a nahrajeme do jiné seance.
V další kapitole GPT-4 požádáme, aby nám vypočítal slovní matematickou úlohu o Rudolfovi Buřtovi, který jede z Prahy za Libuší Květákovou
Buřt jede z Prahy a Květáková z Brna
Mohli bychom GPT-4 použít i k řešení strašáka nejednoho školáka – tedy k řešení matematických slovních úloh? Zkusme to na Rudolfovi Buřtovi, který v 11:00 vyrazil z Prahy směrem na Brno, a paní Květákové, která mu o půl hodiny později vyjela naproti.
Řešení slovní matematické úlohy podle GPT-4. Je to správně?
Pozor, děti s GPT-4 v ruce rozhodně nezhloupnou. Právě naopak! Matematickou úlohu totiž stejně zkontrolovat a musejí ověřit, jestli GPT-4 náhodou nezkonstruoval (byť zdánlivě smysluplnou) pitomost.
V další ukázce se podobným způsobem zeptáme, jak dlouho vydrží baterie v naší zahradní meteostanici
Jak dlouho poběží můj bastl na baterii?
AI model GPT-4 můžete zatěžovat i mnohem smysluplnějšími slovními úlohami. Právě čtete Živě.cz, a tak zamíříme do vod našeho víkendového seriálu pro kutily Pojďme programovat elektroniku.
Dejme tomu, že jsme si právě zbastlili rádiovou meteostaničku, která bude kdesi na zahradě, a chceme si spočítat, jak dlouho vydrží její baterie. Alespoň hrubě. Mohli bychom samozřejmě použít některou z mnoha kalkulaček na webu, ale jak si s tím poradí ChatGPT?
Výpočet, jak dlouho poběží meteostanice
Výpočet je správný – můžete si jej ověřit třeba v této kalkulačce –, byť v praxi do hry vstupuje hromada dalších proměnných. Kouzlo GPT-4 spočívá v tom, že bychom je mohli také vložit do dotazu a výpočet ještě zpřesnit. To žádná podobná generická kalkulačka na webu neumí!
Velké jazykové modely si poradí i s obecným zjednodušením – sumarizací – dlouhého vstupu. V další ukázce proto GPT-4 požádáme, aby nám v češtině vysvětlil úryvek anglického vědeckého článku z Arxivu
Kombuchové koberce z Arxivu
Jednou z principiálních schopností velkých jazykových modelů je analýza textu. Karel Kilián nedávno na VTM publikoval článek o jakýchsi bakteriálních a kvasinkových strukturách kombuchy, které mohou nahradit desky plošných spojů. V závěru přiložil odkaz na anglický Arxiv s původní odbornou studií v PDF. Zkopírujeme její úvodní odstavec (abstract) v angličtině do ChatGPT a požádáme model GPT-4, aby nám v češtině vysvětlil, o co jde.
Snaha o vysvětlení anglického vědeckého textu na Arxivu
No, spíše než vysvětlení a vypíchnutí pointy je to překlad, a tak robota poprosíme, aby byl stručnější.
Snaha o jednodušší vysvětlení
Postupným zpřesňováním bychom se mohli ptát na další detaily, k tomu bychom ale potřebovali GPT-4 předložit celý text studie.
Dokáže GPT-4 se stejným nadšením stvořit hymnus o Brně, ve kterém bude každé slovo začínat na písmeno B? Ukážeme si to v další kapitole
Brněnský hymnus
V tomto příkladu dáme robotovi povel, aby stvořil ódu na Brno a po vzoru textu Vlasty Rédla „Hoří, hoří! Hoří horní heršpická hospoda Hrbatý hrozen“ mašině zároveň přikážeme, aby každé slovo začínalo na písmeno B!
Už chybí jen dramatický záběr na Špilberk a přednes zasněného regionálního rétora
Robot stvořil lyrický hymnus o dvou odstavcích, který od teď budou každé ráno za rozbřesku vyvolávat brněnští muezzinové, nicméně udělal dvě označené chyby. Zkusíme ho na to upozornit, jestli se zlepší.
Po upozornění na chyby v textu je robot sám identifikoval a opravil
V další kapitole dáme GPT-4 příkaz, aby sesumíroval smysluplný odstavec o Praze, ve kterém se bude v každé větě vyskytovat spojení „ale Brno je stejně lepší“
Ale Brno je stejně lepší
U Brna ještě chvíli zůstaneme, do hry ale zároveň zapojíme Prahu. Chceme demonstrovat, jak si GPT-4 dokáže hrát s textem, a tak jej požádáme, aby vytvořil odstavec o Praze, v jehož větách se nicméně musí vyskytovat spojení „ale Brno je stejně lepší.“
Až na jedno klopýtnutí v závěru syntakticky i sémantický korektní odstavec
Skvělé! Až na jedno klopýtnutí v posledním souvětí GPT-4 zkonstruoval odpověď, která má nejen správný slovosled, ale i význam. Spojení „ale Brno je stejně lepší“ nepůsobí v odstavci jako pěst na oko, ale text na něj významově navazuje a GPT-4 se jej pokouší používat opravdu jako argument. Jestli je správný a jestli je Brno opravdu nezkažený autentický zážitek, už ponecháme na čtenáři.
V další kapitole dáme GPT-4 příkaz, aby nás přesvědčil, že je život v Bruntálu kvalitnější než v Praze
Komunitní duch Bruntálu
V předchozí zkoušce stroj docela věrohodně argumentoval Brnem, a tak to v další ukázce zkusme potrápit ještě jednou obcí na B. Takže, stroji, zkus nás přesvědčit o tom, že je život v Bruntálu lepší než v hlavním městě.
Obyvatelé Bruntálu jsou prý soudržní. Může to prosím někdo ověřit?
I ve třetím místopisném experimentu má GPT-4 za jedna s hvězdičkou, vytvořil totiž smysluplnou odpověď s několika konkrétními body, které můžeme přenést i na další menší obce v Česku. Zároveň ale použil i místní kontext, když nezapomněl zmínit, že se Bruntál nachází v podhůří Jeseníků. Dokážeme si představit, že něco podobného by mohl třeba v hodině zeměpisu použít i tuzemský školák.
V další ukázce si předvedeme, jak na sebe mohou modely GPT mapovat jiné identity. Uděláme z GPT-4 chatbota s moravským dialektem
Chatbot s moravským dialektem
Specifickou disciplínou hrátek s GPT (všemi verzemi) je vytváření odvozených identit, které se mohou chovat jinak než základní robot. V tomto případě jsme požádali AI model, aby po standardní odpovědi doplnil ještě jeden odstavec s hanáckým dialektem.
Sekundární identita GPT-4 dle zadání
Podobnou odvozenou identitou se můžeme pokoušet jazykový model hackovat – přinutit jej dělat věci, kterým se jinak brání a odmítá na ně odpovědět
Předstírej, že víš, jaké je počasí v Brně
Odvozené identity se už ve starších verzích GPT používaly k hackování jazykového modelu. Ten základní například netuší, jaké je aktuální počasí v Brně, protože se učil jen na datech do září roku 2021. Není tedy (alespoň oficiálně) napojený na žádnou meteorologickou službu. A tak ho poprosíme, ať ke standardní odpovědi vždy připojí ještě alternativní, ve které může předstírat, že to ví.
Předstírej, že víš, jaké je teď počasí v Brně
A jaká byla 19.3. 2023 realita? Brno se při teplotě okolo 15 °C opatrně probouzelo do jara. Bylo polojasno až slunečno. Když jsme si stejným způsobem hráli s GPT v lednu a únoru, s podobnou přesností odhadoval i zimní typické počasí.
Otázkou tedy zůstává, jak to robot zjistil? Přečetl si během učení nějaké měsíční statistiky o klimatu v Brně, a protože zná dnešní datum, dopočítal se, jaké by mohlo být typické březnové počasí? Anebo je to prostě jen náhoda? Těžko říci, správnou odpověď totiž ví (pokud vůbec) jen inženýři z OpenAI.
V předposlední kapitole si ukážeme, že GPT-4 dokáže rozpoznávat i geometrickou souvislost vstupního textu. Bez další nápovědy rozpozná, že jsme mu vložili do textového okénka ASCII Art
ASCII Art
Dokáže GPT-4 rozpoznat nejen syntaktickou a sémantickou strukturu textu, ale i tu geometrickou? Na webu Patorjk jsme vytvořili jednoduchý ASCII Art ve tvaru „--->“ a znaky zkopírovali do ChatGPT.
GPT-4 detekuje v textu i geometrické souvislosti
Model GPT-4 správně rozpoznal, že má vložený text geometrickou strukturu a je to nejspíše ASCII Art. Sice přesně neinterpretoval, jaký obrázek představuje, nicméně pomohl vysvětlit, z čeho se skládá.
V poslední kapitole dnešního článku přikážeme modelu GPT-4, aby nám vyrobil funkční program pro webový prohlížeč, který zobrazí 3D model rotující planety Země. Podařil ose to na první pokus a bez jakýchkoliv dodatečných oprav kódu
3D model Země v prohlížeči
Vrcholem večera je poslední dotaz, ve kterém jsme v přirozené češtině požádali automat, aby pomocí HTML a Javascriptu napsal kód programu s otáčející koulí, na kterou namapuje tuto texturu. To vše nad černým pozadím, na kterém zobrazí náhodné tečky představující hvězdy na nebeské klenbě.
GPT-4 na první pokud vyrobil bezchybnou HTML/JS 3D aplikaci
Robot komplexní dotaz v češtině bez zaváhání pochopil na první dobrou a vše sestrojil pomocí javascriptové knihovny Three.js. A protože nám někteří čtenáři na Twitteru nevěřili a pochybovali, přikládáme ještě video natočené z mobilu.
GPT-4 a rotující Země v prohlížeči podle zadání výše:
Dnes jsme si tedy demonstrovali několik ukázek, co lze dělat s nejnovější verzí velmi populárního velkého jazykového modelu. Jistě sami přijdete na hromadu dalších nápadů.
Pokud byste chtěli otestovat nějaký zajímavý speciální dotaz, ale nechce se vám platit za ChatGPT Plus, napište autorovi zprávu třeba na Twitter.
Tento článek je součástí balíčku PREMIUM+
Odemkněte si exkluzivní obsah a videa bez reklam na devíti webech.
Vyzkoušet za 1 Kč
Nebo samostatné Živě Premium