Posledních pár týdnů jsou internety plné nové generace AI chatbota Claude 3.5 Sonnet od Anthropiku. Lidé si pochvalují jeho rychlost a inteligenci, která ve většině disciplín strčí do kapsy dokonce i GPT-4o.
Tak že by se tu konečně zrodil pořádný vyzyvatel laboratoře OpenAI, která už třetím rokem udává tón a směr dalšího vývoje na poli velkých jazykových modelů?
Claude 3.5 Sonnet podle vlastního měření překonává dosavadního lídra GPT-4o
První Reasoner svého druhu
Impérium Sama Altmana teď musí opravdu zabrat, už před rokem si totiž zažádalo o ochrannou známku na termín GPT-5, namísto Pětky jsme se ale letos dočkali leda tak kosmeticky vylepšené Čtyřky.
A tak musíme vzít zavděk alespoň šuškandě, která si před pár dny našla cestičku až na titulní stránku amerického Bloombergu. Podle jeho zdrojů OpenAI za zavřenými dveřmi ukuchtilo přelomovou AI, která se prý vymyká všemu, s čím si všichni hrajeme už od podzimu roku 2022.
Nejpokročilejší AI ze stáje OpenAI se jmenuje GPT-4o
Tajemný chatbot údajně dosahuje schopnosti řešit problémy na úrovni člověka s doktorátem a OpenAI jej proto zařazuje už do vyšší úrovně klasifikace současné AI – je to tzv. Reasoner.
Pět stupňu na cestě k AGI podle OpenAI
Počkat, počkat, ona je nějaká klasifikace? Ano a nejen jedna – je jich celá řada, zatím totiž chybí konsenzus na jakési univerzální, podle které bychom hodnotili stav všech ostatních.
Máme po ruce jen hromadu základních benchmarků, které ale nemohou uchopit AI v její komplexní podobě. Zatím veřejně nepublikovaný žebříček úrovní AI podle OpenAI vypadá takto:
- úroveň: Chatbots, schopnost smysluplné konverzace
- úroveň: Reasoners, schopnost řešení problémů na lidské úrovni
- úroveň: Agents, systémy, které jsou schopny plnit úkoly
- úroveň: Innovators, AI, která je schopná inovace
- úroveň: Organizations, AI, která funguje jako organizace/organizmus
To je vše, žádnou bližší definici jednotlivých stádií zatím nemáme, trošku to ale připomíná klasifikaci autonomního řízení SAE, která má také pět stupňů automatizace od základního tempomatu po plného, univerzálního a zatím nedostižného autopilota.
Všichni populární chatboti jsou AI 1. stupně
V každém případě, ať už si po večerech hrajete s Copilotem od Microsoftu, Google Gemini, ChatGPT, Grokem Elona Muska, pařížským Mistralem nebo Claudem od Anthropiku, všichni do jednoho v tuto chvíli podle OpenAI dosahují 1. úrovně.
Claude 3.5 Sonnet a další jsou podle klasifikace OpenAI umělá inteligence prvního stupně
Můžete s nimi vést smysluplnou debatu, můžete s nimi brainstormovat prakticky na libovolné téma, no a pokud si uvědomíte, že LLM nejsou kalkulačka ani Wikipedie a je třeba k nim takto přistupovat, mohou být i velmi dobrými učiteli.
Učiteli nikoliv v tom smyslu, že vám bezchybně napíšou letopočet kdejaké historické události (není to Wikipedie!), ale proto, že dokážou rozložit nějaký velmi složitý problém do pochopitelnějších slov.
Reasoner řeší problémy jako člověk s Ph.D.
Tajemný chatbot od OpenAI, o kterém zatím nic nevíme a můžeme pouze spekulovat, jestli to bude GPT-5, podle zdroje osloveného Bloombergem patří už do 2. úrovně a neexistuje jen kdesi na papíře. Laboratoř jej prý už demonstrovala svým zaměstnancům, kteří pochopitelně podepsali mlčenlivost.
Sečteno a podtrženo, Reasoner od OpenAI je údajně natolik chytrý, že by mohl suplovat doktoranda, kterého vypustíte bez dalších pomůcek na opuštěný ostrov. Nemá kalkulačku, nebo logaritmické pravítko, ale je vyzbrojený svým pořádně vytuněným intelektem.
Jen marketing, oponují skeptici
Podle skeptiků je zmíněných pět stupňů AI na cestě k AGI jen marketingové cvičení obchodního oddělení OpenAI, které prostě potřebuje další miliardy dolarů od investorů, aby se posunulo dál.
Když totiž sestrojíte podobný žebříček a řeknete, že máte pod pokličkou cosi, co je o úroveň lepší, ať už to znamená cokoliv, je to dobrý začátek. A protože chybí jakákoliv standardizovaná metrika, jestli tomu tak opravdu je, nikdo vám to ostatně ani nevyvrátí.
Také Google má svou škálu pro AI
Jak už jsme si řekli výše, snahu rozčlenit a klasifikovat různé intelektuální úrovně AI mají i ostatní. Google na sklonku loňského roku publikoval na Arxivu podobný pětistupňový systém AGI, který zároveň horizontálně dělí na úzkou/narrow a obecnou/general AI.
Pět úrovní na cestě k AGI podle Googlu
Trošku totiž zapomínáme na to, že AI nejsou jen ukecaní a zdánlivě vševědoucí roboti, ale také specializované/úzkoprofilové systémy. Třeba detektor obrázků, jazykový překladač, populární generátory obrázků a tak podobně.
I v tomto případě platí, že všichni současní AI chatboti dosahují 1. úrovně Emerging (rozvíjející se). Následuje 2. úroveň Competent (kompetentní). Obecná – širokospektrální – AI této úrovně zatím nedosáhla, v úzkoprofilové kategorii to jsou ale třeba některé stavební kameny hlasových asistentů Siri, Alexa a Google Assistant.
3. úroveň Expert v obecné kategorii bude ta, která vám jednou sebere práci, 4. úroveň Virtuoso začne dramaticky měnit lidskou společnost a nástupu 5. úrovně Superhuman si možná ani nevšimneme, jedná se totiž o umělou superinteligenci (ASI), na kterou nemáme vlastní intelektuální kapacity – nedokážeme sami změřit, jestli tu už je.
Nutno podotknout, že se jedná pouze o formální výčet stupňů a nikdo dnes neví, které z nich jsou vůbec dosažitelné – přinejmenším v horizontu 21. století. To samé ostatně platí i pro škálu autonomního řízení SAE. Můžeme relativně rychle dosáhnout 3. a 4. úrovně, ale ta pátá (řidič na úrovni člověka, který dokáže ovládat vůz kdekoliv na planetě a za jakýchkoliv podmínek) bude dost možná čekat právě až na příchod AGI (3. a 4. úroveň AGI podle Googlu).
Čtyři stupně etiky podle Anthropiku
A konečně do třetice má svoji klasifikaci AI také Anthropic, kterým jsme dnes článek otevřeli. Firma už od svého vzniku staví na absolutní odpovědnosti k lidskému rodu, její AI tak bude navždy hodná, slušná, politicky korektní a sprostého slovíčka neutrousí! Tím se řídí i škála, která má tentokrát čtyři úrovně ASL (AI Safety Level).
- Žádné katastrofální riziko: LLM z roku 2018, AI, která hraje šachy aj.
- Slabé náznaky rizika: Současné LLM; mohou poradit, jak vyrobit bombu, ale zatím jen příliš obecně
- Zvýšené rizko katastrofální chyby: Autonomní systém, který se splete v interpretaci (například hypotetický AI firewall, bezpečnostní systém atp.)
- ASL-4 a vyšší: Zatím neexistují, globální následky v případě chyby
Vyrábět striktně hodnou a slušně vychovanou AI je vlastně docela praktické, každé klopýtnutí totiž můžeme jako lidé snadno měřit a zjišťovat tak její kvalitu. K vyhodnocování nepotřebujeme IQ 150+, ale spíše EQ.
Anthropic se chlubí, etika je pro jeho velké jazykové modely to samé co bible pro jihomoravské katolíky a pracuje s ní už na nejnižší úrovní přio cvičení AI
Stručně řečeno, pokud v testu přinutíme etickou AI hajlovat a posílat obyvatele Liberce do plynových komor, snadno zjistíme, že nefunguje a můžeme začít znovu. Tím předejdeme tomu, aby její iterace o sto let později neproměnila Liberec skutečně v plynné skupenství zapálením termonukleárního hřibu kdesi nad Ještědem.
Slibem nezarmoutíš, už by to ale vážně chtělo nějaké GPT-5
Suma sumárum, každý má svůj líbivý žebříček, konsensus ale zatím chybí, a tak se v tuto chvíli skutečně jedná hlavně o obecné fráze pro marketing a sociální sítě. Stejně musíme brát i zkazky o jakémsi superbotovi ze stáje OpenAI.
Tvůrci generativní AI před dvěma lety nasadili ohromné tempo vývoje, které jim nakonec může i zlomit vaz, všichni jsme totiž natěšení na mnohdy dechberoucí sliby zářné budoucnosti.
Nejvíce pak investoři, kteří celý tento mejdan platí a už brzy se začnou ptát na reálné výsledky a návratnost tisíců a tisíců nakoupených grafik od Nvidie kus v ceně nové škodovky.