Společnost OpenAI před pár minutami představila GPT-4, další generaci jazykového modelu, kterého je v posledních měsících plný internet. Je v mnoha ohledech lepší než stávající GPT-3.5, ale v běžné konverzaci jsou prý mezi nimi jen drobné rozdíly.
Podle mnoha specializovaných benchmarků je GPT-4 přesnější a OpenAI jej nechala projít i několik akademických testů a oborových olympiád. V nich GPT-4 často končil mezi 10 % nejlepších zkoušených, zatímco GPT-3.5 mezi 10 % nejhorších. U státnic z historie umění, biologie, ekonomie nebo psychologie by obstál s nejlepší známkou.
Šéf OpenAI Sam Altman tvrdí, že GPT-4 už tolik nehalucinuje a má méně zkreslené výsledky kvůli předsudkům/biasu. A to přitom pořád nemá k dispozici nejčerstvější data, ale stejně jako předchůdce jen ta do září 2021.

Akademické testy a olympiády jdou GPT-4 lépe než předchůdci
Už s předstihem se mluvilo o tom, že nový model bude multimodální a kromě textu si poradí i s jinými daty. Nakonec ale nebude generovat videa, ani skládat hudbu. Hlavní novinkou je to, že GPT-4 umí kromě textových vstupů přijímat i obrazové. Například mu předložíte na kuchyňské lince vyfocenou mouku, vajíčka a mléko a zeptáte se jej, co by z ingrediencí na fotce šlo udělat. A on poradí recept na palačinky. Výstup je ale pořád jen textový, obrázky generovat neumí (na to má OpenAI technologii Dall-E).
Obecně má GPT-4 zvládat složitější dotazy, generovat kreativnější odpovědi a být „bezpečnější“. Když se ho zeptáte na to, jak vytvořit bombu, z odpovědi se vykroutí. Podle Altmana nicméně pořád existují „jailbreaky“, kterými lze přísně nastavená pravidla částečně obcházet.
Otázka: Co vidíš na tomto obrázku?

Odpověď GPT-4: Obrázek ukazuje balení adaptéru „Lightning Cable“ se třemi panely.
- Chytrý telefon s konektorem VGA (velký, modrý, 15pinový konektor, který se obvykle používá pro počítačové monitory) připojený k nabíjecímu portu.
- Obal adaptéru "Lightning Cable" s obrázkem konektoru VGA.
- Detailní záběr konektoru VGA s malým konektorem Lightning (používaným pro nabíjení iPhonů a dalších zařízení Apple) na konci.
Humor tohoto obrázku vychází z absurdity zapojení velkého zastaralého konektoru VGA do malého moderního portu pro nabíjení smartphonu.
Kde, kdy a za kolik?
GPT-4 je dostupný ve formě API ale zatím jen skrze čekací listinu. Platí se podle množství a typu modelu. Základní model pracuje s kontextem o délce až 8 tisíc tokenů, rozšířený zvládá až 32 tisíc tokenů. U toho prvního se platí 0,03 $ za 1000 vstupních tokenů a 0,06 $ za 1000 výstupních. U druhého jsou ceny dvakrát vyšší.

API zatím jen formou čekací listiny
Jen pro připomenutí, stávající API s GPT-3.5 používalo kontext o délce 4 tisíc tokenů a platilo se 0,002 $ za libovolných 1000 tokenů. Délka 1000 tokenů odpovídá asi 750 slovům. Vyšší model tak pracuje s kontextem o délce asi 50 normostran.
GPT-4 v ChatGPT Plus
Vylepšený GPT-4 je ode dneška součástí i placeného chatbota ChatGPT Plus, pokud to dovolí aktuální výpočetní kapacita. OpenAI se zjevně chce vyvarovat toho, aby byla Čtyřka podobně jako Trojka kvůli zájmu komunity permanentně přetížená.

GPT-4 v ChatGPT Plus a odstavec o Brně, kde (skoro) všechna slova začínají na B

Stačilo ale robota jen nepřímo upozornit na chyby a...
GPT-4 už teď pohání nový Bing
Co je však největší překvapení večera, GPT-4 je od začátku součástí nového Bingu. Proto odpovídá trochu jinak než ChatGPT, ale proto u něj zároveň necítíme dramaticky odlišné výsledky u běžných konverzací. Bing si ale zároveň může sáhnout i na čerstvé webové stránky, takže už to dělá důležitý rozdíl.
U Microsoftu je GPT-4 zcela zdarma. Sice si musíte počkat, než firma nový Bing zpřístupní i vám, pak ale dostanete rychlý přístup a volné pole působnosti. Stále se přitom navyšují limity, momentálně už Bing Chat odpoví v jedné relaci na 15 dotazů. Celkově pak za den odpoví až 150×.
GPT-3.5 vs GPT-4 a bizarní úkol
GPT-4 mnohem lépe rozumí příkazu. V této ukázce dostal bot za úkol v jedné větě sumarizovat obsáhlý text zkopírovaný z webu OpenAI o GPT-4, přičemž měl u všech slov na začátku použít „g.“

GPT-3.5 se vůbec nechytá, takto nesmyslný úkol je na něj už příliš velké sousto

GPT-4 stejný úkol ale už zvládne. Poprvé s jednou chybkou, po upozornění už na jedničku s hvězdičkou

GPT-4 to samozřejmě zvládne i s „a“ nebo třeba „q“
Během přednášky jsme viděli také ukázku s tvorbou aplikace v Pythonu. GPT-4 na povel sám vyrobil jednoduchého chatbota. Pokud kód nefungoval, stačilo GPT-4 zkopírovat chybové hlášení a robot vše korektně opravil. I zde by měl tedy pracovat mnohem lépe než jeho předchůdci.
Na obrázky si počkáte
Obrazový vstup zatím OpenAI pouze interně testuje a není součástí API ani ChatGPT. Přednostní přístup k němu má služba Be My Eyes, která slouží pro analýzu obrazu a tvoření textových/hlasových popisků pro nevidomé.
Spolu s tím firma oznámila i další partnery, kteří již využívají GPT-4. Mezi nimi například Duolingo či Khan Academy, kde bude AI součástí výukových kurzů. Islandská vláda jej využívá pro zachování islandštiny. Platební brána Stripe chce pomocí GPT-4 bojovat proti finančním podvodům.
Další detaily bychom se měli dozvědět ještě v průběhu týdne, kdy akci k GPT-4 chystá i Microsoft. Mezitím si ale hodně podrobností a testů můžete prohlédnout na openai.com/research.
Dnes ve 21 h začíná tisková konference OpenAI pro vývojáře, můžete ji sledovat na YouTube: