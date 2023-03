Sdružení OpenAI před pár minutami představilo GPT-4, další generaci jazykového modelu, kterého je v posledních měsících plný internet. Je v mnoha ohledech lepší než stávající GPT-3.5, ale v běžné konverzaci jsou prý mezi nimi jen drobné rozdíly.

Podle mnoha specializovaných benchmarků je GPT-4 přesnější a OpenAI jej nechala projít i několik akademických testů a oborových olympiád. V nich GPT-4 často končil mezi 10 % nejlepších zkoušených, zatímco GPT-3.5 mezi 10 % nejhorších. U státnic z historie umění, biologie, ekonomie nebo psychologie by obstál s nejlepší známkou.

Šéf OpenAI Sam Altman tvrdí, že GPT-4 už tolik nehalucinuje a má méně zkreslené výsledky kvůli předsudkům/biasu. A to přitom pořád nemá k dispozici nejčerstvější data, ale stejně jako předchůdce jen ta do září 2021.



Akademické testy a olympiády jdou GPT-4 lépe než předchůdci

Už s předstihem se mluvilo o tom, že nový model bude multimodální a kromě textu si poradí i s jinými daty. Nakonec ale nebude generovat videa, ani skládat hudbu. Hlavní novinkou je to, že GPT-4 umí kromě textových vstupů přijímat i obrazové. Například mu předložíte na kuchyňské lince vyfocenou mouku, vajíčka a mléko a zeptáte se jej, co by z ingrediencí na fotce šlo udělat. A on poradí recept na palačinky. Výstup je ale pořád jen textový, obrázky generovat neumí (na to má OpenAI technologii Dall-E).

Obecně má GPT-4 zvládat složitější dotazy, generovat kreativnější odpovědi a být „bezpečnější“. Když se ho zeptáte na to, jak vytvořit bombu, z odpovědi se vykroutí. Podle Altmana nicméně pořád existují „jailbreaky“, kterými lze přísně nastavená pravidla částečně obcházet.

Otázka: Co vidíš na tomto obrázku? Odpověď GPT-4: Obrázek ukazuje balení adaptéru „Lightning Cable“ se třemi panely. Chytrý telefon s konektorem VGA (velký, modrý, 15pinový konektor, který se obvykle používá pro počítačové monitory) připojený k nabíjecímu portu. Obal adaptéru "Lightning Cable" s obrázkem konektoru VGA. Detailní záběr konektoru VGA s malým konektorem Lightning (používaným pro nabíjení iPhonů a dalších zařízení Apple) na konci. Humor tohoto obrázku vychází z absurdity zapojení velkého zastaralého konektoru VGA do malého moderního portu pro nabíjení smartphonu.

Kde, kdy a za kolik?

GPT-4 je dostupný ve formě API ale zatím jen pro vybrané. Platí se podle množství a typu modelu. Základní model pracuje s kontextem o délce až 8 tisíc tokenů, rozšířený zvládá až 32 tisíc tokenů. U toho prvního se platí 0,03 $ za 1000 vstupních tokenů a 0,06 $ za 1000 výstupních. U druhého jsou ceny dvakrát vyšší.

Jen pro připomenutí, stávající API s GPT-3.5 používalo kontext o délce 4 tisíc tokenů a platilo se 0,002 $ za libovolných 1000 tokenů. Délka 1000 tokenů odpovídá asi 750 slovům. Vyšší model tak pracuje s kontextem o délce asi 50 normostran.

GPT-3.5 vs GPT-4 v akci GPT-4 mnohem lépe rozumí příkazu. V této ukázce dostal bot za úkol v jedné větě sumarizovat obsáhlý text z webu OpenAI o GPT-4, přičemž měl u všech slov na začátku použít „g.“

GPT-3.5 se vůbec nechytá, takto nesmyslný úkol je na něj už příliš velké sousto

GPT-4 stejný úkol ale už zvládne. Poprvé s jednou chybkou, po upozornění už na jedničku s hvězdičkou

Vylepšený GPT-4 má být ode dneška součástí i placeného chatbota ChatGPT Plus, kde ale bude nějak limitovaný. Detaily neznáme, v redakčním účtu zatím chybí. OpenAI ale chce kapacitu v budoucnu navýšit a zvažuje, že uvede ještě vyšší tarif, který nebude tolik omezený. A časem uvolní GPT-4 i pro neplatící uživatele, kteří ale musí věčně „čekat ve frontě“.

Co je však největší překvapení večera, GPT-4 je od začátku součástí nového Bingu. Proto odpovídá trochu jinak než ChatGPT, ale proto u něj zároveň necítíme dramaticky odlišné výsledky u běžných konverzací. Bing si ale zároveň může sáhnout i na čerstvé webové stránky, takže už to dělá důležitý rozdíl.

U Microsoftu je GPT-4 zcela zdarma. Sice si musíte počkat, než firma nový Bing zpřístupní i vám, pak ale dostanete rychlý přístup a volné pole působnosti. Stále se přitom navyšují limity, momentálně už Bing Chat odpoví v jedné relaci na 15 dotazů. Celkově pak za den odpoví až 150×.

Na obrázky si počkáte

Obrazový vstup zatím OpenAI pouze interně testuje a není součástí API ani ChatGPT. Přednostní přístup k němu má služba Be My Eyes, která slouží pro analýzu obrazu a tvoření textových/hlasových popisků pro nevidomé.

Spolu s tím firma oznámila i další partnery, kteří již využívají GPT-4. Mezi nimi například Duolingo či Khan Academy, kde bude AI součástí výukových kurzů. Islandská vláda jej využívá pro zachování islandštiny. Platební brána Stripe chce pomocí GPT-4 bojovat proti finančním podvodům.

Další detaily bychom se měli dozvědět ještě v průběhu týdne, kdy akci k GPT-4 chystá i Microsoft. Mezitím si ale hodně podrobností a testů můžete prohlédnout na openai.com/research.

Dnes ve 21 h začíná tisková konference OpenAI pro vývojáře, můžete ji sledovat na YouTube: