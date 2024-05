OpenAI se dnes podvečer pochlubilo jarními novinkami. Tou nejdůležitější pro širší veřejnost je příslib, že postupně uvolní hromadu prémiových funkcí zdarma.

Uživatelé bezplatného ChatGPT tak získají chatbota se schopnostmi GPT-4, který bude hledat odpovědi také na internetu a bude umět analyzovat nahrané soubory včetně fotografií. Stejně tak se do bezplatné verze konečně dostane GPT Store a jeho specializovaní boti GPTs.

Všemodální GPT-4o chápe text, obraz i zvuk

A co ti z vás, kteří si předplácejí ChatGPT Plus? Pokud dostanou všichni AI na úrovni GPT-4, znamená to, že ti s paušálem získají přístup k nové generaci GPT-5? Ne, tedy alespoň prozatím.

Procházka s GPT-4o po Londýně:

Namísto toho si budou moci v předstihu pohrát se žhavou novinkou GPT-4o. Zatímco předchozí GPT-4v uměl analyzovat obrázky (V jako Vision), písmeno „O“ na konci tentokrát značí „Omni“ – tedy všemodální umělou inteligenci.

GPT-4o proto rozumí:

textu

obrazu

zvuku/hlasu

A je to tedy dílem završení toho, s čím si už nějaký pátek můžeme hrát v mobilní aplikaci ChatGPT, kde se stačí přepnout do hlasového režimu a s AI si pak povídáte klidně i v přirozené češtině.



GPT-4o v placeném ChatGPT Plus

Reaguje stejně rychle jako člověk

Doposud se ale jednalo o několik různých izolovaných modelů. GPT-4o to umí vše v jednom a sám od sebe, protože se učil ve všech třech zmíněných doménách.

Díky tomu by mělo být Óčko mnohem rychlejší v poslechu, porozumění a následné syntéze odpovědi a generování zvuku. Prý dokáže odpovídat už během 230-320 ms (minium-průměr), což má odpovídat latenci průměrného člověka.



Inteligence GPT-4o v obvyklých benchmarcích, které simulují test znalostí podobně jako na škole (MMLU), dialog s člověkem a tak dále. Čím vyšší skóre, tím lépe

Samotná chytrost by měla být na úrovni GPT-4 Turbo, nebo mírně vyšší, novinkou je tedy opravdu hlavně ona všemodalita a nikoliv generační skok vpřed, co se IQ týče. Není to ještě GPT-5.



GPT-4o překonává ostatní i v porozumění vizuální a zvukové informaci

Slibné videoukázky schopností GPT-4o

Slibují to alespoň videoukázky na webu. Jak to bude vypadat v praxi a opět v češtině, ukáže až čas, OpenAI totiž bude GPT-4o pouštět postupně stejně jako všechny předchozí speciality.



Nasazování by nakonec mohlo být docela rychlé. My už GPT-4o máme

My už sice GPT-4o máme i v mobilní aplikaci, zatím to ale funguje úplně stejně jako v dosavadním hlasovém režimu a bez přístupu přímo ke kameře pro real-time analýzu obrazu, jak je to vidět v úvodní ukázce z Londýna a v těch níže. Jsou tedy zjevně šité na míru a oficiální aplikace něco takového přímo neumožňuje.

Kámen, nůžky, papír s AI GPT-4o:

AI GPT-4o vidí pejska a je nadšená:

AI GPT-4o a doučování z matematiky:

V tuto chvíli je klíčovou zprávou hlavně onen příslib uvolnění hromady funkcí i do bezplatného režimu. Tím totiž OpenAI se svým ChatGPT přímo útočí na chatboty Microsoft Copilot i Gemini od Googlu, kteří doposud těžili mimo jiné právě z toho, že zdarma nabízeli některé funkce, jejichž analogie v ChatGPT byly k dispozici pouze ve verzi Plus.

I v tomto případě ale počítejte s tím, že to bude nějaký čas trvat. Ne, že bude vše k dispozici hned zítra ráno.

Desktopová aplikace pro macOS a Windows

Součástí jarních novinek je nakonec i desktopová aplikace ChatGPT pro macOS, díky které bude moci být chatbot později snad i více provázaný se systémem. OpenAI se tedy pokusí o to samé, o co se snaží Microsoft se svým Copilotem na Windows.



Desktopový klient na macOS a analýza obsahu v cizích aplikacích skrze snímek obrazovky

Pokud preferujete spíše ChatGPT než Copilot, nesmutněte, v průběhu roku totiž dorazí desktopová aplikace i pro Windows. To je skvělá zpráva, Microsoft, který je pro OpenAI klíčový partner, si totiž teoreticky mohl vynutit, aby Windows zůstaly výhradně jeho kolbištěm pro Copilota. Takto slízne smetanu hned dvakrát.