OpenAI představilo ChatGPT agenta, který posouvá schopnosti umělé inteligence zase o kus dál. Tento agent dokáže samostatně vykonávat komplexní úkoly pomocí vlastního virtuálního počítače. Spojuje přitom dohromady tři dosavadní produkty:

Operator pro interakci s webem.

pro interakci s webem. Deep Research pro hloubkovou analýzu a zpracování informací.

pro hloubkovou analýzu a zpracování informací. ChatGPT pro konverzační inteligenci.

Tvůrci uvádí, že ChatGPT bude moci vykonávat úkoly typu: „podívej se do mého kalendáře a informuj mě o nadcházejících schůzkách s klienty na základě nejnovějších zpráv“, „naplánuj a nakup suroviny na japonskou snídani pro čtyři osoby“ nebo „analyzuj tři konkurenty a vytvoř prezentaci“.

Agent bude na počítači pracovat s terminálem, API, má vlastní grafický a textový webový prohlížeč a podporuje také tzv. konektory, kterými se připojí do vybraných externích služeb. V současnosti si rozumí s Gmailem, Google Kalendářem a Diskem, webovým Outlookem a jeho kalendářem, OneDrivem, SharePointem, Microsoft Teams, GitHubem, Dropboxem a Boxem.

Funkce a schopnosti

Agent může procházet weby a filtrovat výsledky, přihlašovat se na weby, spouštět kód, analyzovat data, tvořit tabulky, prezentace, texty a posílat notifikace do mobilní aplikace ChatGPT.

Před každou akcí vyžadující zásah do citlivých dat (např. přihlášení) nebo jinou s velkým dopadem (nákup v e-shopu) musí uživatel udělit souhlas.

Uživatel také musí schválit některé úlohy typu „odeslat e-mail“.

ChatGPT má zakázáno provádět finanční transakce.

Uživatel může kdykoli úkoly zastavit, upravit nebo převzít kontrolu nad prohlížečem.

ChatGPT si uchovává cookies pro uložení stavu k příští návštěvě webů, ale uživatel je může smazat. Uživatelem zadané údaje jako hesla se nikde neukládají.

Benchmarky

„V práci můžete automatizovat repetitivní úkoly, jako je převod snímků obrazovky nebo dashboardů do prezentací složených z upravitelných vektorových prvků, přeplánování schůzek, organizace a rezervace firemních akcí mimo kancelář nebo aktualizace tabulek s novými finančními údaji při zachování původního formátování. V osobním životě ho můžete využít k bezstarostnému plánování a rezervaci cest, organizaci a rezervaci celých večeří nebo k vyhledání specialistů a objednání na schůzky,“ uvádí OpenAI.

V testech zaměřených na praktické činnosti dosahuje zatím nejlepších výsledků:

Humanity’s Last Exam : 41.6 % přesnost, s paralelním během až 44.4 %

: 41.6 % přesnost, s paralelním během až 44.4 % FrontierMath : 27.4 % přesnost – nejlepší výsledek mezi modely OpenAI. Jde o nejtěžší matematický test.

: 27.4 % přesnost – nejlepší výsledek mezi modely OpenAI. Jde o nejtěžší matematický test. DSBench : Výrazně (skóre 89,9 %) překonává lidské výkony (64,1 %) v datové analýze.

: Výrazně (skóre 89,9 %) překonává lidské výkony (64,1 %) v datové analýze. SpreadsheetBench: 45.5 % přesnost při úpravách tabulek, oproti 20 % u Copilot v Excelu. Člověk dosahuje 71,3 %.

Novinka už je dostupná pro předplatitele nejvyššího tarifu Pro. Do Plus a Team dorazí v nadcházejících dnech a do Enterprise a Education v řádu týdnů. Uživatelé Pro mají v ceně 400 zpráv měsíčně, ostatní jen 40, ale lze je dokupovat za kreditu. V Evropském hospodářském prostoru (tedy i ČR a SR) a Švýcarsku nicméně agent zatím nebude fungovat.