OpenAI oznámilo, že uživatelé placených tarifů ChatGPT Turbo a Enterprise nově mají přístup k pokročilejšímu jazykovému modelu GPT-4 Turbo. Ten firma představila loni v listopadu spolu s dalšími zlepšováky. Doteď byl GPT-4 Turbo dostupný jen skrz API (případně v Copilotu), až nyní zamířil i do chatbotu.
Turbo oproti základní verzi dokáže pracovat s delším kontextem až 128 tisíc token (přibližně 300 normostran), dříve to bylo jen 8 tisíc. Slibuje dvakrát až třikrát efektivnější provoz, je tedy rychlejší a levnější. A posunuly se i jeho znalosti. GPT-4 se původně trénovalo na datech do září 2021, Turbo pak znalo i události z dubna 2023. Společnost OpenAI ale mezi tím GPT-4 Turbo několikrát aktualizovala a znalosti čerstvě posunula až do 9. dubna 2024, tedy tři dny nazpět.
Náš firemní ChatGPT Plus sice nadále tvrdí, že jeho znalosti končí v dubnu 2023, ale dokázal už přesně popsat teroristický útok v ruském Krasnogorsku, který se odehrál 22. března. To nemusí být jen díky novějším znalostem, ale též přístupu k vyhledávači a čerstvým datům z webu.

Novější znalosti pomohly ChatGPT také k lepším výsledkům v benchmarcích měřících schopnosti AI podobně jako u školních testů. V šesti ze sedmi testů byl novější model lepší než ten v letošního ledna. Claude 3 od Anthropicu je však s výjimkou matematických úloh více než důstojným soupeřem.
Test |
GPT-4 Turbo (04/24) |
GPT-4 Turbo (01/24) |
Claude 3 Opus |
Gemini Ultra 1.0 |
DROP |
85,4 |
83,4 |
83,1 |
82,4 |
GPQA |
49,1 |
39,7 |
50,4 |
- |
MATH |
72,2 |
64,2 |
60,1 |
53,2 |
MSGM |
88,6 |
83,7 |
90,7 |
79,0 |
MMLU |
86,5 |
84,8 |
86,8 |
83,7 |
HumanEval |
87,6 |
88,2 |
84,9 |
74,4 |