Pařížské studio Mistral AI se pochlubilo novou verzí svého stejnojmenného velkého jazykového modelu. Mistral Large se prý podle testů MMLU téměř vyrovná GPT-4.

Mistral se chlubí, že jeho nový model Large dosahuje podobného skóre v MMLU jako GPT-4
Mladý startup je vysněnou evropskou odpovědí na úspěšné americké OpenAI, a tak se loni těšil zájmu investorů a posbíral stovky milionů eur na další rozvoj.
Díky tomu dnes nabízí vlastní platformu pro vývojáře na bázi pay as you go a své AI modely hostuje také ve velkých veřejných cloudech. Mistral Large bude zprvu vedle vlastních serverů k dispozici na Microsoft Azure.
Jak se testují jazykové modely
MMLU je zkratkou pro Massive Multitask Language Understanding a společně s dalšími je to dnes už jedna z mnoha standardních metod, jak testovat schopnosti chatbotů.
Ty ve své podstatě hodnotíme velmi podobně jako studenty ve škole. MMLU totiž není nic jiného než multioborová písemka s desítkami úkolů z matematiky, dějepisu, informatiky nebo třeba práva.
Evropská odpověď na GPT-4
A proč něco takového vlastně chtít? Mistral by mohl zaujmout zejména zákazníky z velkých zemí západní Evropy, vedle univerzální angličtiny jej totiž autoři cvičili na francouzštině, němčině, italštině a španělštině. Lákadlem je také běh na infrastruktuře v EU, čili nehorzí obvyklé prodlevy s nasazováním v Evropě kvůli GDPR apod.

Ceník jazykových modelů z rodiny Mistral na jeho platformě pro vývojáře
Mnoho ostatních jazykových modelů z kapacitních důvodů i limitů studijních dat dosahuje nejvyššího skóre v benchmarcích pouze v angličtině a některé ani jinak mluvit neumějí a používají vrstvu překladače.
Paměť na 32 tisíc tokenů, matmatika a programování
Mistral Large má k dispozici kontextovou paměť na 32 tisíc tokenů, ve které si pamatuje souvislý dialog (token odpovídá jednomu až několika znakům), umí programovat, zvládá matematické operace a také function calling, se kterým jako první přišlo OpenAI a mi si ho vyzkoušeli loni na jaře.



Webové prostředí platformy pro vývojáře a hrátky s Mistral Large skrze HTTP API v programu Postman. API dotazy jsou velmi podobné těm ze světa OpenAI
Inženýři z Mistral AI vyvíjejí i vlastního demonstračního chatbota le Chat, ten je ale k dispozici zatím jen na pozvánky a i k jeho chodu je potřeba účet na vývojářské platformě.