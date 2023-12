Lidé, kteří vyzkoušeli Bing Copilot i ChatGPT, hlásí, že odpovědi chatbota od Microsoftu jsou sice rychlejší, ale méně sofistikované než reakce hlavního nástroje od OpenAI. Rozšířily se spekulace o nastaveních různých módů Copilota a zda vůbec opravdu využívá nejnovější model GPT-4.



Produkty od OpenAI Copilot opravdu používá. Součástí Copilota jsou modely GPT-4 a DALL-E. Tyto modely ale Copilot nepoužívá pro komunikaci s námi. To, s čím mluvíme, je jiná umělá inteligence: Prometheus. Microsoft tuto vlastní AI představil v únoru 2023 roku spolu s novým způsobem vyhledávání v Edge.

Prometheus řídí komunikaci s vyhledávačem Bing, vyhodnocuje relevance výsledků, filtruje osobní informace, navrhuje možnosti pro pokračování konverzace a kontroluje, zda odpovědi splňují firemní standardy. A také si povídá s dalšími AI. K vyhledávání obrázků využívá Bing Visual Search a konečně k porozumění našeho vstupu a vytváření odpovědí spolupracuje s GPT-4. Verze 3.5 na to byla ještě moc hloupá. Jak uvádí ve svém příspěvku na LinkedInu Jordi Ribas, až když minulé léto OpenAI předvedla v Microsoftu schopnosti čtvrté verze, rozhodl se Ribasův team udělat „revoluci ve vyhledávání“.

Tak proč takové rozdíly mezi módy?

Copilot používá ve všech módech ke zpracování textu pouze předposlední modely umělé inteligence GPT-4 spolu s Prometheem. Na X píše CTO Bingu Mikhail Parakhin: Ve vyváženém módu nepoužíváme GPT 3.5, ale vlastní verzi čtvrtého modelu vyrobenou pro Microsoft. Pro veřejnost tedy nedostupnou pátou verzi. Ve stejném vlákně potvrzuje, že zbylé dva módy jsou se stejným modelem čtvrté verze jako v tehdy ChatGPT.



Tři styly konverzace v Bing Copilotu

Přesto jsou ale mezi výstupy z kreativního a přesného módu obrovské rozdíly. Kreativní třeba používá často emotikony a zdraví. Má to totiž zapsané v systémovém promptu. To je instrukce, kterou autor říká velkému jazykovému modelu, jak se má chovat. Jak stručná má být odpověď, anebo jaký má mít tón.

LLM potřebují pro kvalitní odpověď hodně kontextu. Abychom nemuseli ke každé instrukci do chatu psát ručně příkazy jako rozepiš se, nebo buď stručný a popisovat styl, v jakém si přejeme konverzaci vést, Microsoft pro nás připravil tlačítka. Ta tyto instrukce automaticky zařadí do systémového promptu.

Pamětníci prvních verzí ChatGPT si vzpomenou na nutnost psát chatbotovi příkaz „pokračuj“ když se zasekl u dlouhé odpovědi. I na to dnes máme tlačítko, které instrukci propíše do LLM samo. V Edge v záložce „napsat“ uvidíte ještě větší rozdíly v nastavení, kdy si můžete zvolit z nabídky formát, tón i délku odpovědi.



Podrobné nastavení stylu odpovědí Copilotu v panelu Edge

Výsledky ovlivňuje teplota

Dalším faktorem ovlivňujícím, jak nám chatboti odpovídají, je nastavení teploty. Nejde o to, jak moc přehřáté je datacentrum. Teplota je parametr velkých jazykových modelů. Při nastavení k nule postrádá výstup charakter přirozené řeči, chybí prvek náhody a sklouzává k opakujícím se odpovědím. Naopak při nastavení na vysoké hodnoty chatbot pouze chybuje (halucinuje).



Nastavení parametrů v Playgroundu OpenAI. Vlevo píšete systémový prompt, vpravo vybíráte model, nastavujete teplotu a další parametry

Vyvážení této hodnoty si můžete zkusit sami za pár centů v playgroundu OpenAI. Pro přesnější odpovědi, jako je například psaní kódu nebo analýza textu, se ideální nastavení pohybuje okolo 0,2 a u kreativního psaní se blíží k jedné. Při vyvážení nastavení mezi těmito hodnotami, jsou výstupy trochu obsahově suché, a přesto často chybné. Nepřipomíná vám to chování módů v Copilotu?

Copilot je hlavně vyhledávač

Copilot není plnohodnotné ChatGPT Plus. Provoz velkých jazykových modelů je náročný na energii a hardware na výpočty AI je poslední dobou nedostatkovým zbožím. Modely GPT-4 patří mezi špičku a tomu odpovídají i nároky na výkon a náklady na energie. Prometheus je proto elegantní řešení pro rozdělení úloh mezi více modelů a systémů, aby se snížilo zatížení nejnáročnějšího modelu. Rozdělení úloh zároveň umožňuje rychlejší a přesnější odpověď.

Copilot má ale vůči ChatGPT Plus něco navíc – vyhledávač. A je to velmi funkční kombinace. Pro vyhledávání na internetu používám raději Copilota než browsing v ChatGPT Plus. Prometheus umí na web paralelně poslat víc chatbotů a jejich výstupy předat GPT-4. V ChatGPT prochází jeden chatbot postupně výsledky a až pak vytvoří odpověď. I s rychlejší verzí Turbo je ChatGPT Plus při prohledávání webu pomalejší než Prometheus. A i ten má Turbo brzy dostat k dispozici „na pokec“.