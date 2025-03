Microsoft experimentuje s generativní AI Muse. Ta by mohla pomoci s vývojem her a přenášením starých titulů na nové platformy. Vychází ze základního problému – současné AI dle výzkumů nenaplňují požadavky a představy herních vývojářů a vývojářek. Muse to dotáhl do fáze funkčního prototypu a má určité schopnosti. Vedle toho Microsoft hovoří o dalších potenciálech. Realitu a sny je dobré oddělit.

Prozkoumejme nejprve schopnosti aktuální verze AI Muse. Na základě předložených dat vygeneruje jednotky minut trvající herní sekvenci. K silně omezujícím faktorům patří nízké rozlišení výstupů. Z původních 128 × 128 bodů u prvních iterací AI se vývojový tým dopracoval k výstupům ve velikosti 300 × 180 bodů.

S obrázky to bylo podobně. Rozlišení a kvalita postupně stoupaly a není důvod myslet si, že to v tomto případě bude jiné. Nechme však stranou rozlišení. Podstatné je, že Muse v tuto chvíli reálně generuje funkční herní sekvence. To je úspěch s obrovským potenciálem do budoucna a zřejmě další kapitola generativní AI.



AI se ve tvorbě zlepšovala s tím, jak se zvětšoval objem dat, na nichž byla trénována

Všechno začalo experimentem, technologie je pořád považována za experimentální, ale fázi konceptu na papíře překonala. Při té příležitosti publikovali související studii v časopise Nature a další informace na webu Microsoft Research. Především však samotnou AI včetně vzorových dat uvolnili k vyzkoušení na Azure AI Foundry a Hugging Face.

Od textů k interaktivní zábavě

Na evoluční cestě generativní AI představuje Muse nevyhnutelný krok. Začali jsme tím nejjednodušším, tj. tvorbou textu. Přidaly se obrázky a pozvolna se širší veřejnosti dostávají do rukou generátory videí.

Teď vyhlížíme AI, která stojí před výrazně složitější výzvou – tvorbou interaktivní zábavy. Microsoft tvrdí, že vyvinul první funkční generativní model svého druhu. Označuje ho jako World and Human Action Model – zkráceně WHAM. Muse je marketingový název aktuálního modelu. Není těžké si aspoň rámcově domyslet, že generování her je mimořádně komplexní záležitost.

Abyste mohli Midjourney použít pro vytvoření obrázku, AI musí porozumět vašim slovům. Na jiných obrázcích naučila přiřadit objekty ke slovům, aby je pak mohla napodobit dle vašich požadavků. WHAM oproti tomu analyzuje 3D prostředí a procesy, které v něm probíhají. Jde o pravidla virtuálního prostředí, herní mechaniky, ale také o vstupy hráče, který hru ovládá mačkáním tlačítek.

Microsoft považuje za průlomové, jak Muse rozumí fyzice světa a reakcím na hráčské chování. Nejvýkonnější WHAM pracuje s 1,6 miliardy parametrů. Jeho kontextové okno trvá pouhou sekundu. Každý obrázek se rovná 540 tokenům, přičemž rozlišení je již zmíněných 300 × 180 bodů. Video se skládá z deseti snímků za sekundu. Rozlišení ani snímková frekvence nejsou dostatečné na komfortní hraní, ale jak jsem už naznačil, to ani není na pořadu dne.



Současné výstupy Muse jsou v nízkém rozlišení,

ale jsou to hratelné herní sekvence na bázi titulu Bleeding Edge

Velké jazykové modely, které pak používají chatboty, jsou často větší. Např. Llama 3.1 z loňského léta v nejkomplexnější verzi pracuje se 405 miliardami parametrů. V lednu představený DeepSeek R1 se chlubí 671 miliardami parametrů. Větší automaticky neznamená lepší a navíc tyto modely cílí na jiné použití než Muse, takže se těžko srovnávají. Základem této AI je nicméně stále transformátor stejně jako u Llamy nebo DeepSeeku.

Transformátor (anglicky transformer) je architektura hlubokého učení vyvinutá Googlem v roce 2017. Vstupům dává různou váhu. Text se konvertuje do tokenů, každý token je kontextualizován v souvislosti s ostatními tokeny. Transformátory tak rozpoznávají nejdůležitější slova. Trénují se na velkých datových sadách. To také udělal tým v Microsoft Research. Jen netrénoval na obrázcích a textech, nýbrž na herních videích.

Experimentální potrava pro transformátor

Muse je výsledkem experimentu s nejistým výsledkem, který odstartoval koncem roku 2022. Katja Hofmann , vedoucí týmu Microsoft Research Game Intelligence, se vrátila do práce po mateřské dovolené a poznala, že svět strojového učení se výrazně proměnil. O ChatGPT měla veřejnost rekordní zájem. Hofmann se zajímala na možný průnik této technologie se hrami.

Studio Ninja Theory bylo dlouholetým partnerem Microsoft Research a jeho hra Bleeding Edge z roku 2020 se stala hlavní potravou pro trénování budoucího WHAM. Bleeding Edge se hraje ve více lidech a dvou týmech, kteří se ostřelují ve virtuální aréně. Zápasy se nahrávají, pokud souhlasíte s licenčním ujednáním.

Herní tým v divizi Microsoft Research sbíral data už před návratem Hofmann. Po jejím nástupu se začal zabývat tím, čeho by dosáhl, kdyby AI založenou na transformátorech natrénoval na velkém objemu herních dat. Rozhodl se pro praktický experiment. Trénování proběhlo na 500 tisících anonymizovaných záznamech zápasů v Bleeding Edge. Dohromady se jedná o 7 let herního času.

Krátké herní sekvence od Muse nabídne Copilot:

Konzistence, rozmanitost, perzistence – tyto tři aspekty Redmondští vyhodnotili jako klíčové a WHAM otestovali ve zmíněné studii, jejíž výsledky publikovali v časopise Nature.

Herní sekvence není funkční, když se hra každých pár snímků či sekund dramaticky změní. Nesmí se třeba stát, že se střílečka za pár okamžiků promění na závodní hru. Současně každá hra nemůže být stejná. Je potřeba zachovat základní koncepty, přitom nabídnout variabilitu. Např. se v prostředí ukáží jiné překážky, ale zdi budou vždycky pevné a objekty jimi neprojdou.

Všechny zkoumané parametry experimentální technologie splnila. Vysoce konzistentní herní sekvence trvá až dvě minuty. Jde o skvělý výsledek, byť od budoucnosti, kdy bude tato technologie standardně používána, nás zjevně dělí ještě nějaký čas.

Prototypy a staré hry

Protože je Muse experimentální technologie, možnosti využití se budou hledat. Nemusíme se hned upnout k černému scénáři, kdy AI nahradí herní vývojářky a vývojáře. Spíše se stane to, co pozorujeme s jinými typy generativní umělé inteligence – bude to nástroj, který při tvorbě pomůže lidem. Ti ušetřený čas využijí jinak.

To si myslí šéf studia Ninja Theory. V krátkém rozhovoru s Philem Spencerem, ředitelem divize Microsoft Gaming, na kanále Xboxu na YouTubu, odhaduje, že AI aspoň v jeho studiu nebude vytvářet herní obsah. Pomůže však optimalizovat pracovní postupy a lidem při vývoji uvolní ruce. Budou moci rychleji iterovat prototypy a zkoušet nové nápady.

Od prvotní myšlenky k funkčnímu prototypu totiž vede dlouhá cesta. Někdo musí vymyslet koncept, někdo ho musí načrtnout, někdo ho musí naprogramovat. AI bude rychlejší a navíc bude moct různé nápady variovat s menšími či většími úpravami. Tohle je první hrací pole pro Muse, které si Microsoft nyní vytyčuje.

Současně výsledky experimentování vedou Microsoft k myšlence, že by Muse mohl zpřístupnit současnému publiku staré hry. Dotkl se tak dlouhodobě bolestivého místa digitálního interaktivního umění. Hry jsou součástí kulturního dědictví, jenže s generačními obměnami hardwaru jich spousta propadne technologickým sítem.



Některé hry jako např. System Shock se dočkaly přepracování

na současné platformy, ale AI by mohla oživování starých titulů výrazně urychlit

V tomto případě by AI vlastně herní obsah klonovala. Jak jsme si už popsali, Muse vytvoří herní zážitek na základě předloženého materiálu. Kromě textových povelů to mohou být videa. Když mu předložíme záběry starých her, mohl by je znovu vytvořit. Aspoň v Microsoftu jsou o tom přesvědčení.

Dosavadní experimentování technologie dovedlo tým Microsoft Research Game Intelligence k Muse, tj. AI schopné tvořit herní sekvence na bázi Bleeding Edge. Redmondští se domnívají, že podobně se dá WHAM natrénovat na jiných hrách. Stejně jako v případě Bleeding Edge by měl porozumět hernímu světu, aniž by byl dopředu seznámený s jeho pravidly a mechanismy. Měl by pochopit jiné žánry a herní principy.

Momentálně také v Microsoftu schopnosti AI zkouší na dalších titulech. Budeme se muset nechat překvapit, kam a jak rychle vývoj dojde. Ale i tento první pokus vyvolává silný dojem.

Zdroje: Microsoft / Hugging Face | Microsoft Research Blog | Nature | Xbox / YouTube | Xbox Wire