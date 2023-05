Nejen odbornými médii se žene vlna zájmu o téma umělé inteligence. Co neuronové sítě dokážou, s čím pomohou, a koho naopak ohrožují?

Dnes se zaměříme na velké jazykové modely (LLM – Large Language Model). Podíváme se, co umí, komu mohou dobře sloužit, a naopak koho ohrožují.

Co je to neuronová síť a jazykový model?

Nejprve nastolíme pořádek v názvosloví. Umělá inteligence je nadřazený pojem zastřešující veškeré programy, aplikace a služby, které pro svoji činnost využívají takzvané neuronové sítě.

Neuronová síť je ve své podstatě program tvořený zdrojovým kódem jako jakýkoli jiný program. Úkolem tohoto programu je ale přiblížit své chování lidskému mozku. Základním stavebním kamenem mozku jsou neurony, uzly, které se propojují s dalšími neurony. Lidský mozek má takových neuronů okolo stovky miliard, ale jedinečnost lidského mozku tkví v počtu spojení – synapsí. Jeden neuron může mít až dvacet tisíc synapsí na další neurony.

Neurony a synapse tvoří naši paměť a fungují prostě: pokud se učíte a opakujete si třeba cizí slovíčko, synapse mezi určitými neurony zesiluje. Proces zapomínání je vlastně slábnutí takové synaptické vazby.

Chceme-li vyrobit adekvátní umělou náhradu mozku, stojíme před dvěma problémy: pokud by jeden neuron odpovídal jednomu tranzistoru procesoru, pak není problém v množství, už Apple M1 z roku 2021 měl přes sto miliard tranzistorů. Tranzistory ale fungují nespojitě ve dvou stavech: 1 a 0. Mnohem větším problémem je ale počet konexí – technologicky zatím není možné, aby tranzistor byl napřímo propojen s dvaceti tisíci dalšími tranzistory.

Neuronové sítě se proto na univerzálních CPU musejí jen softwarově emulovat a je jasné, že zátěž bude ohromná. Výrobci v posledních letech přidávají zejména do grafických čipů a do mobilních procesorů tzv. NPU (Neural Processor Units), ANE (Apple Neural Engine) apod., které jsou speciál­ně navržené pro efektivnější trénování a následné využití neuronových sítí. Do reálné simulace mozku ale mají zatím velmi daleko.

Jak poznat kočku od psa

Předchozím odstavcem jsme vás chtěli trošku ukonejšit, že nadvláda počítačů zatím nehrozí. Neuronové sítě jsou stále jen programy vykonávající to, co naprogramovali lidé. Sice se samy učí, zdokonalují, ale nemají vlastní inteligenci.

Neuronová síť se učí podobně jako člověk. Pokud dítě vidí kočku poprvé, neví, že je to kočka. Pojmenujeme ji a jakmile dítě uvidí další kočku, pozná ji. A díky onomu ohromnému počtu synapsí v mozku pozná příště kočku, i když bude jinak velká, jinak barevná, bude ležet na parapetu nebo utíkat po louce.

Počítač vinou jeho nedokonalosti musíme naučit co nejvíce podob, kterých může kočka nabývat. Čím víc fotografií kočky mu předložíme, s tím vyšší pravděpodobností pozná další fotku odlišné kočky, nebo kočky v odlišné poloze. Jakmile neuronové síti předhodíme tisíce fotografií kočky, a ta se je naučí (natrénuje), získáme model schopný na obrázku rozpoznat kočku od psa. Natrénovat specifický model není nic těžkého, máte-li dostatek vzorových dat k učení. Avšak natrénovat obecný grafický model schopný rozpoznat tisíce objektů už vyžaduje pořádný výpočetní výkon, čas, energii a tím samozřejmě i finance.

Dnešním tématem jsou ale hlavně velké jazykové modely, dnes nejčastěji skloňované ChatGPT od OpenAI a další. Jste-li netrpěliví a zatím jste ChatGPT nevyzkoušeli, jděte na chat.openai.com, a po rychlé registraci si můžete začít povídat s „umělou inteligencí“, a to i česky.