Umělá inteligence

Google vymyslel novou neuronku pro hraní šachů. Teď vás porazí i menší, rychlejší a jednodušší AI

Hraní šachů poháněné počítačem pokládáme za vyřešené od roku 1997, kdy Deep Blue od IBM porazil šachového velmistra Garry Kasparova. Nyní ale Google vyvinul novou AI, která umí hrát šachy. A vzhledem k původu v Googlu trochu paradoxně bez hledání.

Uděláme to jednoduše

Tradiční přístup k počítačovému hraní šachů spočívá v analyzování pozic, prohledávání stromů různých řešení a dříve naučených situací. Počítač se postupně učí opakovaným hraním a zkoumáním slavných partií vhodné strategie vedoucí k cíli. Samozřejmě k tomu dnes už nepotřebujete sálový počítač, ale pořád jde o výpočetně velmi náročný úkol.

DeepMind AlphaZero od Googlu, který se proslavil výhrou v mnohem obtížnější hře Go, zvládá také šachy. Jeho inovace spočítala v opakovaném hraní, kdy si sám budoval vlastní heuristiku a namísto prohledávání obřích datových sad kombinuje menší a tak úspornější a rychlejší prohledávání s vlastní naučenou heuristikou.

Nyní v DeepMind vyvinuli novou AI pro hraní šachů. Revoluční je zejména svým cílem. Nepotřebuje být ta nejlepší AI pro hraní šachů, chce dosáhnout úrovně velmistra co nejúsporněji.

Díky rozvoji učení velkých jazykových modelů zkusili v Googlu revoluční myšlenku: nebudeme AI učit, jak se hrají šachy a jak se promýšlejí další tahy, prostě ji ukážeme, jaký má být v dané situaci další tah a ona se to naučí sama.

AI, jen se chvíli dívej a uč

Aniž by tedy AI věděla, jak se hrají šachy, a znala pokročilé strategie, dostávala jen rozmístění figurek na šachovnici a následný tah. Pro podobné učení je pochopitelně nezbytné, aby ten následný tah byl opravdu správný. Tady v Googlu sáhli po Stockfish 16, výkonném šachovém enginu klasické koncepce. Je mimořádně schopný, ale AlphaZero jej už porazil. Pořád je však dost silný na to, aby posloužil jako pravdivý zdroj pro učení jednoduché neuronky. 

Nová AI Googlu se pak prostým pohledem na šachovnici dokázala vyrovnat počítačové konkurenci a dosáhnout na šachové hodnocení ELO 2895. Nemusela přitom znát předchozí tahy, pravidla hry, ani prohledávat rozhodovací stromy.

image.png

A to ještě není pořád to zajímavé, její transformátorový model využívá jen 270 milionů parametrů, řádově méně než úsporné modely, které se tak tak vejdou na výkonné stolní počítače.

Především ale nejde vůbec o šachy. Google tady ukazuje, že s využitím stávajících známých principů pokročilého strojového učení dokáže úsporná AI i bez znalosti pravidel a postupů zvládnout algoritmicky náročné úlohy na velmi vysoké úrovni.

I to, co nám nyní připadá jako velmi složité, co dle nás vyžaduje pro rozhodování pokročilé znalosti mnoha různých zákonitostí, může být v zásadě řešené jednoduchou AI, které se vám jen chvíli dívala pod ruce a sledovala, co děláte.

Diskuze (11) Další článek: Microsoft má bleskový prohlížeč a přehrávač pro Windows, ale musíte si jej stáhnout zvlášť

Témata článku: , , , , ,