Garry Kasparov a souboj s počítačem Deep Blue v roce 1997

Garry Kasparov a souboj s počítačem Deep Blue v roce 1997

Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016

Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016

Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016

Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016

Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016

Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016

Loňský souboj špičkových hráčů s AlphaGo

Loňský souboj špičkových hráčů s AlphaGo

Superpočítač AlphaGo sestavený z procesorů Google Tensor Processing Unit pro strojové učení

Superpočítač AlphaGo sestavený z procesorů Google Tensor Processing Unit pro strojové učení

Tensor Processing Unit je vysoce specializovaná výpočetní jednotka, která namísto běžného procesoru obsahuje TPU – Tensor Processing Unit pro strojové učení.

Tensor Processing Unit je vysoce specializovaná výpočetní jednotka, která namísto běžného procesoru obsahuje TPU – Tensor Processing Unit pro strojové učení.

AlphaGo v týdnu porazil celou řadu špičkových hráčů a už nemá kam růst. Proto jej Google vypne.

AlphaGo v týdnu porazil celou řadu špičkových hráčů a už nemá kam růst. Proto jej Google vypne.

Světová jednička ve hře go, Kche Ťie, se třikrát utkal s Alpha go a pokaždé prohrál

Světová jednička ve hře go, Kche Ťie, se třikrát utkal s Alpha go a pokaždé prohrál

Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016
Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016
Záznamy her go mezi ALphaGo a špičkovými hráči v roce 2016
Loňský souboj špičkových hráčů s AlphaGo
10
Fotogalerie

DeepMind se pochlubil neuronovou sítí, která se učí, aniž by měla studijní data

Neuronová síť AlphaGo v posledních dvou letech porazila nejlepší experty ve hře go, a tak se zprvu zdálo, že laboratoř DeepMind, která dnes patří Googlu, program ukončí jako úspěšný a získané technologie využije zase v jiném oboru.

Článek publikovaný v časopisu Nature však ukazuje, že se věci mají trošku jinak a AlphaGo ještě má co říci. Jeho nová verze AlphaGo Zero je totiž poměrně unikátní.

Když se A.I. naučí hrát go, aniž by kdy viděla jakoukoliv jinou hru

51504435

Jak se zdokonalovaly tři různé verze AlphaGo: AlphaGo Lee je ta, která porazila nejlepšího hráče na světě. Supervised learning představuje síť, která se učila analýzou záznamů hromady lidských her (a vychází z ní právě verze Lee) a konečně reinforcement learning představuje novinku Zero, která na začátku nic neumí a nemá k dispozici žádná studijní data, jen základní pravidla, nicméně se učí hrou se sebou samotnou. Během několika desítek hodin překonala všechny předchozí verze.

I Zero porazí všechny hráče, ale přesto je o celý vesmír lepší než její předchůdci. Jak je to možné? Zatímco všechny ostatní verze se strojově učily na základě analýzy hromady her lidských a později strojových hráčů (tzv. supervised learning), AlphaGo Zero je jedním z prvních střípků do skládačky jménem univerzální A.I.

Síť Zero se totiž začala učit jen se znalostí základních herních pravidel – tedy asi tak, jako byste dostali k Vánocům šachy a návod ke hře, nicméně byste v životě neviděli žádný reálný mač... A za pár hodin by se z vás stal nejlepší hráč světa.

AlphaGo Zero se tedy začala učit od naprosté nuly a už po třech dnech poprvé překonala verzi, která v minulosti porazila nejlepší lidské hráče. Zhruba po měsíci nakonec dosáhla 90% úspěšnosti.

Právě v tomto je skrytý svatý grál strojového učení budoucnosti, to současné totiž sice odvede v mnoha úkolech skvělou práci, ale potřebujete velmi kvalitní studijní data a musíte jich mít dostatek, což v mnoha případech není vůbec jednoduché, a proto si se strojovým učením pohrávají hlavně ti, kteří tato data mají – Facebook a Google.

Podívejte se, jak se A.I. učí ve virtuálním světě zdolávat překážky:

Určitě si přečtěte

Články odjinud