Umělá inteligence | Neuronová síť | IT Osobnosti | Paul Allen

Umělá inteligence Paula Allena by se dostala na střední školu. Zvládla test z přírodovědy

Umělá inteligence Paula Allena by se dostala na střední školu. Zvládla test z přírodovědy

V roce 2016 oznámila laboratoř AI2 (Allen Institute for Artificial Intelligence) výsledky soutěže, ve které vyzvala počítačové experty, aby vyrobili program, který pokoří znalostní test z přírodních věd na úrovni žáka, který opouští základní školu (8th grade).

Z přihlášených projektů neuspěl ani jeden a i ty nejzdařilejší programy s databázemi tisíců a tisíců testů, nedosáhly vyššího než 60% skóre. Výzvu nakonec po letech splnila samotná laboratoř AI2 a její technologie Aristo, o které nyní napsal The New York Times.

Klepněte pro větší obrázek
Ukázka standardního přírodovědného testu americké úrovně 8th grade

Experti test z přírodních věd trošku upravili, takže počítač dostal jen textové otázky, přičemž měl vybrat správnou odpověď. Ve skutečném testu by mohly být i grafické úlohy, takže do práce by se muselo zapojit i obrazové rozpoznávání, což ale nebylo účelem tohoto experimentu.

Chcete příklad otázky? Na webu AI2 jich najdete požehnaně. Třeba:

Který objekt sluneční soustavy odráží světlo a je oběžnicí naší planety?

A) Měsíc
B) Země
C) Merkur
D) Slunce

Chvíle napětí… Ano, správná odpověď je samozřejmě ta první a programu bude stačit relativně jednoduchá sémantická slovní analýza bez špetky náročnějšího logického uvažování. Viz obrázek níže přímo od AI2.

Klepněte pro větší obrázek
Jak Aristo analyzuje text

Co ale nějaká komplikovanější otázka? Podle NYT si tak musel Aristo poradit třeba i s tou následující pro fanoušky veverek.

Co nejpravděpodobněji povede ke zmenšení populace veverek v dané oblasti?

A) Snížení počtu predátorů
B) Snížení konkurence mezi veverkami
C) Zvýšení dostupnosti potravy
D) Zvýšení počtu lesních požárů

Toto je už pro program přeci jen složitější rébus. Správnou odpovědí je sice D, tedy pravděpodobný úbytek veverek po lesním požáru, nicméně program by stejně tak ve své databázi mohl narazit třeba na analogii známé studie, podle které se u některých společenství může nepřirozeným navýšením životních zdrojů snížit natalita. Stroj by tedy mohl dojít k závěru, že správnou odpovědí by mohlo být v určitém kontextu i C anebo dokonce B a A.

Tazatel se ale ptá na ten nejpravděpodobnější a lokální důvod, kterým v tomto výčtu bude opravdu lesní požár a nikoliv hypotetická proměna sociálního chování veverek, pokud je dlouhodobě zahrneme mlékem, strdím a odstraníme všechny predátory. Člověk tento rozdíl automaticky pozná, ale co stroj?

Nevíme, jestli Aristo správně odpověděl zrovna na tuto otázku, celkově však test zvládl s úspěšností okolo 90 %, a pokud by to byl americký školák, vzali by ho na střední.

Jedná se tedy o další zajímavý experiment, který ukazuje současné schopnosti textové analýzy, která by se v tomto případě hodila třeba webovým vyhledávačům, protože je to v prvé řadě skvělá demonstrace počítačového pochopení dotazu.

Laboratoř AI2 v roce 2014 založil a společně s dalšími projekty financoval spoluzakladatel Microsoftu Paul Allen, který v říjnu loňského roku podlehl rakovině, se kterou bojoval už od raných 80. let.

Diskuze (20) Další článek: Stát vytvořil mapu výskytu umělé inteligence v Česku

Témata článku: Microsoft, Země, Sluneční soustava, Umělá inteligence, Slunce, Strojové učení, Neuronová síť, IT Osobnosti, Paul Allen, Lesní požár, Grad, Stroj, Str, Úbytek, Veverka, Test, Správná odpověď, New York Times, Microsoft Paul Allen, Inteligence


Určitě si přečtěte

Biblická potopa Česka: Jak bychom dopadli, kdyby nás zatopil oceán

Biblická potopa Česka: Jak bychom dopadli, kdyby nás zatopil oceán

** Představte si biblickou potopu ** Nejprve zaniknou Děčín a Břeclav, pak i Brno a Praha ** Hlavním městem se stane Jihlava a zbytky Čechů přežijí na Kvildě

Jakub Čížek | 93

Nový Edge je opravdu Chrome! Prohnali jsme prohlížeče benchmarky i vlastním unikátním testem

Nový Edge je opravdu Chrome! Prohnali jsme prohlížeče benchmarky i vlastním unikátním testem

** Nový Edge je postavený na Chromiu ** Prohnali jsme ho benchmarky a srovnali s ostatními ** Potvrdily nám, že je prakticky stejný jako Chrome a Opera

Jakub Čížek | 65

Nejlevnější router s Wi-Fi 6 v testu: vážně ještě chcete kupovat routery jen pro 802.11ac?

Nejlevnější router s Wi-Fi 6 v testu: vážně ještě chcete kupovat routery jen pro 802.11ac?

** Otestovali jsme TP-Link Archer AX10, nejdostupnější router s Wi-Fi 6 ** Šetřilo se, ale zatím ty ústupky tolik nebolí ** Pro domácí síťování pohodlná volba, do firmy ale chcete něco lepšího

Tomáš Holčík | 43



Aktuální číslo časopisu Computer

Megatest 12 bezdrátových sluchátek

Vyplatí se Apple z bazaru?

Test batohů pro notebooky

Vybíráme nejlepší sportovní hodinky