Umělá inteligence Microsoftu dokáže vytvořit fotky jen z textového popisu

Microsoft předvedl umělou inteligenci, která dokáže nakreslit kompletní obrázky pouze na základě toho, jak jsou jí popsány slovy. Vychází přitom z ohromného množství fotografií, které si předtím prohlédla.

Jak přesně to funguje? V zásadě stačí napsat "tento pták je žlutý s šedými křídly a sedí na větvi" a A.I. to nakreslí až s překvapivou přesností. Microsoft toho docílil díky vytvoření neuronové sítě jménem Attentional Generative Adversarial Network (zkráceně AttnGAN), která tvoří obrázky pixel po pixelu.

Microsoft tuto síť vytvořil jako součást celého programu, kde ještě můžeme najít např. Caption Bota, který dokáže sám popsat obrázky psaným slovem, a další umělou inteligenci, která dokáže odpovědět na otázky, týkající se obsahu nějakého obrázku.

Tato trojice by měla dopomoci strojům lépe pochopit lidi a svět tak, jak ho vidíme my. Samozřejmě nás ještě stále čeká dlouhá cesta, některé obrázky z galerie totiž nejsou tak přesné, jak by si tvůrci přáli.

Diskuze (12) Další článek: Tisknout přímo z mobilu a bez inkoustu je lákavé, ale realizace kulhá. Testujeme HP Sprocket

Témata článku: Software, Microsoft, Technologie, Programování, Umělá inteligence, Fotky, Neuronová síť, Fotografování, Pixel, Textový popis, Popis, Inteligence, Ohromné množství, Síť, Celý program, Dlouhá cesta, Fotka, Obrázek

Určitě si přečtěte


Aktuální číslo časopisu Computer

Jak rychlé je nabíjení bez drátů?

Test 11 sluchátek pro hráče

Aplikace, které vám zachrání dovolenou

Kompletní přehled datových tarifů