Neuronová síť Speech2Face rekonstruuje tvář podle nahrávky hlasu

Jakub Čížek 31. května 2019

Další
článek Mapy Googlu začaly v Česku upozorňovat na rychlostní radary. Funkce přichází z Waze SDÍLET NA FACEBOOKU TWEETNOUT

Když zavřete oči a začnete poslouchat neznámého člověka, podle hlasových charakteristik odhadnete jak jeho pohlaví, tak hrubý věk a dost možná i to, kde žije a do jaké socioekonomické skupiny patří. To vše díky naší zkušenosti, protože jsme za svůj život viděli a slyšeli tisíce lidí všech možných specifik.

Rozmazali jste text a tvář kvůli ochraně soukromí? Neuronová síť to stejně rozlouskne

Vědci z laboratoře pro umělou inteligenci MIT CSAIL na stejném principu vycvičili neuronovou síť Speech2Face. Potřebovali k tomu pár milionů videí z YouTube, přičemž algoritmus si v rámci strojového učení přiřazoval k tvářím jejich hlasový projev a hledal jednoznačné vzory pro statistický model.

Vpravo originální fotografie a vlevo její rekonstrukce podle hlasu osoby

Výsledek? Alespoň podle závěrů prezentovaných na GitHubu a ve studii na Arxivu (PDF) dechberoucí. Program podle charakteru hlasu určil nejen pohlaví a věk, ale opravdu i základní fyziologii tváře, neboť ta samozřejmě s drobnými nuancemi v hlasových rozdílech přímo souvisí.

A ještě jedno srovnání tentokrát s automaticky vygenerovaným avatarem osoby. Nabízí se tedy využití třeba ve hrách, na komunitních webech, VoIP aj., kde se obrázek uživatele vygeneruje podle jeho hlasu.

Autoři experimentu proto ujišťují, že při vývoji mysleli na etický rozměr a uklidňují čtenáře, že technologie rozpoznává opravdu jen základní rysy a nikoliv konkrétního člověka.

Diskuze (6) › Další článek: Mapy Googlu začaly v Česku upozorňovat na rychlostní radary. Funkce přichází z Waze

Témata článku: Umělá inteligence, YouTube, PDF, Neuronová síť, Strojové učení, GitHub, Soukromí, Síť, Milión videí, Řek, MÍT CSAIL, Nahrávka, Tvář, Hlas, Pohlaví, CSAIL, HLA, Arxivu, TV +

Doporučujeme

Dubnový Computer

Jak používat VR k práci

Megatest 18 levných monitorů

Test lokátorů s Bluetooth

Průvodce nákupem RAM

Kupte si časopis nebo předplatné

O webu

Napište nám | Redakce | Inzerce

Neuronová síť Speech2Face rekonstruuje tvář podle nahrávky hlasu

Rozmazali jste text a tvář kvůli ochraně soukromí? Neuronová síť to stejně rozlouskne

Vpravo originální fotografie a vlevo její rekonstrukce podle hlasu osoby

A ještě jedno srovnání tentokrát s automaticky vygenerovaným avatarem osoby. Nabízí se tedy využití třeba ve hrách, na komunitních webech, VoIP aj., kde se obrázek uživatele vygeneruje podle jeho hlasu.

{{values.title}}

Doporučujeme

Dubnový Computer

O webu

Proč si předplatit Netflix? Třeba kvůli těmto filmům. Všechny mají dabing nebo české titulky

25 nejlepších filmů o dobývání vesmíru. Víme, jestli a kde si je můžete pustit online

FOTO: Pikantní snímky norské modelky, která miluje Manchester United

Komunikace s úřady v mobilu: Portál občana spouští novou aplikaci, jak vám usnadní život?

Se Západem, nebo k Ficovi a Orbánovi? V Česku začala horká část kampaně před evropskými volbami

Karel Steigerwald: Zásadní zprávou z posledního kongresu ODS je, že byl zcela nevýznamný

Tahle loď instaluje největší větrné turbíny na světě. Uprostřed moře vysune hevery, zvedne jeřáb a přeroste Eiffelovku

Google není jen vyhledávač: 21 užitečných funkcí, o kterých možná ani nevíte

V nové Dacii Duster se vyspí i čahouni. Můžete ji proměnit v malý obytňák

Jak se liší světla Volkswagenů Passat a Tiguan? Desetitisíce diod má jen jeden

Neuronová síť Speech2Face rekonstruuje tvář podle nahrávky hlasu

Vpravo originální fotografie a vlevo její rekonstrukce podle hlasu osoby

A ještě jedno srovnání tentokrát s automaticky vygenerovaným avatarem osoby. Nabízí se tedy využití třeba ve hrách, na komunitních webech, VoIP aj., kde se obrázek uživatele vygeneruje podle jeho hlasu.

Doporučujeme

O webu

Nastavte si přezdívku