Google | YouTube | Umělá inteligence | Strojové učení

Umělá inteligence YouTube dokáže nově popisovat zvuky

Dobrá zpráva pro všechny sluchově postižené uživatele YouTube – zdejší algoritmy dokáží videa obohatit o popis základních zvukových efektů.

Už to bude osm let, co YouTube pomocích svých algoritmů tvoří automatické titulky, které miliony videí zpřístupňují lidem se sluchovým postižením. I když funkce ze začátku fungovala dost špatně, postupem času se výrazně zlepšila až do dnešní podoby, kdy je podle Googlu celkem blízko lidské transkripci.

Jenže mluvené slovo je jednou ze složek celé zvukové stránky audiovizuálních děl, a tak YouTube zcela poprvé nabízí automatické titulky i pro zvukové efekty. Systém v tuto chvíli dokáže popsat tři základní druhy zvuků: aplaus, hudbu a smích. „To byly nejčastěji manuálně popisované zvuky. Celému dílu dokáží dát kontext,“ píše Googlu na svém blogu.

Podobně jako u automatických titulků pro mluvené slovo, Google k zobrazení a tvorbě textu ze zvuků používá strojové učení. Společnost nejprve vytvořila umělou neuronovou síť pro ambientní zvuk, kterou následně „vycvičila“ pomocí tisíců hodin videí k rozpoznávání těch správných efektů. Jak vypadá výsledek, můžete vidět například v následujícím videu.

YouTube tvrdí, že si uvědomuje, že titulky jsou hodně jednoduché, a proto na nich hodlá dále pracovat. Časem chce rozpoznávat i zvuky jako je klepání, štěkot psů, zvonění a další. To bude o něco těžší, protože umělá inteligence se bude muset naučit rozpoznávat odkud zvuky pocházejí.

Diskuze (5) Další článek: Samsung plánuje 22 nových zakřivených televizorů. Jako jediný velký výrobce

Témata článku: Google, YouTube, Umělá inteligence, Strojové učení, Zvuk, Základní efekt, Štěkot, Postižení, Mluvené slovo, YouTube TV, Inteligence, Dobrá zpráva, Popis, POP, Dok, Zvukový efekt


Určitě si přečtěte

Vyzkoušeli jsme chytrou čínskou zásuvku Sonoff S26 za tři stovky. Nevyhořeli jsme

Vyzkoušeli jsme chytrou čínskou zásuvku Sonoff S26 za tři stovky. Nevyhořeli jsme

** Je sice z Aliexpressu, ale funguje ** Můžete ji ovládat hlasem přes Amazon Echo nebo Google Home ** Za tři stovky zautomatizuje menší 230V spotřebič

Jakub Čížek | 96

Google Coral: Raspberry Pi s čipem, který zpracuje 4 biliony operací za sekundu

Google Coral: Raspberry Pi s čipem, který zpracuje 4 biliony operací za sekundu

** Je to velké jako Raspberry Pi ** Ale je to až o několik řádů rychlejší ** Dorazil nám exotický Google Coral s akcelerátorem Edge TPU

Jakub Čížek | 18

Biblická potopa Česka: Jak bychom dopadli, kdyby nás zatopil oceán

Biblická potopa Česka: Jak bychom dopadli, kdyby nás zatopil oceán

** Představte si biblickou potopu ** Nejprve zaniknou Děčín a Břeclav, pak i Brno a Praha ** Hlavním městem se stane Jihlava a zbytky Čechů přežijí na Kvildě

Jakub Čížek | 91

3D tisk pro naprosté zelenáče: Co vyrobíte na laciném stroji za pár tisíc korun

3D tisk pro naprosté zelenáče: Co vyrobíte na laciném stroji za pár tisíc korun

** Domácí 3D tisk je dnes už finančně dostupný prakticky všem ** Lacinou tiskárnu pořídíte za pár tisíc korun ** Jak vlastně tisk probíhá a jak navrhnout, co vytisknout

Jakub Čížek | 66



Aktuální číslo časopisu Computer

Speciál o přechodu na DVB-T2

Velký test herních myší

Super fotky i z levného mobilu

Jak snadno upravit PDF