Britská laboratoř Googlu DeepMind se před třemi lety pochlubila neuronovou sítí WaveNet, která dokázala generovat jakýkoliv zvuk počínaje klavírním koncertem a konče hovorem v angličtině včetně imitace nádechů mezi slovy.
Google později technologii implementovat do svých hlasových syntetizátorů, takže dnes jsou nad WaveNetem postavení robotičtí mluvčí v hromadě jazyků, které pak firma používá ve svých internetových službách.
Po třech letech se s podobnou technologií pochlubila i nezisková organizace OpenAI, u jejíhož zrodu stala i peněženka Elona Muska. Cílem OpenAI je teoretický výzkum v oblasti A.I. a hlavním motivem vybudovat lepší společnost.
MuseNet složí čtyřminutovou hudební skladbu
Nejnovějším přírůstkem do rodiny neuronových sítí a dalších technologii OpenAI je MuseNet, který organizace představila před několika dny. Neuronová síť dokáže vygenerovat čtyřminutovou hudební kompozici s deseti různými nástroji a umí kombinovat hudební styly od Mozarta přes Beatles až po country.
Nahrávky níže vytvořila neuronová síť MuseNet naučením tisíců MIDI:
Vědci nenaučili MuseNet skládat hudbu podle jasného vzorce (sami to prý neumějí), ale namísto toho ji předložili stovky tisíc souborů MIDI. MuseNet v nich pak hledal struktury a opakující se harmonické vzorce, aby se naučil sám předvídat, jaký tón má následovat za tím předchozím, aby nahrávka fungovala a zněla dobře.
Samotná technologie používá stejný základ jako už dříve představená neuronová síť GPT-2, která namísto hudby pracuje se znaky a dokáže generovat souvislý text s vnitřním dějem. Tuto síť OpenAI představila letos v únoru, přičemž pro jistotu zveřejnila jen část naučeného modelu, protože se vědci obávali snadného zneužití třeba spamovacími boty.