Mizerný zvuk promění na výrazně lepší. Strojové učení v Teams odstraňuje nejen ozvěnu | zdroj: Microsoft Teams / YouTube / koláž: Petr Urban / Živě.cz

zdroj: Microsoft Teams / YouTube / koláž: Petr Urban / Živě.cz

Mizerný zvuk promění na výrazně lepší. Strojové učení v Teams odstraňuje nejen ozvěnu

Nedávno Microsoft na jablečné platformy přivedl inovace v oblasti kvality zvuku při online schůzkách. Teď se firma chlubí tím, že díky „umělé inteligenci“ audio zkvalitňuje na více frontách. Minule šlo o eliminaci rušivých zvuků na pozadí tak, aby byl slyšet jen hlas řečníka či řečnice.

Model strojového učení ale také potlačí ozvěnu, takže už byste neměli slyšet sami sebe, když někdo na druhé straně poslouchá příchozí zvuk do reduktoru místo do sluchátek. Často bývá reproduktor k mikrofonu blíže než mluvící osoba, takže je příchozí zvuk hlasitější, tudíž je náročnější ho odstranit.

Zvlášť když obě strany mluví současně. Když ale mluví mluvit jen jedna, je pro druhou obtížnější ji přerušit. I to se podařilo zlepšit, protože teď mohou obě strany poslouchat a mluvit zároveň. Vývojový tým dále docílil odstranění dozvuků. Zachycený signál po úpravě zní tak, jako kdybyste mluvili do mikrofonu na krátkou vzdálenost. Na plody práce se můžete podívat na videu níže:

Microsoft pro trénování modelu, který by si poradil s filtrováním signálů v reálném čase, použil zhruba 30 000 hodin záznamů řeči. Nešlo o data z hovorů v Teams, ale o veřejně dostupná data, kde tým zajistil vyváženost mužských a ženských hlasových projevů v 74 jazycích.

Aby se vyhnul zvýšené komplexitě, netrénoval dva modely, ale jeden, který odfiltruje rušivé zvuky a současně i ozvěnu. Tento model běží o 10 % rychleji než dřívější model pro potlačování rušivých zvuků. Microsoft jej aktuálně zapíná v klientu Teams pro Windows a macOS a brzy dojde i na mobily.

Zdroje: Microsoft Teams Blog

Určitě si přečtěte

Články odjinud