Pokud jste někdy dělali titulky k videu, jistě víte, jak náročné je vytvořit je od nuly. Udělat časování, přepis řeči do krátkých úseků textu, korektura. Existuje však možnost, jak je vytvořit automaticky, a to i v češtině.
Společnost OpenAI vytrénovala a k volnému použití vydala neuronovou síť Whisper, která se v rozpoznávání anglické řeči blíží lidské úrovni. Systém trénoval na 680 000 hodinách vícejazyčných dat z internetu, což mu pomohlo k lepší odolnosti vůči akcentům či hluku na pozadí. Umožňuje přepis z/do více jazyků včetně češtiny, a také jejich automatický překlad do angličtiny.
Jde sice „jen“ o model, ne o aplikaci, existuje však cesta, jak ho můžete využít i vy už nyní, a to prostřednictvím nástroje Colaboratory na Disku Google.
Otevřete si Disk Google na drive.google.com a klikněte pravým tlačítkem do prázdné plochy. Ze seznamu vyberte Více, 1 jelikož tam ale ještě Google Colaboratory mít nebudete, klikněte na Připojit další aplikace. 2 Vyskočí vám okno obchodu Google Workspace Marketplace, ve kterém najděte Colaboratory 3 a aplikaci nainstalujte.
Pokračování článku patří k prémiovému obsahu pro předplatitele
Chci Premium a Živě.cz bez reklam
Od 41 Kč měsíčně