Audiologger umožňuje automatickú konverziu zvukovej stopy videa na textový dokument a to v reálnom čase.
Na konferencii DEMO 99, ktorej cieľom je prezentovať nové špičkové priemyselné technológie a produkty, bol predvádzaný program Audiologger firmy Virage. Tento program umožňuje automatickú konverziu zvukovej stopy videa na textový dokument a to v reálnom čase. Audiologger „počúva“ zvuková stopu, identifikuje slová, mená hovoriacich a ostatné zvuky. Takto vytvorený index dovolí užívateľovi vyhľadávať vo videozázname potrebnú sekvenciu. Táto PC aplikácia prevedie zvukový záznam z akéhokoľvek zvukového zdroja, ale primárne sa počíta s nasadením vo vysielaní. Televízne spoločnosti ušetria veľa prostriedkov na titulkovanie, prepisovanie textov z videozáznamu a indexáciu správ.
Audiologger sa skladá z troch častí. Speech Keyword Engine vytvára index hovorených slov. V reálnom čase rozpoznáva slová a ukladá ich do dokumentu. Je nezávislý na hlase, teda nie je ho potrebné učiť počúvať konkrétny hlas. Obsahuje aj algoritmy na filtráciu šumu a okolitých ruchov zo záznamu.
Speaker Identification Engine identifikuje hlas z databázy až tristo osôb, bez ohľadu na slová alebo jazyk, ktorým osoba hovorí. Jednoduchým nahratím krátkeho úseku hovorenej reči sa do databázy dajú pridať ďalšie osoby.
Audio Classification Engine vytvára index zvukovej stopy. Určuje kde je v zázname hovorené slovo, hudba, šum, ruchy alebo ticho. Umožňuje rýchle a pohodlné prehľadávanie videozáznamov, čo doteraz bolo možné len ak sa vytvorili textové prepisy záznamu a manuálne sa roztriedili a označili jeho časti. Odteraz celú prácu vykoná PC a všetko v reálnom čase.