Denis Shiryaev prezentoval na svém YouTube kanále schopnosti „umělé inteligence“ při zpracování starých filmových záběrů. Pro tyto účely použil padesátisekundový němý černobílý film Příjezd vlaku do stanice La Ciotat, který v roce 1895 natočili bratři Auguste a Louis Lumièrové.
Jako většina tehdejších filmů bratří Lumièrových se i Příjezd vlaku skládá jen z jednoho záběru. Necelou minutu trvající snímek zachycuje příjezd vlaku do stanice ve francouzském přímořském městě La Ciotat. Obrazová kvalita snímku odpovídá možnostem a schopnostem dobové kamery, jak ostatně můžete posoudit sami:
Bratři Lumièrové ve 4K
Film Příjezd vlaku do stanice La Ciotat prý působil při promítání v kinech paniku, neboť děsil některé diváky tím, že vlak projede skrz plátno. Nakolik je tato historka pravdivá už dnes nezjistíme, avšak s ohledem na to, jakou novinkou v té době byly filmové projekce, se jistě pro mnohé jednalo o jedinečný zážitek.
Denis Shiryaev použil nejlepší dostupnou digitální kopii snímku, která už byla částečně očištěná a v rozlišení 720p:
Následně toto video nechal zpracovat algoritmy využívající neuronové sítě. Ty se snažily obraz rekonstruovat na základě metod strojového učení a následně jej dopočítaly do rozlišení 4K při 60 snímcích za sekundu. Na výsledek se můžete podívat:
Vyšší počet snímků za sekundu se projevuje větší plynulostí a dramatickým účinkem celé scény. Kromě toho, že je obraz černobílý, působí z hlediska své kvality tak, jako by byl natočen na moderní chytrý telefon nebo akční kameru. Je ale fakt, že při bližším zkoumání jsou znát silné artefakty dopočítávaného obrazu.
Poté ovšem vznikla ještě jedna další verze, která používá neuronovou síť DeOldify k obarvení videa. Na snímek se tak můžete podívat i v barvách (Full HD, 60 FPS):
Realizace dostupnou technikou
Shiryaev využil k převodu původního záběru několik veřejně dostupných programů, jako jsou například DAIN či Gigapixel AI od Topaz Labs. Druhý jmenovaný používá proprietární interpolační algoritmus, který „analyzuje snímek, rozpoznává detaily a struktury a doplňuje obraz“. V Topaz Labs naučili umělou inteligenci zaostřit a vyjasnit obrázky i poté, co byly zvětšeny až o 600 procent.
DAIN „dopočítává“ a vkládá obrázky mezi klíčové snímky existujícího videoklipu. Je to stejný princip, na jakém funguje vyhlazování pohybu u 4K televizorů. V tomto případě bylo úkolem přidat dostatek snímků pro zvýšení snímkovací frekvence na 60 fps.
I přes své současné zjevné nedostatky nabízí Shiryaevova technika lákavé příležitosti. Mohli bychom díky ní zažít renesanci němých filmů, která by představila historické filmové materiály v digitalizované a kvalitnější podobě, než v jaké byly pořízeny.
Omlouváme se za nepřesnosti v původním znění článku. Původně odkazované originální video pocházelo ze zdroje originálního videa uvedeného na Wikipedii, ovšem jednalo se o jinou verzi stejného záběru natočenou v jiný čas. Na první pohled jsme si rozdílu nevšimli, protože video zprvu působilo identicky a již jsme ho neprohlíželi celé. Za chybu se omlouváme, v článku je již opravena. Doplnili jsme při té příležitosti ještě nově vytvořenou kolorovanou verzi videa.