Jak mluvit s AI a nechat si automaticky shrnout obsah videa

Spoustu informací na internetu nenajdeme v textové formě, ale v různých návodech připravených formou videa. Ale kdo má dnes čas pro jednu větu sledovat celé video? Ukážeme si, jak využít generativní AI ke shrnutí a překládání obsahu z videí. Podmínkou ale je, aby měla titulky.

Jak využít Copilot v Edge

Pro tento účel musíte mít nainstalovaný prohlížeč Edge. Copilot ve webové verzi tohle zatím neumí. Nebo jsem nepřišel na to, jak ho k tomu úspěšně naprogramovat v NLP (natural language procesing), neboli ukecat.

Naopak Copilot v postranním panelu Edge často sám od sebe video na otevřené stránce detekuje a rovnou nabídne akci. Jestli souhrn zrovna nenabízí, zkuste dát nové téma, nebo stránku obnovit. Někdy detekce videa selže.

Další problém je absence titulků. Informace o obsahu videa totiž AI bere právě z nich, ale stačí i ty automaticky generované. U videa bez titulků si Copilot bez upozornění začne brát informace z popisu, který bývá o dost stručnější než samotný obsah.

image.png 
Tlačítko pro vygenerování souhrnu videa v panelu Copilota

Začněte kliknutím na Vygenerovat souhrn videa a nechte Copilota souhrn dokončit. Že si vzal informace z titulků, a ne z popisu, poznáte podle stopáže uvedené v hranatých závorkách. Video ani nemusí běžet, generované titulky si z něj Copilot umí vytáhnout i spuštění. Výsledkem je časová osa, podle které se můžete ve videu snadněji orientovat.

image.png 
Výsledek u Copilota: V úvodu ukáže shrnutí, poté obsah jednotlivých částí videa

Mohou ale nastat problémy, pokud souhrn vychází z generovaných titulků. Už ty má totiž na svědomí umělá inteligence, která občas chybuje a chyby se potom přenášejí dál. Problém je třeba s novými zkratkami. Například ve videích v angličtině zkratku GPT-4 všechna AI generující titulky neustále zapisují jako Jupiter.

V angličtině je výslovnost obou podobná a AI vyhodnotí, že pravděpodobnější je planetární varianta, protože se v textech použitých pro trénink vyskytuje mnohonásobně častěji. U ručně psaných titulků na tento problém samozřejmě nenarazíte. Třeba YouTube při zapnutí titulků píše, jestli jsou automaticky generované.

Jak využít plugin Glasp

Plugin Glasp do desktopových prohlížečů Chrome a Safari si můžete nainstalovat zdarma, ale má omezení pouze na videa na YouTube. Opět vychází z titulků, ale na rozdíl od Copilota nedělá přímo shrnutí, ale kompletní přepis titulků. Stejně jako Copilot nepotřebuje, aby se video přehrávalo a stačí mu generované titulky.

Glasp tlačítko.png 
Tlačítko v Glasp, které vytvoří přepis

Glasp využívá starší OAI GPT-3.5, v nastavení lze přepnout i na Anthropic Claude. U videí delších než 15 minut ale narazíte na problém. GPT-3.5 má na dnešní poměry malé kontextové okno a tak dlouhé video nezpracuje. Respektive zpracuje, ale bude rozdělené na kousky. Claude funguje i na videa o dvojnásobné délce. Shrnutí sice Glasp přímo sám nezvládne, ale po kliknutí na ikonku „ChatGPT“ v záhlaví shrnutí otevře nové okno ChatGPT s již zkopírovaným textem a promptem k vytvoření shrnutí.

image.png 
Přepis videa v Glasp, se kterým můžete pracovat například v ChatGPT nebo jiném AI nástroji

Porovnání výsledků

Pro srovnání obou variant jsem vybral video od Space Flight News, což je anglicky namluvená verze českého kanálu Kosmonautix. Česká verze videa nemá ručně psané titulky a YouTube zatím neumí generovat titulky z českého mluveného slova. K tomuto kanálu se váže i další AI zajímavost. Anglicky namluvená videa dabuje nikoliv sám autor, ale jeho AI generovaná verze hlasu v angličtině.

Copilot: Umí rovnou shrnutí s překladem a uvedením časové osy, neumí přímý přepis. Potřebujete prohlížeč Microsoft Edge.

Glasp: Umí pouze přímý přepis s časovou osou, k shrnutí a překladu potřebuje další AI, přímo je podporována aplikace ChatGPT. Je k dispozici pro prohlížeče Chrome a Safari.

Jak mluvit s AI

Při používání nástrojů postavených na AI je často obtížné vůbec si uvědomit, že je právě teď můžete použít. Že mohou pomoci při činnosti, kterou zrovna děláte – zjednodušit ji, zrychlit, třeba vykonat úplně za vás.

Rozhodli jsme se proto ukazovat, jak a kde AI použít. Konkrétně a prakticky. Když to jde, v ukázkách používáme nástroje, které jsou k dispozici úplně zdarma.

Určitě si přečtěte

Články odjinud