Google během úvodní keynote na konferenci I/O představil novou generaci AI Gemini 1.5 Pro a Flash, které si už můžeme všichni vyzkoušet v testovacím rozhraní pro vývojáře Google AI Studio.
Klíčovou vlastností nejnovějšího Gemini je obrovské kontextové okno o velikosti 1 milionu tokenů (pro vybrané partnery až 2 miliony). Kontextové okno je vlastně paměť AI v konkrétním chatu a tvoří ji jak samotný dialog, tak třeba přílohy.

Povídání o nahrané elektronické knížce, která spotřebovala 200 tisíc tokenů
Kontextové okno plní podobnou roli jako krátkodobá paměť u člověka. Když bude Pepa vést dialog s Máňou, po pěti minutách už začne zapomínat, co spolu řešili na začátku. Stejně tak pokud budeme vést příliš dlouhý dialog s chatbotem, po určité době začne zapomínat, o čem byla řeč v úvodu.
S milionem tokenů si AI přečte celou knihu
S milionem tokenů (token představuje jeden až několik znaků/bajtů) nicméně může být dialog obrovský a paměť Gemini astronomická. Anebo může být naprosto krátký, ale robotovi můžeme nahrát ke zpracování třeba celou knihu, video a další informačně složitá data.

Napiš recenzi na knížku, kterou jsem ti nahrál
V Google AI Studio si to všechno můžete vyzkoušet. Stačí se přihlásit svým účtem, vybrat model generace Gemini 1.5 a začít si povídat. Když nahrajete rozměrnější přílohu (pouze skrze Google Drive), webové rozhraní rovnou ukáže, kolik tokenů takový soubor spotřeboval z kontextového okna.


Výběr modelu AI z nabídky a možnost nahrání přílohy skrze úložiště Drive
Anebo klidně kompletní videoreportáž
Jen pro představu, když jsem tímto způsobem do studia nahrál zhruba tři minuty dlouhé video z reportáže, ve které studenti z ČVUT popisují jejich experimentální raketu Illustria, veškerá faktografie spotřebovala 44 840 tokenů. Z celého milionu tedy zlomek.

Rozbor tříminutové videoreportáže o raketě Illustria v Google AI Studio, která spotřebovala v paměti 45 tisíc tokenů
Za pár sekund jsem se už ale mohl s robotem bavit o tom, co je obsahem reportáže, ačkoliv měl k dispozici opravdu jen zmíněné video.
Stejným způsobem můžete nahrát do Gemini třeba vlastní diplomovou práci, knihu, libovolný evropský či český předpis o délce mnoha desítek normostran či jiná velká data a uvidíte, co robot dokáže.