Rozpoznání obličeje nefunguje zrovna optimálně a lze ho obejít. Co když ale použijete heslo, které vyslovíte pouze pohybem vlastních rtů?
Počítače a mobilní telefony dnes odemykáme různými způsoby, mezi současné použitelné techniky patří snímání otisku prstu, které je rychlé a relativně funkční, alespoň v případě Touch ID od Applu. Čtečky otisků prstů jsou ale zatím pouze u nejdražších mobilních telefonů a v případě počítačů či notebooků jsou spíše výjimkou i u dražších modelů.
Rozpoznání obličeje pomocí přední kamery je trochu problémové především kvůli tomu, že se jedná o 2D kameru a přesnost a správné rozpoznání pod různými úhly a nasvícením je nízká, což znamená i otravné chybné snímání a systém oklamání třeba fotkou. Problémy jsou i u hlasových hesel, kdy ruší okolní šum a navíc ho může případný útočník snadno získat.
Vědci ale přišli na jednoduchý způsob, jak odemknout počítač bezpečně a relativně dobře i s běžnou 2D kamerou – stačí aby počítač uměl odezírat ze rtů a nejlépe pouze z vašich.
Když počítač odezírá ze rtů
Ahmad B. A. Hassanat se v rámci svého výzkumu o obrazovém heslu zaměřil na využití současných kamer v počítačích, mobilních telefonech nebo tabletech a rozpoznávání rtů. Naučit počítač odečítat konkrétní slova ze rtů je ale samozřejmě velmi náročné a poměrně dost se liší dle konkrétního člověka. Pravděpodobně jde ještě o náročnější věc než v případě rozpoznávání hlasu.
Systém rozpoznávání se soustředí pouze na rty a pusu
Místo rozpoznávání jednotlivých slov se tak spíše zaměřil na efektivnější a jednodušší způsob – odezírání slov ze rtů stejného uživatele, který zároveň uložil prvotní vzory.
Hlavní a poměrně úspěšný systém tak funguje na stejném principu jako jiné rozpoznávací techniky – uživatel nejdříve do počítače uloží vlastní vzor, se kterým pak posléze probíhá porovnání.
Pro maximální zabezpečení si může uživatel zvolil heslo tvořící několik slov, což umožňuje vytvořit relativně slušně bezpečné heslo. Systém pomocí kamery nahraje videozáznam, ve kterém zanalyzuje pouze oblast rtů a jednotlivé pohyby a tvary v průběhu času. Uživatel nic nahlas nevyslovuje, pouze řekne heslo pomocí pohybu rtů.
Po několika opakování se vytvoří vzor, se kterým se porovnávají budoucí pokusy o ověření.
Nízká chybovost
Trochu ironií je, že díky rozšíření „selfie“ (focení sebe sama a dalších přední kamerou) se poměrně rychle rozjíždí rozlišení u předních kamer, které stagnovalo poměrně dlouho. U videohovorů to zkrátka nebylo tolik potřeba.
Nahrané vzory pro rozpoznání vycházejí z videa, ze kterého se vyhodnocují jednotlivé snímky a vlastnosti pusy - pohyby rtů, případné objevení zubů a podobně
Právě díky vyššímu rozlišení lze poměrně přesně nahrávat pouze rty a pusu a zachytit tak i malé detaily. Ale vzhledem k tomu, že se využívá kamera, musí být k dispozici alespoň trochu ucházející světelné podmínky. Náchylnost na špatnou detekci není ale tak vysoká, jako při rozpoznání celého obličeje.
Do testování úspěšnosti detekce u různých uživatelů se přihlásilo celkem 20 uživatelů – deset mužů a deset žen. Dalších 15 lidí se pak zúčastnilo pouze pomocí videozáznamu.
Z tohoto vzorku bylo měřením dosaženo poměrně slušné výsledku – chybovost se pohybovala od 7,63 % až do 20,51 %, což byl nejhorší případ. Taková úspěšnost správné detekce je velmi slušná vzhledem k tomu, že se k rozpoznání vzorů používá 2D kamera.
Doplňkové zabezpečení
Systém obrazového hesla pomocí několika slov má řadu výhod oproti konkurenčním řešením. Rozpoznání obličeje má vysokou chybovost a lze ho obejít pomocí fotografie (pokud nejde o 3D kameru). Klasické piny jsou příliš krátké, zvukové heslo lze odposlechnout a nahrát. Snímání otisku vyžaduje speciální hardware.
Nahrání a falšování pohybů rtů je složité a i když budete mít záznam, bude vám více méně k ničemu. Každý člověk totiž říká slova jiným způsobem a je tak velmi těžké případnou sekvenci přesně zreplikovat.
Ale stejně lze riziko ještě dále minimalizovat. Další úrovní zabezpečení je, že uživatel bude například vyslovovat pouze jedno slovo z celé sekvence slov. Pokaždé může být dotázán jiným slovem v pořadí – na displeji se objeví třeba „Vyslovte 5. slovo z hesla“ a tím pádem se minimalizuje riziko případného zcizení. Jedno slovo lze navíc vyslovit poměrně rychle s čímž souvisí i porovnání rychlosti třeba se čtečkami otisků.
Čtečky ale vyžadují další kus hardwaru, zatímco vizuální heslo z pohybu rtů si vystačí s integrovanou kamerou. I když se jedná o zajímavou technologii, tvůrce výzkumu o rozpoznávání slov ze rtů s ní počítá spíše jako s doplňkovým zabezpečením. Systém tak může mít povahu dodatečného složitějšího hesla, například pokud zadáte třikrát špatně pin, tak se objeví nutnost zadání vizuálního hesla pomocí rtů.