Technologie | Umělá inteligence | Programování | Web

Algorithmia: Tisíc chytrých algoritmů, které obarví černobílou fotografii a umí i další kouzla

  • Algorithmia je katalog unikátních inteligentních API
  • Vyzkoušet si je může každý zdarma
  • A to i když nenapíše ani řádku kódu

Ať už máte služby Googlu v oblibě, anebo se jim vyhýbáte širokým obloukem, jedna věc se mu nedá upřít – jako jeden z mála pouští do svých služeb atraktivní inteligentní automatizaci. Když tedy v jeho úložišti obrázků Photos zadám do vyhledávače budovy nebo třeba rozhledna, pokusí se najít fotografie, na kterých dominují buď stavby, nebo rozhledny, věže, výhledy do širého okolí a tak dále. A to nikoliv proto, že se tak jmenují jednotlivé soubory nebo jsem snímky jednotlivě popsal, ale jednoduše proto, že fotografie prošel indexovací robot a pokusil se sám rozpoznat, co na nich je.

Klepněte pro větší obrázek
Google Photos díky strojovému učení rozpoznají fotografie podle jejich skutečného obsahu. Zdaleka to není dokonalé, ale rozpoznávání se s novými a novými fotografiemi postupně zlepšuje.

Software, který se pokouší vidět

Této oblasti počítačového softwaru se obecně říká CV – Computer Vision a Google zdaleka není první. Ostatně komunita vývojářů již celé roky vyvíjí třeba soubor knihoven OpenCV, které většinu podobných úkolů hravě zvládnou a na OCV pak staví další a další odvozené knihovny, které se už soustředí třeba jen na vyhledávání osob a určování parametrů jako jejich pohlaví, věk, barva kůže, emoce a tak podobně. Pokud máte výkonný počítač a programování vám není cizí, takový vlastní chytrý klasifikátor fotek si nad OCV postavíte i bez Googlu a jeho chytrých datacenter.

Doba se ale mění, a jak se postupně přesouváme do cloudu, roste i hlas po chytrých službách. Vývojáři nechtějí dlouhé týdny studovat OpenCV a vyhrazovat pro něj dedikovaný server. Namísto toho chtějí někam poslat fotku, to něco typu fotku samo analyzuje, vyplivne třeba JSON s výsledkem a strhne nějaký ten kredit.

Těžko říci, jak tento nový segment chytrých API nazvat, ale říkejme tomu hezky česky třeba inteligence jako služba, podobná API se totiž zdaleka neomezují jen na analýzu fotografií, ale do nejmenšího detailu rozeberou i text. Zde už ale zpravidla narážíme na to, že většina z nich si zatím dobře poradí pouze s angličtinou.

Tisícovka inteligentních algoritmů

Dost ale planého teoretizování. Pojďme se na jednu takovou službu podívat pod drobnohledem. Jmenuje se Algorithmia a dokáže takové divy jako třeba analýzu toho, čemu se věnuje nějaký úryvek textu. Přesně to umí API AutoTag, které přechroustá text a vyplivne charakteristická klíčová slova. Po něčem takovém by jistě zatoužil nejeden webový vydavatel, nebo třeba knihovna, škola a další instituce pracující s ohromnými kvanty textu, který je třeba nějak klasifikovat.

Klepněte pro větší obrázek
Algorithmia je databanka chytrých algoritmů, které analyzují text a fotografii

Všemožné komunikační služby by zase ocenily API Sentiment Analysis, která na stupnici od 0 do 4 vyjádří, jestli je text spíše negativní, neutrální nebo pozitivní.

Algorithmia dnes nabízí podobných alogritmů okolo tisícovky, což z ní činí naprosto unikátní znalostní systém pro vývojáře, kteří za používání služby platí podobně jako za mnohé jiné hostingové služby. Každé využití API jednoduše spotřebuje nějaký počet kreditů, které je třeba zakoupit jako jakékoliv jiné elektronické zboží.

Klepněte pro větší obrázek
Použití Algorithmie je snadné i pro laika a to pomocí formuláře pro rychlé vyzkoušení konkrétního algoritmu. Zde jsem do horního levého formuláře vložil odkaz na fotografii, která se má zpracovat, a klepl na tlačítko Run. Vpravo se pak zobrazí odkaz na výsledek, který vede do interního úložiště služby. Níže pak služba vygenerovala kód pro použití v několika programovacích jazycích.

Jenže pozor! Každý nový uživatel dostane pro začátek zdarma několik tisíc kreditů, aby si mohl vše vyzkoušet. Použití Algorithmie je zároveň díky připraveným příkladům a předvyplněným formulářům naprosto snadné a službu si tak může vyzkoušet i ten, pro kterého je jakékoliv programování španělská vesnice.

Pojďme si tedy pár takových ukázek vyzkoušet v praxi.

Obarvení černobílých fotografií

V týdnu si některá americká média všimla algoritmu, který pomocí strojového učení promění černobílý snímek v barevný. A to vše bez jakékoliv asistence uživatele. Ten jen do formuláře/API vloží odkaz na původní černobílý snímek a spustí převod.

Klepněte pro větší obrázek
Algoritmus Colorful Image Colorization slibuje podobné kouzlo

Systém strojového učení se v tomto případě na hromadě starších fotek naučil, které části předmětů a černobílé odstíny mají nejtypičtější barvu a to pak na tyto oblasti fotky aplikuje.

Převod ani zdaleka není dokonalý a ne vždy se podaří, pokud však vezmete v potaz, že vše provádí automat, je to příslib toho, že je jen otázkou času, kdy se podobných kouzel strojové CGI dočkáme v každém grafickém editoru.

Klepněte pro větší obrázek Klepněte pro větší obrázek
Takto strojově naučená Algorithmia obarvila moje o dvacet let mladší černobílé Já

Co to je?

Další zajímavý CV algoritmus je klasifikátor fotografií Places365, který se opět s pomocí strojového učení pokusí popsat místo na fotografii. Namísto popisu osob a jejich biologických charakteristik tedy například odpoví, že na snímku je s pravděpodobností 0,66 (66 %) třeba mrakodrap. Vývojář pak může takový klasifikátor použít k automatickému rozřazení fotografií podobně jako Google ve svých Photos.

Klepněte pro větší obrázek
S 61% pravděpodobností se jedná o věž a se 14% se jedná o mrakodrap
Klepněte pro větší obrázek
A takto Algorithmia vidí tuto fotku Alcatrazu

Pokusí se odhalit emoce

Do třetice můžete vyzkoušet ještě onen zmíněný detektor pozitivní a negativní emoce. Sice mu můžete předložit text v libovolném jazyce, nicméně alespoň trošku spolehlivé výsledky podá především v angličtině. Zároveň zapomeňte na to, že stačí napsat pouze „I love you“ a protipól „I hate you!“ Algoritmus potřebuje pro spolehlivou detekci více dat. Pokud je dostane a API bude využívat třeba některý z botů pro Facebook Messenger, může inteligentněji zareagovat na vaši přirozenou komunikaci.

Klepněte pro větší obrázek
Toto je zjevně negativní emoce
Klepněte pro větší obrázek
A toto sdělení má naopak pozitivní emoci

Algorithmia skýtá podobných lahůdek obrovské množství, a výchozí bezplatné kredity tak podobnými hrami vytřískáte velmi rychle. Celé to má vlastně jen jeden háček – snad kvůli zájmu médií v posledních několika dnech je služba docela pomalá, a tak zpracovávání byť jen jedné zmenšené fotografie trvá i několik minut.

Nelze však než doufat, že podobná automatika bude časem samozřejmostí všech podobných fotogalerií na webu. A kdy se podobná automatika dostane do všemožných softwarových katalogů a grafických editorů? Těžko říci. Nejde totiž o to, že by to snad už dnes nešlo – viz třeba zmíněná knihovna OpenCV, nicméně si představte, že by měl třeba klasifikátor objektů ve snímků projít jednu fotografii za druhou na vašem počítači. Trvalo by to dlouhé hodiny permanentní zátěže procesoru a GPU, což by asi většinu uživatelů odradilo. I porot lze předpokládat, že se v dohledné době podobná automatika rozšíří především v cloudu, který může vaše data zkoumat, aniž by vás to jakkoliv omezovalo na počítači.

Diskuze (5) Další článek: CryptoDrop je nejúčinnější ochrana proti ransomware, zatím jen ve fázi testování

Témata článku: Technologie, Umělá inteligence, Programování, Web, Strojové učení, Fotografování, API, Fotky, CGI, OpenCV, Určování, Španělská vesnice, Hate, Černobílý snímek, Asistence, Širé okolí, Interní editor, DAL, Alcatraz, Nový segment, Nejmenší detail, Škoda Vision E, Mrakodrap, Webový vydavatel, Tisícovka



Recenze cykloradaru Garmin Varia RCT715. Bílé dodávky, všechny si vás natočím

Recenze cykloradaru Garmin Varia RCT715. Bílé dodávky, všechny si vás natočím

** Garmin do svého stále unikátního cykloradaru přidal kameru ** Snímá a ukládá, co se při jízdě děje za sedlem ** Kromě toho je to jedna z nejsilnějších svítilen na kolo

Marek Lutonský
Testy
Rozluštili jsme infračervený signál a připojili starou stropní klimatizaci k internetu

Rozluštili jsme infračervený signál a připojili starou stropní klimatizaci k internetu

** Nedávno jsme si pohráli s mobilní klimatizací a Wi-Fi ** Ale co se starými kancelářskými kusy? ** Dekódujeme jejich IR signál a vyrobíme si Wi-Fi ovladač

Jakub Čížek
Pojďme programovat elektronikuProgramování
Vyzkoušeli jsme DALL-E 2, noční můru všech grafiků. Umělá inteligence zvládne náročné koláže a má smysl pro humor

Vyzkoušeli jsme DALL-E 2, noční můru všech grafiků. Umělá inteligence zvládne náročné koláže a má smysl pro humor

** OpenAI uvolnilo do betaverze umělou inteligenci DALL-E pro generování obrázků a fotografií ** Technologie zvládne generovat obrazy všeho druhu i podle jakéhokoli stylu **

Karel Javůrek
OpenAIUmělá inteligenceByznys
Domácí síť bez kompromisů. Jak dosáhnout na maximální propustnost a dokonalé pokrytí

Domácí síť bez kompromisů. Jak dosáhnout na maximální propustnost a dokonalé pokrytí

Rychlost sítě omezuje ten nejpomalejší prvek po cestě. Poradíme vám, jak vybudovat síť s maximální propustností a dokonalým pokrytím domácnosti.

Antonín Trčálek
SíťRouter
Tuto českou základnu plnou satelitů nesmíte vidět. V Mapy.cz je každá anténa pečlivě vyretušovaná

Tuto českou základnu plnou satelitů nesmíte vidět. V Mapy.cz je každá anténa pečlivě vyretušovaná

** Zapomeňte na rozčtverečkovaná místa, kterých si každý všimne ** Mapy.cz musely dokonale zakrýt desítky parabol ** Základnou se přitom na webu chlubí i její majitel. Kocourkov

Jakub Čížek
ČeskoMapy.czMapy
Šmírování kamerami Googlu: Koukněte, co nového se zase objevilo na Street View

Šmírování kamerami Googlu: Koukněte, co nového se zase objevilo na Street View

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

redakce
Mapy GoogleStreet View