Každý den pracujeme s hromadou statistických zdrojů a pročítáme desítky RSS. Když je začnete také sledovat, snadno nás přechytračíte. Vybrali jsme jich deset.
Ano, já vím, že těch způsobů je samozřejmě mnohem více, přesto možná stojí za to sepsat nějaký sumář zajímavých zdrojů, ze kterých při své práci čerpáme, ze kterých možná už dávno čerpáte i vy, ale které zatím nikdo nedal na jednu pěknou hromádku.
Našim hlavním zdrojem při každodenní práci je pochopitelně agregátor nejrůznějších zahraničních médií a blogů. Drtivá většina z nás se neobejde bez Google Readeru, který je vyzbrojen několika desítkami nejrůznějších RSS kanálů. Pokud ale připravujete větší článek, nebo chcete obohatit o nějaké to číslo i kratší zprávičku, je třeba se poohlédnout jinde.
Vybral jsem deset spíše statistických zdrojů, ve kterých najdete hromadu zajímavých čísel a docela možná i odpověď na otázku, kterou jste u nás marně hledali.
Občas mám pocit, že Wolfram Alpha používají skutečně jen novináři a aktivní studenti, trošku se na něj možná zapomnělo – možná jej běžný surfař ani nepotřebuje. To je ale škoda, Wolfram Alpha totiž není pouze chytrá kalkulačka, ale v mnoha směrech i skutečně velmi efektivní centrální mozek lidstva. Představte si třeba situaci, kdy se chcete rychle podívat na historické příjmy Applu, Microsoftu a Googlu a tato data chcete porovnat. Bez Wolframu byste museli pročítat tiskové zprávy a hutné hospodářské výsledky za vybrané kvartály. Přitom na to samé ve zhuštěné formě odpoví právě tato služba. Stačí se ji zeptat třeba extrémně jednoduchou formulí apple, microsoft, google. WolframAlpha si ale poradí i s mnohem specifičtějším zadáním, takže si můžete nechat vypsat třeba jen příjmy (apple, google, microsoft revenue) a případně zobrazit i graf s přesným časovým rozpětím (revenue 1990-2010). Znalostní vyhledávač pana Wolframa je v dotazování neskutečně tvárný a hromadu tipů, jak z něho vytáhnout ekonomická a statistická data, najdete na stránce s desítkami příkladů rozdělených do kategorií. Vyhledávač je věrohodný, data totiž ždímá z důvěryhodných ekonomických zdrojů (jejich seznam najdete u každého výsledku), nikoliv z širého intenretu jako klasické fulltextové vyhledávače.
Vše na jedné hromadě, to umí jen WolframAlpha
Své známé můžete rychle ohromit i znalostí velikosti internetu, respektive velikostí jeho populace surfařů. Na tuto otázku hledá odpověď už dlouhá léta stránka internetworldstats.com. Najdete zde počty internetový h surfařů podle kontinentů i konkrétních zemí, a přestože se design stránky zapomenul kdesi v 90. letech, je skutečně skoro nenahraditelná.
Celý internet na dlani. Na webu najdete i metodiku odhadu/výpočtu
Internet World Stats se věnuje velikosti populace, Ad Planner pro zadavatele reklamy se zase snaží odhadem zjistit návštěvnost konkrétních webů – domén. Pokud si tedy vyhledáte třeba stránky Živě.cz, Ad Planner vypíše počet měsíčních unikátních návštěvníků, počet zobrazených stránek, další údaje a také vývoj v čase.
I kdybychom se nechtěli pochlubit svou měsíční návštěvností, Google to odhadne
Ad Planner poslouží ke zjištění odhadované návštěvnosti větších českých a zahraničních webů. NetMonitor se pak věnuje pouze těm českým a jedná se už o klasické počítadlo, jehož měřící kód musí mít každý registrovaný web. Podstatné je to, že NetMonitor je nepsaný (a vlastně i psaný) český standard, jeho služby totiž využívají všechny velké české weby včetně Seznamu, portálu iDnes a samozřejmě i webů Mladé fronty.Porovnáním relativně přesných čísel NetMonitoru a odhadovaných čísel AdPlanneru zjistíte, že je služba Googlu docela přesná.
NetMonitor nabízí každému návštěvníkovi živá aktuální data a měsíční výstupy v PDF a XLS
Pokud připravujeme články, ve kterých zazní nějaký ten tržní podíl webového prohlížeče, většinou používáme měřící službu StatCounter, Rankings a pochopitelně i Analytics od Googlu s daty návštěvníků Živě.cz. StatCounter se v posledních letech stal standardem na poli měření globálních tržních podílů, pokud ale hledáte třeba podíly webových prohlížečů v Česku, raději se řiďte výsledky Rankings. Rankings.cz je služba společnosti Gemius, která vychází z dat naměřených v NetMonitoru, jelikož i toto měření technicky zajišťuje Gemius (než jej brzy vystřídá americký ComScore). Pokud si tedy mnozí stěžují, že StatCounter nedokáže podat uspokojivé výsledky používání prohlížeče, OS a tak dále v Česku, protože se do jeho měření započítalo příliš málo českých přístupů (a tedy nereprezentativních), Rankings tento problém zatím nemá, jeho statistické výsledky jsou totiž založené na milionech přístupů na běžné české weby jako je Seznam, v podstatě všechny zpravodajské weby a tuzemské zábavní služby.
Rankings.cz zjistí, co v Česku používáme a v čem surfujeme
Data pro český NetMonitor bude brzy připravovat americký a respektovaný ComScore. Populární statistická služba vydává hromadu zajímavých čísel, ta jsou ale placená a tedy ne pro každého. Pokud se nechcete spoléhat na pár bezplatných periodických výstupů a tabulek, určitě koukněte na web comscoredatamine.com. Je to jakási galerie nejrůznějších grafů, žebříčků, mapek a dalšího barevného infotainmentu bez ladu a skladu. Občas se jedná o docela obskurní okrajové analýzy, najdete zde ale i skutečné špeky. Nechybí naštěstí rozdělení do kategorií.
Jedna ze statistických mapek, choropletů, z webu Data Mine
Český statistický úřad za dobou svého působení vydal ohromné množství publikací, přičemž většina z nich dnes k dispozici díky internetu v digitální podobě a online. Je to případ i této ucelené studie s desítkami a možná i stovkami grafů a tabulek o moderních dějinách postkomunistického státu. Nás by měla nejvíce zajímat osmá kapitola s názvem Výzkum, vývoj informační technologie. Podobných publikací najdete na webu czso.cz hromadu a skrývají množství zajímavých čísel o českém internetu a počítačích. Statistické novinky o České republice a zejména hospodářství můžete sledovat i na twitterovém kanálu #statistickyurad.
Dost už ale statistických čísel! Magickým pojmem posledních let je cloud-computing… A hromada dalších buzzwordů včetně slovíčka startup. Původně ryze ekonomický termín se v poslední době stal všudypřítomnou nálepkou v podstatě pro každou začínající webovou službu včetně těch, jejichž autoři snad ani nechtějí vydělávat peníze, natož zakládat firmu. Všechny tyto experimenty i vážně míněné projekty se snaží katalogizovat web killerstartups.com. Každý den zde objevíte okolo desítky nových projektů, což vřele doporučuji všem studentům informatiky a nejrůznějšího byzu, kteří právě dopsali svůj skvělý projekt třeba v rámci diplomové práce a mají představu, že s ním okamžitě a snadno prorazí do světa, je totiž unikátní. Zpravidla není. V českých podmínkách by něco podobného mohl suplovat katalog startupů na Lupě.
A nakonec ona, matka všech bezchybných článků a studnice fotografií a náčrtů s použitelnou licencí. Ne ne, i toto je samozřejmě nadsázka, na druhou stranu je nutno sklonit dobrovolníkům obrovskou poklonu. Wikipedie funguje jako ideální zdroj informací o firmách a jejich historii a zároveň je to také největší katalog jmen, které ve světě IT něco znamenají.Wikipedie slouží a funguje jako jeden z mnoha zdrojů při skládání článku dohromady a informace by se bez ní dnes hledaly mnohem obtížněji. Nakonec může Wikipedie výborně fungovat i jako jakési nakopnutí, jelikož zvláště ta univerzální – anglická je plná původních citací a odkazů na původní originál.
Takto by tedy mohla vypadat jedna z desítek. Píšu jedna, protože nezbylo místo na mnoho dalších statistik a zajímavých grafů. Namátkou třeba IANA, Eurostat, Akamai State of the Internet, ISC Domain Survey, spíše americký Hitslink, WorldWideWebSize, Whois.sc, AdMonitoring, Google Public Data, Insights for Search a další…