Minulý rok jsme společně s redakcí e15 připravili důkladnou analýzu cen v obchodě IKEA. České ceny jsme srovnali se zahraničními obchody a zjistili… že jsou s náskokem nejvyšší. Letos jsme se na ceny podívali stejným způsobem.

Proč? Česká IKEA totiž na podzim ve dvou vlnách zlevňovala. Ředitel tuzemské pobočky nás potom v rozhovoru pro Seznam Zprávy vyzval, ať to zkusíme znovu. Nenechali jsme se přemlouvat.

Stejně jako loni je vhodné vysvětlit, proč o tomto tématu píšeme na Živě. Kolegům z webu e15, na kterém vyšel tento článek, jsme totiž pomáhali při jeho přípravě. Ceny v obchodech IKEA jsme stahovali a analyzovali a kromě samotných výsledků nám přišlo zajímavé napsat i o tomto pozadí.

Česko už není nejdražší

IKEA skutečně hodně zlevnila, prohlédněte si podrobné infografiky na následujících stránkách. Ale stačí už jen pohled na souhrnné výsledky:

Aktuálně, při srovnání všech produktů, je německá IKEA je v průměru dokonce o 7 % dražší než česká. V Polsku je v průměru stále o něco levněji, ale jen o 4 %. Srovnejte to s loňskem, kdy bylo Německo celkově o 11 % levnější a Polsko dokonce o 20 %. To je meziroční posun o 18 a 16 procentních bodů.

Jsou to ale průměry. Stále najdeme konkrétní produkty, které se v Německu a Polsku vyplatí i za cenu dlouhé cesty. Jen jich už není tolik jako loni a vyplatí se už proto pečlivě porovnávat.

Takhle dopadlo srovnání českého, německého a polského obchodu mezi roky v rámci jednotlivých kategorií:

Česká IKEA meziročně u produktů, které byly v nabídce loni a jsou i letos, zlevnila o 10 %, dražší jsou akorát potraviny. Oproti tomu německá IKEA oproti loňsku o 9 % zdražila a polské ceny jsou za rok o 2 % vyšší.

Pro nás na Živě může být zajímavé, že největší meziroční zlevnění je v Česku u kategorií Domácí elektronika (15 %) a Chytrá domácnost (17 %).

Na dalších listech článku pak najdete podrobné výsledky s ukázkami zboží s největšími cenovými rozdíly.

Jak jsem zjišťoval ceny v IKEA

Marek Lutonský

Říkal jsem si, že to bude rychlé. Z loňska mám přece připravený postup, jak zpracovat webové sitemapy a jak si na stránkách produktů sáhnout na ceny a další informace. Bude stačit pustit hotové skripty a dva dny počkat.

Postup jsem podrobně popisoval v loňském článku. Pro stahování používám R, letos jsem v něm zpracoval pět XML ze sitemapy a získal 24 392 URL odkazujících na produktové stránky českého e-shopu. Na každou z nich jsem skriptem sáhnul, stáhnul ji a vytáhnul z HTML kódu informace: cenu, název a popis produktu, první a druhou úroveň kategorie.

Už jsem věděl, že když v české URL změním jazykovou část řetězce /cz/cs/ na /de/de, stránka se přesměruje do německého e-shopu. Tím jsem hned měl německé adresy a další půlden z nich upraveným skriptem stahoval jejich ceny. Některé zboží v německém obchodě nebylo, získal jsem ale 19 103 cen.

Následoval stejný postup pro polský e-shop, kde zase stačilo v URL nahradit jazykový řetězec za /pl/pl/. Výsledkem bylo 21 568 společných produktů.

Potom stačilo podle aktuálního kurzu převést ceny v eurech a zlotých na české koruny, spočítat absolutní a relativní rozdíly a podívat se na získaná data z různých úhlů.

Plán byl pěkný, ale jen teoretický. Po nějaké době stahování se objevila chyba: zjistil jsem, že na stránce byly dvě ceny. Zjistil jsem, že IKEA k některým produktům přidala rámeček Budete ještě potřebovat s cenami souvisejících produktů. Anebo tam byl už loni, ale s jinými třídami CSS. Teď mi výraz xpath vracel dvě ceny. Úprava nebyla složitá, tak teď to už musí jít.

Všechno jsem stáhl, a po dvou dnech z relativního porovnání cen zjistil, že na to musím jít znovu. Některé produkty mají žlutě zvýrazněné ceny, které loňský xpath nechytil. Ale nevrátil chybu, naopak místo nich vzal ty z rámečku. Potom je navíc na některých stránkách Původní cena. Někdy se cena na stránce přepíše až po načtení u klienta. A kód českých a německých/polských stránek se mírně liší…

Ceny jsem stahoval asi pětkrát. Chyba se bohužel nedala snadno zjistit, několikrát to bylo opět až při závěrečné analýze, kdy se ukázaly příliš podivné relativní rozdíly.

Nakonec jsem po dalším zbytečném stahování celé výrazy smazal a po důkladné analýze aktuálního kódu stránek je napsal znovu. Trvalo to asi jen čtvrt hodiny… Kdybych to udělal hned, ušetřím dny práce – naštěstí automatizované, kdy se jen stahovalo.

Takhle pro zajímavost vypadají řádky s konstrukcemi xpath pro stažení základních cen. Ještě pak následovaly různé podmínky, kterými jsem zjišťoval žluté ceny a kontroloval další výjimky.

# CZ temp.price <- temp.page %>% html_nodes(xpath = '//div[@class = "js-price-package pip-price-package"]//div[@class = "pip-temp-price-module__price"]//span[contains(@class, "pip-temp-price--medium")]//span[@class = "pip-temp-price__integer"]') %>% html_text() # DE a PL temp.integer <- temp.page %>% html_nodes(xpath = '//div[@class = "js-price-package pip-price-package"]//div[@class = "pip-temp-price-module__price"]//span[@class = "pip-temp-price__integer"]') %>% html_text() temp.decimal <- temp.page %>% html_nodes(xpath = '//div[@class = "js-price-package pip-price-package"]//div[@class = "pip-temp-price-module__price"]//span[@class = "pip-temp-price__decimal"]') %>% html_text()

Příště bych asi zvolil jiný postup. Teď jsem veškeré vyhodnocení dělal hned při stahování a do tabulky uložil jednu cenu. A potom až při vyhodnocení zjistil, že mám někde chybu.

Výhodnější by bylo ukládat úplně všechno, každou cenu a vyhodnocení provést až v hotové tabulce. Jednak by byla větší šance dostat dalšími úpravami z těchto dat požadované informace. Teď mi nezbylo než stahovat znovu. A také by se dalo snadněji, už z menší části dat, objevit, že je někde problém. Tak zase za rok…

Na dalších listech článku najdete podrobné letošní srovnání výsledky s ukázkami zboží s největšími cenovými rozdíly.