Co jsou BIG DATA a co nám mohou přinést

Kamkoliv se podíváme, narůstá množství dat kolem nás. Postupně si uvědomujeme, že kapacity disků se během krátké doby zvýšily do velikosti, kterou běžný uživatel nevyužije, ani pokud si ukládá rozsáhlé sbírky hudebních skladeb nebo video soubory s filmy. Kapesní USB klíčenky mají běžně vyšší kapacitu než DVD a jejich cena drasticky klesla k jednotkám stokorun.

U nového počítače ani nezjišťujeme, kolik má paměti RAM, protože jí má více, než využijeme k běžné práci. Serverové kapacity také nesledujeme, protože místa pro uložení souborů je všude dostatek a běžné cloudové služby nabízejí nejméně 5 GB zdarma pro každého, kdo se k nim připojí. Vedle toho je kolem nás obrovské množství různých informačních systémů a zařízení, která generují neuvěřitelné množství dat, a to v takové míře, že s nimi už nelze pracovat běžnými prostředky.

Čím dál častěji jsme svědky toho, že se odborné pojmy z IT stávají součástí běžného slovníku. V poslední době se do něj zařadil i termín Big Data. Proč se dnes týkají každého z nás? Jaký nám mohou přinést užitek?



Aby se nestalo, že zpracováním všech dat budou vznikat nová a nová data a požadavky na výpočetní výkon porostou exponenciální řadou, až nebude možné provádět jejich zpracování v reálném čase, musela nastat změna. A toto představuje změna způsobu práce s hromadnými neboli velkými daty – Big Daty. Namísto práce s každou veličinou zvlášť dochází k určitému zobecnění a spíše než na exaktní výsledek je důraz kladen na sledování trendů, indexů a dalších statistických veličin, které lze z dat vyčíst. Ale pojďme postupně.

Co označujeme za Big Data?

Když si dva současníci povídají o úložištích, mluví o megabytech, gigabytech (109) nebo terabytech (1012). Big Data začínají spíše na petabytech (1015), ale jejich objem roste exponenciálně, takže objemy jsou stále vyšší. Současně s tím je nutné tento objem dat zpracovávat v reálném čase. Jako vhodný příklad se uvádí zpracování dat z kamery, nebo i více kamer najednou, a to vše v kontextu s dalšími datovými zdroji.

S tím souvisí i další specifikum, kterým je různorodost formátu takových dat. Nemusí totiž jít o strukturovaná (tedy utříděná a jednoduše čitelná data), ale o kombinaci dat, která jsou každá v jiném formátu, s jinými charakteristikami atd. Jako příklad lze uvést zpracování databázových informací společně s multimediálními daty, obsahy textových dokumentů a vzorců chování uživatelů na internetovém portálu.

Že už se vám to zdá těžko uchopitelné? A právě proto jsou tu Big Data jako nástroj, do kterého jeho tvůrci, dodavatelé a konzultanti zabudovali dostatečnou logiku a nástroje na to, aby se i s takovými daty dalo efektivně pracovat například pro marketingové účely.

Prvními oblastmi, kde se využívala Big Data, byly výzkumné instituce a marketing. Jejich průkopníky se staly společnosti jako Google, eBay nebo Amazon s cílem zmapovat, jak co nejlépe provést uživatele svými stránkami tak, aby se zvýšila výtěžnost z klikání.

Jak je můžeme využít?

Prvními oblastmi, kde se využívala Big Data, byly výzkumné instituce, inovativní projekty a marketing. Ze své podstaty se jejich průkopníky staly společnosti jako Google, eBay nebo Amazon s cílem zmapovat, jak co nejlépe provést uživatele obsahem svých stránek tak, aby se zvýšila výtěžnost z jejich klikání. A že se jim to daří, si všimnete okamžitě, když se vám v reklamě vedle stránky, kterou si náhodně prohlížíte, najednou objeví něco, o co jste se zajímali nebo co si skutečně chcete koupit.

Trochu méně viditelné, ale věřte, že stejně systematické, je využívání podobných principů ze strany bank a finančních institucí. Rozdělení uživatelů kreditních karet do jednotlivých skupin a následné zacílení konkrétních finančních produktů s mnohem vyšší úspěšností je dnes běžnou praxí.

Najednou máte pocit, že vám i při hromadné obsluze vaše banka lépe rozumí a nabízí vám produkty šité na míru. Už jste se také zapojili do nějakého věrnostního programu nebo soutěže v supermarketu? Vnímáte to jako velmi výhodný způsob, jak ušetřit při nakupování? Věřte, že za tím vším jsou velmi sofi stikované výpočty, které ve svém výsledku znamenají to, že zákazníci odcházejí spokojenější a přitom utratí mnohem více.

V neposlední řadě má každý z nás ve své kapse mobilní telefon. Paradoxní je, že i když nemáte chytrý telefon, stále poskytujete velmi zajímavé informace, které mohou být využity ke zlepšení služeb. Nebojte se, nikdo konkrétně vás nesleduje, ale naopak se informace o pohybu vašeho mobilního telefonu smíchají s informacemi o pohybu všech dalších mobilních telefonů, nebo spíše SIM karet, a mohou nabídnout zcela nové služby.

Během vteřiny je možné zjistit, že proud telefonních přístrojů pohybujících se na dálnici se zpomaluje a zastavuje. Automaticky lze vyhodnotit obraz z dopravních kamer v přilehlých místech a zjistit, zda nedošlo k nějaké dopravní komplikaci. To vše se dá obratem přenést na dopravní tabule nad dálnicí a do navigací, které umí dynamicky měnit cestu podle informací poskytovaných z dopravních center. Že se vám to zdá relativně jednoduché a užitečné a že by to usnadnilo život mnoha lidem na cestách? Technické prostředky už jsou k dispozici, jde jen o to, aby se našel obchodní model, který bude dostatečnou motivací pro její zavedení.

Mnohem vyšší ekonomickou hodnotu má informace o tom, kolik lidí se pohybuje v jaké části města v okamžiku, kdy plánuje obchodní řetězec otevření nové prodejny. A pokud si k tomu připojíme i zobecněná data o výši mobilního účtu nebo zprůměrované ceníkové ceně používaného mobilního telefonu v dané oblasti, můžeme vytvořit mapu zobrazující i kupní sílu obyvatel dané oblasti. Podobně se dnes dají do celého zpracování přidat i informace ze sociálních sítí a přesně zacílit reklamní kampaň na ty, kteří mají nejvyšší užitek z dané informace.

Technologie je jedna stránka věci, na opačné straně je lidský rozměr a vyhodnocení užitečnosti pro jednotlivce. A etický rozměr. V digitálním světě jsme se s tím již postupně smířili, ale přesah do reálného světa část společnosti odmítá s odkazem na přílišný zásah do soukromí. I proto je nutné k technologiím Big Dat přistupovat velmi citlivě a důsledně vážit přínosy a nevýhody. Jen tak mohou společnosti jako celek obohatit a posunout kupředu.

Jsou informace o mně v bezpečí?

Předchozí odstavce pracují s faktem, že každý pohyb vašeho telefonu, každé kliknutí na webové stránce nebo jakákoliv jiná informace je někde zaznamenána. Cílem není vás sledovat, spíše jde o vedlejší efekt toho, jak fungují základy technologií. Vše ostatní je nadstavba a její rámec by měl být vždy podřízen vývoji lidské společnosti a hranice by měly být nastaveny do komfortní zóny obsluhy.

Jakékoliv vychýlení z rovnováhy bude znamenat znehodnocení dosažené úrovně obsluhy. Příliš snadná dostupnost informací povede k restrikcím a regulatorním zásahům, které budou reakcí na jakékoliv zneužití. Na druhé straně přílišná omezení sníží komfort služeb a v konečném výsledku jej budou zákazníci vnímat negativně.

Zlatou střední cestou je důsledná generalizace a anonymizace dat, které zabrání zneužití konkrétních údajů a současně umožní pracovat s trendy nad hromadnými daty. A cílem veškerého snažení by mělo být nastavení právě takovéto rovnováhy podpořené možností individuálního nastavení komfortní zóny dle preferencí každého zákazníka.

Převzato z časopisu Komora
Autor článku: Jiří Berger

• Oblasti podnikání: Software a ICT služby

Doporučujeme