Zajímá mě
5. března 2020
5. března 2020

Big data – umělá inteligence, datová věda a internet

3 min čtení

S termínem „Big data“, tedy česky „Velká data“ se setkáváme stále častěji. Velká data se vyvíjejí skutečně rychle a nabývají čím dál víc na důležitosti. Co vlastně velká data jsou a odkud se berou? Pro lepší pochopení toho, jak big data fungují, uveďme, že zahrnují umělou inteligenci, datovou vědu (data science) a v neposlední řadě i internet jako takový a internet věcí.

Velká data můžeme charakterizovat jako data, jejichž velikost je mimo schopnosti zachytávat a zpracovávat běžně dostupnými a používanými softwarovými prostředky v rozumném čase.

Asi nejpoužívanější definicí pro big data je Gartnerova definice z roku 2001. Big data jsou data, která sestávají z obrovského a rychle rostoucího objemu dat. V angličtině je tato definice známá jako tři V (z anglického volume, variety a velocity).

Tři V velkých dat

Volume – objem

Objem je důležitý. Pro práci s big daty je příznačné zpracovávání obrovského množství dat. Háčkem je však skutečnost, že jde většinou o nestrukturovaná data neznámé hodnoty, jako například data feed Twitteru, zdrojové kódy webstránek nebo mobilních aplikací, nebo dokonce deník záznamů zapnutí wi-fi žárovky. Mohou to být desítky terabytů až petabytů dat (pro ilustraci jeden petabyt je 1 000 000 gigabytů).

Velocity – rychlost

U big dat nezáleží jen na objemu dat. Stejně důležitá je rychlost jejich zaznamenávání a zpracovávání. Big data přibývají velmi rychlým tempem, a proto je důležité je umět průběžně zpracovávat.

Variety – různorodost

Různorodost je pro big data charakteristická. Big data, jak bylo uvedeno, se neskládají jen ze strukturovaných dat, ale z polo-strukturovaných (semi-structured) dat jako například xml feedy, e-maily a podobně a z nestrukturovaných dat, jako jsou audio nebo video soubory.

Věrohodnost a hodnota velkých dat

V posledních pár letech ke třem V přibyla další dvě V z anglických veracity (věrohodnost) a value (hodnota).

Veracity – věrohodnost

Jelikož big data pocházejí z různorodých zdrojů, je důležitá i jejich věrohodnost a výpovědní hodnota. Je to obrovská výzva zejména při zpracovávání big dat.

Value – hodnota

Samotný objem dat je bezpředmětný, pokud data nemají hodnotu. Tedy je důležité, aby sbíraná data měla výpovědní hodnotu a byla použitelná pro další zpracování a použití.

Využití big dat

Samotné využití big dat je širokospektrální. Od zákaznického servisu až po umělou inteligenci. Podívejme se spolu aspoň na pár příkladů.

Strojové učení – Machine learning

Strojové učení je horké téma dnešních dní a ještě také dlouho horkým tématem bude. A big data jsou dalším důvodem, proč je tomu tak. Právě big data jsou klíčem k pokroku v této oblasti. Díky nim nemusíme stroje programovat, ale budeme je učit.

Vývoj produktů – Product development

Společnosti jako Netflix, Unilever nebo Procter & Gamble využívají big data na analýzu chování zákazníků a předvídání jejich potřeb. Skládají a vyvíjejí prediktivní modely pro nové produkty a služby. Snaží se identifikovat klíčové vlastnosti aktuálních a předcházejících produktů a služeb a najít spojitost jejich klíčových vlastností s jejich komerčním úspěchem.

Předvídání údržby – predictive maintenance

Existuje mnoho údajů a faktorů, které dokážou předpovědět, kdy a za jakých okolností se může daný stroj pokazit, nebo daný software zkolabovat. Tyto údaje mohou být hluboko skryté ve strukturovaných údajích jako například model, rok výroby, typové označení, výbava, výrobce a také i v nestrukturovaných datech jako deníky aktivit, záznamy vstupů, počet vstupů, chybové zprávy, údaje ze snímačů a tak dále. Analyzováním těchto údajů můžeme identifikovat problém dříve, než nastane. Společnosti mohou sladit opravy a údržbu strojů, dříve než dojde k trvalému poškození nebo k výraznému opotřebení.

Zákaznická zkušenost – Customer experience

Big data umožňují získat údaje ze sociálních médií, návštěvy webů, záznamy přihlášení, záznamy telefonních hovorů. Pokud jsou tyto údaje správně vyhodnocené, pomáhají zlepšit zákaznický servis, pomáhají připravovat personalizované nabídky a předejít tak nespokojenosti zákazníka.

Zpronevěření a únik citlivých informací

Antivirové a ostatní ochranné systémy se také vyvíjejí a generují svou činností obrovské množství dat. Big data umožňují identifikovat vzorce, které indikují potenciální hrozbu úniku dat a vytvořit tak predikční model a následné procesy, které by měly zabránit těmto incidentům.

Výhledy s big daty

Nezapomínejme, že big data jsou dynamický koncept, který se rychle mění a stejně rychle jako se mění, také roste. Odhaduje se, že každé dva roky se objem dat zdvojnásobuje. Právě kvůli big datům vznikly nové technologie jak ukládat a analyzovat tato data.

Právě obrovská množství dat způsobují vrásky společnostem. Protože jen „uskladnit“ data nestačí. Je potřebné je správně analyzovat a interpretovat.

Vědci a specialisté stráví 50 až 80 % času tím, že big data analyzují a vyhodnocují.

Pro budoucí práci s big daty je důležité zvládnout jejich sběr, vyhodnocování a následné implementování. Společnosti, které zvládnou práci s big daty, budou prosperovat a zařadí se k lídrům ve svém oboru.

Získej novinky jako první

Prihlásením sa do noviniek súhlasíš s ich odberom a týmto úprimným dokumentom, ktorý sme k ochrane osobných údajov pripravili.

Tento článek přináší

V PTA Group milujeme výkonnostní marketing a děláme pouze reklamu, která má smysl. Jsme certifikovaným Google Partnerem, Mergado partnerem, BiddingFox partnerem a členem Internet Marketing Association. Specializujeme se na "data driven marketing" s vysokým akcentem na návratnost investice - a při práci se tedy držíme filozofie, že všechny naše aktivity musí být dokonale měřitelné a efektivní. Naším cílem je pomáhat e-shopům růst - jak na lokálním trhu, tak v zahraničí.