Analitika velikih podataka izvor je za stvaranje društvenih vrijednosti

Izazovi implementacije

Često se pretpostavlja da vrijednost čuvanih velikih podataka mora biti veća od troškova čuvanja što je malokad realnost pa vrlo malo tvrtki uspijeva iz podataka stvoriti značajne poslovne vrijednosti.

PIŠE: ANDREA BUDIN POSAVEC

Organizacije i tvrtke svih vrsta -  industrijske, državne, nevladine...   počinju shvaćati da iskorištenje brojnih vrijednosti koje omogućuju veliki podaci može donijeti značajne prednosti poslovanju i društvu u cjelini. Dok tvrtke izrasle na efikasnom upravljanju podacima - kao što su Google i Amazon - svoj rast sve više temelje na analitici, mnoge tvrtke shvaćaju da analitiku ne iskorišćuju dovoljno za bolje poslovno odlučivanje i postizanje boljih poslovnih performansi. Razlozi tomu su različiti - od organizacijskih ometajućih faktora, nedostatka mehanizama upravljanja podacima, nedostatka analitičkih umijeća, nepoznavanja koncepata znanosti o podacima pa do nedovoljnog poznavanja pravnih aspekata i nerazumijevanja vrijednosti, rizika i troškova vezanih uz podatke.


Stvaranje vrijednosti iz analitike velikih podataka

Nedvojbeno je da se danas primjenom analitike može pristupiti različitim poslovnim odlukama u područjima poput:

■ marketinga: odluke o cijenama, lokacijama prodajnih mjesta, ciljanim promocijama, prilagodbama web-stranica, smještaju digitalnih reklama itd.
■ financija: odluke o financijskim planovima, ključnim financijskim faktorima i pokazateljima, investicijama itd.
■ upravljanja opskrbnim lancima: odluke o zalihama, lokacijama distribucijskih centara i skladišta, usmjeravanju transporta itd.
■ ljudskih resursa: odluke o kompenzacijama, obrazovanju, zapošljavanju itd.
■ istraživanja i razvoja: odluke o dizajnu i značajkama proizvoda, učinkovitosti procesa  itd.
Zdravstveni sustavi su diljem svijeta suočeni s različitim izazovima, a analitika velikih podataka može donijeti brojne vrijednosti u područjima upravljanja liječenjem, procjene učinkovitosti liječenja, sukladnosti sa smjernicama, povećanju produktivnosti zdravstvenih sustava, pravodobnom prepoznavanju epidemija, utvrđivanju optimalnog tretmana (IBM Watson i Memorial Sloan Kettering Cancer Center itd.).
U naprednim se društvima analitika velikih podataka već primjenjuje i za stvaranje društvene vrijednosti kao što su različite crowdsourcing inicijative, web-sučelja za angažman građana, otvorene inovacijske platforme i pozivi na javne akcije poput change.org.

Kompanije s izvrsnim poslovnim performansama najbolje prepoznaju važnost i prilike koje pruža primjena napredne analitike u različitim poslovnim segmentima.

Usvajanje analitike u tvrtkama

Uz današnje tehnologije koje omogućuju prikupljanje više podataka negoli ikada ranije, mnogi se pitaju daje li im analitika punu vrijednost tih podataka. U uglednom časopisu MIT Sloan Management Review (u suradnji s IBM Institute for Business Value)  objavljena je 2011. godine zanimljiva studija Big Data, Analytics and the Path from Insights to Value  koja je obuhvatila više od 30 industrija u 108 zemalja i pokazala segmentiranje tvrtki prema stupnju analitičke sposobnosti u tri skupine: tvrtke s aspiracijskim analitičkim sposobnostima, iskusne i transformirane tvrtke. Od objavljivanja rezultata studije do danas, izmijenili su se omjeri u pojedinim skupinama, no može se zaključiti da podjela vrijedi i danas.
Tvrtke s aspiracijskim analitičkim sposobnostima uglavnom fokusiraju analitiku prema poboljšanju troškove učinkovitosti ili na automatizaciju poslovnih procesa. Takvima uglavnom nedostaju ljudski, procesni i tehnološki resursi potrebni za razumijevanje ili djelovanje na temelju analitičkih spoznaja. Donekle iskusne tvrtke ne primjenjuju analitiku samo za poboljšanje troškovne učinkovitosti već osmišljuju i uvode nove načine prikupljanja podataka, ugrađuju analitiku i na temelju rezultata analitike optimiraju svoje poslovne procese. U transformiranim tvrtkama analitika se (s obzirom na usvajanje) ozbiljno primjenjuje u različitim poslovnim funkcijama i kao konkurentska prednost.
Studija izričito povezuje poslovne performanse tvrtki i konkurentsku vrijednost analitike – pokazalo se da kompanije s izvrsnim poslovnim performansama najbolje prepoznaju važnost i prilike koje pruža primjena napredne analitike u različitim segmentima poslovanja.
Unatoč popularnom mišljenju pokazalo se da najveći izazov pri usvajanju analitike u tvrtkama nije vezan uz same podatke ili njihovu kvalitetu i dostupnost. Većina prepreka vezana je uz potporu i razumijevanje menadžmenta i organizacijsku kulturu, a ne uz podatke ili tehnologije.  Među najistaknutijim preprekama su:
■ nedostatak razumijevanja o tome kako analitika može poboljšati poslovanje
■ nedostatak potpore menadžmenta (zbog drugih prioriteta)
■ nedostatak analitičkih umijeća
■ organizacijska kultura koja ne potiče dijeljenje informacija  
■ nejasno vlasništvo nad podacima ili neučinkovito upravljanje podacima.
Kao najprimjenjivije analitičke tehnike tvrtke su navele analizu i predviđanje trendova, standardizirano izvještavanje (business intelligence) i vizualizaciju podataka, a očekuje se sve veća važnost simulacija i razvoja scenarija, analitike primijenjene u poslovnim procesima, regresivne analize, diskretnog modeliranja i matematičkog optimiranja.


Krivulja životnog ciklusa informacija

Vrijednost, rizici i troškovi upravljanja podacima

Tvrtke imaju svoje vlastite podatkovne centre ili koriste usluge specijaliziranih pružatelja usluga gdje podaci godišnje rastu gotovo eksponencijalno. Obje opcije iziskuju nemale troškove pri čemu se tvrtke često vode pretpostavkom da vrijednost čuvanih velikih podataka mora biti veća od troškova čuvanja. Ta se pretpostavka danas rijetko pretvara u realnost pa malo tvrtki uspijeva stvoriti značajne poslovne vrijednosti iz čuvanih podataka.
Bez jasnog razumijevanja stvarne vrijednosti velikih podataka i kako se ta vrijednost kroz vrijeme može mijenjati tvrtke mogu pogriješiti u svojim strategijama čuvanja podataka. Premale investicije u pouzdana spremišta podataka mogu donijeti značajne tehničke, ekonomske i reputacijske rizike (primjerice, spremanje podataka o kliničkom ispitivanju novog skupog lijeka u nepouzdano, jeftino spremište) dok s druge strane neprimjereno velike investicije u skupu tehnologiju spremišta podataka male vrijednosti znači nepotrebno trošenje resursa.

Zanemarena vrijednost podatkovne imovine

Podaci i informacije tretiraju se kao da im je vrijednost nula, čak i kod izrazito podatkovno bogatih tvrtki pa većina ni nema odgovarajuće metodologije za procjenjivanje njihove vrijednosti.

Pri certificiranju godišnjih financijskih izvještaja tvrtke često očekuju da im revizorske tvrtke potvrde kako posjeduju vrijedne podatke i da ih štite na odgovarajući način, no standardi financijskog izvještavanja ne uključuju vrijednost podatkovne imovine u godišnjim bilancama. Stoga se podaci i informacije tretiraju kao da im je vrijednost nula, čak i kod izrazito podatkovno bogatih tvrtki. Posljedično, većina tvrtki ni nema odgovarajuće metodologije za procjenjivanje vrijednosti podataka i informacija ili za praćenje te vrijednosti kroz vrijeme.
Koncept upravljanja životnim ciklusom informacija (Information Lifecycle Management) pojavio se zbog sve većih troškova spremišta podataka i brzo rastućih količina podataka kako bi se bolje razumjelo da se vrijednost podataka i informacija mijenja kroz vrijeme. Vrijednost informacija raste i pada kroz vrijeme razmjerno korisnosti tih informacija u organizacijskom odlučivanju. Jedan od mogućih prikaza te promjene krivulja životnog ciklusa informacija je na slici 1 (prema P. Tallon: “Corporate Governance of Big Data: Perspectives on Value, Risk, and Cost” IEEE Computer, 2013).
Praktična primjena krivulje životnog ciklusa informacija zahtijeva poznavanje dužine razdoblja tijekom kojega vrijednost informacija raste i pada – trajanja životnog ciklusa informacija. Dužina životnog ciklusa informacija značajno varira od primjene do primjene. Naprimjer, informacija o cijenama dionica vrijedna je možda samo djelić sekunde prije nego što joj vrijednost značajno padne dok s druge strane elektronički zdravstveni kartoni imaju vrijednost tijekom cijelog životnog vijeka pojedinca.
Iako tvrtke često nemaju pravi uvid u stvarnu vrijednost svojih podataka pa životni ciklus informacija promatraju uglavnom kroz prizmu troškova čuvanja podataka, postoje i neke druge mogućnosti vrednovanja informacija. Jedan od mogućih pogleda je na temelju vrijednosti koja se može izgubiti - kroz gubitak prihoda, profita ili kroz troškove nadoknađivanja izgubljenih podataka - ako kritični podaci nisu dostupni u trenutku kad su potrebni. Ta tzv. rizična vrijednost (value-at-risk) mjeri najveći mogući gubitak kroz ciljano razdoblje uz određenu pouzdanost. Znajući kolika je rizična vrijednost uzrokovana štetnim događajima kao što su kvarovi hardvera ili nehotično uništenje podataka, tvrtke mogu donositi strateške odluke o investicijama kojima bi spriječile ponovljene incidente.
Zbog učinkovitijeg upravljanja troškovima spremišta, tvrtke često organiziraju spremišta prema zahtjevima pristupa podacima, pri čemu se spremišta dijele na spremišta prvog, drugog i trećeg ranga.
Spremišta prvog ranga su najskuplja, najpouzdanija i omogućuju najveću brzinu pristupa, a služe za kritične podatke koji moraju biti dostupni u svakom trenutku (24/7). Spremišta drugog ranga su obično umrežena, jeftinija su, dovoljno pouzdana i brza za podatke koji su manje kritični. Spremišta trećeg ranga - najčešće magnetske trake i optički mediji - su najjeftinija i prikladna za podatke kojima se rijetko pristupa. Tijekom vremena podaci se premještaju iz jedne vrste spremišta u drugu (slika 1) pri čemu se duže nekorišteni podaci i oni male vrijednosti premještaju u spremišta trećeg ranga. Pritom ne treba zanemariti da vrlo često i regulativa definira razdoblje tijekom kojega podaci moraju biti arhivirani i raspoloživi.
Bez obzira na to kako tvrtke procjenjuju vrijednosti informacija kroz njihov životni ciklus, stalno treba procjenjivati mogu li neki podaci biti vrijedni u budućnosti, čuvati ih ili ne, balansirajući pritom između troškova čuvanja i oportunitetnih troškova ako ih se ne sačuva. Kad oportunitetni troškovi padnu na niže razine od troškova čuvanja to može biti indikacija za uklanjanje podataka ili da ih se smjesti u neko znatno jeftinije dugoročno spremište. Valja spomenuti još jednu zanimljivu mogućnost - zahtjeve za elektroničko predočavanje dokumenata (e-Discovery), odnosno prikupljanje elektronički pohranjenih podataka da se mogu iskoristiti kao dokazi u sudskom postupku. Takvi se zahtjevi mogu pojaviti i nakon vremenske točke u kojoj tvrtka više ne čuva podatke, a nemogućnost elektroničkog predočavanja dokumenata može uzrokovati nemale zahtjeve za odštetama.
Činjenica je da se cijene hardvera uglavnom kontinuirano smanjuju, no često se zanemaruju različiti drugi troškovi vezani uz podatkovne centre i spremišta koji čine ukupni trošak posjedovanja (TCO – Total Cost of Ownership) podataka, a uključuju među ostalim troškove energije, održavanja i softverskih licenci koji rastu s porastom velikih podataka. Procjene ukupnih troškova posjedovanja variraju, ali neka istraživanja pokazuju da mogu biti i od pet do sedam puta veći negoli troškovi hardvera.

Redefiniranje investicija

Neke su tvrtke već blizu točke kad su troškovi spremišta toliki da kompromitiraju strateške IT investicije, a IT budžeti su ionako često podložni različitim ograničenjima. Povećane investicije u upravljanje velikim podacima zahtijevat će stoga preraspodjele i povećanja IT budžeta. Još krajem prošlog stoljeća kad je rast podataka bio znatno manji, spremišta su promatrana uglavnom samo kao taktički IT resurs. No, s porastom velikih podataka i prepoznavanjem njihovih strateških vrijednosti  te s evolucijom analitičkih softvera - dok istodobno hardver i standardni softver postaju komoditet - tvrtke bi trebale redefinirati budžete i razdvojiti ulaganja u upravljanje velikim podacima od ostalih standardnih IT investicija.
Jedan od načina kontrole sve većih troškova vezanih uz velike podatke je već spomenuto rangiranje spremišta te migriranje iz jeftinijih u skuplja spremišta kad vrijednost podataka raste, ali i obrnuto - preseljenje podataka iz skupih u jeftinija spremišta kad im vrijednost pada. Pritom je izazov identificirati te promjene vrijednosti podataka pa tvrtke primjenjuju različita mjerila koja su možda i neprecizna.

Koncept pravnog okvira za velike podatke (prema R. Kemp: Legal Aspects of Managing Big Data, Kemp IT Law, London, 2014.)

Prakse upravljanja podacima

Prakse upravljanja podacima - politike i procedure koje opisuju kako upravljati podacima tijekom njihovog korisnog životnog ciklusa - općenito se mogu podijeliti u tri kategorije: strukturne prakse (identificiraju ključne donositelje odluke te njihove uloge i odgovornosti vezane uz vlasništvo nad podacima, analizu vrijednosti i upravljanje troškovima), operativne prakse (definiraju kako  tvrtka upravlja podacima) i relacijske prakse (opisuju formalne poveznice između različitih sudionika tvrtke u smislu dijeljenja znanja i informacija, analize vrijednosti podataka, edukacije i strateškog IT planiranja). Pritom mogu na implementaciju praksi upravljanja podataka utjecati različiti organizacijski, industrijski i tehnološki faktori (Tablica 1. prikazuje neke od njih). Omogućujući faktori često su specifični za pojedinu industriju, dok su ometajući faktori podjednako prisutni u svim industrijama.


Pravni i regulatorni aspekti velikih podataka

Iz brojnih dosadašnjih i potencijalnih primjena analitike velikih podataka može se zaključiti da tvrtke i organizacije koriste različite izvore podataka pri čemu se ponekad približavaju granicama pravnih aspekata, kvalitete podataka, disparatnih značenja podataka i kvalitete samih procesa obrade podataka. Time se ponekad javljaju i rizici nekvalitetnog donošenja odluka i zadiranja u privatnost podataka. Potencijalni negativni aspekti analitike velikih podataka ne javljaju se samo u sferi pojedinca i njegove privatnosti već zadiru i u različite društvene, ekonomske i političke sfere. Stoga su za dosljedno upravljanje i kontroliranje tih aspekata potrebni odgovarajući okviri uz minimiziranje potencijalnih negativnih nuspojava. Kao neke primjere izvora podataka koji svakako zahtijevaju čvrstu kontrolu vlasništva i prava nad podacima valja spomenuti elektroničke zdravstvene kartone, podatke o građanima u vlasništvu vladinih institucija, podatke prikupljene uz pomoć kartica lojalnosti, baze podataka o kupcima, podatke iz različitih mjernih senzora, satelitske snimke i snimke učinjene uz pomoć bespilotnih letjelica.
Kako rastu količine velikih podataka, a istodobno je i sve više povezanih izvora - uključujući  internet stvari - tako mogućnosti univerzalnog nadzora iz sporadične paranoične pompe sazrijevaju u stvarnu prijetnju. Slobodna demokratska društva se uvelike temelje na pravima pojedinaca, uključujući i zaštitu privatnosti, zbog čega se nameće potreba za ozbiljne pravne i regulatorne okvire vezane uz velike podatke. Za razliku od bilo kakvih opipljivih artefakata, podaci i informacije –pogotovo veliki zbog svoje raznovrsnosti i različitih izvora – niti su opipljivi niti imaju granice. Stoga su iz pravnih aspekata vrlo neobični, a dosad su uglavnom bili regulirani pravima intelektualnog vlasništva i nekim drugim vrstama zaštite privatnosti. Zato je u pravnim okvirima teško govoriti o pravima u podacima pa se uglavnom govori o pravima i obvezama vezanima uz podatke. To se područje prava danas prilično brzo razvija, pogotovo uz rastuću primjenu velikih podataka. Mogući koncept pravno-regulatornog okvira za velike podatke (prema R. Kemp: Legal Aspects of Managing Big Data, Kemp IT Law, London, 2014.) prikazan je na slici 3 i sastoji se od šest slojeva.

Analitika velikih podataka već se koristi i za stvaranje društvene vrijednosti, primjeri čega su različite crowdsourcing inicijative, web-sučelja za angažman građana, otvorene inovacijske platforme i pozivi na javne akcije.

Sloj 1 - platformska infrastruktura obuhvaća fizičku (hardversku) infrastrukturu sustava za upravljanje podacima (servere, spremišta podataka, korisničke uređaje, mrežnu infrastrukturu) i instalirani softver - operacijske sustave, softverske međuslojeve (middleware) i različite softverske aplikacije. Pravni aspekti su uglavnom vezani uz tradicijska autorska prava (copyright)  te uz prava pristupa i dohvaćanja podataka iz baza podataka, pri čemu također treba obratiti pozornost na primjenu relevantnih tehničkih standarda.
Sloj 2 - informacijska infrastruktura  je posrednička između platformske infrastrukture i samih podataka, a definira tokove podataka. Prava intelektualnog vlasništva u ovom se sloju često previđaju ili se svode samo na zaštitu autorskim pravima dokumentacije koja opisuje korištene informacijske modele. Formalna struktura informacijske arhitekture i baza podataka u Europskoj se uniji može zaštititi temeljem Direktive 96/9/EC Europske komisije koja definira pravnu zaštitu baza podataka.
Sloj 3 -  prava intelektualnog vlasništva vezan je uz same podatke i može se podijeliti u tri kategorije: autorska prava, prava proizvođača (neoriginalnih) baza podataka te povjerljivost i poslovne tajne. Autorska prava mogu zaštititi oblik ili izričaj informacija i podataka, no ne i sam sadržaj, a primjenjuju se na softver, određene baze podataka i dokumentaciju. Prava proizvođača (neoriginalnih) baza podataka proistječu iz činjenice da je kreator baze podataka uložio značajna sredstva u prikupljanje, verifikaciju i prikaz podataka. Vlasnik tog prava općenito je kreator baze podataka, a to pravo u Europskoj uniji vrijedi petnaest godina od inicijalnog kreiranja baze podataka. Za razliku od autorskih i prava proizvođača baza podataka koja uglavnom štite formu podataka, pravila i regulative vezane uz povjerljivost i poslovne tajne štite sami sadržaj podataka te informacije koje se iz njih može derivirati - primjer je direktiva Europske komisije o poslovnim tajnama (Directive of the European Parliament and of the Council on the protection of undisclosed know-how and business information (trade secrets) against their unlawful acquisition, use and disclosure) usvojena u svibnju 2016. godine.

Najviše prepreka vezano je uz potporu i razumijevanje menadžmenta i organizacijsku kulturu, a ne uz podatke ili tehnologije.

Sloj 4 -  ugovaranje podataka govori o ugovornim pravima vezanim uz podatke koja su potpuno razdvojena od prava intelektualnog vlasništva, a sastoje se od ugovornih klauzula o davanju podataka potpisanih od ugovornih strana i zakon ih tretira kao snažne, točno određene i primjenjive. Ključna područja na koja valja obratiti pažnju pri ugovaranju prava vezanih uz velike podatke obuhvaćaju djelokrug ugovornih prava, svrhe za koje se podaci smiju koristiti, vlasništvo nad izvornim i deriviranim podacima, garancije ugovornih strana o usklađenosti sa zakonima i regulativama vezanima uz zaštitu podataka, regulativama specifičnima za konkretni industrijski sektor te o reviziji, raspodjeli rizika, trajanju i raskidu ugovora o davanju podataka te korištenju izvornih i deriviranih podataka nakon raskida ili isteka ugovora.
Sloj 5 -  zakoni i propisi o podacima postaje sve važniji uz porast primjena velikih podataka, a obuhvaća:
■ prava zaštite podataka – jedan od najvažnijih aspekata koji se sastoji od dodjeljivanja prava i nametanja obveza za procesiranje osobnih podataka pojedinaca. Postaje sve jasnije da su potrebni čvrsti zahtjevi za eksplicitni i informirani pristanak pojedinca za korištenje i obradu njegovih osobnih podataka, što je u Europskoj uniji predmet Direktive 2016/680 i Uredbe 2016/679 (koju su države članice obvezne ugraditi u zakone do svibnja 2018. godine) Europskog parlamenta i Vijeća Europske unije;
■ prava zaštite tržišnog natjecanja – aspekte vezane uz velike podatke treba promatrati i kroz prizmu tih prava, prateći licenciranje i ugovaranje podataka u različitim sektorima, osobito na financijskim tržištima;
■ regulativu specifičnu za pojedini sektor – sveprisutna digitalizacija podataka i dostupnost velikih podataka zahtijeva određene promjene u regulativi pojedinih sektora, među kojima su najuočljiviji financijski sektor, osiguravajući sektor (npr. podaci o solventnosti klijenata), zračni promet (npr. podaci o itinerarima putnika) i zdravstvo (npr. anonimizirani klinički podaci), a zajednička su im tema propisi specifični za sektor, ali primjenjivi na digitalizirane podatke.

Autorica Andrea Budin magistar je znanosti u području računalstva. MBA studij završila je na Zagrebačkoj školi ekonomije i managementa. Bila je zaposlena u tvrtki Ericsson Nikola Tesla gdje je vodila projekt upravljanja inovacijama u istraživačko-razvojnom centru i bila linijski rukovoditelj jednog odjela za razvoj softvera. Posljednjih desetak godina bavi se marketinško-prodajnim aktivnostima, većinom u području e-Zdravstva. Od 2005. godine predaje na Zagrebačkoj školi ekonomije i managementa za kolegij koji pokriva upravljanje operacijama i lancima opskrbe. Dugogodišnja je voditeljica konferencije Inteligentni sustavi u sklopu Međunarodnog skupa MIPRO.

Sloj 6 - informacijska sigurnost  o upravljanju i sigurnosti informacija uglavnom se odnosi na sukladnost s odgovarajućim standardima kao što je serija ISO 27000 (Information Security Management Systems), standardi u Sjedinjenim Američkih Državama koji propisuju kako uslužne organizacije moraju izvještavati o sigurnosti informacija (npr. SSAE 16, ISAE 3402), kao i standardni informacijske sigurnosti specifični za pojedinu industriju (npr. Data Security Standards (DSS) u industriji platnih kartica).
Valja napomenuti da se uz sveprisutni trend računalstva u oblaku javlja još niz pravnih i regulatornih aspekata vezanih uz smještaj podataka. Primjera ima mnogo, a jedan je i to da je okvirni sporazum Safe Harbour između EU i SAD-a proglašen krajem 2015. godine nevažećim i sad nastaje novi takozvani  U-US Privacy Shield.

Veliki izazovi

Unatoč značajnom napretku tehnologije i nastojanjima u primjeni analitike velikih podataka u poslovanju, mnoge se tvrtke bore s izazovima implementacije planova i strategija velikih podataka. Izazovi su često organizacijske prirode vezani uz organizacijsku kulturu i nedostatak odgovarajućih kompetencija, a mogu se odnositi i na vrijednost i troškove velikih podataka. Dodatni se izazovi javljaju pri nepoznatoj ili nedovoljno prihvaćenoj regulativi vezanoj uz velike podatke. Prepoznaju se potrebe za dobrim praksama upravljanja podacima – strukturama i politikama koje bi trebale biti primijenjene diljem cijele poslovne organizacije kako bi se postigla što veća vrijednost analitike velikih podataka.