Prediktivnost - novi alat poslovnog odlučivanja omoguĆUJE punu iskoristivost skrivenih znanja BIG DATA baza podataka

Intuicija više nije dovoljna

Intuicija već odavno nije dovoljna, posebno ako se vaša konkurencija oslanja na sofisticirane alate za poslovnu inteligenciju i rudarenje podataka koji se vuku iz skladišta podataka ili Big Data baza. Prediktivna analitika postaje nezaobilazna u poslovnom odlučivanju - danas menadžeri donose odluke na temelju obrađenog znanja u sustavu koji se generira metodama podatkovne analitike.

PIŠE: MARIJANA ZEKIĆ-SUŠAC

Lotfi Zadeh, otac neizrazite fuzzy logike, još je 1965. godine shvatio da tradicijske statističke i matematičke metode ne pružaju zadovoljavajuća rješenja za stvarne probleme u kojima je puno nesigurnosti, rizika, nedostajućih ili nepreciznih podataka. Treba li sutra prodati dionicu ili pričekati, treba li odobriti klijentu kredit, uputiti nekomu reklamu za proizvod ili uslugu, koliko smanjiti zalihe... Vjerojatno ste se kao menadžer barem jedanput našli u situaciji da treba donijeti takvu odluku, a da pritom niste imali odgovarajući alat za potporu pa ste bili prisiljeni osloniti se na vlastitu intuiciju?

Autorica Marijana Zekić-Sušac redovita profesorica na Ekonomskom fakultetu u Osijeku nositeljica je kolegija Sustavi poslovne inteligencije, Poslovne simulacije, Inteligentni sustavi za potporu odlučivanju i drugih. Područja njezinog interesa su inteligentne metode prediktivne analitike, posebno neuronske mreže, stabla odlučivanja, asocijacijska pravila i njihova primjena u poslovnom odlučivanju. Predsjednica je Hrvatskog društva za operacijska istraživanja od 2012. godine, urednica znanstvenog časopisa Croatian Operational Research Review i predsjednica Organizacijskog odbora međunarodne konferencije International Conference on Operational Research KOI. Aktivno radi na primjeni metoda prediktivne analitike u ekonomiji, medicini i obrazovanju.

Sofisticirani alati za poslovnu inteligenciju i rudarenje podataka (data mining) koji vuku podatke iz skladišta podataka ili Big Data baza podataka omogućuju da danas menadžeri, posebice u velikim tvrtkama, nisu prepušteni sami sebi i da donose odluke na temelju obrađenog znanja u sustavu koje se generira metodama podatkovne analitike što u posljednje vrijeme sve više uključuje ne samo statističke metode već  i metode strojnog učenja.

Što je uopće prediktivna analitika? Podatkovna analitika osim same analize podataka podrazumijeva i sve faze upravljanja podacima koje prethode analizi, kao što su prikupljanje, čišćenje, organiziranje, pohrana i izvješćivanje o rezultatima, a dijeli se na:
■ deskriptivnu
■ dijagnostičku
■ prediktivnu i
■ preskriptivnu analitiku.
Deskriptivna analitika uglavnom koristi jednostavne statističke metode koje opisuju jednu varijablu i njezinu raspodjelu, naprimjer učestalost pojavljivanja,  udjele, prosječne vrijednosti, smjer kretanja troškova, prihoda, profita i slično.
Dijagnostička analitika fokusira se na traženje uzroka događaja koji su se pojavili u prošlosti i traži odgovore na pitanja zbog čega se nešto pojavilo. Primjerice, zbog čega jedna od prodavaonica ima učestalo manji promet od ostalih?
Prediktivna analitika se provodi na višedimenzionalnim podacima s pomoću online analitičkog procesiranja i sličnih metoda. S druge strane, cilj prediktivne analitike jest odrediti vrijednost nekog obilježja (varijable) koja će se vjerojatno pojaviti u budućnosti. Ona istražuje snagu i smjer veza, trendove, uzorke i izuzetke, aproksimira funkcije kako bi se kreirali modeli koji se mogu koristiti u prediktivne svrhe. Primjeri problema koji se rješavaju metodama prediktivne analitike su predviđanje prodaje, predviđanje sutrašnje cijene dionice, predviđanje rasta poduzeća, ali i segmentiranje kupaca prema vjerojatnosti buduće kupnje nekog proizvoda, razvrstavanje tražitelja kredita prema vjerojatnosti urednog vraćanja kredita i slično.
Preskriptivna analitika koristi rezultate deskriptivne i prediktivne analitike te na temelju njih sugerira i usmjerava aktivnosti koje će dovesti do željenih rezultata.
U analitičkim alatima raspoloživim za analizu aktivnosti korisnika na web-sjedištu tvrtke (kao npr. Google Analytics) najčešće se koriste metode deskriptivne analitike, dok dijagnostička, prediktivna i preskriptivna analitika postaju sve značajnije na transakcijskim bazama ili skladištima podataka te u okviru Big Data platformi, pri čemu omogućuju stvaranje znanja iz raspoloživih podataka.
Pritom se primjenjuju naprednije statističke metode kao npr. regresijska analiza, eksplorativna analiza, faktorska analiza i druge proširene metodama strojnog učenja, poput klaster analize, neuronskih mreža, Bayesovih mreža, stabala odlučivanja, metode potpornih vektora, asocijacijskih pravila, link-analize i drugih metoda. Kako bi producirala modele koji s visokom točnošću mogu predvidjeti buduću vrijednost, prediktivna analitika traži puno podataka iz prošlosti na kojima će metode učiti veze među podacima. U kontekstu Big Data, podatkovna analitika se fokusira na upravljanje velikim količinama podataka uz uporabu skalabilnih distribuiranih tehnologija, a može obrađivati i nestrukturirane podatke, poput slika, audio i videozapisa, podatke iz uređaja putem Interneta stvari (Internet of Things).


Prediktivna analitika na transakcijskim bazama i u okviru Big Data platforme (Izvor: Sušac, M., Has, A., Predictive analytics in Big Data platforms – comparison and strategies)

Metodologija i alati

U kontekstu Big Data, podatkovna analitika se fokusira na upravljanje velikim količinama podataka uz uporabu skalabilnih distribuiranih tehnologija, a može obrađivati i nestrukturirane podatke, poput slika, audio i videozapisa, podatke iz uređaja putem Interneta stvari.

S obzirom na veliku brojnost metoda podatkovne analitike i njihovih primjena, fokusirat ćemo se na metode prediktivne analitike i njihovu implementaciju u okviru Big Data platformi, jer taj način obrade podataka ima sve veći značaj. Jedan od izazova s kojim se susreću menadžeri žele li koristiti metode prediktivne analitike je odabir alata i njegovo povezivanje s postojećom transakcijskom bazom ili integriranje u Big Data platformu.
Pri odabiru alata ne postoje rješenja za sve pa tvrtka treba razmotriti:
■ za što joj treba prediktivna analitika,
■ koje će probleme rješavati,
■ s kakvim podacima će se susresti,
■ koji budžet ima na raspolaganju,
■ kakva je postojeća infrastruktura (platforma koja omogućuje povezivanje s postojećim bazama),
■ koju razinu znanja i vještina ima osoblje, odnosno
■ jesu li upoznati s tumačenjima rezultata metoda prediktivne analitike,
■ koliku razinu vizualizacije, fleksibilnosti i skalabilnosti žele imati menadžeri i slično.  

Alati za prediktivnu analitiku danas su nezaobilazni čimbenik konkurentske prednosti svake tvrtke na tržištu.

Odabir alata često otežava činjenica da pokrivaju sličan opseg metoda, no ohrabrujuća je njihova skalabilnost te moguća zamjena drugim alatom. Prvi odabir ne mora biti i posljednji pa tako menadžeri mogu biti sigurni da će manje pogriješiti odaberu li bilo koji alat za prediktivnu analitiku negoli ako odluče ne koristiti nijedan.

Koji su alati raspoloživi na tržištu?

Tradicijske statističke i matematičke metode analize podataka ne pružaju zadovoljavajuća rješenja za stvarne probleme u kojima je puno nesigurnosti, rizika, nedostajućih ili nepreciznih podataka.

Ako se prediktivna analitika koristi na transakcijskoj bazi podataka tu su proizvođači baza ugraditi dodatne module za poslovnu analitiku u svoje sustave za upravljanje bazama pa tako Oracle Cloud Platform for Business Analytics i Microsoft Power BI sadrže i neke od metoda prediktivne analitike, kao npr. logističku regresiju, Bayesov klasifikator i druge, iako je fokus stavljen više na deskriptivnu i dijagnostičku analitiku uz visoku razinu vizualizacije, s velikim rasponom grafikona i slika koji će menadžerima omogućiti pregledniji uvid u neka kretanja i veze među podacima. Kod oba proizvođača postoje inačice za mobilne i desktop uređaje, a alatu se pristupa putem oblaka pri čemu je omogućena integracija Big Data platforme s relacijskom bazom podataka zbog što većeg broja mogućih analiza.


Primjer vizualizacijskog izvješća u alatu Tableau za poslovnu analitiku (Izvor: Tableau, http://www.tableau.com/products/desktop)

Osim toga, jedna od opcija su i specijalizirani alati, kao npr. Tableau  koji je Gartner prema svom izvješću od veljače 2016. svrstao na vodeće mjesto u svom magičnom kvadratu prema kriterijima kompletnosti vizije i izvršnim mogućnostima, zajedno s alatima Qlik i Microsoft Power BI, iza kojih su u kategoriju vizionara svrstani Alteryx, SAS, SAP, Microstrategy, IBM i još nekoliko alata. Detaljna analiza prednosti i nedostataka svakog od uspoređenih alata može se pogledati na linku Magic Quadrant for Business Intelligence and Analytics Platforms.


Istraživači više vole koristiti statističke pakete, kao npr. IBM SPSS, SAS, R softver i druge koji, osim što sadrže napredne metode za prediktivnu analitiku, omogućuju i ugradnju novih algoritama u postojeće metode pa su osim poslovnim ljudima, namijenjeni i istraživačima za testiranje novih algoritama i metoda. Nedostatak tih paketa je nedovoljna integriranost s bazom podataka tvrtke, pri čemu treba prenositi podatke iz transakcijske baze u format koji podržava određeni statistički paket te je nužno ekspertno znanje istraživača u području metodologije. Zbog toga je za tvrtke koje žele samo koristiti već ugrađene metode prediktivne analitike bolje rješenje uzeti neki od user-friendly alata koji se nadovezuju na baze podataka.

Primjer predviđanja prodaje u alatu Tableau (Izvor: Tableau, http://www.tableau.com/products/cloud-bi)

Zbog nedostatka prostora usporedit ćemo samo pet većih pružatelja usluga prediktivne analitike u okviru Big Data platforme: Tableau, IBM Watson Analytics, SAS Enterprise Miner, SAP Predictive Analytics i Oracle Advanced Analytics. Osim njih, postoje i drugi ponuđači, npr. Amazon (Amazon Machine Learning), Dell Big Data Analytics (Statistica), KNIME Analytics Platform, Microsoft Power BI, RedHat Access Insights (RHAI), Software AG (APAMA Streaming Analytics), Teradata (Aster Analytics) i brojni drugi. Cijene alata variraju ovisno o tomu nabavlja li se desktop inačica, mobilna ili online inačica u cloud platformi, a kreću se otprilike od 500 do nekoliko tisuća američkih dolara po korisniku godišnje.

Kako menadžer može koristiti prediktivnu analitiku?

Odabir alata često otežava činjenica da pokrivaju sličan opseg metoda, no ohrabrujuća je njihova skalabilnost te moguća zamjena drugim alatom. Prvi odabir ne mora biti i posljednji pa tako menadžeri mogu biti sigurni da će manje pogriješiti odaberu li bilo koji alat za prediktivnu analitiku negoli ako odluče ne koristiti nijedan.

Razvoj tehnologije omogućio je da uporaba prediktivne analitike bude intuitivna za menadžere pa tako alati kao što su IBM Watson Analytics, Microsoft Power BI i neki drugi omogućuju komunikaciju s korisnikom pomoću rečenica teksta, a ne naredbi. Korisniku se tako na zaslonu pojavljuju pitanja poput koji problem želite rješavati ili mu se pruža mogućnost da sam upiše pitanje primjerice kako će se prodaja kretati sljedećih šest mjeseci ili Što najviše utječe na prodaju, a alat kao odgovor ponudi vizualna grafička izvješća s dodatnim tekstualnim objašnjenjima. Na taj način alat govori jezikom poslovnog korisnika, a ne jezikom istraživača ili informatičara koji treba poznavati metodologiju ili naredbe programa.


Eric Siegel Ph. D. bivši profesor na sveučilištu Columbia sada potpuno posvećen propovijedanju preditivnih tehnika, svojim je predavanjima, knjigama i aktivnom promocijom putem medija učinio mnogo za upoznavanje poslovnih ljudi u SAD-u pa potom i u drugim razvijenim zemljama s tehnologijom prediktivne analitike. Izdvajamo jedan od komentara povodom izlaska novog izdanja njegove knjige Predictive Analitics: Ova je knjiga radni priručnik za život u 21. stoljeću izvlačeći srž iz gotovo svega, radilo se o znanosti, poslovanju, financijama, sportu ili politici. Eric Siegel je idealan vodič.

Ono što nedostaje na tržištu je malo više uputa za poslovne korisnike oko strategije uporabe prediktivne analitike, ali se na temelju istraživanja primjera dobre prakse i znanstvenih radova u tom području može izlučiti ovih pet glavnih koraka u implementaciji prediktivne analitike u poslovnom odlučivanju:
1 Prilike – Uočiti prilike za poboljšanje poslovanja i ostvarivanje poslovnih ciljeva koje se mogu realizirati pomoću prediktivne analitike. Taj se korak može opisati i odgovaranjem na pitanje: Koja nova znanja su nam potrebna o kupcima/proizvodima/dobavljačima da bi tvrtka bila uspješnija?
2 Izvori – Identificirati izvore strukturiranih i nestrukturiranih podataka i dokumenata koji se mogu koristiti za prediktivnu analitiku, odnosno pitati se gdje se mogu pronaći informacije potrebne za postizanje ciljeva i prilika – u kojim bazama, na webu, društvenim mrežama, putem Interneta stvari (IoT)?
3 Alati – Izbor i postavljanje platforme za prikupljanje, pohranu i analizu podataka, pri čemu se preporučuje koristiti Big Data platformu u oblaku, što omogućuje štednju resursa.
4 Uporaba – Pri uporabi alata menadžeri mogu na intuitivan način kreirati modele, dobiti uvid u uzorke ponašanja kupaca, dobavljača, predviđati prodaju, životni ciklus proizvoda i dr.  Pritom ne moraju znati detalje o statističkim metodama i metodama strojnog učenja, jer će se odgovarajuće metode odabrati automatizmom unutar alata. Rezultati će se prikazati numerički, vizualno grafički, s tekstualnim opisima koji omogućuju i personalizaciju prikaza izvješća.
5 Promjena – Nakon uvida u izvješća menadžer može to znanje iskoristiti za donošenje odluka, za pokretanje novih aktivnosti, promjenu postojećih i drugo što će pridonijeti većem zadovoljstvu korisnika i uspješnosti poslovanja. Kako bi se pratila promjena koju je donio sustav prediktivne analitike, važno je unaprijed postaviti pokazatelje uspješnosti, kao npr. povećanje cross-selling indeksa, povećanje prodaje, stopa konverzije i druge odgovarajuće pokazatelje.

Primjeri iz prakse

U okviru prediktivne analitike posebno je obećavajuća uporaba metoda strojnog učenja gdje pripadaju i umjetne neuronske mreže čiji su modeli pokazali na brojnim uzorcima veću uspješnost od logističke regresije i drugih metoda.
Zamislite da želite predvidjeti cijenu svoje dionice za sutrašnji dan. Ako raspolažete nekim od alata za prediktivnu analitiku koji uključuje metodu neuronskih mreža, npr. SAS Enterprise Miner ili TradingSolutions koji je specijaliziran za predviđanja na tržištima vrijednosnica, u njemu je moguće koristiti gotove modele neuronskih mreža koji zahtijevaju od korisnika izbor datoteke s podacima o svojim dionicama kao što su jučerašnja cijena otvaranja, cijena zatvaranja dionice  te volumen dionice na burzi i slično, a na temelju tih podataka model izračunava sutrašnju cijenu dionice i daje signal za prodaju ili kupnju.

Drugi primjer vrlo učinkovite upotrebe neuronskih mreža je u bankarskom poslovanju za predviđanje uspješnosti tvrtki ili klijenata koji traže kredit (bankruptcy prediction for credit risk). Istraživanja su pokazala da neuronske mreže mogu točno klasificirati više od 80 % klijenata za razdoblje od tri godine unaprijed na testnom uzorku tako da su važna potpora bankovnim analitičarima. Od čestih primjena te metode treba još spomenuti detektiranje zloupotreba kreditnih kartica ili bankovnih računa gdje mreže imaju funkciju prepoznavanja uzoraka. Fair Isaac, vodeća američka tvrtka za potporu odlučivanju i poslovnu implementaciju neuronskih mreža, koja servisira devet od deset najuspješnijih tvrtki na ljestvici Fortune 500, tvrdi da je nakon uvođenja sustava Fraud Manager koji se temelji na neuronskim mrežama stopa zloupotrebe kreditnih kartica drastično smanjena.
Osim za predviđanje, klasifikaciju ili prepoznavanje uzoraka, metode strojnog učenja mogu se iskoristiti i za identificiranje ključnih čimbenika nekih pojava pa nam tako model dobiven pomoću tih metoda može reći npr. koje su ključne karakteristike klijenata koji ne vraćaju svoje kredite, zatim koje su karakteristike kupaca koji kupuju naš proizvod i slično. Na temelju tih spoznaja menadžeri mogu kreirati strategije pristupa klijentima.


Primjer analize signala za dionicu u alatu TradingSolutions (Izvor: TradingSolutions, http://www.tradingsolutions.com, 14. VI. 2016.)

Provjera uspješnosti

Na kraju, može se postaviti pitanje - koliko su metode prediktivne analitike uspješne u svojim predviđanjima? Fair Isaac tvrdi da je vrijeme povrata investicije uložene u njihov sustav predviđanja temeljen na neuronskim mrežama u Telecomu oko četiri mjeseca, a od ostalih prednosti navode smanjenje gubitaka od oko 50 %, što je iznosilo oko 750.000 eura godišnje uštede. Citibank, Merrill Lynch, Chase Manhattan Bank, samo su neke od brojnih svjetskih banaka i financijskih institucija koje se oslanjanju na tu metodu pri donošenju poslovnih odluka. LBS Capital Management, ulagačka tvrtka s Floride jedna je od prvih koje su primijenile neuronske mreže za prepoznavanje uzoraka na tržištu dionica i predviđanje tržišnih indeksa i trendova. Tvrtka koristi integraciju ekspertnog sustava i neuronske mreže tako da ekspertni sustav na temelju rezultata neuronske mreže generira signale za prodaju, odnosno kupnju dionica. Sustav predviđa kretanje na S&P 500 s prosječnom točnošću od 95 %.

Za Hrvatsku skupo – ali nužno

Uzroci zašto se metode prediktivne analitike malo koriste u Hrvatskoj uglavnom su pomanjkanje osposobljenog kadra te visoka cijena alata.

Uzroci zašto se te metode ne koriste više u Hrvatskoj uglavnom su pomanjkanje osposobljenog kadra te visoka cijena alata za prediktivnu analitiku. No s obzirom na to  da se te metode sve intenzivnije ugrađuju u sustave za upravljanje bazama podataka kao dio modula za poslovnu inteligenciju, znatno su dostupnije pa su veće i šanse da se učestalije koriste u praksi.
 U Hrvatskoj postoje tvrtke koje razvijaju i koriste skladišta podataka te OLAP poslovne analize, kao npr. Poslovna inteligencija koja u suradnji s Tehničkim veleučilištem organizira i ljetnu školu o Big Data. No, alati za prediktivnu analitiku još ne uključuju dovoljno metoda strojnog učenja koje mogu pridonijeti kvaliteti razvijenih modela i njihovih predikcija.
Budući da ni metode strojnog učenja ne mogu rješavati sve probleme, uvijek ih je preporučljivo koristiti u kombinaciji sa statističkim metodama te u integrativnom pristupu dobiti uspješne modele. Zbog svojih prediktivnih mogućnosti takvi su alati danas nezaobilazni čimbenik konkurentske prednosti svake tvrtke na tržištu.

Dakle...

Želi li vaša tvrtka predviđati svoju uspješnost, cijenu svojih dionica, prodaju (potražnju)... želite li segmentirati svoje kupce u skupine na kojima ćete primijeniti posebne marketinške strategije kako biste ih zadržali, odnosno želite li biti proaktivni u kreiranju tržišnih promjena, a ne samo reagirati kad se to već dogodi, uključite alate za prediktivnu analitiku u svoje odlučivanje, jer bez njih se više ne može.