Osnovni podatki
Sodelavci:
, , , , ,
 
Trajanje:
1. marec 2016–28. februar 2019
Link SICRIS:
Povezava na SICRIS
Šifra:
L1-7542 (A)
Opis

Težko bi pretiravali v poudarjanju tega, kako pomembna je danes statistična analiza podatkov: vse empirične znanosti, zdravstvo, finance, odkrivanje goljufij, telekomunikacije, družabna omrežja, in trženje so samo nekatera izmed področij, ki se močno zanašajo na podatke in njihovo analizo. Čeprav je v zadnjem času uporabna statistika močno napredovala in postala bolj dostopna, še posebej sodobna Bayesova statistika, se je napredek upočasnil, saj s sodobnimi računskimi metodami ne moremo več obvladati statističnih modelov in količin podatkov, ki jih želimo analizirati danes.

Problem neučinkovitih računskih metod je bil pred kratkim izpostavljen kot eden izmed 5 najpomembnejših odprtih problemov v statistiki. Naš primarni cilj je prispevati k reševanju tega problema z raziskavo pristopa za bolj učinkovito splošnonamensko računanje in implementacijo ugotovitev v računsko orodje, ki nam bo omogočilo analizo vse večje količine podatkov po zmerni ceni.

Cilj bomo dosegli s samodejno paralelizacijo najbolj potratnih delov splošnonamenskih računskih algoritmov iz družine Monte Carlo z markovskimi verigami (natančneje, algoritma Metropolis-Hastings in algoritma hamiltonski Monte Carlo) in z uporabo grafičnih kartic. Grafične kartice so glede na ceno na enoro računske moči najbolj učinkovita strojna oprema, kar bo v bližnji prihodnosti postalo še bolj izrazito. Kot rezultat projekta pričakujemo 100-krat hitrejše izvajanje algoritmov za nizko ceno (manj kot €1.000,00). K projektu smo privabili vrhunske raziskovalce in strokovnjake iz Univerze v Ljubljani, Slovenske akademije znanosti in umetnosti in industrije. Vse množice podatkov in aplikativni problemi, ki jih bomo uporabili za vpogled, razvoj, ocenjevanje in validacijo razvite metodologije, bodo izhajale iz nekega pomembnega praktičnega problema, s katerim se spopadajo slovenski raziskovalci.

V preteklosti so že bili uspešni poskusi učinkovitega računanja za statistične namene, a le za posebne primere statističnih modelov. Naš cilj - splošnonamenska statistična analiza, ki je samodejno paralelizirana za visoko učinkovitost računanja - je novost in bi pomenila pomemben korak naprej. Projekt je izjemno aktualen tako z vidika znanosti, saj gre za pomemben znanstveni dosežek na področju računskih metod, kakor tudi zaradi številnih praktičn učinkov nizkocenovne in dostopne, a visoko učinkovite statistične analize.

Utrinki iz sorodnih del namigujejo, da lahko dosežemo pohitritve, ki smo si jih zadali. Čeprav gre za raziskovalni projekt in bo potrebno razrešiti več tehničnih in implementacijskih problemov, trdno verjamemo v uspešno izvedbo projekta, saj smo dobro definirali zahteve in mere uspešnosti, izdelali načrt, kako jih bomo dosegli, in zbrali ustrezne strokovnjake z različnimi ozadji, ki pokrivajo vsa zahtevana teoretična in praktična znanja. Prav tako smo privabili sofinanciranje iz gospodarstva ter tako okrepili proračun, aktivno pa bomo spodbujali tudi sodelovanje naših študentov.

Glavni prispevki projekta bodo teoretična raziskava, ki bo pripeljala do učinkovitih računskih metod, praktična implementacija raziskovalnih rezultatov v programsko orodje za splošnonamensko statistično analizo in, kot stranski učinek, raziskovalni rezultati v empiričnih znanostih in industriji, ki jih bo omogočila razvita metodologija. Učinkovito računanje bo zmanjšalo čas in ceno statistične analize, kar predstavlja neposredno korist gospodarstvu in, glede na vseprisotnost podatkov, tudi družbi. Nenazadnje pa bo sodelovanje med raziskovalci, aplikativnimi raziskovalci, gospodarstvom in študenti dvignilo nivo uporabnega statističnega znanja, področja, ki je v Sloveniji izjemno slabo razvito.

Vodilni partner

Vodja projekta

Vodja projekta na ZRC

Partnerji

OPTILAB d.o.o., informacijske tehnologije in poslovne storitve • Univerza v Ljubljani, Fakulteta za šport • Univerza v Ljubljani, Filozofska fakulteta • Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti

Finančni vir

Javna agencija za raziskovalno dejavnost Republike Slovenije; Garex Adria, napredne informacijske storitve, d.o.o.