primena oracle data warehouse u analizi uspešnosti studenata

7
620 PRIMENA ORACLE DATA WAREHOUSE U ANALIZI USPEŠNOSTI STUDENATA IMPLEMENTATION OF ORACLE DATA WAREHOUSE IN STUDENT SUCCESS ANALYSIS Prof. dr Alempije Veljović Zoran Jevremović Tatjana Knežević 1 Rezime: U ovom radu vrlo sažeto opisana je izrada sistema poslovne inteligencije potrebnog za analizu uspeha studenata. Ovim sistemom donosiocima odluka obezbeđuju se potrebne informacije u procesu odlučivanja. Kako ne postoji precizno definisana metodologija za izradu sistema poslovne inteligencije, postavljena je metodologija objektno orijentisanog razvoja (OO) sistema poslovne inteligencije koja sadrži sledeće definisane standarde: standard za funkcionalno modeliranje IDEF0 za postupak modeliranja procesa; standard za informaciono modeliranje IDEF1X za postupak modeliranja podataka; ORACLE Database Warehouse Builder za dimenziono modeliranje. Ključne reči: poslovna inteligencija, odlučivanje, metodologija, modeliranje Abstract: This paper briefly describes the development of business intelligence needed to analyze the success of students. This system can provide decision makers the necessary information in the decision making process. As there is no precisely defined methodology for making business intelligence system, the methodology of object oriented development (OO) of business intelligence system is set, that contains the following defined standard: a standard for functional modeling IDEF0 for process modeling, process, standards for information modeling IDEF1X procedure for modeling data; Oracle Database Warehouse Builder for dimensional modeling. Keywords: business intelligence, decision making, methodology, modeling 1. UVOD U ovom radu razvijena je metodologija koja predstavlja sintezu više metodologija, a sastoji se od sledećih koraka: - definisanje zahteva, - objektno orijentisana analiza, - objektno orijentisan dizajn, i - implementacija. Na slici 1 prikazana je struktura izgrađene metodologije koja je primenjena u izradi ovog rada. 1 Tehnički fakultet Čačak, Svetog Save 65, Čačak Međunarodna naučna konferencija MENADŽMENT 2010 International Scientific Conference MANAGEMENT 2010 Kruševac, Srbija, 17-18. mart 2010 Krusevac, Serbia, 17-18 March, 2010

Transcript of primena oracle data warehouse u analizi uspešnosti studenata

Page 1: primena oracle data warehouse u analizi uspešnosti studenata

620

PRIMENA ORACLE DATA WAREHOUSE U ANALIZI USPEŠNOSTI STUDENATA

IMPLEMENTATION OF ORACLE DATA WAREHOUSE IN STUDENT SUCCESS ANALYSIS

Prof. dr Alempije Veljović Zoran Jevremović Tatjana Knežević1

Rezime: U ovom radu vrlo sažeto opisana je izrada sistema poslovne inteligencije potrebnog za analizu uspeha studenata. Ovim sistemom donosiocima odluka obezbeđuju se potrebne informacije u procesu odlučivanja. Kako ne postoji precizno definisana metodologija za izradu sistema poslovne inteligencije, postavljena je metodologija objektno orijentisanog razvoja (OO) sistema poslovne inteligencije koja sadrži sledeće definisane standarde: standard za funkcionalno modeliranje IDEF0 za postupak modeliranja procesa; standard za informaciono modeliranje IDEF1X za postupak modeliranja podataka; ORACLE Database Warehouse Builder za dimenziono modeliranje. Ključne reči: poslovna inteligencija, odlučivanje, metodologija, modeliranje Abstract: This paper briefly describes the development of business intelligence needed to analyze the success of students. This system can provide decision makers the necessary information in the decision making process. As there is no precisely defined methodology for making business intelligence system, the methodology of object oriented development (OO) of business intelligence system is set, that contains the following defined standard: a standard for functional modeling IDEF0 for process modeling, process, standards for information modeling IDEF1X procedure for modeling data; Oracle Database Warehouse Builder for dimensional modeling.

Keywords: business intelligence, decision making, methodology, modeling

1. UVOD U ovom radu razvijena je metodologija koja predstavlja sintezu više metodologija, a sastoji se

od sledećih koraka: - definisanje zahteva, - objektno orijentisana analiza, - objektno orijentisan dizajn, i - implementacija.

Na slici 1 prikazana je struktura izgrađene metodologije koja je primenjena u izradi ovog rada.

1 Tehnički fakultet Čačak, Svetog Save 65, Čačak

Međunarodna naučna konferencija

MMEENNAADDŽŽMMEENNTT 22001100 International Scientific Conference

MMAANNAAGGEEMMEENNTT 22001100 Kruševac, Srbija, 17-18. mart 2010

Krusevac, Serbia, 17-18 March, 2010

Page 2: primena oracle data warehouse u analizi uspešnosti studenata

621

Slika 1 - Šematski prikaz metodologije objektno orijentisanog razvoja sistema poslovne inteligencije

2. DEFINISANJE ZAHTEVA Definisanje zahteva je prvi korak u izradi svih sistema poslovne inteligencije pa i sistema za

potrebe analize uspeha studenata gde treba da sagledamo sistem i uočimo potrebe korisnika. Definisanje zahteva podrazumeva primenu:

- Klasičnog pristupa definisanog IDEF0 i IDEF1X metodologijom, čime se definiše način izrade logičkog modela funkcija i podataka, i

- Objektnog pristupa, definisanog dijagrama poslovnih slučajeva upotrebe i dijagrama aktivnosti koji se nalaze unutar standarda UML-a.

Definisanjem zahteva obavljena je identifikacija sistema. Ovaj proces se definiše kao:

- prikupljanje zahteva, - izrada modela poslovnih slučajeva upotrebe.

Izvori podataka za skladišta podataka su operativni (transakcioni) tzv. OLTP (On-Line Transaction Processing) podaci, spoljne informacije nastale kao istorija poslovanja ili industrijski i demografski podaci uzeti iz velikih javnih baza podataka. Polazeći od postavljenih hipoteza, informacije do kojih je potrebno doći nalaze se u podacima transakcione baze, a vezane su za:

- analizu uspeha studenata, i - praćenje ispita studenata.

2.1. ANALIZA PODATAKA

Analiza izvornih podataka je veoma bitan korak i oduzima preko 80% vremena, jer je potrebno definisati skup ciljnih podataka kao i odgovarajuća pravila za njihovo preuzimanje iz izvornih baza.

U prikupljanju korisničkih (user-driven) zahteva do izražaja neosporno dolaze i metode intervjua sa korisnikom sistema kao i korišćenje CASE alata a naročito prilikom definisanja poslovnih pravila. Postojeća dokumentacija najčešće ne daje dovoljno podataka za ekstrakciju podataka. Korišćenjem CASE alata, BPwin za modeliranje procesa i ERwin za modeliranje podataka, definišu se procesi i struktura podataka koja je potrebna a koja se nalazi u OLTP i u spoljnim izvorima podataka.

Page 3: primena oracle data warehouse u analizi uspešnosti studenata

622

Slika 2. Definisanje granica posmatranog sistema - Dijagram konteksta poslova Studentske službe

Za prikupljanje izvornih (source-driven) zahteva koristi se metodologija odozdo nagore, čime se omogućuje preciznost, tj. metoda bazirana na definisanju zahteva analiziranjem podataka za transakcione baze podataka korišćenjem ER-modela podataka. Definisanje korisničkih zahteva, imalo je za cilj da definiše i funkcionalno opiše sve poslovne procese studentske službe i na taj način podrži zahtev integralnosti informacionog sistema. Poslovi studentske službe koji odgovaraju postavljenoj hipotezi su vezani za:

- Personalno praćenje studenta - upis viših semestara i overa semestra, - vođenje matične knjige, - analiza uspešnosti studiranja.

- Praćenje ispita - izrada rasporeda polaganja ispita i otvaranje zapisnika o polaganju ispita, - prijavljivanje ispita, - polaganje ispita i ažuriranje zapisnika, - analiza ispita.

Model podataka za personalno praćenje studenta prikazan je kao transakcioni model podataka na slici 3.

Slika 3 - Model podataka za personalno praćenje studenta

Page 4: primena oracle data warehouse u analizi uspešnosti studenata

623

Model podataka za praćenje ispita prikazan je kao transakcioni model podataka na slici 4.

Slika 4 - Model podataka za praćenje ispita

2.2 OBJEKTNO MODELIRANJE POSLOVNIH PROCESA

Za objektno modeliranje poslovnih procesa koristi se UML (Unified Modeling Language) standard, a cilj je napraviti dobar poslovni model koji će poslužiti kao osnova za razvoj softvera poslovne inteligencije. Dijagram poslovnih slučajeva upotrebe prikazuje poslovne slučajeve upotrebe i učesnike, kao i njihove relacije. Dijagram poslovnih aktivnosti koristi se za objektno orijentisanu specifikaciju informacionih sistema, za opis aktivnosti vezanih za poslovni proces, tj. poslovni slučaj upotrebe.

Analiza uspeha studiranja kao cilj u ovom radu, predmet je daljih razmatranja i izvodi se zbog potrebe praćenja, uspešnosti studiranja. Na slici 5 prikazan je dijagram poslovnih aktivnosti personalno praćenje studenta. Na slici 6 prikazan je dijagram poslovnih aktivnosti za poslovni slučaj upotrebe praćenja ispita.

Slika 5 - Dijagram poslovnih aktivnosti upotrebe

personalno praćenje studenta Slika 6 - Dijagram aktivnosti za slučaj praćenja

ispita

Page 5: primena oracle data warehouse u analizi uspešnosti studenata

624

3. OBJEKTNO ORIJENTISANA ANALIZA Objektno orijentisana (OO) analiza predstavlja najkritičniju fazu, jer je potrebno uočiti koji se

objekti pojavljuju u realnom sistemu i specificirati atribute i interakciju između objekata. Na osnovu izrađenog modela poslovnih slučajeva upotrebe u kojima su specificirani i dijagrami aktivnosti koji opisuju pojedine poslovne slučajeve upotrebe, sačinjen je model sistemskih slučajeva upotrebe za ograničenja definisana hipotezama ovog rada. Sistemski slučajevi upotrebe omogućavaju grubi opis dinamike aktivnosti rada referenta studentske službe, kao što se vidi na slici 7.

Slika 7 - Dijagram sistemskog slučaja upotrebe

Sistemski slučaj upotrebe sugeriše način na koji će se referent studentske službe nalaziti u interakciji sa budućim softverskim rešenjem, tj. moraju se predvideti događaji koje će sistemski učesnik generisati. Sistemski učesnik koji izvodi analize na fakultetu je referent studentske službe. Identifikovan je kao korisnik funkcionalnosti sistema, koji će imati podršku sistema u obavljanju dnevnih zadataka i zainteresovan je za rezultate koje sistem proizvodi. Sistemski učesnik komunicira sa sistemskim slučajevima upotrebe kao što je pokazano na prethodnoj slici. Sistemski slučaj upotrebe analiza uspeha studenata enkapsulira aktivnosti koje korisnik sistema mora da uradi da bi izvršio sagledavanje uspeha studenata. Sistemski slučaj upotrebe učitavanje podataka ima za cilj da u pozadini realizuje punjenje skladišta podataka selektovanim podacima iz OLTP sistema.

4. OBJEKTNO ORIJENTISAN DIZAJN

Na osnovu definisanog osnovnog koncepta, u okviru objektno orijentisane analize i pripreme podataka za analitičko procesiranje pristupilo se izradi dimenzionog modela. Na slici 8. prikazana je šema galaksije koja je nastala na osnovu objektno orjentisane analize, tj. definisanjem konceptualnog modela.

Slika 8 - Šema galaksije

Page 6: primena oracle data warehouse u analizi uspešnosti studenata

625

5. IMPLEMENTACIJA Da bi izgradili skladište podataka potrebno je, osim dizajna modela podataka, napisati i skripte,

procedure, programe u raznim programskim jezicima (SQL, PL/SQL, ...) zavisno od potrebe. Da bi olakšali izgradnju skladišta podataka, mnogi proizvođači su izradili programske pakete u kojima se može jednostavno i lako, koristeći grafičko okruženje, napraviti logički model i definisati skripte. To predstavlja veliku uštedu u vremenu razvoja i implementacije skladišta podataka. Jedan od takvih programskih paketa je i Oracle Warehouse Builder (OWB).

OWB je programski paket koji služi za definisanje logičkog modela, implementaciju skladišta podataka kao i za nadgledanje i kontrolu rada skladišta podataka. To je integrisani skup programskih rješenja koji nam omogućava lakše dizajniranje i izgradnju skladišta podataka, ali i kasniju kontrolu rada i nadgledanje skladišta podataka.

Filozofija i način rada Oracle Warehouse Buildera je potpuno logičan i u skladu s današnjim trendovima. Osnovni princip rada je da je izgradnja skladišta podataka podeljena u tri dela. Prvi deo je potpuna logička definicija koja osim definicije logičkog modela obuhvata i logičku definiciju mapiranja podataka iz izvora. Drugi deo predstavlja konfiguraciju svih objekata definisanih na logičkom nivou. Završni deo predstavlja generisanje i pokretanje skripti za stvaranje logičkog modela (dimenzija, tablica činjenica, ...), kao i generisanje i pokretanje skripti za izvlačenje, transformaciju i učitavanje podataka iz izvora u skladište podataka.

Logička definicija započinje stvaranjem izvorišnih i odredišnih modula. Nakon definisanja izvorišnog modula, potrebno je uvesti definicije relacione baze koja nam služi kao izvor podataka. Ako imamo više izvora, potrebno je stvoriti više izvorišnih modula (za svaki izvor podataka, potreban nam je jedan izvorišni modul).

Nakon definisanja odredišnog modula, potrebno je definisati, unutar samog modula, dimenzije, tablice činjenica, materijalizovane poglede,. prema našem logičkom modelu podataka. Takođe unutar odredišnog modula definišemo svoje transformacije i mapiranja. Osim naših transformacija u OWB-u već postoje standardne funkcije i procedure koje možemo koristiti u svojim mapiranjima.

Nakon što se kreiraju definicije objekata potrebnih za logički model, vlastite transformacije i mapiranja, i učitaju definicije izvora gotovo je sa logičkim definisanjem. Logička definicija je zapisana u repozitorijum OWB-a, ali još nije stvoren nijedan objekt, nijedna tablica, niti skripta. Da bi se stvorila fizička instanca skladišta prvo je potrebno konfigurisati fizička svojstva svakog modula, objekta, tablice, svakog mapiranja i operatora unutar mapiranja. Na taj način definišemo kako će se logički model fizički kreirati, kako će se skripte izvršavati itd.

Posle konfiguracije fizičkih parametara potrebno je generisati skripte za kreiranje raznih tablica, kao i generisati skripte za izvlačenje, transformaciju i učitavanje podataka iz izvora u skladište. Generisane skripte zatim treba fizički zapamtiti u bazu podataka i posle toga pokrenuti. Na taj način se stvara fizička instanca skladišta podataka i učitavaju se podaci u njega. Učitavanjem podataka skladište podataka je izgrađeno.

6. ZAKLJUČAK Prikazana metodologija izrade skladišta podataka u cilju praćena analize uspeha studenata

uopštena je i lako primenljiva u svim obrazovnim institucijama, a izuzetno je važna kao pouzdana podrška odlučivanju. U radu su razrađeni osnovni koraci u izgradnji skladišta podataka. Tokom izgradnje skladišta potrebno je definisati izvor odakle se izvlače podaci, potrebno je definisati logički model skladišta u koji će se uskladištiti izvučeni podaci. Takođe potrebno je definisati proces izvlačenja, transformacije i učitavanja podataka iz izvora u skladište podataka. Nakon definisanja logičkog dela potrebno je implementirati stvarno skladište i učitati njegove podatke. U datom slučaju, Oracle Warehouse Builder se pokazao kao programski paket koji je jednostavan za korišćenje, i koji znatno ubrzava izgradnju skladišta podataka, naročito olakšava definisanje ETL procesa. Naime u OWB nije potrebno pisati skripte ručno, već OWB generiše kod prema definicijama i konfiguracijama koje smo sami napravili. To omogućava veliku uštedu u vremenu razvoja i implementacije skladišta podataka, pa se na taj način povećava efikasnost izrade skladišta.

Page 7: primena oracle data warehouse u analizi uspešnosti studenata

626

LITERATURA 1. Adamson, Christopher and Michael Venerable, 1998, Data Warehouse Design Solutions,

New York: John Wiley and Sons. 2. Bennett, S., McRobb, S., Farmer, R., Object-oriented systems analysis and design using

UML, McGraww-Hill, 1999. 3. Hardman Ron, Managing Data Quality, Oracle Magazine, November/December 2006. 4. Mattson, R. Data Warehousing: Strategies, Technologies and Techniques. McGraw-Hill,

1996. 5. Veljović A. Njeguš A., Osnove relacionih i analitičkih baza podataka, Megatrend univerzitet

primenjenih nauka, Beograd, 2004. 6. Veljović A., Tot I., Joksimović S., Student success analyse system, 8th BALKAN

CONFERENCE ON OPERATIONAL RESEARCH, Bukurest, 2005.