BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-01050-SI...
Transcript of BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-01050-SI...
10
BAB 2
LANDASAN TEORI
2.1 Teori Umum
2.1.1 Pengertian Data Warehouse
Berdasarkan Connoly dan Begg (2005, p1151), “ Data Warehouse is a
subject-oriented, integrated, time-variant, and non-volatile collection of data in
support of management’s decision-making process.” Yang artinya Data
Warehouse adalah koleksi data yang mempunyai sifat berorientasi pada subjek,
terintegrasi, rentang waktu, dan koleksi datanya tidak mengalami perubahan
dalam menudukung proses pengambilan keputusan di manajamen.
Menurut Inmon (2005, p29), sebuah data warehouse adalah sebuah
kumpulan data yang integrated, subject-oriented, nonvolatile, time variant yang
mendukung managemen mengambil keputusan.
Data warehouse dibangun dengan cara mengintegrasikan data yang
berasal dari berbagai sumber data, yaitu database operasional. Untuk melakukan
proses integrasi ini, Data Warehouse memiliki tiga proses utama yang
dilaksanakan, yaitu: extraction, data transformation, dan loading (ETL). Sebelum
proses transformation terdapat suatu proses yang bernama data cleansing
(Watson, 2010).
Data warehouse adalah kumpulan pendukung teknologi decision support,
yang bertujuan membantu pekerja (eksekutif, manajer, analis) untuk membuat
keputusan yang lebih baik dan lebih cepat. Ini berfungsi sebagai pelaksanaan fisik
11
dari decision support data model dan menyimpan informasi pada yang perusahaan
perlu membuat keputusan strategis (Reddy, 2010).
Dari pengertian-pengertian di atas, dapat disimpulkan bahwa data
warehouse adalah sekumpulan data yang diperoleh dari berbagai sumber yang di
gunakan untuk mendukung proses pembuatan management di dalam suatu
perusahaan.
2.1.2 Pengertian OLTP (On-line Transaction Processing)
Menurut Connolly and Begg (2005, p1149), OLTP system adalah sistem
yang dirancang untuk menangani high transaction, dengan transaksi yang secara
khusus membuat perubahan kecil terhadap data operasional organisasi, yaitu data
yang diperlukan organisasi untuk menangani operasi dari hari ke hari.
On-Line Transaction Processing (OLTP) adalah sebuah istilah dalam data
warehouse, OLTP sendiri adalah suatu kegiatan atau sebuah proses database
dalam menyimpan data dalam hal kegiatan operasional transaksi yang dilakuan
setiap hari.
OLTP (Online Transaction Processing Systems) adalah suatu sistem yang
memproses suatu transaksi secara langsung (insert, update, delete) melalui
komputer yang terhubung dalam jaringan. OLTP berorientasi pada proses yang
memproses suatu transaksi secara langsung melalui komputer yang terhubung
dalam jaringan. Seperti misalanya kasir pada sebuah supermarket yang
menggunakan mesin dalam proses transaksinya. OLTP mempunyai karakteristik
beberapa user dapat creating, updating, retrieving untuk setiap record data, lagi
pula OLTP sangat optimal untuk updating data.
12
2.1.3 Perbandingan Data warehouse dan OLTP
Di bawah ini adalah tabel yang menunjukkan karakteristik utama dari
sistem OLTP dan sistem data warehouse (Connolly dan Begg, 2005,
p1153) :
Table 2.1 Perbandingan Sistem OLTP dan Sistem Data warehouse
Sistem OLTP Sistem Data Warehouse
Menangani data sekarang Menangani data historis
Menyimpan detailed data Menyimpan detailed, lightly dan
highly summarized data
Data bersifat dinamis Data bersifat statis
Proses berulang Proses sewaktu – waktu tidak
terstruktur dan heuristic
Jumlah transaksi tinggi Jumlah transaksi rendah sampai
sedang
Transaction driven Analysis driven
Berorientasi aplikasi Berorientasi subjek
Mendukung keputusan harian Mendukung keputusan strategis
Melayani banyak user Melayani sedikit user (manajerial)
13
2.1.4 Data Mart
Adalah suatu bagian pada data warehouse yang mendukung pembuatan
laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu
perusahaan. Menurut Conolly and Begg (2005, p1171), data mart merupakan
subset dari data warehouse yang mendukung kebutuhan informasi dari suatu
departemen atau fungsi bisnis tertentu. Data mart merupakan suatu bagian dari
data warehouse yang dapat mendukung pembuatan laporan dan analisis data pada
suatu unit, bagian atau operasi perusahaan.
Data Mart adalah bentuk atau versi skala kecil (ruang lingkup data mart
lebih kecil) dari Data Warehouse (Gudang Data), yang dirancang untuk unit bisnis
strategis atau Strategic Business Unit (SBU) atau departemen. Karena Data Mart
mengandung informasi yang tidak sebanyak gudang data (Data Warehouse), Data
Mart memberikan respon yang lebih cepat dan lebih mudah navigasikan
dibandingkan gudang data (Data Warehouse).
Perbedaan antara data mart dan data warehouse adalah :
1. Data mart hanya berfokus pada kebutuhan user yang berkaitan dengan
suatu departemen atau fungsi bisnis.
2. Data mart tidak mengandung data operasional secara detil, berbeda
dengan data warehouse.
3. Data yang terdapat didalam data mart lebih sedikit dari data yang ada di
dalam data warehouse.
2.1.5 Karakteristik Datawarehouse
Karakteristik dari data warehouse menurut pendapat Inmon
(2005, p29-32) yaitu subject oriented, integrated, non-volatile, dan time
variant.
14
1. Subject Oriented
Sistem operasi secara klasik diorganisasikan sekitar aplikasi
fungsional dari perusahaan. Untuk perusahaan asuransi, aplikasinya
dapat berupa auto, health, life, dan casuality. Area subyek utama dari
perusahaan asuransi dapat berupa customer, policy, premium, dan
claim. Untuk perusahaan, area subyek utama dapat berupa
product, order vendor, bill of material, dan raw goods. Untuk
pedagang eceran, area subyek utama dapat berupa product, sale,
vendor.
Gambar 2.1 Aspek Subject Oriented Dari Data Warehouse
(Sumber : Inmon, 2005, p30)
15
2. Integrated
Data diambil dari banyak sumber berbeda kemudian dimasukkan
ke dalam data warehouse. Selama data diambil, data tersebut diubah,
dilakukan format kembali, diurutkan, diringkas dan seterusnya.
Hasilnya, data terletak dalam data warehouse yang memiliki
pandangan terpadu dan terintegrasi.
Untuk menciptakan subyek area yang berguna, sumber data yang
berasal dari beberapa sistem yang berbeda, terlebih dahulu
harus terintegrasi sebelum digabungkan ke dalam sebuah data
warehouse. Sebagai contoh, terdapat 4 aplikasi yang menyimpan
kode jenis kelamin dalam database secara berbeda. Aplikasi A
menyimpan kode jenis kelamin dalam bentuk 'm' untuk laki-laki
dan ‘ f ’ untuk perempuan, sedangkan aplikasi V dalam bentuk 'I'
dan '0', aplikasi C dalam bentuk 'x' dan 'y', aplikasi D dalam
bentuk 'male' dan 'female'. Melalui proses integrasi dihasilkan kode
jenis kelamin yang seragam untuk data warehouse yaitu 'm' dan
‘f’ . Untuk lebih jelasnya dapat dilihat pada gambar berikut ini :
16
Gambar 2.2 Aspek Integrated dari Data Warehouse
(Sumber : Inmon, 2005, p31)
3. Non-volatile
Data dalam lingkungan operasional di-update secara teratur, tetapi
data pada data warehouse menunjukkan karakteristik yang berbeda.
Data pada data warehouse di-load dan diakses tetapi tidak di-
update. Ketika data pada data warehouse di-load, data di-load di
dalam sebuah snapshot (static format). Ketika terjadi perubahan
selanjutnya, snapshot record yang baru akan ditulis.
17
Gambar 2.3 Aspek Non-volatility dari Data Warehouse
(Sumber : Inmon, 2005, p32)
4. Time Variant
Data yang tersimpan dalam data warehouse bersifat time-variant
atau bersifat akurat pada periode tertentu. Karakteristik dasar data
dalam data warehouse sangat berbeda dengan data pada OLTP,
dimana data hanya akurat untuk waktu sesaat setelah data diakses,
sedangkan data pada data warehouse, data akurat selama periode
waktu tertentu, maka dikatakan memiliki perbedaan waktu/ rentang
waktu (time variant).
Aspek yang menunjukkan karakteristik time variant dalam data
warehouse adalah sebagai berikut :
• Data warehouse mempresentasikan data untuk
kurun waktu 5-10 tahun. Sedangkan pada OLTP
mempresentasikan data untuk jangka waktu yang lebih
18
singkat mulai dari 60-90 hari, karena pada OLTP, aplikasi
yang digunakan harus memiliki response time yang singkat
maka data yang diproses harus optimal.
• Secara implisit maupun eksplisit, setiap struktur
data pada data warehouse mengandung elemen waktu
seperti hari, minggu, bulan, dan sebagainya. Elemen waktu
ini hampir selalu menjadi dasar yang mengintegrasikan data
dalam data warehouse.
• Data pada data warehouse merupakan serangkaian
snapshot, yaitu potongan data yang dikelompokkan sesuai
dengan urutan waktu.
Gambar 2.4 Aspek Time Variant dari Data Warehouse
(Sumber : Inmon, 2005, p32)
19
2.1.5.1. Struktur Data Warehouse
A. Current Detail Data
Current detail data merupakan data detil yang aktif saat ini,
mencerminkan keadaan yang sedang berjalan dan merupakan level terendah
dalam data warehouse. Didalam area ini warehouse menyimpan seluruh detail
data yang terdapat pada skema basis data. Jumlah data sangat besar sehingga
memerlukan storage yang besar pula dan dapat diakses secara cepat. Dampak
negatif yang ditimbulkan adalah kerumitan untuk mengatur data menjadi
meningkat dan biaya yang diperlukan menjadi mahal. Berikut ini beberapa
alasan mengapa current detail data menjadi perhatian utama :
1. Menggambarkan kejadian yang baru terjadi dan selalu menjadi
perhatian utama.
2. Sangat banyak jumlahnya dan disimpan pada tingkat
penyimpanan terendah.
3. Hampir selalu disimpan dalam storage karena cepat di akses
tetapi mahal dan kompleks dalam pengaturannya.
4. Bisa digunakan dalam membuat rekapitulasi sehingga current
detail data harus akurat.
B. Older Detail Data Warehouse
Data ini merupakan data historis dari current detail data, dapat berupa
hasil cadangan atau archive data yang disimpan dalam storage terpisah.
Karena bersifat back-up (cadangan), maka biasanya data disimpan dalam
storage alternatif seperti tape-desk.
20
Data ini biasanya memilki tingkat frekuensi akses yang rendah.
Penyusunan file atau directory dari data ini di susun berdasarkan umur dari
data yang bertujuan mempermudah untuk pencarian atau pengaksesan
kembali.
C. Lightly Summarized Data
Data ini merupakan ringkasan atau rangkuman dari current detail data.
Data ini dirangkum berdasar periode atau dimensi lainnya sesuai dengan
kebutuhan. Ringkasan dari current detail data belum bersifat total summary.
Data-data ini memiliki detail tingkatan yang lebih tinggi dan mendukung
kebutuhan warehouse pada tingkat departemen. Tingkatan data ini disebut
juga dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk
view suatu kondisi yang sedang atau sudah berjalan.
D. Hightly Summarized Data
Data ini merupakan tingkat lanjutan dari Lightly summarized data,
merupakan hasil ringkasan yang bersifat totalitas, dapat di akses misal untuk
melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan
analisis menggunakan data multidimensi.
E. Metadata
Metadata bukan merupakan data hasil kegiatan seperti keempat jenis data
diatas. Menurut Poe, metadata adalah ‘data tentang data’ dan menyediakan
informasi tentang struktur data dan hubungan antara struktur data di dalam
atau antara storage (tempat penyimpanan data). Metadata berisikan data yang
menyimpan proses perpindahan data meliputi database structure, contents,
21
detail data dan summary data, matrics, versioning,aging criteria, versioning,
transformation criteria. Metadata khusus dan memegang peranan yang sangat
penting dalam data warehouse.
Metadata sendiri mengandung :
• Struktur data
Sebuah direktori yang membantu user untuk melakukan
analisis Decission Support System dalam pencarian letak/ lokasi
dalam data warehouse.
• Algoritma
Algoritma digunakan untuk summary data. Metadata sendiri
merupakan panduan untuk algoritma dalam melakukan pemrosesan
summary data antara current detail data dengan lightly summarized
data dan antara lightly summarized data dengan hightly summaried
data.
• Mapping
Sebagai panduan pemetaan (mapping) data pada saat data di
transform/ diubah dari lingkup operasional menjadi lingkup data
warehouse.
22
2.1.5.2. Anatomi Data Warehouse
a) Data Warehouse Fungsional
Kata operasional disini merupakan database yang diperoleh dari kegiatan
sehari-hari. Data warehouse dibuat lebih dari satu dan dikelompokkan
berdasar fungsi-fungsi yang ada di dalam perusahaan seperti fungsi keuangan
(financial), marketing, personalia dan lain-lain. Keuntungan dari bentuk data
warehouse seperti ini adalah, sistem mudah dibangun dengan biaya relatif
murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan
terbatasnya kemampuan dalam pengumpulan data bagi pengguna.
Gambar 2.5 Bentuk Data Warehouse Fungsional
(Sumber : Gustiarahman, 2006)
b) Data warehouse terpusat
Bentuk ini terlihat seperti bentuk data warehouse fungsional, namun
terlebih dahulu sumber data dikumpulkan dalam satu tempat terpusat,
kemudian data disebar ke dalam fungsinya masing-masing, sesuai kebutuhan
persuhaan. Data warehouse terpusat ini, biasa digunakan oleh perusahaan
yang belum memiliki jaringan eksternal. Keuntungan dari bentuk ini adalah
23
data benar-benar terpadu karena konsistensinya yang tinggi sedang
kerugiannya adalah biaya yang mahal serta memerlukan waktu yang cukup
lama untuk membangunnya.
Gambar 2.6 Bentuk Data Warehouse Terpusat
(Sumber : Gustiarahman, 2006)
c) Data warehouse terdistribusi
Pada data warehouse terdistribusi ini, digunakan gateway yang berfungsi
sebagai jembatan penghubung antara data warehouse dengan workstation
yang menggunakan sistem beraneka ragam. Dengan sistem terdistribusi seperti
ini memungkinkan perusahaan dapat mengakses sumber data yang berada
diluar lokasi perusahaan (eksternal). Keuntungannya adalah data tetap
konsisten karena sebelum data digunakan data terlebih dahulu di sesuaikan
atau mengalami proses sinkronisasi. Sedangkan kerugiannya adalah lebih
kompleks untuk diterapkan karena system operasi dikelola secara terpisah juga
biaya nya yang paling mahal dibandingkan dengan dua bentuk data warehouse
lainnya.
24
Gambar 2.7 Bentuk Data Warehouse Terdistribusi
(Sumber : Gustiarahman, 2006)
Tiga tipe dari data warehouse terdistribusi:
1. Data warehouse yang terdistribusi secara geografi terdiri dari
data warehouse lokal dan data warehouse global.
2. Data warehouse yang terdistribusi dalam banyak prosesor, secara
logis ada satu data warehouse tetapi secara fisiknya ada banyak data
warehouse yang saling berhubungan.
3. Data warehouse yang tumbuh dalam sumber yang tidak terkoordinasi.
2.1.5.3. Arsitektur Data Warehouse
Arsitektur data warehouse menurut Conolly dan Begg (2005, p1162)
sebagai berikut :
25
Gambar 2.8 Arsitektur Data Warehouse (Conolly and Begg, 2005,
p1162)
Menurut Connolly and Begg (2005, p11556), arsitektur data
warehouse terdiri atas:
a. Operational Data
Sumber data untuk data warehouse disediakan dari :
• Mainframe data operasional disimpan dalam generasi pertama
database hirarkis dan database jaringan. Itu diperkirakan bahwa
mayoritas dari data operasioanal perusahaan adalah berada dalam
sistem ini.
• Data-data antar bagian departemen yang tersimpan dalam beraneka
ragam sistem penyimpanan file seperti VSAM, RMS, dan
relational DBMS seperti Informix dan Oracle.
• Data internal yang tersimpan di workstation dan private server.
26
• Sistem eksternal seperti internet , database komersial, atau
database yang berhubungan dengan pelanggan atau supplier dari
organisasi.
b. Operational Data Store
Suatu operational data store (ODS) adalah suatu media
penyimpanan atas data operational yang terbaru dan terintegrasi
yang digunakan untuk analisis. ODS menstrukturkan dan
menyediakan data dengan cara yang sama seperti data warehouse,
tetapi sesungguhnya bertindak secara sederhana sebagai tempat
penampungan sementara sebelum data dipindahkan ke warehouse.
ODS diciptakan ketika sistem operasional ditemukan tidak mampu
untuk mencapai keberhasilan sistem pelaporan. ODS menyediakan
manfaat yang berguna dari suatu relational database dalam
mengambil keputusan yang mendukung fungsi data warehouse.
c. Load Manager
Load manager melakukan semua operasi yang berhubungan
dengan extract dan load data ke dalam data warehouse. Data di-
extract secara langsung dari sumber data atau umumnya dari
penyimpanan data operasional. Operasi yang dilakukan oleh load
manager dapat meliputi transformasi data yang sederhana untuk
mempersiapkan data tersebut agar dapat dimasukan ke dalam
warehouse.
d. Warehouse Manager
Warehouse manager melaksanakan semua operasi yang
berhubungan dengan pengelolaan atas data dalam warehouse.
27
Operasi-operasi yang dilaksanakan oleh warehouse manager
meliputi :
o Analisa atas data untuk memastikan konsistensinya.
o Transformasi dan penggabungan sumber data dari
tempat penyimpanan sementara ke dalam tabel-tabel
data warehouse.
o Pembuatan index dan view pada tabel-tabel dasar.
o Menghasilkan denormalisasi (jika diperlukan).
o Menghasilkan agregasi (jika diperlukan).
o Backup dan archieve data.
e. Query Manager
Query manager melakukan semua operasi yang berkaitan
dengan pengelolaan dari query user. Komponen ini secara khusus
dibangun menggunakan tool akses data end-user, tool pengontrol
data warehouse, fasilitas database, dan custom built program.
Kompleksitas query manager ditentukan oleh fasilitas yang
disediakan oleh tool akses end-user dan database.
Operasi yang dilakukan komponen ini meliputi pengarahan
query pada tabel yang sesuai dan penjadwalan pelaksanaan query.
Dalam beberapa kasus, terkadang query manager juga
menghasilkan profil query yang mengijinkan warehouse manager
menentukan kesesuaian index dan agregasi.
f. Detailed Data
Area ini menyimpan semua data detail di dalam skema
database, yang bertujuan untuk melengkapkan kumpulan data
28
untuk data warehouse. Dalam banyak kasus, data yang terperinci
tidaklah disimpan secara online tetapi dapat disediakan melalui
agregasi data pada tingkatan detil berikutnya.
g. Lightly dan Highly Summarized Data
Area ini menyimpan semua lightly dan highly summarized
(aggregated) data yang dihasilkan oleh warehouse manager. Area
ini adalah tempat penampungan sementara sebelum dilakukan
perubahan secara berkelanjutan untuk merespon perubahan profil
query.
Tujuan ringkasan informasi ini adalah untuk mempercepat
penyampaian query. Meskipun biaya operasi akan meningkat
sehubungan dengan proses peringkasan data tersebut, ini akan
diseimbangkan dengan menghapus keperluan untuk secara terus
menerus melakukan operasi ringkasan dalam menjawab query user.
Ringkasan data di-update secara terus menerus ketika ada data baru
terisi ke dalam warehouse.
h. Archieve/ Backup Data
Area ini menyimpan semua detail dan ringkasan data untuk
kepentingan archiving dan backup. Walaupun ringkasan data
dihasilkan dari detail data, itu akan mungkin untuk membutuhkan
backup ringkasan data secara online jika data ini disimpan melebihi
periode penyimpanan untuk data yang terinci. Data ditransfer ke
arsip penyimpanan seperti magnetic tape atau optical disk.
29
i. Meta-data
Area ini menyimpan semua definisi metadata yang digunakan
oleh semua proses di dalam warehouse. Metadata digunakan untuk
berbagai tujuan termasuk :
o Proses extract dan load atas metadata digunakan untuk
memetakan sumber data ke dalam pandangan umum data dalam
warehouse.
o Sebagai proses pengelolaan warehouse, metadata
digunakan untuk mengotomatisasi pembuatan atas tabel ringkasan.
o Sebagai bagian proses pengelolaan query, metadata
digunakan untuk mengarahkan suatu query dengan sumber data
yang tepat.
j. End-User Access Tools
Tujuan yang utama dari data warehouse adalah menyediakan
informasi kepada user untuk mendukung pengambilan keputusan.
Para user ini berinteraksi dengan warehouse menggunakan end-
user access tools. Menurut para ahli end-user access tools dapat
dikategorikan menjadi 5 kelompok utama:
1. Reporting dan query tools
Reporting tools meliputi alat pelaporan (production
reporting tools) dan penulis laporan (reporting writers).
Production reporting tools digunakan untuk menghasilkan
laporan operasional reguler, atau daya pemicu kerja yang
tinggi. Seperti order customer, invoice, dan gaji karyawan.
30
Query tools untuk relational data warehouse, dirancang
untuk menerima SQL dan syntax-nya, untuk query
penyimpanan data, untuk data warehouse. Tools ini
melindungi end user dari kompleksitas SQL dan struktur
database.
2. Application Development Tools
Kebutuhan dari end user, kemampuan membuat
informasi yang built-in dan tools query yang tidak
mencukupi, dikarenakan kebutuhan analisis tidak bisa
dilakukan, atau karena interaksi user membutuhkan tingkat
professional yang tinggi.
3. Executive Information System (EIS) Tools
EIS lebih dikenal sebagai ‘Everybody’s information
system’ yang semula dikembangkan untuk mendukung
strategi kebutuhan tingkat tinggi. Tools EIS mulanya
terasosiasi dengan mainframe, sehingga memungkinkan
user membuat aplikasi pendukung pengambilan keputusan,
dalam menyediakan overview data organisasi dan
mengakses sumber data eksternal.
4. Online Analitical Proccessing (OLAP) Tools
Online analytical processing tools berbasis pada konsep
basis data multidimensi dan memperbolehkan user untuk
menganalisis data menggunakan view yang kompleks dan
multidimensional. Tools ini mengasumsikan bahwa data
diatur dalam model multidimensi yang didukung oleh
31
special multidimensional database (MDDB) atau oleh basis
data relasional yang dirancang untuk mendapatkan
multidimensional queries.
2.1.5.4. Data Flow dalam Data Warehouse
Menurut Conolly dan Begg (2005,p1161-1165), data warehouse fokus
pada managemen lima arus data primer, yaitu :
Gambar 2.9 Aliran Data pada Data Warehouse
A. Inflow Proses yang berhubungan dengan pengekstrakan (extraction),
pembersihan (cleansing), dan pemuatan (loading) data dari sumber
data ke dalam data warehouse.
B. Upflow Proses yang terhubung dengan menambahkan nilai ke data di
dalam warehouse, melalui peringkasan, pemadatan, dan
pendistribusian data.
32
C. Downflow Proses yang berhubungan dengan penyimpanan dan backup
datan dalam data warehouse.
D. Outflow Proses yang berhubungan dengan membuat data tersedia agar
tersedia bagi end user.
E. Metaflow Proses managemen metadata. Metaflow merupakan proses
yang memindahkan metadata (data tentang flow yang lainnya).
2.1.5.5. Sketsa Data Warehouse
A. Tabel Fakta
Berdasarkan Connoly dan Begg (2005, p1183), setiap model
dimensional (Dimensional Model) disusun dalam satu tabel
dengan campuran primary key dan dinamakan tabel fakta.
Sebagaimana bagian besar data dalam data warehouse disajikan
sebagai fakta, tabel fakta dapat berhubungan erat dengan tabel
dimensi. Dengan demikian, sangat penting untuk memperlakukan
tabel fakta sebagai data referensi read-only yang tidak akan
berubah seiring waktu. Tabel fakta mengandung satu atau lebih
ukuran yang dinyatakan dengan angka atau fakta yang terdapat
pada setiap record.
Fakta yang paling berguna dalam tabel fakta adalah numerik
karena aplikasi data warehouse tidak mengakses record tunggal.
Sebaliknya, data warehouse mengakses ratusan, ribuan, bahkan
jutaan record pada satu waktu dan hal yang paling penting
dilakukan pada record yang begitu banyak adalah
mengagregasikan mereka.
33
B. Tabel Dimensi
Serangkaian tabel yang lebih kecil dinamakan tabel dimensi.
Tabel dimensi umumnya terdiri dari deksripsi informasi tekstual.
Atribut dimensi digunakan sebagai pembatas dalam queries data
warehouse.
C. Pemodelan dalam Dimensional
Model dimensional merupakan rancangan logikal yang
bertujuan untuk menampilkan data dalam bentuk standar dan
intuitif yang memperbolehkan akses dengan performa yang tinggi.
Model dimensional menggunakan konsep model hubungan
antar entity (ER) dengan beberapa batasan yang penting. Setiap
model dimensi terdiri dari sebuah tabel dengan sebuah komposit
primary key, disebut dengan table fakta, dan satu set table yang
lebih kecil disebut table dimensi. Setiap table dimensi memiliki
sebuah simple primary key yang merespon tepat pada satu
komponen primary key pada tabel fakta. Dengan kata lain primary
key pada table fakta terdiri dari dua atau lebih foreign key. Struktur
karakteristik ini disebut dengan skema bintang atau join bintang.
Fitur terpenting dalam model dimensional ini adalah semua
natural keys diganti dengan kunci pengganti (surrogate keys).
Maksudnya yaitu setiap kali join antar tabel fakta dengan tabel
dimensi selalu didasari kunci pengganti. Kegunaan dari kunci
pengganti adalah memperbolehkan data pada data warehouse
34
untuk memiliki beberapa kebebasan dalam penggunaan data, tidak
seperti halnya yang diproduksi oleh sistem OLTP.
Sebuah sistem OLTP memerlukan normalisasi untuk
mengurangi redudansi, validasi untuk input data, mendukung
volume yang besar dari transaksi yang bergerak sangat cepat.
Model OLTP sering terlihat seperti jaring laba-laba yang terdiri
atas ratusan bahkan ribuan tabel sehingga sulit untuk dimengerti.
Sebaliknya, dimension model yang sering digunakan pada data
warehouse adalah skema bintang atau snowflake yang mudah
dimengerti dan sesuai dengan kebutuhan bisnis, mendukung query
sederhana dan menyediakan performa query yang superior dengan
meminimalisasi tabel-tabel join. Berikut contoh perbandingan
diagram antara model data OLTP dengan dimension table data
warehouse :
35
Gambar 2.10 Model Data OLTP
(Sumber : Gustiarahman, 2006)
D. Perancangan Data Warehouse dengan Skema Bintang
Skema bintang (Connoly dan Begg, 2005, p1183) adalah
struktur logikal yang memiliki tabel fakta yang mengandung data
faktual pada pusatnya dan dikelilingi oleh tabel dimensi yang
mengandung data referensi (yang dapat didenormalisasi).
Skema bintang merupakan tabel fakta yang terdapat di tengah,
yang terhubung pada serangkaian tabel dimensi. Skema bintang
mengeksploitasi karakteristik dari data faktual seperti fakta yang
dihasilkan oleh kejadian pada masa lampau, dan tak mungkin
untuk berubah, tanpa mempedulikan bagaimana mereka dianalisis.
36
Gambar 2.11 Skema Bintang (Conolly dan Begg, 2005, p1184)
a) Keuntungan mengggunakan Skema Bintang :
Skema bintang memiliki beberapa keuntungan yang
tidak terdapat dalam struktur relational biasa. Keuntungan
menggunakan skema bintang yaitu :
a. Respon data yang lebih cepat dihasilkan dari
perancangan database.
b. Kemudahan dalam mengembangkan atau
memodifikasi data yang terus berubah.
37
c. End user dapat menyesuaikan cara berpikir dan
menggunakan data, konsep ini dikenal juga dengan
istilah pararel dalam perancangan database.
d. Menyederhanakan pemahaman dan penelusuran
metadata bagi pemakai dan pengembang.
E. Skema Bintang Sederhana
Dalam skema ini, setiap table harus memiliki primary key yang
terdiri dari satu kolom atau lebih. Primary key dari table fakta
terdiri dari satu atau lebih foreign key. Foreign key merupakan
primary key pada table lain.
Gambar di bawah ini menggambarkan hubungan antara tabel
fakta dan dimensi dalam skema bintang sederhana.
Gambar 2.12 Skema Bintang Sederhana (Poe et al., 1998, p195)
F. Skema Bintang dengan banyak Tabel Fakta
Konsep skema bintang dengan banyak tabel fakta sama
dengan skema bintang sederhana. Perbedaannya adalah skema
bintang dengan banyak tabel fakta memiliki lebih dari satu tabel
fakta yang saling berhubungan dengan tabel dimensi yang sama.
38
Berikut ini adalah gambar skema bintang dengan banyak tabel
fakta:
Gambar 2.13 Skema Bintang dengan Banyak Tabel fakta
(Poe et al., 1998, p196)
G. Skema Bintang Majemuk
Tabel fakta dalam skema majemuk memiliki dua kumpulan
foreign key, yang pertama mengandung suatu referensi dengan
tabel dimensi sedangkan sisanya adalah primary key yang
merupakan gabungan dari satu atau lebih kolom yang
menghasilkan suatu identifikasi unik untuk setiap barisnya. Dalam
skema bintang majemuk, tabel faktanya memiliki sekumpulan
foreign key yang mengacu pada tabel dimensi dan primary key.
Primary key ini terdiri dari satu atau lebih kolom yang
menyediakan identifier yang unik untuk setiap barisnya. Dalam
skema bintang majemuk, primary key dan foreign key tidaklah
identik. Inilah yang membedakan skema bintang majemuk
dengan skema bintang sederhana. Skema bintang majemuk dapat
39
digambarkan seperti di bawah ini :
Gambar 2.14 Skema Bintang Majemuk (Poe et al., 1998, p200)
H. Skema SnowFlake
Skema snowflake adalah variasi dari skema bintang yang tabel
dimensinya tidak mengandung data denormalisasi. Skema
snowflake mengijinkan dimensi memiliki dimensi. (Connoly dan
Begg, 2005, p1184)
Skema snowflake merupakan perbaikan skema bintang yang
beberapa hirarki dimensionalnya dinormalisasi menjadi
serangkaian tabel dimensi yang lebih kecil. Berikut adalah
gambar skema snowflake.
40
Gambar 2.15 Skema Snowflake
Keuntungan dan Kerugian Skema Snowflake :
1. Kecepatan memindahkan data dari data OLTP ke dalam
metadata.
2. Sebagai kebutuhan dari alat pengambil keputusan
tingkat tinggi dimana dengan tipe yang seperti ini,
seluruh struktur dapat digunakan sepenuhnya.
Kerugian dari skema snowflake adalah :
1. Skemanya kurang jelas dan end user terhambat oleh
kompleksitas.
2. Sulit untuk mencari isi skema karena terlalu kompleks.
3. Performa query menurun karena adanya tambahan
gabungan tabel.
4. Mempunyai masalah yang besar dalam hal kinerja, hal
ini disebabkan semakin banyaknya join antar tabel-tabel
yang dilakukan dalam skema snowflake.
41
Ciri-ciri snowflake adalah :
a) Tabel dimensi dinormalisasi dengan dekomposisi pada
tingkat atribut.
b) Setiap dimensi mempunyai satu key untuk setiap tingkat
pada hirarki dimensi.
c) Kunci tingkat terendah menghubungkan tabel dimensi
dengan tabel fakta dan tabel atribut bertingkat rendah.
I. Keuntungan Pemodelan Dimensional
Berikut ini adalah keuntungan menggunakan
pemodelan dimensional dalam lingkungan data warehouse
(Connoly dan Begg, 2005, p1185-1186):
1. Efisiensi
Konsistensi struktur database pokok
memperbolehkan akses yang lebih efisien ke data oleh
alat yang beragam termasuk report writers dan query
tools.
2. Kemampuan untuk menangani kebutuhan yang selalu
berubah
Skema bintang dapat mengadaptasi terhadap
perubahan dalam kebutuhan pengguna, sebagaimana
semua dimensi ekuivalen dalam hal penyediaan akses
ke tabel fakta. Hal ini berarti rancangan dapat lebih baik
mendukung ad hoc user queries.
42
3. Pemrosesan query yang dapat diprediksi
Aplikasi drill down data warehouse akan
secara sederhana menambah atribut dimensi yang lebih
banyak dari dalam skema bintang tunggal. Drill across
application akan menghubungkan tabel fakta yang
terpisah melalui dimensi yang terbagi. Walaupun
keseluruhan rangkaian skema bintang dalam model
dimensional perusahaan kompleks, pemrosesan query
dapat diprediksi karena pada tingkat terendah, setiap tabel
fakta harus di-query secara mandiri.
4. Dapat mempersempit lingkup data untuk pemrosesan
Decision Support Systems sehingga lebih sederhana dalam
mengakses dan menganalisisnya.
2.1.5.6. Metadata
Menurut Inmon (2005, p102), metadata adalah sebuah
komponen penting dari lingkungan data warehouse. Metadata
telah menjadi bagian dari lingkungan pemrosesan informasi selama
telah ada program dan data. Tetapi dalam dunia data warehouse,
metadata mendapatkan tingkat kepentingan yang baru, untuk
segala usaha yang paling efektif digunakan pada data warehouse.
Metadata memungkinkan end user atau decision support
system analyst untukmenavigasi melalui beberapa kemungkinan.
Ketika user akan menggunakan data warehouse yang tidak
memiliki metadata, maka user tidak tahu darimana akan memulai
analisa. Dengan adanya metadata, maka user dapat dengan cepat
43
mencari data yang penting atau menentukan data yang tidak ada
dalam data warehouse. Metadata bertindak sebagai index untuk isi
dari data warehouse.
Metadata adalah informasi terstruktur yang
mendeskripsikan, menjelaskan, menemukan, atau setidaknya
membuat menjadikan suatu informasi mudah untuk ditemukan
kembali, digunakan, atau dikelola. Metadata sering disebut sebagai
data tentang data atau informasi tentang informasi. Metadata ini
mengandung informasi mengenai isi dari suatu data yang dipakai
untuk keperluan manajemen file/ data itu nantinya dalam suatu
basis data.
Metadata items menyimpan hal-hal sebagai berikut:
� Struktur data bagi programmer
� Struktur data bagi DSS Analyst
� Sumber data untuk data warehouse
� Transformasi data ke data warehouse
� Data model
� Relationship antara data model dan data warehouse
� Histori extracts
2.1.5.7. Proses Transfer Data dari Lingkungan Operasional
ke Data Warehouse
Tiga proses pemindahan data dari lingkungan operasional ke data
warehouse, yaitu :
44
1. Extraction
Data ditemukan dan dipindahkan dari sistem
operasional ke data warehouse atau platform transformasi.
2. Transformation
Suatu program special atau software tool yang
membersihkan data operasional agar sesuai dengan definisi
awal aturan transformasi untuk data warehouse.
3. Loading
Suatu program atau tool-tool seringkali yang sama
dengan yang digunakan untuk transformasi memindahkan data
ke dalam tabel data warehouse.
Gambar 2.16 Extraction, Transformation, and Loading
45
2.1.5.8. Metodologi Perancangan Data Warehouse
Berdasarkan kutipan dari Connolly dan Begg (2005, p1187-1193),
metodologi yang dikemukakan oleh Kimball dalam membangun data
warehouse ada 9 tahapan, yang dikenal dengan Nine-step Methodology.
Sembilan tahap tersebut adalah :
Langkah 1 : Pemilihan proses
� Data mart yang pertama kali dibangun haruslah data mart yang
dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan
bisnis yang penting.
� Pilihan terbaik untuk data mart yang pertama adalah yang
berhubungan dengan sales, misal property sales, property
leasing,property advertising.
Langkah 2 : Pemilihan sumber
� Untuk memutuskan secara pasti apa yang diwakili atau
direpresentasikan oleh sebuah tabel fakta.
� Misal, jika sumber dari sebuah tabel fakta properti sale adalah
properti sale individual maka sumber dari sebuah dimensi
pelanggan berisi rincian pelanggan yang membeli properti utama.
Langkah 3 : Mengidentifikasi dimensi
� Set dimensi yang dibangun dengan baik, memberikan kemudahan
untuk memahami dan menggunakan data mart.
� Dimensi ini penting untuk menggambarkan fakta-fakta yang
terdapat pada tabel fakta.
46
� Misal, setiap data pelanggan pada tabel dimensi pembeli dilengkapi
dengan
id_pelanggan,no_pelanggan,tipe_pelanggan,tempat_tinggal, dan
lain sebagainya.
� Jika ada dimensi yang muncul pada dua data mart, kedua data
mart tersebut harus berdimensi sama, atau paling tidak salah
satunya berupa subset matematis dari yang lainnya.
� Jika sebuah dimensi digunakan pada dua data mart atau lebih,dan
dimensi ini tidak disinkronisasi, maka keseluruhan data warehouse
akan gagal, karena dua data mart tidak bisa digunakan secara
bersama-sama.
Langkah 4 : Pemilihan fakta
� Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa
digunakan dalam data mart.
� Semua fakta harus diekspresikan pada tingkat yang telah
ditentukan oleh sumber.
Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta
Setelah fakta-fakta dipilih maka dilakukan pengkajian ulang untuk
menentukan apakah fakta-fakta yang dapat diterapkan kalkulasi awal
dan melakukan penyimpanan pada tabel fakta. Contoh umum dari
kebutuhan untuk penyimpanan kalkulasi awal muncul ketika fakta
berisi pernyataan untung atau rugi. Situasi ini akan meningkat ketika
tabel fakta didasarkan pada invoice atau sales.
47
Langkah 6 : Melengkapi tabel dimensi
� Pada tahap ini kita menambahkan keterangan selengkap-
lengkapnya pada tabel dimensi.
� Keterangannya harus bersifat intuitif dan mudah dipahami oleh
Pengguna.
Langkah 7 : Pemilihan durasi database
Durasi mengukur waktu dari pembatasan data yang diambil dan
dipindahkan ke tabel fakta. Sebagai contoh perusahaan asuransi
memiliki kebutuhan untuk menyimpan data dalam jangka waktu 5
tahun atau lebih.
Langkah 8 : Menelusuri perubahan dimensi yang perlahan
• Ada tiga tipe perubahan dimensi yang perlahan, yaitu :
o Tipe 1. Atribut dimensi yang telah berubah tertulis
ulang.
o Tipe 2. Atribut dimensi yang telah berubah
menimbulkan
sebuah dimensi baru.
o Tipe 3. Atribut dimensi yang telah berubah
menimbulkan alternatif sehingga nilai atribut lama dan
yang baru dapat diakses secara bersama pada dimensi
yang sama.
48
Langkah 9 : Menentukan prioritas dan mode query
Mempertimbangkan pengaruh dari rancangan fisik, seperti
penyortiran urutan tabel fakta pada disk pdan keberadaan dari
penyimpanan awal ringkasan atau penjumlahan. Selain itu, masalah
administrasi, backup, kinerja indeks, dan keamanan juga merupakan
faktor yang harus dipertahankan.
Dengan langkah-langkah tadi, seharusnya kita bisa membangun
sebuah data warehouse yang baik.
2.1.5.9. Keuntungan Penggunaan Data Warehouse
Menurut Connolly dan Begg (2005, p1152), data warehouse yang
telah diimplementasikan dengan baik dapat memberikan keuntungan
yang besar bagi organisasi, yaitu:
• Potensi nilai kembali yang besar pada investasi Sebuah
organisasi harus mengeluarkan uang dan sumber daya dalam
jumlah yang cukup besar untuk memastikan kalau data
warehouse telah diimplementasikan dengan baik, biaya yang
dikeluarkan tergantung dari solusi teknikal yang diinginkan.
Akan tetapi, setelah data warehouse digunakan, maka
kemungkinan didapatkannya ROI (Return on Investment)
relative lebih besar.
• Keuntungan kompetitif
Keuntungan kompetitif didapatkan apabila pengambil
keputusan mengakses data yang dapat mengungkapkan
49
informasi yang sebelumnya tidak diketahui, tidak tersedia,
misalnya informasi mengenai konsumen, tren, dan permintaan.
• Meningkatkan produktivitas para pengambil keputusan
perusahaan data warehouse meningkatkan produktivitas para
pengambil keputusan perusahaan dengan menciptakan sebuah
database yang terintegrasi secara konsisten, berorientasi pada
subjek, dan data historis.
• Data warehouse mengintegrasikan data dari beberapa sistem
yang tidak compatible ke dalam bentuk yang menyediakan satu
pandangan yang konsisten dari organisasi. Dengan mengubah
data menjadi informasi yang berguna, maka seorang manajer
bisnis dapat membuat analisa yang lebih akurat dan konsisten.
50
2.2. Teori Khusus
2.2.1 Penjualan (Sales)
Penjualan merupakan sebuah proses dimana kebutuhan
pembeli dan kebutuhan penjualan dipenuhi, melalui antar
pertukaran informasi dan kepentingan. Jadi konsep penjualan
adalah cara untuk mempengaruhi konsumen untuk membeli
produk yang ditawarkan. (Kotler, and Armstrong, 2006).
Penjualan adalah dengan menjual barang dagangannya,
maka perusahaan akan menghasilkan pendapatan sejumlah
harga barang yang dibebankan kepada pembeli. Transaksi ini
diikuti syarat jual beli yang mengikat kedua belah pihak.
(Suranto, 2002)
Penjualan adalah suatu usaha yang terpadu untuk
mengembangkan rencana-rencana strategis yang diarahkan
pada usaha pemuasan kebutuhan dan keinginan pembeli, guna
mendapatkan penjualan yang menghasilkan laba. Penjualan
merupakan sumber hidup suatu perusahaan, karena dari
penjualan dapat diperoleh laba serta suatu usaha memikat
konsumen yang diusahakan untuk mengetahui daya tarik
mereka sehingga dapat mengetahui hasil produk yang dihasikan
(Iskandar, 2009a).
51
2.2.2 Promosi (Promotion)
Promosi merupakan teknik komunikasi yang secara
penggunaannya atau penyampaiannya dengan menggunakan media
seperti: pers, televisi, radio, papan nama, poster dan lain-lain yang
bertujuannya untuk menarik minat konsumen terhadap hasil produksi
suatu perusahaan. Promosi sebagai media untuk menjembatani
kepentingan produsen dengan konsumen (Musliadi, 2012).
Sedangkan pengertian promosi menurut Alma (2006 : 179)
adalah: Promosi adalah sejenis komunikasi yang memberi penjelasan
dan meyakinkan calon konsumen mengenai barang dan jasa dengan
tujuan untuk memperoleh perhatian, mendidik, mengingatkan dan
meyakinkan calon konsumen.
Promosi merupakan alat komunikasi dan penyampaian pesan
yang dilakukan baik oleh perusahaan maupun perantara dengan tujuan
memberikan informasi mengenai produk, harga dan tempat. Informasi
itu bersifat memberitahukan, membujuk, mengingatkan kembali
kepada konsumen, para perantara atau kombinasi keduanya. Dalam
promosi juga, terdapat beberapa unsur yang mendukung jalannya
sebuah promosi tersebut yang biasa disebut bauran promosi (Iskandar,
2009b).
52
2.2.3 Biaya (Cost)
Biaya didefinisikan sebagai kas atau nilai ekuivalen kas yang
dikorbankan untuk mendapatkan barang atau jasa yang diharapkan
memberikan manfaaf saat ini atau di masa yang akan datang bagi
organisasi (Hansen & Mowen, 2006).
Biaya merupakan kas atau nilai ekuivalen kas yang dikeluarkan
oleh perusahaan untuk mendapatkan barang atau jasa yang diharapkan
guna untuk memberikan suatu manfaat yaitu peningkatan laba
(Iskandar, 2009a).