Data Warehouse Architecture

34
LOGO Data Warehouse Architecture

description

สถาปัตยกรรม คลังข้อมูล

Transcript of Data Warehouse Architecture

Page 1: Data Warehouse Architecture

LOGO

��

��������������������� ����������������� ����������������������������������� ����������������� ��������������Data Warehouse Architecture

������������ ����������� ������

Page 2: Data Warehouse Architecture

Contents

2 สถาปตยกรรมคลงขอมล

1

แนวคดของฐานขอมลปฏบตการสแนวคดของการออกแบบคลงขอมล

2

สวนประกอบตางๆ ของสถาปตยกรรมคลงขอมล3

4

5

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

แนวทางในการพฒนาคลงขอมล

Page 3: Data Warehouse Architecture

แนวคดของฐานขอมลปฏบตการสแนวคดของการออกแบบคลงขอมล

ใบส�งซ�อสนคา บรษท ABC จากด

ลกคา คณสมชาย ใจด เบอรโทร 081-9999999

สนคา จานวน เปนเงน

เกาอ� 172 17200

3

เกาอ� 172 17200

โตะ 85 1700

ต 184 18400

ช�นวางของ 110 1100

กระดาน 47 940

Page 4: Data Warehouse Architecture

แนวคดของฐานขอมลปฏบตการสแนวคดของการออกแบบคลงขอมล

4

Page 5: Data Warehouse Architecture

แนวคดของฐานขอมลปฏบตการสแนวคดของการออกแบบคลงขอมล

5

Page 6: Data Warehouse Architecture

แนวคดของฐานขอมลปฏบตการสแนวคดของการออกแบบคลงขอมล

6

Page 7: Data Warehouse Architecture

สถาปตยกรรมคออะไร ??

“สถาปตยกรรมของระบบใดๆ (Architecture) หมายถง การกลาวถง องคประกอบ และความสมพนธระหวางองคประกอบตางๆ ท�มในระบบน�นๆ รวมถงหนาท�ของแตละองคประกอบของระบบดวย”

7

ระบบดวย”

คลงขอมล เปรยบไดกบเปนระบบสารสนเทศขนาดใหญท�รวบรวมเอาขอมลและกระบวนการตางๆ ท�มอยในธรกจท�งหมดขององคกรไวในท�เดยวกน และมความสอดคลองกน

Page 8: Data Warehouse Architecture

สถาปตยกรรมคลงขอมล

ดงน�นสถาปตยกรรมของคลงขอมล จะสอดคลองกบองคประกอบหลกของระบบสารสนเทศ ดงน�

InputInput ProcessProcess OutputOutput

8

InputInput ProcessProcess OutputOutput

StorageStorage

Page 9: Data Warehouse Architecture

สถาปตยกรรมคลงขอมล

Data Acquisition System

Data Staging Area

Data Warehouse Database

Data Provisioning Area

Data Data DataData

9

Metadata Repository

Meta

data

Meta

data

Meta

data

Meta

data

Terminal

Page 10: Data Warehouse Architecture

สวนประกอบตางๆ ของสถาปตยกรรมคลงขอมล

องคประกอบหลกๆ ท�สาคญ ในสถาปตยกรรมคลงขอมล มดงน�

1. Data Acquisition System : ทาหนาท�รวบรวมขอมลจากภายในและภายนอกองคกร และทาการตรวจสอบความถกตองในเบ�องตน กอนสงไปยงกระบวนการตอไป

2. Data Staging Area : ทาหนาท�รบขอมลและตรวจสอบรายละเอยดของ

10

2. Data Staging Area : ทาหนาท�รบขอมลและตรวจสอบรายละเอยดของขอมล โดยมการทา Cleansing และ Filtering

3. Data Store หรอ Data Warehouse Database : ทาหนาท�บนทกขอมลท�ผานกระบวนการ Data Staging มาแลว ลงในคลงขอมล

ซ�งในกระบวนการน�จะตองมการออกแบบแบบจาลองขอมล (Data Model) เพ�อเปนโครงสรางขอมลท�จะทาการจดเกบ

Page 11: Data Warehouse Architecture

สวนประกอบตางๆ ของสถาปตยกรรมคลงขอมล

4. Data Provisioning Area หรอ Data Mart : ทาหนาท�ดงมาจาก Data Warehouse Database มาประมวลผล และบนทกขอมลท�ตองการนาไปวเคราะห ซ�งขอมลดงกลาวจะถกทาการปรบขอมลใหเหมาะสมกบการนาไปใช (นาไปวเคราะห)

5. End Users Terminal : ทาหนาท�เปนเคร�องมอท�ดงเอาขอมลท�เตรยม

11

5. End Users Terminal : ทาหนาท�เปนเคร�องมอท�ดงเอาขอมลท�เตรยมไวใน Data Provisioning Area หรอ Data Warehouse Database มานาเสนอผลลพธ โดยจะมเคร�องมอท�ทาหนาท�ออกรายงาน (reporting tools), Multidimensional (OLAP) tools, Data mining tools

Page 12: Data Warehouse Architecture

สวนประกอบตางๆ ของสถาปตยกรรมคลงขอมล

6. Metadata Repository : เปนพ�นท�ท�ใชสาหรบเกบขอมลตางๆ ท�จาเปนสาหรบควบคมการทางานและขอมลในคลงขอมล โดยจะเกบขอมลท�เก�ยวของกบทกๆ กระบวนการ เชน

- คานยามของขอมลใน Data Warehouse

12

- คานยามของขอมลใน Data Warehouse

- ความถ�ในการนาขอมลเขา ในสวนของ Data Acquisition System

- กระบวนการในการแปลงขอมล ของ Data staging

- ขอมลท�จาเปนในการออกรายงานแตละรายงาน

Page 13: Data Warehouse Architecture

สวนประกอบตางๆ ของสถาปตยกรรมคลงขอมล

สวนประกอบอ�นๆ ท�เสรมอยภายในสถาปตยกรรมคลงขอมล

Process Management : ทาหนาท�จดการกระบวนการทางานท�งหมด

เชน ลาดบการทางานของกระบวนการตางๆ

Application Messaging : เปน Middleware ทาหนาท�ในการสง

13

Application Messaging : เปน Middleware ทาหนาท�ในการสงขอมลภายในองคกร ผานทางเครอขาย

Middleware คอ ซอฟตแวรประเภทหน�งท�ทาหนาท�เปนตวกลาง

เปนตวประสานและให Service ตางๆ แก Application

Page 14: Data Warehouse Architecture

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

Data Warehouse Architecture

หลกการแบงประเภทของสถาปตยกรรมของคลงขอมลน�น จะแบงจากสภาพทางกายภาพของ Data Warehouse Database และ Data Provisioning

14

Centralized Architecture

Architecture

DistributedArchitecture

Page 15: Data Warehouse Architecture

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

Centralized ArchitectureCentralized Architecture

หมายถง รปแบบของสถาปตยกรรมของคลงขอมลท� Data Warehouse

น�นถกเกบเปนกลมกอนเดยวกน ไมไดมการแยกหรอกระจายออก

Data

15

DataWarehouseDatabase

Dataprovisioning

Area

Dataprovisioning

Area

Dataprovisioning

Area

Page 16: Data Warehouse Architecture

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

ขอดของสถาปตยกรรมคลงขอมลแบบ Centralized Architecture

การรกษาความปลอดภย และบารงรกษาทาไดงาย

เน�องจากเปนสถาปตยกรรมท�มคลงขอมลแบบรวมเปนกอนเดยว ทาให..

- มความซบซอนนอย

16

- มความซบซอนนอย

- มงรกษาความปลอดภยของขอมลไปท�จดเดยว

สามารถสรางความเปนปกแผนของขอมลไดงายท�สด

มความถกตองตรงกนของขอมลอยแลว เพราะไมมโอกาสท�จะมขอมลชดเดยวกน 2 ชดอยหลายท�ได

Page 17: Data Warehouse Architecture

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

ขอเสยของสถาปตยกรรมคลงขอมลแบบ Centralized Architecture

มความเส�ยงในการไดรบความเสยหายมากกวาสถาปตยกรรมอ�นๆ

ในกรณท�เกดความเสยหายข�น จะเกดความเส�ยงสงท�ขอมลจะถกทาลายแลวสงผบกระทบอยางมากตอการใชงาน

ในการออกแบบและสรางทาไดยากท�สด

17

ในการออกแบบและสรางทาไดยากท�สด

- จะตองออกแบบ Data Model ขององคกรใหครบถวนกอนท�จะสราง

- Data Warehouse ท�สรางข�นจะตองมความเปนหน�งเดยว

** ถงแมวาความยากในการออกแบบจะเปนขอดอยของ Centralized Architecture แตความเปนหน�งเดยวของขอมล เปนท�ยอมรบวาเปน Data Model ท�มประสทธภาพมากท�สด

Page 18: Data Warehouse Architecture

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

Distributed ArchitectureDistributed Architecture

หมายถง รปแบบของสถาปตยกรรมของคลงขอมลท� Data Warehouse

มการกระจายออก โดยอาจจะกระจายอยบน Disk ตวเดยวกนหรอคนละตวกได

เพ�อสรางความคลองตวในการใชงาน

18

เพ�อสรางความคลองตวในการใชงาน

โดยการกระจายออกของ Data Warehouse น�นหมายความวา มขอมล

ใดๆ ตวหน�ง อาจจะมอยใน Data warehouse เพยงตวเดยว หรอหลายตวกได

Page 19: Data Warehouse Architecture

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

DataWarehouse

Dataprovisioning

Area

Dataprovisioning

19

WarehouseDatabase

provisioningArea

Dataprovisioning

AreaData

WarehouseDatabase

Dataprovisioning

Area

Page 20: Data Warehouse Architecture

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

ขอดของสถาปตยกรรมคลงขอมลแบบ Distributed Architecture

เปนสถาปตยกรรมคลงขอมลท�สามารถสรางไดงาย

เน�องจากม Data warehouse ท�แยกจากกน ดงน�นจงงายท�จะคอยๆ ออกแบบ และสรางทละสวน คอออกแบบ Data Model ท�ยงไมเปนภาพรวม

** เหมาะกบองคกรท�ตองการระบบ Data Warehouse อยางรวดเรว

20

** เหมาะกบองคกรท�ตองการระบบ Data Warehouse อยางรวดเรว

เปนสถาปตยกรรมท�สามารถกระจายความเส�ยง ในกรณท�อาจจะเกดความเสยหายข�นกบระบบไดด

คอ มโอกาสท�ขอมลชดนงใน Data warehouse ตวหน�งอาจจะถกทาลาย แตขอมลชดเดยวกนในอกท�หน�งยงอย

Page 21: Data Warehouse Architecture

สถาปตยกรรมในแบบตางๆ ของคลงขอมล

ขอเสยของสถาปตยกรรมคลงขอมลแบบ Distributed Architecture

มโอกาสท�ขอมลอาจจะขาดความเปนอนหน�งอนเดยวกน

ในการท�ยอมใหขอมลชดเดยวกนมในหลายๆ ท�ได มโอกาสท�ขอมลชดเดยวกนใน 2 ท� อาจจะมความไมสอดคลองกนได

21

เดยวกนใน 2 ท� อาจจะมความไมสอดคลองกนได

การรกษาความปลอดภย ทาไดยาก

เน�องจากม Data Warehouse มหลายแหง ดงน�นจะตองมการหามาตรการปองกนความเสยหายท�รดกมมากพอ ซ�งทาไดยากกวา Centralized Architecture

Page 22: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

แนวทางในการพฒนาคลงขอมลน�น มอยดวยกน 3 วธการ โดยจาแนกตาม

ลกษณะและลาดบเวลา กอน-หลง ในการเกด Data Model, Data Warehouse

Database และ Data Provisioning

Top-Down Data Warehouse Development

22

Top-Down Data Warehouse Development

Bottom-Up Data Warehouse Development

Mixed Data Warehouse Development

Page 23: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

Top-Down Data Warehouse Development

เปนหลกการท�เหมาะสมในการใชเพ�อพฒนา Centralized Data Warehouse

โดยยดหลกการท�จะทาใหได Data Warehouse รวมของท�งองคกรในคราวเดยว

23

ซ�งวธการพฒนา จะเร�มจากการวเคราะหธรกจองคกรท�งหมด และออกแบบ

Data Model ท�เปนภาพรวมของธรกจ

Page 24: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

Organization-wide

Data Model

Data

24

DataWarehouseDatabase

Data Mart

Data Mart

Data Mart

Page 25: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

ขอดของการพฒนาคลงขอมลดวยหลกการ Top-Down

Data Model ท�พฒนาข�น จะสามารถอธบายธรกจขององคกรไดอยางถกตอง และสามารถเช�อมโยงขอมลกนไดท�งหมด ไมวาขอมลน�น จะถกใชงานท�แตกตางกน

25

แตกตางกน

หลงจากท�พฒนาเสรจแลว จะมงานท�เหลอท�จะตองทาเพ�มนอยมาก

ไมจาเปนตองรกษาความสอดคลองของขอมล เพราะวาขอมลหน�งหนวยใดๆ มอยเพยง 1 ท�เทาน�น

Page 26: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

ขอเสยของการพฒนาคลงขอมลดวยหลกการ Top-Down

มการออกแบบ Data Model ท�มความยากท�สด

อาจพบขอจากดของขอมลท�เกดจากความแตกตางในการปฏบตงาน

26

อาจพบขอจากดของขอมลท�เกดจากความแตกตางในการปฏบตงาน

เชน ขอมลตวเดยวกน แตมช�อตางกนใน 2 ฝายงาน

ตองใชเวลา งบประมาณ และกาลงคนเปนจานวนมาก

Page 27: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

Bottom-Up Data Warehouse Development

เปนวธการพฒนาท�ตรงขามกบ Top-Down โดยการพฒนาในวธน� จะเร�มจาก

- การวเคราะหและออกแบบผลลพธทละสวนกอน

27

- การวเคราะหและออกแบบผลลพธทละสวนกอน

- Data Acquisition, Data Staging Area, Data Provisioning (Data Mart)

- นาเอาขอมลท�มอยในแตละ Data Mart มารวมกน เพ�อออกแบบและสราง

Data Model และ Data Warehouse

Page 28: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

DataWarehouseDatabase

Next

Ste

p

28

Data MartData

Model

Data Mart Data Mart Data Mart

Data MartData

Model

Data MartData

Model

Next

Ste

p

Next

Ste

p

Page 29: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

ขอดของการพฒนาคลงขอมลดวยหลกการ Bottom-Up

ทาใหผใชไดขอมลอยางรวดเรว

การออกแบบ Data Mart แตละตวมความซบซอนนอยกวาการออกแบบ

29

การออกแบบ Data Mart แตละตวมความซบซอนนอยกวาการออกแบบ Data Warehouse ท�มความเปนหน�งเดยว

ตนทน และเวลาท�ใชสาหรบการออกแบบและสราง Data Mart แตละตว นอยกวาการออกแบบและสราง Data Warehouse ดวยวธ Top-Down

Page 30: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

ขอเสยของการพฒนาคลงขอมลดวยหลกการ Bottom-Up

การควบคมความซ�าซอนทาไดยาก เพราะเม�อม Data Mart มากข�น โอกาสท�มขอมลท�มความหมายเดยวกน แตอยคนละ Data Mart กมสงข�น

30

การนาขอมลเขาอาจมมากเกนความจาเปน ซ�งเกดจากการดาเนนกบขอมลท�มความซ�าซอนเกดข�น

การรวม Data Mart แตละตว เพ�อทาการสราง Data Warehouse กลางขององคกร ทาไดยากและใชเวลามาก

Page 31: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

Mixed Data Warehouse Development

เปนการพฒนาระบบ Data Warehouse โดย

- แยกขอมลออกเปนสวนๆ

31

- แยกขอมลออกเปนสวนๆ

- พจารณาเลอกวธการวเคราะหและออกแบบ

(Top-Down หรอ Bottom-Up)

- นาเอาแตละสวนท�ไดพฒนาข�น มารวมกนภายหลง

Page 32: Data Warehouse Architecture

แนวทางในการพฒนาคลงขอมล

Organization-wide

Data Model

DataWarehouse

32

WarehouseDatabase

Data Mart Data Mart

Data MartData

Model

Data MartData

Model

Ne

xt

Ste

p

Page 33: Data Warehouse Architecture

LOGO

����

Do you have any Question ?

Page 34: Data Warehouse Architecture

Home Work

1. จงอธบายถงสวนประกอบ หรอกระบวนการหลกๆ ในสถาปตยกรรมของคลงขอมลท�ง 6 กระบวนการ

2. สถาปตยกรรมคลงขอมล แบงไดเปนก�ประเภท และอธบายลกษณะสาคญของแตละประเภท

3. จงบอกขอด-ขอเสย ของสถาปตยกรรมคลงขอมลในแตละประเภท

34

3. จงบอกขอด-ขอเสย ของสถาปตยกรรมคลงขอมลในแตละประเภท

4. แนวทางในการพฒนาคลงขอมลมก�แนวทาง และอธบายลกษณะสาคญของแตละแนวทาง

5. จงบอกขอด-ขอเสย ของแนวทางในการพฒนาคลงขอมลแบบ Top-Down และ Bottom-Up