วันเสาร์ที่ 14 กรกฎาคม พ.ศ. 2550

การรวบรวมและวิเคราะห์

กระบวนการรวบรวมข้อมูลและวิเคราะห์หารูปแบบข้อมูลในคลังข้อมูล

ขั้นตอนที่ 1 เลือก

ขั้นตอนที่ 2 เลือกข้อมูลพื้นฐานที่เก็บอยู่ในตารางหลักของ business process

ขั้นตอนที่ 3 เลือก dimension ที่จะถูกนำมาใช้กับแต่ละแถวของตารางหลัก

ขั้นตอนที่ 4 เลือก measured fact

(ข้อมูลที่มีการวัด, การประมวลผล หรือการคำนวณไว้แล้ว)

ตัวอย่างระบบ Data Warehouse

ตัวอย่างของระบบ Data Warehouse ที่ประสบความสำเร็จ
  • ระบบจัดการชนิดสินค้า (Categories Management) ช่วยให้ธุรกิจค้าปลีกเข้าใจพฤติกรรม การใช้จ่ายของลูกค้ามาก ขึ้นและทราบว่าลูกค้ามีปฏิกิริยากับโปรโมชั่นของตนอย่างไร
  • ระบบวิเคราะห์การ “Claim” หรือการอ้างสิทธิของธุรกิจประกันสุขภาพ ช่วยให้บริษทควบคุมค่าใช้จ่ายของ ลูกค้าได้ดีขึ้น
  • ระบบควคุมการทุจริตและควบคุมค่าใช้จ่ายของธุรกิจประกันสุขภาพ
  • ระบSupplier Management หรือระบบจัดการ Supplier ช่วยให้องค์กรเหล่านั้น สามารถประเมินคาดการณ์ และวางแผนสำหรับอนาคตได้ดีกว่า
  • ระบบการเงิน ซึ่งมีองค์กรทั้งหลายนำไปใช้อย่างกว้างขวาง ทำให้องค์กรเหล่านี้ สามารถประเมินคาดการณ์ และวางแผนสำหรับอนาคตได้ดีกว่า
  • ระบบจัดการค่าใช้บริการ ซึ่งบริษัทโทรคมนาคมนำไปใช้ ทำให้บริษัทเหล่านั้นสามารถ กำหนดอัตราค่าบริการ ที่ทำกำไรได้สูงสุด ในขณะเดียวกันก็เป็นอัตราที่จูงใจลูกค้ามากที่สุดด้วย ไม่ว่าจะเป็นค่าบริการโทรศัพท์เคลื่อนที่โทรศัพท์ ทางไกลหรือโทรศัพท์บ้านก็ตาม
  • ระบบประวัติลูกค้า ระบบทำนายความต้องการและระบบการตลาดขนาดจุลภาค ที่มีใช้ในบริษัทบริการสื่อสาร
  • ระบบจัดเก็บค่าบริการ ระบบจัดการเครดิต และระบบการตลาดขนาดจุลภาคที่มีใช้ในสถาบันการเงิน
  • ระบบจัดการทรัพย์สินที่ปรับปรุงใหม่และระบบควบคุมค่าใช้จ่าย ในอุตสาหกรรมน้ำมันและก๊าซ

หนึ่งในระบบ Data Warehouse ที่ประสบความสำเร็จมากเป็นระบบที่นำมาประยุกต์ใช้กับ ธุรกิจค้าปลีก เพราะระบบ Data Warehouse ทำให้เจ้าของสามารถสร้างระบบรายงานที่ดึง เฉพาะข้อมูลที่ต้องการ ออกมาจากเครื่องเก็บเงินได้ (Point-of-Sales) และนำข้อมูลนั้นมาสร้าง และทดสอบโปรโมชั่นต่าง ๆ ช่วยในการดูพฤติกรรมการซื้อ (เช่น ของบางอย่างลูกค้ามักจะซื้อคู่กัน เช่น เสื้อเชิ้ตกับเนคไทหรือรองเท้ากับกระเป๋าถือ ) หรือสร้างบริการและ ผลิตภัณฑ์ใหม่ ๆ

ความแตกต่างระหว่าง ระบบที่ผ่านการวิเคราะห์และระบบปฏิบัติงานทั่วไป





ระบบ Data Warehouse เรียกได้ว่าเป็นระบบฐานข้อมูลที่ผ่านการวิเคราะห์แล้ว ผลลัพธ์ที่ได้จะถูกนำมา ช่วยในการตัดสินใจได้ ขณะที่ระบบปฏิบัติงานทั่วไป เป็นเพียงระบบฐานข้อมูลที่ออกแบบมาเพื่อช่วยอำนวยความ สะดวกในงานประจำวันเท่านั้น ส่วนระบบ Data Warehouse เป็นระบบที่จะนำข้อมูลมาผ่านการวิเคราะห์ก่อนซึ่ง ออกแบบมาให้ข้อมูลเหล่านั้นช่วยผู้ใช้ในการตัดสินใจได้ทันที ไม่ว่าจะโดยการนำข้อมูลมาวิเคราะห์ สรุปและเสนอ เป็นรายงาน เช่นพวกประสิทธิภาพในการทำงานขององค์กร

คลังข้อมูลกับระบบฐานข้อมูลงานประจำวัน (OLTP)

ความแตกต่างของระบบฐานข้อมูลคลังข้อมูลกับระบบฐานข้อมูลงานประจำวัน (OLTP)
  • Consistency : ความสอดคล้องกันของข้อมูล
  • Transaction
  • Time dimension : OLTP จะทำงานอย่างรวดเร็ว และข้อมูลมีการเปลี่ยนแปลงตลอดเวลา ส่วนคลังข้อมูลตลอดวันไม่ค่อยมีการเปลี่ยนแปลง
  • Normalization : คลังข้อมูลไม่ต้องการทำ normalization

คุณสมบัติคลังข้อมูล

คุณสมบัติของระบบฐานข้อมูลคลังข้อมูล ที่แตกต่างจากฐานข้อมูลทั่วๆ ไป ประกอบด้วย

1. Subject Oriented

2. Integrated

3. Time-variant

4. Non-volatile

1. Subject Oriented

คลังข้อมูลจะต้องถูกสร้างจากหัวข้อหลักทางธุรกิจที่เน้นเนื้อหาที่สนใจ เช่น ลูกค้า (Customer) ผลิตภัณฑ์ (product) ยอดขาย (sales) ใบกำกับภาษีลูกค้า (customer invoicing) การควบคุมสต็อก (stock control) และ การขายผลิตภัณฑ์ (product sales) สิ่งเหล่านี้แสดงให้เห็นถึงความต้องการการจัดเก็บเพื่อใช้ในการสนับสนุน
การตัดสินใจ การวิเคราะห์ และดาต้ามายนิง (
data mining)

2. Integrated

ข้อมูลที่นำมาใช้ประกอบการตัดสินใจเป็นได้ทั้งข้อมูลจากแหล่งข้อมูลภายในและจากแหล่งข้อมูลภายนอก การจัดเก็บข้อมูลอยู่ในรูปแบบแตกต่างกัน (Different formats) หรือมาจากความแตกต่างของแพล็ตฟอร์ม แต่นำมาสร้างเป็นฐานข้อมูลที่สอดคล้องเป็นหนึ่งเดียว

3. Time-variant

ข้อมูลในฐานข้อมูลปฏิบัติการมุ่งเน้นความเป็นปัจจุบัน และต้องปรับปรุงให้ทันสมัยอยู่ตลอดเวลา แต่ข้อมูลในคลังข้อมูลจะเป็นข้อมูลที่มีช่วงอายุในระยะเวลาหนึ่ง อาจมีระยะเวลาตั้งแต่ 5-10 ปี ทั้งนี้ขึ้นกับความเหมาะสมเป็นหลัก การนำข้อมูลย้อนหลังที่เก็บรวบรวมไว้ก็เพื่อนำมาทำการวิเคราะห์เปรียบเทียบ หาแนวโน้มและใช้พยากรณ์ทางธุรกิจ

4. Non-volatile

ข้อมูลในคลังข้อมูลนั้นจะมีความแตกต่างจากฐานข้อมูลที่ใช้งานอยู่ประจำวัน ฐานข้อมูลประจำวันจะมีการเพิ่ม ลบ หรือปรับปรุงอยู่ตลอดเวลา ขณะที่คลังข้อมูลมีจุดประสงค์เพื่อให้ยูสเซอร์เข้าถึงข้อมูลเพื่อเรียกใช้งานเท่านั้น การปรับปรุงข้อมูลในคลังข้อมูลถือเป็นเรื่องใหญ่มากเพราะรูปแบบการจัดเก็บข้อมูลในคลังข้อมูลมุ่งเน้น
ประสิทธิภาพด้านการเรียกใช้ข้อมูลที่มีความรวดเร็วสูงเห็นหลักสำคัญมากกว่าการพิจารณาความซ้ำซ้อนในฐานข้อมูล

สถาปัตยกรรมของคลังข้อมูล (Data Warehouse Architecture –DWA)


DWA เป็นโครงสร้างมาตรฐานที่ใช้บ่อย โดยทั่วไปแล้วคลังข้อมูลแต่ละระบบอาจจะมีรูปแบบที่ไม่เหมือนกันได้ เพื่อให้เหมาะสมกับองค์กรนั้นๆ ทั้งนี้ส่วนประกอบต่างๆ ภายใน DWA ที่สำคัญได้แก่

1. Operational database หรือ external database layer ทำหน้าที่จัดการกับข้อมูลในระบบงานปฏิบัติการหรือแหล่งข้อมูลภายนอกองค์กร

2. Information access layer เป็นส่วนที่ผู้ใช้ปลายทางติดต่อผ่านโดยตรง ประกอบด้วยฮาร์ดแวร์และซอฟต์แวร์ ที่ใช้ในการแสดงผลเพื่อวิเคราะห์ โดยมีเครื่องมือช่วย เป็นตัวกลางที่ผู้ใช้ใช้ติดต่อกับคลังข้อมูล โดยในปัจจุบันเครื่องมือที่ได้รับความนิยมเพิ่มขึ้นอย่างรวดเร็วคือ Online Analytical Processing Tool หรือ OLAP tool ซึ่งเป็นเครื่องมือที่มีความสามารถในการวิเคราะห์ที่ซับซ้อนและแสดงข้อมูลในรูปแบบหลายมิติ

3. Data access layer เป็นส่วนต่อประสานระหว่าง Information access layer กับ operational layer

4. Data directory (metadata) layer เพื่อให้เข้าใจถึงข้อมูลได้ง่ายขึ้น และเป็นการเพิ่มความเร็วในการเรียกและดึงข้อมูลของคลังข้อมูล

5. Process management layer ทำหน้าที่จัดการกระบวนการทำงานทั้งหมด

6. Application messaging layer เป็นมิดเดิลแวร์ ทำหน้าที่ในการส่งข้อมูลภายในองค์กรผ่านทางเครือข่าย

7. Data warehouse (physical) layer เป็นแหล่งเก็บข้อมูลของทาง information data และ external data ในรูปแบบที่ง่ายแก่การเข้าถึงและยืดหยุ่นได้

8. Data staging layer เป็นกระบวนการการแก้ไขและดึงข้อมูลจาก external database

แนวคิดเกี่ยวกับคลังข้อมูล

  • คลังข้อมูล คือ แหล่งจัดเก็บข้อมูลขององค์กรที่ได้รับการออกแบบ เพื่อช่วยสำหรับวิเคราะห์และตัดสินใจของฝ่ายบริหารโดยระบบข้อมูลเพื่อการบริหารจะแยกจากฐานข้อมูลงานประจำวัน ซึ่งอาจได้ข้อมูลจากฐานข้อมูลงานประจำวันหรือจากภายนอกองค์กรมาประมวลร่วมกัน ซึ่งข้อมูลที่นำมาประมวลจะเป็นข้อมูลย้อนหลังหรือเป็นข้อมูลในอดีต โดยจะไม่มีการเปลี่ยนแปลงข้อมูลใดๆ แต่อาจปรับเพื่อความเหมาะสมก่อนที่จะนำไปเก็บไว้ในคลัง และมักจะคัดเลือกจัดเก็บเฉพาะข้อมูลที่จำเป็นต่อการใช้งานเท่านั้น โดยข้อมูลที่จัดเก็บในคลังนั้นมักจะจัดเก็บอยู่ในรูปแบบของฐานข้อมูลเชิงสัมพันธ์ และเก็บข้อมูลในรูปแบบข้อมูลสรุป นอกจากนี้ในคลังข้อมูลยังเก็บเครื่องมือสำหรับดำเนินการกับข้อมูล กระบวนการทำงานกับข้อมูล และทรัพยากรอื่นๆ
  • เป้าหมายในการสร้างคลังข้อมูล เพื่อแยกกลุ่มข้อมูลสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้งานประจำวัน ให้เกิดประสิทธิภาพสูง และทำให้การเรียกใช้ข้อมูลชุดนี้ทำได้อย่างยืดหยุ่น รวดเร็วมากยิ่งขึ้น
  • ประโยชน์ของคลังข้อมูล
    • ทำการรวบรวมข้อมูลที่มีความซับซ้อนให้ง่ายต่อการจัดเก็บ
    • สามารถนำข้อมูลมาใช้ได้อย่างรวดเร็วและถูกต้อง

Data Warehouse


data warehouse เป็นศูนย์รวมของส่วนสำคัญหรือทั้งหมดของข้อมูล ซึ่งธุรกิจได้รวบรวมไว้ในระบบ คำนี้ได้รับเสนอโดย W.H. Inmon ในบางครั้ง IBM ใช้คำว่า information warehouse การย้ายข้อมูลจากฐานข้อมูลปกติ เข้าไปไว้ใน Date Warehouse มีข้อดีหลายอย่าง เช่น ทำให้องค์กรหรือ เจ้าของข้อมูล มีโอกาสได้ออกแบบรูปแบบการเก็บข้อมูลใหม่ให้เหมาะสมกับการเรียกใช้มากยิ่งขึ้น และทำให้เหมาะ สำหรับการนำไปใช้ช่วยในการตัดสินใจ หรือใช้ในงานวิเคราะห์ นอกจากนั้นระบบ Data Warehouse ยังรวมเอา ข้อมูลที่ใช้อยู่ในปัจจุบันเข้ากับข้อมูลในอดีตเข้าเป็นฐานข้อมูลเดียวกัน สามารถเรียกใช้งานได้จากอินเตอร์เฟสแบบ กราฟิกได้โดยตรง (GUI) พร้อมสำหรับการจัดการข้อมูลและนำข้อมูลที่ได้ไปวิเคราะห์ ข้อดีสุดท้ายก็คือ ระบบ Data Warehouse ทำให้ผู้ใช้ระดับสูง หรือพนักงานทั่วไปสามารถเข้าถึงและเรียกใช้ฐานข้อมูลได้ด้วยตัวเอง โดยไม่ต้องอาศัยความ ช่วยเหลือจากเจ้าหน้าที่ทาง IT อีกต่อไป