วันศุกร์ที่ 22 พฤษภาคม พ.ศ. 2552

Data Ware house


Introduction to Data Warehouse

  • นิยามของ Data Warehousing
    Data Warehouse คือ ที่เก็บข้อมูลที่เป็นกระบวนการรวบรวม เรียบเรียง และจัดเตรียมสารสนเทศ ( information ) เชิงกลยุทธ์
    Data Warehousing Solution คือ กระบวนการที่รวบรวมสารสนเทศ มีหน้าที่ดังนี้
    - เรียกดู หรือเรียกใช้ข้อมูลจากระบบแหล่งข้อมูล
    - แปลงข้อมูลให้อยู่ในรูปแบบที่นำไปใช้ได้ แล้วเก็บไว้ที่ Data Warehouse
    - จัดการฐานข้อมูล
    - ใช้ Tools เพื่อสร้างและ Managing Data Warehouse
    Data Warehouse
    Data Warehouse คือกระบวนการจัดเตรียม สารสนเทศ เพื่อช่วยในการตัดสินใจของบริษัท โดยบริษัทสามารถใช้ข้อมูล ใน Data Warehouse เพื่อแสดงแนวโน้ม, รูปแบบการซื้อของลูกค้า และ ความสัมพันธ์
    Data Warehouse เป็นฐานข้อมูลที่ประกอบด้วย
    - Enterprise data
    - Historical data set จาก multiple operational systems
    - Subject-oriented consolidated และ consistent data
    - Structured data ที่ง่ายต่อการกระจาย (distribution) และ query
    ระบบการวิเคราะห์ของ Data Warehousing Solution
    ระบบการวิเคราะห์ช่วยสนับสนุนการตัดสินใจเกี่ยวกับ กลยุทธ์, ความกว้างของข้อมูลในdata warehousing solution อีกทั้งยังเป็นกระบวนการจัดการฐานข้อมูลที่ได้ออกแบบมาเพื่อช่วยสนับสนุนการตัดสินใจ โดยมีเครื่องมือที่ช่วยลดความยุ่งยากในการวิเคราะห์
    ระบบการปฏิบัติของ Transactional Solution
    โดยทั่วไป ระบบแบ่งได้เป็นหลักการปฏิบัติ หรือหลักการวิเคราะห์ โดยยึดองค์ประกอบ ของระบบและ หน้าที่ที่ระบบจัดให้กับองค์กรเป็นหลัก
    ระบบการปฏิบัติจะกล่าวถึงใน Tracking Individual Events โดย Operational Systems มักจะหมายถึง ระบบ Online Transaction Processing (OLTP) ที่ออกแบบมาสำหรับ real-time data entry และ editing
    การเปรียบเทียบ Transactional and Data Warehousing Solutions
    Transactional และ Data Warehousing Solutions สร้างขึ้นมาเพื่อวัตถุประสงค์ที่ต่างกัน โดยทั่วไป Operational Systems จะค้นหาและตอบสนองเฉพาะเหตุการณ์ ในขณะที่การวิเคราะห์ระบบจะอนุญาตให้วัดและประเมินความสัมพันธ์ระหว่างเหตุการณ์ต่างๆ ภายหลังจากเกิดขึ้นด้วยค่าขนาดใหญ่
    Transactional Solution มีลักษณะของข้อมูลดังนี้
    - สามารถแก้ไขตามเวลาจริง ๆ
    - โครงสร้างมีความสอดคล้องกันของข้อมูล
    - การวิเคราะห์เพื่อให้การทำงานของ Transactional เร็วขึ้น
    หากตัดสินใจใช้ Transactional Solution ในการวิเคราะห์ การทำ query อาจต้องเจอกับการเปลี่ยนแปลงข้อมูลบ่อยๆ
    Data Warehousing Solution มีลักษณะของข้อมูลดังนี้
    - แก้ไขเป็นระยะๆ
    - เป็นโครงสร้างซึ่งนำไปใช้ได้ง่าย
    - การวิเคราะห์เพื่อให้การทำงานของ query มีประสิทธิภาพ
    Data Mart คือ data warehouse ขนาดเล็กนั่นเอง ข้อมูลใน Data Mart เป็น subset ของ data warehouse ซึ่งมีลักษณะดังนี้ :
    - มีลักษณะเฉพาะของแต่ละเรื่อง/หัวข้อ หรือ ความเคลื่อนไหวทางธุรกิจ
    - สามารถใช้เป็นยุทธวิธีเพื่อแก้ปัญหาทางธุรกิจในทันทีทันใด
    เราสามารถสร้าง Data Marts ก่อนหรือหลังจากการสร้าง Data Warehouse ก็ได้
    ทำไมจึงมีการสร้าง Data Marts ขึ้นมา
    เราสามารถสร้าง Data Warehouse โดยปราศจาก Data Mart ได้เช่นเดียวกันกับการสร้าง data Mart โดยปราศจาก Data Warehouse ได้ อย่างไรก็ตามการสร้าง Data Mart ก่อให้เกิดผลดังนี้
    - มีความเร็วในการ query สูงเพราะว่ามีข้อมูลน้อย
    - มีการแย่งข้อมูลระหว่างผู้ใช้ระบบด้วยกันน้อย
    - สามารถปรับปรุงได้อย่างรวดเร็ว
    กระบวนการใน Data Warehousing
    กระบวนการทำงานพื้นฐาน
    รูปที่ 1 แสดงการทำงานโดยพื้นฐานของ Data Warehouse
    Data Warehousing Solution เป็นกระบวนการที่
    1. เรียกดูหรือเรียกใช้ข้อมูลจากหลาย ๆ แหล่ง อย่างเช่น ระบบการปฏิบัติ หรือ ข้อมูลภายนอก
    2. ข้อมูลที่ถูกเปลี่ยนแปลงแล้ว ซึ่งแหล่งข้อมูบมักจะมีการเปลี่ยนแปลงก่อนเก็บไว้ใน data warehouse
    3. ย้ายเข้าไปอยู่ใน Data Warehouse
    4. จะอยู่ใน Data Marts หรือไม่ก็ได้
    5. Query data โดยใช้ เครื่องมือช่วยในการวิเคราะห์
    จากกระบวนการทั้งหมด Metadata จะถูกเก็บ ดังนั้นเราจึงใช้ข้อมูลสารสนเทศที่เกี่ยวข้องกับข้อมูลได้ อย่างเช่น :
    - คำนวณค่าได้อย่างไร
    - แหล่งของข้อมูล
    - วันที่มีการปรับปรุงข้อมูลครั้งสุดท้าย
    เครื่องมือที่ใช้ในการจัดการกระบวนการ
    Microsoftâ SQL Serverä version 7.0 ประกอบด้วย เครื่องมือที่ใช้ในการตัดสินใจ และ เครื่องมือในการวิเคราะห์ data warehousing ซึ่งได้แก่
    SQL Server คือ relational database management system ที่ใช้จัดการกับ data warehouse
    Data Transformation Services (DTS) อนุญาตให้ผู้ใช้ระบบย้ายข้อมูลจากหลาย ๆ แหล่งข้อมูลที่ต่างกันลงในฐานข้อมูล เราสามารถใช้ข้อมูลขณะที่ย้ายหรือปรับปรุงค่า และ DTS ยังสร้างค่าสรุปจากข้อมูลเบื้องต้นได้
    SQL Server OLAP Services จะสร้างโครงสร้างข้อมูลแบบ multidimensional ที่เรียกว่า “cubes” OLAP Services มีเครื่องที่ช่วยวิเคราะห์ข้อมูลและปรับปรุงการทำ queries
    Microsoft Repository เป็นอุปกรณ์ที่ใช้เก็บ consistent metadata ที่มีมาตรฐานในการอธิบายสารสนเทศแบบ object-oriented โดยมาก metadata มักจะเก็บ ใน SQL Server หรือ Microsoft Access databases ที่สามารถ accessed โดยผ่าน administrative interfaces Microsoft Repository สนับสนุน Component Object Model (COM) และ Automation programming, data tracking, และ object versioning
    Microsoft English Query อนุญาตให้ผู้ใช้ระบบทำการ query data warehouse โดยใช้ ภาษาอังกฤษแทน SQL statements ได้ ดังนั้นผู้ใช้ระบบไม่มีความรู้เกี่ยวกับ join, field names และ Transact-SQL syntax สามารถถามคำถามกับ data warehouse และ รับข้อมูลได้
    PivotTable Service อนุญาตให้วิเคราะห์บนคอมพิวเตอร์ที่เป็น client ได้ ข้อมูลย่อยสามารถเก็บไว้บน client ได้ ดังนั้นการวิเคราะห์จึงเร็วกว่าและ client จะใช้ข้อมูลจาก server โดยผ่าน network ได้ Client ที่ไม่ได้ติดต่อกับ network ข้อมูลจะไม่ถูกวิเคราะห์
    ข้อมูลใน Data Warehouse
    เมื่อสร้างData Warehouse เราจะทำการเปลี่ยนแปลงข้อมูลสำหรับวิเคราะห์วัตถุประสงค์ได้
    ข้อมูลที่อยู่ใน data warehouse มีคุณลักษณะหลายตัวที่ต่างจากข้อมูลใน OLAP system ตารางที่ จะอธิบายลักษณะที่ทำให้ข้อมูลมีประโยชน์ต่อการ query data warehouse
    ตารางที่ 2 แสดงลักษณะของข้อมูล
    Characteristic
    Description
    Consolidated
    รวบรวมข้อมูลจากองค์กร และเก็บไว้ที่ส่วนกลาง
    Consistent
    ข้อมูลใน data warehouse จะมีความสอดคล้องกัน
    Subject-oriented
    ข้อมูลประกอบด้วยสิ่งที่สารสนเทศที่สำคัญในทางธุรกิจ
    Historical
    ข้อมูลใน data warehouse เป็นประวัติ และมันแสดงลำดับตามเวลา
    Read-only
    อ่านข้อมูลได้อย่างเดียว เพราะมันเป็นข้อมูลประวัติ
    Summarized
    data warehousing system สามารถสรุปเป็นลำดับที่เหมาะกับรายละเอียดได้

ไม่มีความคิดเห็น:

แสดงความคิดเห็น