วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Class#9 19.01.2011

Data Management and Data Intelligence

Major Benefits of Data Warehouse
       •    สามารรวบรวมข้อมูลได้อย่างรวดเร็ว ทันต่อความต้องการการใช้งาน เนื่องจากอำนวยความสะดวกเรื่องการรวบรวมข้อมูลที่มีความจำเป็นไว้ในที่เดียว
       •    ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายและสามารถเข้าใจ รวมทั้งนำไปใช้ต่อได้ง่ายภายใต้รูปแบบเดียวกันของการนำเสนอข้อมูล

Characteristics of Data Warehouse
       •    ความสม่ำเสมอของข้อมูล - ข้อมูลที่เก็บใน Data Warehouses ควรมีลักษณะสม่ำเสมอในรูปแบบเดียวกัน เช่นเดียวกับหลักการของ consistency
       •    ต้องเก็บข้อมูลที่จำเป็น - Data Warehouses ต้องเก็บข้อมูลที่จำเป็นสำหรับผู้บริหาร เพื่อนำไปวิเคราะห์และตัดสินใจ เมื่อมีการเรียกข้อมูล

Data Warehouse Process
       เริ่มจากการนำข้อมูลที่ได้จากปฎิบัติงานภายใน หรือข้อมูลภายนอกมาเข้าสู่ขั้นตอน Data staging หรือ ETL คือ Extract และ Clean จากนั้นก็ Transform ห้อยู่ในรูปแบบที่นำไปใช้ประโยชน์ได้ แล้วจึง Load ข้อมูลที่ได้จากการแปลงลง Data cube จากนั้นเก็บข้อมูลใน Data Warehouses และจึงจะสามารถนำมาใช้ในหัวข้อต่างๆทางธุรกิจ โดยสามารถนำเสนอผลที่ได้จากการวิเคราะห์ข้อมูลในรูปแบบต่างๆ เพื่อทำการตัดสินใจต่อไป เช่นใช้ Dashboard เป็นต้น

Data Mart
       Data mart เป็นการรวบรวมข้อมูลในคลังข้อมูลเดียวกัน (Data warehouse) ของแต่ละหน่วยงาน มี 2 ประเภท
              1.    Replicated(Dependent) Data mart เป็นการสร้าง data warehouse ขององค์กรแล้วนำข้อมูลที่จำเป็นไปยังแต่ละแผนก
              2.    Stand-alone Data Mart เป็นการสร้าง Data mart ของแผนก โดยไม่มี Data warehouse ของบริษัท เนื่องจากบริษัทยังไม่มีความพร้อม แต่มีข้อเสีย คือ เนื่องจากข้อมูลแต่ละแผนกมีรูปแบบไม่เหมือนัน ทำให้มีความยากในการจัดการและประสบความสำเร็จยากData mart เป็นการรวบรวมข้อมูลในคลังข้อมูลเดียวกัน

Data Mining

       Data mining คือ การค้นหาข้อมูลหรือสิ่งที่ไม่เคยทราบมาก่อน เพื่อให้เกิดความเข้าใจและสามารถนำมาปฏิบัติใช้ได้จริง เสมือนการกรองข้อมูลที่มีอยู่เป็นจำนวนมาก ให้เหลือเฉพาะข้อมูลที่มีความจำเป็นและเป็นประโยชน์กับการตัดสินใจ แบ่งได้คือ
              •    Clustering    -    การจัดกลุ่มของข้อมูลโดยไม่มีการตั้งสมมติฐานไว้ล่วงหน้า
              •    Classification    -    การจัดกลุ่มของข้อมูลแต่มีการตั้งสมมติฐานไว้ล่วงหน้า
              •    Association    -    การสร้างผลสืบเนื่องของข้อมูลให้มีความเกี่ยวข้องกันมากขึ้น
              •    Sequence    -    Discovery การแสดงผลที่เกิดขึ้นสืบเนื่องตามหลังมา
              •    Prediction    -    การคาดการณ์ไปในอนาคตข้างหน้า

Text Mining

       Text Mining จะมีความคล้ายคลึงกับการทำ Data Mining แต่จะใช้ในกรณีที่ข้อมูลเป็น Unstructured Data หรือข้อมูลไม่มีโครงสร้างที่ตายตัวหรือรูปแบบที่แน่นแน เช่น จดหมายการ complain ของลูกค้า เป็น ต้น โดยระบบจะพยายามค้นหาความสัมพันธ์ของประเด็นต่างๆในข้อมูลที่กระจัดกระจาย ดังกล่าว เพื่อจับกลุ่มประเด็นของข้อมูลสำหรับการใช้งานต่อไป

5202112883
สานุพัฐ รัตนมโนชัย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น