วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Class#9 19.01.2011

Data Management and Data Intelligence

Major Benefits of Data Warehouse
       •    สามารรวบรวมข้อมูลได้อย่างรวดเร็ว ทันต่อความต้องการการใช้งาน เนื่องจากอำนวยความสะดวกเรื่องการรวบรวมข้อมูลที่มีความจำเป็นไว้ในที่เดียว
       •    ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายและสามารถเข้าใจ รวมทั้งนำไปใช้ต่อได้ง่ายภายใต้รูปแบบเดียวกันของการนำเสนอข้อมูล

Characteristics of Data Warehouse
       •    ความสม่ำเสมอของข้อมูล - ข้อมูลที่เก็บใน Data Warehouses ควรมีลักษณะสม่ำเสมอในรูปแบบเดียวกัน เช่นเดียวกับหลักการของ consistency
       •    ต้องเก็บข้อมูลที่จำเป็น - Data Warehouses ต้องเก็บข้อมูลที่จำเป็นสำหรับผู้บริหาร เพื่อนำไปวิเคราะห์และตัดสินใจ เมื่อมีการเรียกข้อมูล

Data Warehouse Process
       เริ่มจากการนำข้อมูลที่ได้จากปฎิบัติงานภายใน หรือข้อมูลภายนอกมาเข้าสู่ขั้นตอน Data staging หรือ ETL คือ Extract และ Clean จากนั้นก็ Transform ห้อยู่ในรูปแบบที่นำไปใช้ประโยชน์ได้ แล้วจึง Load ข้อมูลที่ได้จากการแปลงลง Data cube จากนั้นเก็บข้อมูลใน Data Warehouses และจึงจะสามารถนำมาใช้ในหัวข้อต่างๆทางธุรกิจ โดยสามารถนำเสนอผลที่ได้จากการวิเคราะห์ข้อมูลในรูปแบบต่างๆ เพื่อทำการตัดสินใจต่อไป เช่นใช้ Dashboard เป็นต้น

Data Mart
       Data mart เป็นการรวบรวมข้อมูลในคลังข้อมูลเดียวกัน (Data warehouse) ของแต่ละหน่วยงาน มี 2 ประเภท
              1.    Replicated(Dependent) Data mart เป็นการสร้าง data warehouse ขององค์กรแล้วนำข้อมูลที่จำเป็นไปยังแต่ละแผนก
              2.    Stand-alone Data Mart เป็นการสร้าง Data mart ของแผนก โดยไม่มี Data warehouse ของบริษัท เนื่องจากบริษัทยังไม่มีความพร้อม แต่มีข้อเสีย คือ เนื่องจากข้อมูลแต่ละแผนกมีรูปแบบไม่เหมือนัน ทำให้มีความยากในการจัดการและประสบความสำเร็จยากData mart เป็นการรวบรวมข้อมูลในคลังข้อมูลเดียวกัน

Data Mining

       Data mining คือ การค้นหาข้อมูลหรือสิ่งที่ไม่เคยทราบมาก่อน เพื่อให้เกิดความเข้าใจและสามารถนำมาปฏิบัติใช้ได้จริง เสมือนการกรองข้อมูลที่มีอยู่เป็นจำนวนมาก ให้เหลือเฉพาะข้อมูลที่มีความจำเป็นและเป็นประโยชน์กับการตัดสินใจ แบ่งได้คือ
              •    Clustering    -    การจัดกลุ่มของข้อมูลโดยไม่มีการตั้งสมมติฐานไว้ล่วงหน้า
              •    Classification    -    การจัดกลุ่มของข้อมูลแต่มีการตั้งสมมติฐานไว้ล่วงหน้า
              •    Association    -    การสร้างผลสืบเนื่องของข้อมูลให้มีความเกี่ยวข้องกันมากขึ้น
              •    Sequence    -    Discovery การแสดงผลที่เกิดขึ้นสืบเนื่องตามหลังมา
              •    Prediction    -    การคาดการณ์ไปในอนาคตข้างหน้า

Text Mining

       Text Mining จะมีความคล้ายคลึงกับการทำ Data Mining แต่จะใช้ในกรณีที่ข้อมูลเป็น Unstructured Data หรือข้อมูลไม่มีโครงสร้างที่ตายตัวหรือรูปแบบที่แน่นแน เช่น จดหมายการ complain ของลูกค้า เป็น ต้น โดยระบบจะพยายามค้นหาความสัมพันธ์ของประเด็นต่างๆในข้อมูลที่กระจัดกระจาย ดังกล่าว เพื่อจับกลุ่มประเด็นของข้อมูลสำหรับการใช้งานต่อไป

5202112883
สานุพัฐ รัตนมโนชัย

วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

Class#8 12.01.2011

Data Management
       ระบบ(System) คือ การเอาหน่วยย่อยๆมาทำงานร่วมกัน "Input ผ่าน Process ได้ Output" เราจะต้องระบุวัตถุประสงค์หรือ Output ให้ได้ก่อนเพื่อจะสามารถกำหนด Input และ Process ได้ชัดเจน โดยมีองค์ประกอบดังนี้
              •    วัตถุประสงค์ (Objective)
              •    ส่วนประกอบ (Elements)
              •    กระบวนการ (Process)
              •    สิ่งแวดล้อม (Environment)
              •    ขอบเขต (Boundary)
              •    การควบคุมและผลย้อนกลับ (Feedback)

       ความแตกต่างระหว่าง Data กับ Information อยู่ที่การใช้งานของผู้รับ ในกรณีที่ถ้าไม่มีประโยชน์ต่อผู้รับ ถือว่าเป็น Data แต่ถ้ามีผลต่อผู้รับหรือทำให้เกิดการเปลี่ยนแปลงพฤติกรรมของผู้รับถือว่าเป็น Information

Information system
       เป็นระบบผลิตสารสนเทศ ที่ต้องมีการรวบรวมข้อมูลจากแหล่งต่างๆเพื่อวิเคราะห์ให้ได้ผลลัพธ์ตาม Objective ที่ต้องการ ซึ่งระบบสารสนเทศก็แตกต่างกันตามวัตถุประสงค์ หลังจากได้ Information แล้วก็จะนำเสนอให้กับผู้ที่ต้องการใช้งานและเก็บ Output นั้นเข้าใน Database เพื่อเรียกใช้ในอนาคตต่อไปด้วย มีองค์ประกอบอยู่ 6 อย่าง ได้แก่ Hardware, Software, Data, Network, Procedures และ People

Data Sources and Databases
              -    Internal Data เช่น ประวัติพนักงานเป็น TPS ของ HR
              -    External Data เช่น คู่แข่ง สภาพเศรษฐกิจ หรือ ซื้อข้อมูลจาก Website
              -    Personal Data ข้อมูลที่บุคลากรใช้ เช่น Excel ที่ทำขึ้นมาใหม่เพื่อใช้ในการวิเคราะห์ สำหรับงานของตน

Data Warehouse
       Data warehouse ไม่ใช่ database ขนาดใหญ่ มีวัตถุประสงค์คือช่วยให้ Analytical ทำงานได้ง่ายขึ้นโดย Operational ยังดำเนินไปได้เหมือนเดิม
              -    Input     เป็นข้อมูลที่ดึงมาจาก TPS อาจเป็น Internal หรือ External หรือ Personal Data ก็ได้ หลังจากนั้นก็นำมาเก็บใน Data Warehouse เป็นข้อมูลที่จัดใหม่ในมุมมองเพื่อวิเคราะห์
              -    Processing     เป็นกระบวนการ Process ข้อมูลให้ได้ Output อาจเป็น DSS EIS หรือ  Data Mining ก็ได้
              -    Output    อาจแสดงออกมาผ่าน Web Browser

       Data Warehouse เหมาะกับ องค์กรที่มีผู้บริหารที่ใช้ data ในการวิเคราะห์ (Information Base) การทำ Data Warehouse นั้นเป็นเหมือนขั้นตอนการเตรียมข้อมูลเฉพาะที่ต้องการ เพื่อนำไปใช้ในการวิเคราะห์และประมวลผลเพื่อการตัดสินใจอีก

องค์กรที่เหมาะกับ Data warehouse
              -    ข้อมูลเยอะ
              -    ข้อมูลถูกเก็บในที่ที่มีDatabaseเยอะ format ต่างกัน
              -    ผู้บริหารเป็น Information Base

5202112883
สานุพัฐ รัตนมโนชัย