วันอาทิตย์ที่ 23 มกราคม พ.ศ. 2554

1/19/2011 Data Management and Business Intelligent

Data warehouse
     มีไว้เพื่อเตรียมข้อมูลหรือเก็บข้อมูลที่จะในการแปรผลหรือการวิเคราะห์ 
Data warehouse มีลักษณะดังนี้
1. Organization ข้อมูลถูกจัดตามหัวข้อที่จะวิเคราะห์
2. Consistency ข้อมูลมีรูปแบบที่แน่นอนเหมือนกัน
3. Time variant ข้อมูลถูกเก็บไว้ 5-10 ปี จะสามารถมองเป็นเทรนหรือเป็นแนวโน้มได้
4. Non-volatile ข้อมูลที่ใส่ใน data warehouse จะไม่มีการอัพเดท
5. Relational ข้อมูลมีโครงสร้างที่มีความสัมพันธ์
6. Client/server ทำให้ผู้ใช้เข้าถึงได้ง่าย โดยใช้ผ่าน server

Data Warehouse Processing
     นำข้อมูลที่ได้จากปฎิบัติงานภายในหรือข้อมูลภายนอกมาเข้าสู่ขั้นตอน Data staging หรือ ETL คือExtract และ Clean จากนั้นก็ Transform ห้อยู่ในรูปแบบที่นำไปใช้ประโยชน์ได้ แล้วจึง Load ข้อมูลที่ได้จากการแปลงลง Data cube จากนั้นเก็บข้อมูลใน Data Warehouses และจึงจะสามารถนำมาใช้ในหัวข้อต่างๆทางธุรกิจ โดยสามารถนำเสนอผลที่ได้จากการวิเคราะห์ข้อมูลในรูปแบบต่างๆ เพื่อทำการตัดสินใจต่อไป  แบ่งเป็นขั้นตอน ดังนี้
1. รวบรวมข้อมูล ซึ่งเป็นข้อมูลจากภายในองค์กร (Operational Data) และ ภายนอกองค์กร (External Data) 
2. ทำ Meta Data ซึ่งเป็นข้อมูลของข้อมูล จากการนำข้อมูลที่ได้มาทั้งหมดมารวบรวม และสร้างเป็น Meta Data
ใช้สำหรับอธิบายข้อมูลต่างๆใน Data Warehouse
3. ทำ Data Staging สร้างเป็น Data Cube ซึ่งประกอบไปด้วยขั้นตอนการทำ 4 ขั้นตอน ได้แก่ คัดแยกข้อมูล (Extract)ลดความซ้ำซ้อนของข้อมูล (Clean)แปลงสภาพข้อมูล (Transform) และจัดเก็บ (Load) 
4. สร้าง Data Warehouse โดยยึด Business Object เป็นหลัก
5. สร้าง Business View การนำเสนอข้อมูลเป็นแบบ Dash Board เพื่อให้ผู้บริหารสามารถนำไปใช้งานได้อย่างสะดวก

Data Mart
     Data mart เป็นส่วนย่อยของ Data warehouse ที่แยกออกต่างหาก เพื่อตอบสนองต่อความต้องการเฉพาะส่วนและเพื่อสะดวกและรวดเร็วต่อการเข้าใช้ 
Data mart มี 2 รูปแบบ คือ
1. Replicated data marts คือ คัดลอกจาก warehouse 
2. Stand-alone data marts คือ ทำขึ้นโดยไม่ผ่าน Data warehouse ซึ่งการทำ Data warehouse ในลักษณะนี้จะมีโอกาสรวมเป็น Enterprise ได้ยาก

Business Intelligence
     Business Intelligence หรือ BI เป็นเครื่องมือในการวิเคราะห์ข้อมูล  เป็นการเตรียมข้อมูลให้พร้อม เพื่อช่วยในการวิเคราะห์ข้อมูลได้ทันที ประกอบไปด้วยการรวบรวม จัดเก็บ เตรียมข้อมูล ตลอดจนแปลงข้อมูลดังกล่าว ให้เป็นสารสนเทศ วิเคราะห์ และนำเสนอข้อมูลในรูปแบบที่สามารถปรับเปลี่ยนได้ และการวิเคราะห์ข้อมูลที่เหมาะสมสำหรับผู้บริหารและนักวิเคราะห์ ประกอบด้วย 3ส่วนหลัก คือ

1.Reporting and Analysis

Enterprise Reporting System 
จัดทำรายงานทั้งในรูปแบบปกติ และรูปแบบที่สามารถปรับแก้ได้ตามความต้องการ ซึ่งรายงานเหล่านี้จะเป็นข้อมูลที่เตรียมให้สำหรับผู้บริหารนำไปใช้ในการวิเคราะห์ต่อไป

Balance Scorecard (BSC)
เป็นรายงานสำหรับผู้บริหารในระดับกลยุทธ์ สามารถเปรียบเทียบผลที่ได้จริงกับเป้าหมายที่วางไว้ ทำให้การปฎิบัติงานขององค์กรสอดคล้องกับกลยุทธ์องค์กรโดยรวมด้วย โดยการใช้ KPI (Key Performance Index)

Dashboard
เป็นรายงานที่นำเสนอออกมาเป็นรูปภาพเกี่ยวกับผลการดำเนินงานในระดับต่างๆ ได้แก่  Operational dashboards, Tactical dashboards และ Strategic dashboards

Visualization tools 
เป็นการรายงานที่ช่วยทำให้เห็นภาพ และเข้าใจได้ง่ายมากที่สุด

2.Analytic
Online Analytical Processing (OLTP)
เป็นเครื่องมือพื้นฐานของผู้บริหารที่ช่วยในการวิเคราะห์ สามารถระบุปัญหาและวิเคราะห์ในระดับพื้นฐานเท่านั้น มักจะแสดงผลออกมาในรูปของแผนภูมิและกราฟ นอกจากนี้การวิเคราห์จะเป็นแบบ Multi-dimensional 

Mining
-Data Mining
เป็นการ extract ข้อมูลออกมา โดยแบ่งเป็น 5 ประเภท ได้แก่
1. Clustering เป็นการนำเสนอข้อมูลโดยจัดกลุ่มโดยไม่กำหนดกลุ่มให้กับข้อมูลตั้งแต่ต้น
2. Classification เป็นนำเสนอข้อมูลตามสมมติฐานที่ตั้งไว้
3. Association เป็นการนำเสนอผลสืบเนื่อง
4. Sequence discovery เป็นการนำเสนอผลที่เกิดตามหลังมา
5. Prediction เป็นการนำเสนอโดยการพยากรณ์สิ่งที่จะเกิดขึ้น
-Text Mining
 เป็นการ extract หา hidden content จากข้อมูลที่ไม่มีรูปแบบ (Unstructured Data)  และจัดกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน
-Web mining


3.
Data Integration

วันพุธที่ 12 มกราคม พ.ศ. 2554

1/12/2011 Data Management

Data and Information
          สาร หรือ Message นั้นเป็นได้ทั้ง Data และ Information แต่จะเป็นอะไรนั้นขึ้นกับผู้รับสารนั้นๆ ถ้าผู้รับสารได้ประโยชน์หรือมีส่วนได้เสียจากสารนั้น สารนั้นก็จะเป็น information ดังนั้น Data จึงเป็นข้อมูลดิบที่ยังไม่ผ่านกระบวนการต่างๆ แต่ Information เป็นข้อมูลที่ผ่านกระบวนการแล้ว เป็นข้อมูลที่มีประโยชน์ต่อผู้รับสาร
Information system
          ระบบสารสนเทศ คือ ระบบที่ประกอบด้วยการเก็บ รวบรวมข้อมูล และวิเคราะห์ข้อมูลเหล่านั้น เพื่อได้มาซึ่งสารสนเทศที่ต้องการตามวัตถุประสงค์ของผู้ใช้งาน รวมถึงมีการถ่ายทอด นำเสนอข้อมูลเหล่านั้นแก่ผู้มีสิทธิใช้สารสนเทศ และต้องทำการจัดเก็บข้อมูลเพื่อใช้ในอนาคตอีกด้วย
องค์ประกอบของสารสนเทศ
1.    Hardware
2.     Software
3.     Data
4.     Network
5.     Procedure
6.     People
Data Management
วัตถุประสงค์คือการจัดทำโครงสร้างพื้นฐานเพื่อแปลงข้อมูลดิบเป็นสารสนเทศขององค์กร  โดยมีพื้นฐานดังนี้
1.      Data profiling
2.      Data quality management
3.       Data integration
4.       Data augmentation
Data Life Cycle Process
1.       เก็บรวบรวมข้อมูลจากหลายๆแหล่ง
2.       เก็บข้อมูลใน database และ ปรับเปลี่ยนรูปแบบของข้อมูลเข้าสู่ data warehouse
3.        เรียกใช้ข้อมูลเพื่อการวิเคราะห์
4.        การวิเคราะห์ใช้เครื่องมือ เช่น Data analysis tools และ Data mining tools
Data Sources
-    Organizational Data
-    End User Data
-    External Data
Data Processing
แบ่งได้เป็น 2 ประเภท
1.      Transactional เป็นระบบปฏิบัติการ (Operational systems) ใช้ TPS จัดเก็บข้อมูลและแปลผลจากส่วนกลาง
2.      Analytical ระบบการวิเคราะห์ข้อมูลที่รวบรวมมาจากหลายแหล่ง ส่วนใหญ่จาก end-users เช่น DSS, EIS, Web เป็นต้น
Data Warehouse
ประโยชน์ของ Data Warehouse
1.      เข้าถึงข้อมูลได้เร็ว
2.      เข้าถึงข้อมูลได้ง่าย
Characteristics of Data Warehouses
1.      Organization
2.      Consistency
3.      Time variant
4.      Non-Volatile
5.      Relational
6.      Client/server