บทที่ 2 การประมวลผลข้อมูล

บทที่ 2 การประมวลผลข้อมูล



ความหมายของข้อมูล
          ข้อมูล (data) หมายถึง ข้อเท็จจริง (fact) ที่อยู่ในรูปแบบตัวอักษร ตัวเลข สัญลักษณ์พิเศษ รูปภาพ ภาพเคลื่อนไหว และเสียง ซึ่งสามารถบันทึกไว้อย่างต่อเนื่องและมีความหมายอยู่ในตัว เช่น ชื่อนักเรียน อายุ เพศ จำนวนประชากร ปริมาณน้ำฝน เป็นต้น ข้อมูลจะมีอยู่จำนวนมาก และจะถูกนำไปประมวลผลเพื่อใช้ประโยชน์ในเรื่องต่าง ๆ ได้มากมาย



ประเภทของข้อมูล
           สามารถแบ่งประเภทข้อมูลได้หลายรูปแบบขึ้นอยู่กับความต้องการ ลักษณะของข้อมูลที่นำไปใช้และเกณฑ์ที่นำมาพิจารณา

           1. การแบ่งข้อมูลตามลักษณะของข้อมูล เป็นการแบ่งข้อมูลขั้นพื้นฐานโดยพิจารณาจากการรับข้อมูลของประสาทสัมผัส (Sense) ของร่างกาย ได้แก่ ข้อมูลภาพที่ได้รับจากการมองเห็นด้วยดวงตา ข้อมูลเสียงที่ได้รับจากการฟังด้วยหู ข้อมูลกลิ่นที่ได้รับจากการสูดดมด้วยจมูก ข้อมูลรสชาติที่ได้รับจากการรับรสชาติด้วยลิ้น และข้อมูลสัมผัสที่ได้รับจากความรู้สึกด้วยผิวหนัง


            2. การแบ่งข้อมูลตามแหล่งข้อมูลที่ได้รับ โดยพิจารณาจากลักษณะของที่มาหรือการได้รับข้อมูล

          - ข้อมูลปฐมภูมิ (Primary Data) คือ ข้อมูลที่ได้จากจุดกำเนิดของข้อมูลนั้นๆ เป็นการเก็บรวบรวมหรือบันทึกจากแหล่งข้อมูลโดยตรงด้วยวิธีการต่างๆ เช่น การสอบถาม การสัมภาษณ์ การสำรวจ การจดบันทึก ตลอดจนการใช้เทคโนโลยีต่างๆ ซึ่งข้อมูลปฐมภูมิจัดเป็นข้อมูลที่มีความน่าเชื่อถือมากที่สุด ตัวอย่างข้อมูลปฐมภูมิ ได้แก่ ข้อมูลการมาโรงเรียนสายของนักเรียนชั้นมัธยมศึกษาปีที่ 1 ซึ่งได้จากการจดบันทึกในรอบ 1 เดือนที่ผ่านมา


          - ข้อมูลทุติยภูมิ (Secondary Data) คือ การนำข้อมูลที่ผู้อื่นได้เก็บรวบรวมหรือบันทึกไว้แล้วมาใช้งาน ผู้ใช้ไม่จำเป็นต้องเก็บรวบรวมหรือบันทึกด้วยตนเอง จัดเป็นข้อมูลที่เกิดขึ้นในอดีต มักผ่านการประมวลผลแล้ว บางครั้งจึงไม่ตรงกับความต้องการของผู้ใช้ และข้อมูลที่ได้มีความคลาดเคลื่อน ไม่ทันสมัย ตัวอย่างข้อมูลทุติยภูมิ ได้แก่ สถิติการมาโรงเรียนสายของนักเรียนชั้นมัธยมศึกษาปีที่ 1 ในปี พ.ศ. 2551


          3. การแบ่งข้อมูลตามการจัดเก็บในสื่ออิเล็กทรอนิกส์ มีลักษณะคล้ายการแบ่งข้อมูลตามลักษณะของข้อมูล แต่มีการแยกลักษณะข้อมูลตามชนิดและนามสกุลของข้อมูลนั้น ๆ ซึ่งจะตั้งตามประเภทของข้อมูลและโปรแกรมที่ใช้สร้างข้อมูล ได้แก่


           - ข้อมูลตัวอักษร (Text Data) เช่น ตัวหนังสือ ตัวเลข และสัญลักษณ์ ข้อมูลประเภทนี้มักมีนามสกุลต่อท้ายไฟล์เป็น .txt และ .doc

          - ข้อมูลภาพ (Image Data) เช่น ภาพกราฟิกต่างๆ และภาพถ่ายจากกล้องดิจิตอล ข้อมูลประเภทนี้มักมีนามสกุลต่อท้ายไฟล์เป็น .bmp .gif และ .jpg

          - ข้อมูลเสียง (Sound Data) เช่น เสียงพูด เสียงดนตรี และเสียงเพลง ข้อมูลประเภทนี้มักมีนามสกุลต่อท้ายชื่อไฟล์เป็น .wav .mp3 


          - ข้อมูลภาพเคลื่อนไหว (Video Data) เช่นภาพเคลื่อนไหว ภาพมิวสิควีดิโอ ภาพยนตร์ คลิปวีดีโอ ข้อมูลประเภทนี้มักมีนามสกุลต่อท้ายชื่อไฟล์เป็น .avi .mov


          4. การแบ่งข้อมูลตามระบบคอมพิวเตอร์ มีลักษณะคล้ายและใกล้เคียงกับการแบ่งข้อมูลตามการจัดเก็บในสื่ออิเล็กทรอนิกส์มาก แต่มุ่งเน้นพิจารณาการแบ่งประเภทตามการนำข้อมูลไปใช้งานในระบบคอมพิวเตอร์ ได้แก่


          - ข้อมูลเชิงจำนวน (Numeric Data) มีลักษณะเป็นตัวเลขที่สามารถนำมาคำนวณด้วยคอมพิวเตอร์ได้ เช่น จำนวนเงินในกระเป๋า จำนวนค่าโดยสารรถประจำทาง และจำนวนนักเรียนในห้องเรียน
         - ข้อมูลอักขระ (Character Data) มีลักษณะเป็นตัวอักษร ตัวหนังสือ และสัญลักษณ์ต่างๆ ซึ่งสามารถนำเสนอข้อมูลและเรียงลำดับได้แต่ไม่สามารถนำมาคำนวณได้ เช่น หมายเลขโทรศัพท์ เลขที่บ้าน และชื่อของนักเรียน


         - ข้อมูลกราฟิก (Graphical Data) เป็นข้อมูลที่เกิดจากจุดพิกัดทางคอมพิวเตอร์ ทำให้เกิดรูปภาพหรือแผนที่ เช่น เครื่องหมายการค้า แบบก่อสร้างอาคาร และกราฟ
         - ข้อมูลภาพลักษณ์ (Image Data) เป็นข้อมูลแสดงความเข้มและสีของรูปภาพที่เกิดจากการสแกนของสแกนเนอร์เป็นหลัก ซึ่งสามารถนำเสนอข้อมูล ย่อหรือขยาย และตัดต่อได้ แต่ไม่สามารถนำมาคำนวณหรือดำเนินการอย่างอื่นได้




ลักษณะของข้อมูลที่ดี
ข้อมูลที่ดีจะต้องประกอบด้วยคุณสมบัติที่สำคัญๆ ดังนี้คือ

        1. ความถูกต้องแม่นยำ (accuracy) ข้อมูลที่ดีควรจะมีความถูกต้องแม่นยำสูง หรือถ้ามีความคลาดเคลื่อน (errors) ปนอยู่บ้าง ก็ควรที่จะสามารถควบคุมขนาดของความคลาดเคลื่อนที่ปนมาให้มีความคลาดเคลื่อน น้อยที่สุด

        2. ความทันเวลา (timeliness) เป็นข้อมูลที่ทันสมัย (up to date) และทันต่อความต้องการของ ผู้ใช้ ถ้าผลิตข้อมูลออกมาช้า ก็ไม่มีคุณค่าถึงแม้จะเป็นข้อมูลที่ถูกต้องแม่นยำก็ตาม


        3. ความสมบูรณ์ครบถ้วน (completeness) ข้อมูลที่เก็บรวบรวมมาต้องเป็นข้อมูลที่ให้ข้อเท็จจริง (facts) หรือข่าวสาร (information) ที่ครบถ้วนทุกด้านทุกประการ มิใช่ขาดส่วนหนึ่งส่วนใดไปทำให้นำไปใช้การไม่ได้


        4. ความกะทัดรัด (conciseness) ข้อมูลที่ได้รับส่วนใหญ่จะกระจัดกระจาย ควรจัดข้อมูลให้อยู่ใน รูปแบบที่กะทัดรัด สะดวกต่อการใช้และค้นหา ผู้ใช้มีความเข้าใจได้ทันที


        5. ความตรงกับความต้องการของผู้ใช้ (relevance) ข้อมูลที่จัดทำขึ้นมาควรเป็นข้อมูลที่ผู้ใช้ข้อมูลต้องการใช้ และจำเป็นต้องรู้ / ทราบ หรือเป็นประโยชน์ต่อการจัดทำแผนกำหนดนโยบายหรือตัดสินปัญหาในเรื่องนั้นๆ ไม่ใช่เป็นข้อมูลที่จัดทำขึ้นมาอย่างมากมาย แต่ไม่มีใครต้องการใช้หรือไม่ตรงกับความต้องการของผู้ใช้ข้อมูล


         6. ความต่อเนื่อง (continuity) การเก็บรวบรวมข้อมูล ควรอย่างยิ่งที่จะต้องดำเนินการอย่างสม่ำเสมอและต่อเนื่องในลักษณะของอนุกรมเวลา (time-series) เพื่อจะได้นำไปใช้ประโยชน์ในด้านการวิเคราะห์วิจัยหรือหาแนวโน้มในอนาคต






วิธีการประมวลผลข้อมูล 
          การประมวลผลข้อมูล (Data Processing) หมายถึง การเปลี่ยนแปลงหรือจัดระเบียบข้อมูลให้อยู่ในรูปแบบที่เป็นประโยชน์ต่อผู้ใช้งาน ข้อมูลโดยทั่วไปเกิดขึ้นอย่างไม่เป็นระเบียบจากขบวนการนับหรือการวัด ไม่สามารถสื่อความหมายให้เข้าใจหรือใช้ประโยชน์ได้ การประมวลผลจึงเป็นวิธีการนำข้อมูล (Data) กลายสภาพเป็นสารสนเทศ (Information) ที่มีประสิทธิภาพและนำไปใช้ประโยชน์ต่อไปได้ ซึ่งวิธีการประมวลผลข้อมูลเพื่อให้ได้มาซึ่งสารสนเทศ มีหลายวิธี ดังนี้

           1. การคำนวณ (Calculation) หมายถึง การนำข้อมูลที่เป็นตัวเลขมาทำการ บวก ลบ คูณ หารยกกำลัง เช่น การคำนวณภาษี การคำนวณค่าแรง เป็นต้น

           2. การจัดเรียงข้อมูล (Sorting) เป็นการเรียงข้อมูลจากน้อยไปหามาก หรือมากไปหาน้อย เพื่อทำให้ดูง่ายขึ้น ค้นหาข้อมูลที่ต้องการได้เร็วขึ้น เช่น การเรียงคะแนนดิบของนักเรียนจากมากไปหาน้อย การเก็บบัตรดัชนีสำหรับหนังสือต่างๆ โดยการเรียงตามตัวอักษร จาก ก ข ค ถึง ฮ เป็นต้น จะเห็นได้ว่าการเรียงลำดับข้อมูลสองประเภทใหญ่ๆด้วยกันคือ การเรียงข้อมูลที่เป็นตัวเลข (Numeric) และการเรียงข้อมูลที่เป็นตัวอักษร (Alphabetic) สำหรับการจัดเรียงข้อมูลในระบบคอมพิวเตอร์นั้นถ้าข้อมูลเป็นตัวอักษรจะจัดเรียงตามลำดับของรหัสแทนข้อมูล

           3. การจัดกลุ่ม (Classifying) หมายถึง การจัดข้อมูลโดยการแยกออกเป็นกลุ่มหรือประเภทต่างๆ เช่น การนำข้อมูลเกี่ยวกับประวัตินักศึกษา มาแยกตามคณะต่างๆเช่น แยกเป็นนักศึกษาที่สังกัดคณะวิทยาศาสตร์ นักศึกษาที่สังกัดคณะครุศาสตร์ เป็นต้น การทำเช่นนี้ทำให้การค้นหาข้อมูลทำได้ง่ายขึ้น และยังสะดวกสำหรับทำรายงานต่างๆ

          4. การดึงข้อมูล (Retrieving) หมายถึง การค้นหาและการนำข้อมูลที่ต้องการมาจากแหล่งเก็บเพื่อนำไปใช้งาน เช่น ต้องการทราบค่าคะแนนเฉลี่ยๆ สะสมของนักศึกษา ที่มีเลขประจำตัว 33555023 ซึ่งสังกัดคณะวิทยาศาสตร์ ถ้าข้อมูลเรียงโดยแยกตามคณะวิชาและในแต่ละคณะวิชาเรียงตามหมายเลขประจำตัว การดึงข้อมูลจะเริ่มต้นค้นหาแฟ้มของคณะวิชา และค้นหาข้อมูลเริ่มจากกลุ่มแรก โดยดูเลขประจำตัวจนกระทั่งพบหมายเลขประจำตัว 33555023 ก็จะดึงเอาค่าคะแนนเฉลี่ยสะสมของนักศึกษาผู้นี้นำไปใช้ตามที่ต้องการ

           5. การรวมข้อมูล (Merging) หมายถึง การนำข้อมูลตั้งแต่สองชุดขึ้นไปมารวมกันให้เป็นชุดเดียวเช่น การนำประวัติส่วนตัวของนักศึกษา และประวัติการศึกษามารวมเป็นชุดเดียวกัน เป็นประวัตินักศึกษา เป็นต้น การรวมข้อมูลจัดได้ว่าเป็นวิธีการที่นิยมใช้กันมากในระบบการจัดการฐานข้อมูลในปัจจุบันนี้

           6. การสรุปผล (Summarizing) หมายถึง การสรุปส่วนต่างๆ ของข้อมูลโดยย่อเอาเฉพาะส่วนที่เป็นใจความสำคัญ เพื่อเน้นจุดสำคัญและแนวโน้ม เช่น การนำข้อมูลมาแจงนับและทำเป็นตารางการหายอดนักศึกษาของแต่ละวิชา ข้อมูลเหล่านี้ใช้สำหรับพิมพ์เป็นรายงานสรุปส่งขึ้นไปให้ผู้บริหารระดับสูง เพื่อใช้ในการบริหาร

         7. การทำรายงาน (Reporting) หมายถึง การนำข้อมูลมาจัดพิมพ์รายงานรูปแบบต่างๆ เช่น รายงานการวิเคราะห์อาชีพของผู้ปกครองของนักศึกษา รายงานการเรียนของนักศึกษา เป็นต้น

        8. การบันทึก (Recording) หมายถึง การจดบันทึกข้อมูลเอาไว้โดยทำการคัดลอกข้อมูลจากต้นฉบับแล้วเก็บเป็นแฟ้ม (Filing) เช่น การบันทึกประวัติส่วนตัวนักศึกษาแต่ละคน เป็นต้น

        9. การปรับปรุงรักษาข้อมูล (Updating) หมายถึง การเพิ่ม (Add) หรือการเอาออก (Delete) และการเปลี่ยนค่า (Change) ข้อมูลที่อยู่ในแฟ้มให้ทันสมัยอยู่เสมอ


ขั้นตอนการประมวลผลข้อมูล
         1. การรวบรวมเอกสารข้อมูล หมายถึง เอกสารข้อมูลที่ได้ถูกบันทึกโดยแหล่งใช้ข้อมูลนั้น เช่น บัตรลงทะเบียนเรียนของนักศึกษา ใบรายชื่อประวัติหมู่เรียน เป็นต้น เอกสารข้อมูลนับเป็นสิ่งจำเป็นยิ่ง หากเอกสารผิดพลาดหรือไม่ครบถ้วน รายงานที่ได้จากการประมวลผลย่อมผิดพลาดไปด้วย ฉะนั้น งานในขั้นนี้ก็คือจะต้องสร้างวิธีการควบคุม ซึ่งส่วนใหญ่มักใช้การจัดเอกสารให้เป็นกลุ่ม มีใบนำส่งที่แสดงรายละเอียดเกี่ยวกับจำนวนเอกสารจากจุดต่างๆ ถ้าไม่ครบถ้วน หรือมีข้อผิดพลาดก็จะสามารถทราบจุดที่ติดต่อสอบถามได้ง่ายสำหรับการประมวลผลด้วยคอมพิวเตอร์อาจจะหมายถึงการรวบรวมแฟ้มข้อมูลที่เกี่ยวข้องกันไว้ในแหล่งข้อมูลที่สามารถเรียกใช้ ดังเช่นในระบบฐานข้อมูลที่ประกอบด้วยแฟ้มข้อมูลจำนวนมากนั่นเอง

        2. การเตรียมข้อมูล หมายถึง การจัดเตรียมข้อมูลที่รวบรวมมาแล้วให้อยู่ในรูปที่สะดวกต่อการประมวลผล ซึ่งได้แก่ งานต่างๆ ดังต่อไปนี้

         - งานบรรณาธิกรเบื้องต้น (Preliminary Editing) คือ การนำข้อมูลที่รวบรวมได้ของแต่ละหน่วยงานมาตรวจสอบความถูกต้องและครบถ้วน และทำการปรับปรุงแก้ไขในกรณีที่เอกสารมีข้อผิดพลาดต้องแก้ไขใหม่ ถ้าเป็นข้อมูลที่สำคัญ เช่นตัวเลขทางการเงินที่จะยอมให้คลาดเคลื่อนไม่ได้ควรส่งไปยังแหล่งที่ให้เอกสารข้อมูลทำการแก้ไขปรับปรุง การบรรณาธิกรเบื้องต้นนี้นับว่าเป็นสิ่งสำคัญยิ่งเพราะถ้าข้อมูลผิดพลาดย่อมทำให้ผลสรุป หรือรายงานที่ได้ผิดพลาดไปด้วย


        - การลงรหัส (Coding) หมายถึง การใช้รหัสแทนข้อมูล เช่น จากข้อมูลเกี่ยวกับภูมิลำเนาของนักศึกษาอาจจำแนกได้เป็นเขตๆ

        3. การประมวลผล ในส่วนของการประมวลผลแฟ้มข้อมูล หมายถึง การสร้างความสัมพันธ์ของข้อมูลระหว่างแฟ้มข้อมูลการออกแบบโปรแกรมเพื่อการประมวลผลแฟ้มข้อมูลต่างๆ เมื่อผ่านการรวบรวมและเตรียมข้อมูลแล้วเราสามารถใช้วิธีการประมวลผลวิธีใดวิธีหนึ่ง หรือหลายวิธีดังที่ได้กล่าวมาแล้ว เช่น การคำนวณ การเรียงลำดับ เป็นต้น เพื่อให้ได้ผลลัพธ์เป็นข้อสนเทศ ซึ่งอาจจะอยู่ในรูปรายงาน ตาราง หรือกราฟ 

วิธีการประมวลผลข้อมูลโดยใช้คอมพิวเตอร์ มี 2 วิธี

         1. การประมวลผลแบบเชื่อมตรง (online processing) หมายถึง การทำงานในขณะที่ข้อมูลเดินทางไปบนสายสัญญาณเชื่อมต่อจากเครื่องปลายทาง (terminal) ไปยังฐานข้อมูลของเครื่องหลักที่ใช้ในการประมวลผล การประมวลผลแบบเชื่อมตรงจึงเป็นการประมวลผลโดยทันทีทันใด เช่น การจองตั๋วเครื่องบิน การซื้อสินค้าในห้างสรรพสินค้า การฝากถอนเงินผ่านตู้เอทีเอ็ม อาจกล่าวได้ว่าการประมวลผลแบบเชื่อมตรงจึงเป็นวิธีการที่ใช้กันมากในปัจจุบัน


          2. การประมวลผลแบบกลุ่ม (batch processing) หมายถึง การประมวลผลในเรื่องที่สนใจเป็นครั้งๆ เช่น เมื่อต้องการทราบผลสำรวจความนิยมของประชาชนต่อการเลือกตั้งสมาชิกสภาผู้แทนราษฎร หรือที่เรียกว่า โพล (poll) ก็มีการสำรวจข้อมูลโดยเก็บรวบรวมข้อมูล เมื่อเก็บรวบรวมข้อมูลได้แล้ว ก็นำมาป้อนเข้าเครื่องคอมพิวเตอร์ แล้วนำข้อมูลนั้นมาประมวลผลตามโปรแกรมที่ได้กำหนดไว้ เพื่อรายงานผล หรือสรุปผลหาคำตอบ กรณีการประมวลผลแบบกลุ่มจึงกระทำในลักษณะเป็นครั้งๆ เพื่อให้ได้ผลลัพธ์ โดยจะต้องมีการรวบรวมข้อมูลไว้ก่อน

          ซึ่งในการประมวลผลทั้งสองแบบนี้เป็นวิธีการที่ใช้คอมพิวเตอร์ช่วยดำเนินการกับข้อมูลจำนวนมากเพื่อแยกแยะ คำนวณ หรือดำเนินการตามที่กำหนดไว้ในโปรแกรม การทำงานของคอมพิวเตอร์ในการประมวลผลจึงต้องมีซอฟต์แวร์หรือโปรแกรมคอยสั่งการเพื่อให้ได้ผลลัพธ์ในรูปแบบที่ต้องการ




ความคิดเห็น

  1. นาย เทพประธาน เม้ยสมัคร ปวส2/2 (ม.6) สาขา คอมพิวเตอร์ธุระกิจ

    ตอบลบ
  2. นส.พัชราภรณ์ เผื่อนผึ้ง ปวส.2/2 สาขาคอมพิวเตอร์

    ตอบลบ

แสดงความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

บทที่ 3 การแจกแจงความถี่ การวัดการกระจาย

บทที่1 ความรู้เบื้องต้นเกี่ยวกับสถิติ

บทนำ