หน่วยวิทยาการข้อมูล
ยุคของสารสนเทศดิจิทัล
พจนานุกรมศัพท์ศึกษาศาสตร์ ฉบับราชบัณฑิตยสถาน อธิบายว่า ยุคสารสนเทศ (information age) เริ่มประมาณ ค.ศ. ๑๙๗๐ (พ.ศ. ๒๕๑๓) เป็นยุคที่ข้อมูลสารสนเทศมีความสำคัญอย่างมากต่อการสร้างมูลค่าเพิ่ม คุณค่าของการผลิตสินค้าและบริการเป็นประโยชน์ทั้งต่อผู้ผลิตและผู้บริโภค ในช่วงเวลานี้ ระบบคอมพิวเตอร์ ระบบอิเล็กทรอนิกส์ และเครือข่ายโทรคมนาคม สามารถเชื่อมโยงธุรกิจทุกด้านได้อย่างรวดเร็วและมีประสิทธิภาพ ในทางการศึกษา ยุคสารสนเทศ หมายถึง ช่วงเวลาประมาณ พ.ศ. ๒๕๓๓ ซึ่งเริ่มมีการใช้ประโยชน์จากระบบข้อมูลสารสนเทศ โดยเฉพาะในเรื่องระบบการบริหารจัดการสารสนเทศ (management information system) เช่น ระบบทะเบียนนักเรียน ระบบเงินเดือน และการเรียนการสอนโดยใช้คอมพิวเตอร์ช่วยสอน ระบบการบริหารจัดการสารสนเทศยังรวมถึงการใช้คอมพิวเตอร์เพื่อศึกษาค้นคว้าหาความรู้ แลกเปลี่ยนความคิดเห็นผ่านระบบเครือข่ายต่าง ๆ ด้วย
ยุคสารสนเทศดิจิทัล พัฒนาการจากยุคแอนะล็อกสู่ยุคดิจิทัล การเปลี่ยนแปลงที่เกิดขึ้นอย่างรวดเร็วในส่งผลทำให้เกิดการเปลี่ยนแปลงอย่างมากต่อพฤติกรรมในการใช้ชีวิตรวมถึงการเรียนรู้ การใช้สารสนเทศพัฒนาไปอย่างมากจากการที่มีระบบอินเทอร์เน็ตและการพัฒนาของเทคโนโลยีดิจิทัล ซึ่งระบบเครือข่ายความรู้ออนไลน์มีการขับเคลื่อนอย่างเห็นได้ชัด ระบบอินเทอร์เน็ตจะมีบทบาทมากขึ้นจะช่วยให้คนที่อยู่ในพื้นที่ห่างไกลความเจริญสามารถเข้าถึงความรู้ได้ ในขณะที่การเรียนรู้ในพื้นที่ที่ได้ปฏิบัติจริงซึ่งยังเป็นส่วนสำคัญที่ช่วยพัฒนาเสริมทักษะด้านต่าง ๆ ในหลากหลายมิติ นวัตกรรมเทคโนโลยีที่เกิดขึ้นในปัจจุบันได้มีการพัฒนาไปอย่างมาก มีการนำไปปรับประยุกต์ใช้ในวงการต่างๆ รวมทั้งในเรื่องของการเรียนรู้และมิติรอบข้าง ไม่ว่าจะเป็น 5G, VR, AR, IOTs, และแอปพลิเคชันต่าง ๆ ซึ่งส่งผลต่อการเรียนรู้และการนำไปประยุกต์ใช้ทั้งต่อผู้เรียน ผู้สอน ผู้ประกอบการรวมถึงคนทั่วไปด้วย มีนักวิชาการได้แบ่งยุคของสารสนเทศดิจิทัล ไว้ 4 ช่วงเวลาดังนี้
- ยุคเปิดโลกอินเทอร์เน็ต (Internet Age)
เป็นยุคเริ่มต้นของ “อินเทอร์เน็ต” เป็นช่วงเวลาที่กิจกรรมและการดำเนินชีวิตของผู้คนเปลี่ยนจากออฟไลน์ (offline) สู่ออนไลน์ (online) มากขึ้น เช่น การส่งจดหมายทางไปรษณีย์ก็เปลี่ยนมาเป็นการส่งอีเมล e-mail การเกิดขึ้นของเว็บไซต์ (Website) ทำให้เราเข้าถึงทุกอย่างได้ง่ายขึ้น การเปลี่ยนแปลงนี้ส่งผลกระทบเป็นวงกว้างในการดำเนินกิจกรรม และเปลี่ยนพฤติกรรมของมนุษย์โดยสิ้นเชิง เชื่อมโลกไกลให้ใกล้ขึ้น การรับข้อมูลข่าวสารรวดเร็วขึ้น การดำเนินกิจกรรมสะดวกและรวดเร็ว เริ่มมีกิจกรรมเชิงพาณิชย์และโฆษณาผ่านเครื่องมือออนไลน์ การเรียนรู้สามารถเข้าถึงได้รวดเร็วขึ้น
ภาพที่ 1 การใช้งานแท็บเลตในการเข้าอินเทอร์เน็ต
ที่มา https://www.pexels.com/th-th/photo/ipad-35550/, Pixabay
- ยุคของสื่อสังคมออนไลน์ (Social Network Age)
ต่อยอดจากยุคเปิดโลกอินเทอร์เน็ต เป็นยุคที่ผู้บริโภคเริ่มสร้างเครือข่ายติดต่อสื่อสารกันในโลกออนไลน์ เครือข่ายสังคม (Social Network) บุคคลเริ่มจากการคุยหรือแชทกับเพื่อน ที่อยู่ไกลกัน ความต้องการความสะดวกสบายในการติดต่อสื่อสาร พัฒนาและขยายวงกว้างไปสู่การดำเนินกิจกรรมในเชิงธุรกิจ โดยนักธุรกิจส่วนใหญ่มองว่าสื่อสังคมออนไลน์เป็นเครื่องมือเชื่อมต่อและสร้างเครือข่ายทางธุรกิจได้เป็นอย่างดี
ภาพที่ 2 หน้าจอสมาร์ตโฟนที่แสดงแอปพลิเคชันประเภทสื่อสังคมออนไลน์
ที่มา https://www.pexels.com/th-th/photo/linkedin-www-youtube-267350/, Pixabay
อีกทั้งยังช่วยในการพัฒนาแบรนด์สินค้า ส่งเสริมภาพลักษณ์แบรนด์สินค้า เสมือนว่าสื่อสังคมออนไลน์เป็นกระบอกเสียงและเวทีเสนองานแก่นักธุรกิจได้เป็นอย่างดี เครื่องมือสื่อสังคมออนไลน์ยังสามารถเป็นอำนาจในการต่อรองของผู้บริโภคที่กำลังตัดสินใจเลือกสินค้าและบริการ เนื่องจากมีตัวเลือกและร้านค้าให้เห็นมากขึ้นอีกด้วย สื่อสังคมออนไลน์ยังสามารถแลกเปลี่ยนข้อมูลความรู้ในสิ่งที่สนใจร่วมกันได้ เป็นคลังข้อมูลความรู้ขนาดย่อมเพราะเราสามารถเสนอและแสดงความคิดเห็น แลกเปลี่ยนความรู้ หรือตั้งคำถามในเรื่องต่าง ๆ เพื่อให้บุคคลอื่นที่สนใจหรือมีคำตอบได้ช่วยกันตอบ เป็นสื่อในการนำเสนอผลงานของตัวเอง เช่น งานเขียน รูปภาพ วิดีโอต่าง ๆ เพื่อให้ผู้อื่นได้เข้ามารับชมและแสดงความคิดเห็น เป็นต้น
- แห่งข้อมูลมหัต (Big Data)
ยุคแห่งการใช้ข้อมูลที่มีขนาดใหญ่ทุกชนิดที่อยู่ในองค์กรของเราไม่ว่าจะเป็น ข้อมูลบริษัท ข้อมูลลูกค้า พฤติกรรมผู้บริโภค การเข้าออกของธุรกรรมการเงิน ไฟล์เอกสารต่าง ๆ ที่เกี่ยวข้องทั้งหมด รวมไปจนถึง รูปภาพ URLs ลิงก์ต่าง ๆ ที่เก็บไว้ ฯลฯ ที่มีปริมาณมากจนกระทั่งซอฟต์แวร์ปกติทั่วไปไม่สามารถรองรับการเก็บข้อมูลหรือประมวลผลได้อย่างเต็มประสิทธิภาพ ข้อมูลขนาดใหญ่นี้มีความรวดเร็ว และซับซ้อนจนยากหรือที่จะประมวลผลโดยใช้วิธีการแบบเดิม การเข้าถึงและจัดเก็บข้อมูลจำนวนมากเพื่อทำการวิเคราะห์มีมานานแล้ว แต่แนวคิดเกี่ยวกับข้อมูลขนาดใหญ่เป็นที่แพร่หลายในช่วงต้นปีค.ศ. 2000 เมื่อดั๊ก ลานีย์ นักวิเคราะห์อุตสาหกรรมได้ให้คำจำกัดความที่เป็นที่เข้าใจกันในขณะนี้ว่า ข้อมูลขนาดใหญ่ประกอบด้วย 3V ได้แก่ ปริมาณ(Volume) ความเร็ว (Velocity) และความหลากหลาย (Variety)
การเข้าออกข้อมูลเป็นล้าน ๆ ข้อมูลให้เป็นประโยชน์ในการเติบโตของสื่อสังคมออนไลน์และ ระบบพาณิชย์อิเล็กทรอนิกส์ (e-Commerce) จากยุคสื่อสังคมออนไลน์ ทำให้เกิดการขยายของข้อมูลอย่างมหาศาล ทุกแพลตฟอร์มไม่ว่าจะเป็น สื่อสังคมออนไลน์ เว็บเบราว์เซอร์ หรือแม้แต่ธุรกิจอย่างธนาคาร โลจิสติกส์ ประกันภัย ต่างมีข้อมูลเข้าออกเป็นจำนวนมากในแต่ละวัน และเริ่มมีการนำข้อมูลเหล่านั้นมาใช้ให้เกิดประโยชน์ ดังคำกล่าวที่ว่า “ใครมีข้อมูลมาก ก็มีอำนาจมาก”
ข้อมูลมหัตถูกนำมาประมวลผล จับสาระ วิเคราะห์ถึงความต้องการของผู้บริโภคเพื่อสร้างสินค้าและบริการที่สามารถตอบสนองโจทย์ของลูกค้าได้ ทุกองค์กรต่างเห็นความสำคัญของการนำข้อมูลมหัตมาใช้ให้เกิดประโยชน์สูงสุด แต่การนำข้อมูลมหัตมาตอบสนองอย่างเรียลไทม์นั้น จำเป็นต้องมีระบบคลาวด์ มาช่วยอำนวยความสะดวก จัดเก็บข้อมูล เลือกทรัพยากรตามการใช้งาน และทำให้เราสามารถเข้าถึงข้อมูลบนคลาวด์จากที่ใดก็ได้ ผู้ใช้ทุกคนสามารถเข้าถึงระบบ ข้อมูลต่าง ๆ ผ่านอินเทอร์เน็ต สามารถจัดการ บริหารข้อมูล และแบ่งปันข้อมูลกับผู้อื่น ลดต้นทุนและลดความยุ่งยากเพื่อโฟกัสกับงานหลัก เพิ่มความเร็วในการบริการและการทำธุรกิจได้มากขึ้น อีกทั้งข้อมูลมหัตสามารถนำมาต่อยอดโดยการคิดค้น เลือกหา และประยุกต์ใช้ข้อมูลนั้น พัฒนาเป็นแอปพลิเคชัน (Application) ที่ให้ความสะดวกสบายแก่ผู้บริโภคผ่านทางสมาร์9โฟนและแท็บเลต
แหล่งที่มา
สำนักงานราชบัณฑิตยสภา. (10 มิถุนายน 2563). ยุคสารสนเทศ. สืบค้นเมื่อ 10 มิถุนายน 2563, จาก http://www.royin.go.th/?knowledges=ยุคสารสนเทศ-๖-พฤศจิกายน.
สำนักปลัดกระทรวงศึกษาธิการ. (10 มิถุนายน 2563). ยุคดิจิทัล 4.0. สืบค้นเมื่อ 10 มิถุนายน 2563, จาก http://www.ops.moe.go.th/ops2017/สาระน่ารู้/2876-ยุค-digital-4-0-เมื่อโลกขับเคลื่อนด้วยเทคโนโลยี-25-ก-ย-2561.
กลับไปที่เนื้อหา
วิทยาการข้อมูล
วิทยาการข้อมูล (Data Science) เป็นสหสาขาวิชาที่ใช้วิธีการ กระบวนการ อัลกอริทึม และระบบทางวิทยาศาสตร์มาใช้เพื่อหาความรู้จากข้อมูลหลากหลายรูปแบบ ทั้งจัดเก็บเป็นระเบียบและไม่เป็นระเบียบ เป็นสาขาที่เกี่ยวข้องกับการทำเหมืองข้อมูล (Data Mining) การเรียนรู้เชิงลึก (Deep Learning) และข้อมูลมหัต (Big Data) โดยเป็นการบูรณาการสถิติศาสตร์ การวิเคราะห์ข้อมูล และการเรียนรู้ของเครื่องเข้าด้วยกันเพื่อให้สามารถเข้าใจและวิเคราะห์ปรากฏการณ์ที่เกิดขึ้นจริงในข้อมูลได้ โดยใช้เทคนิคและทฤษฎีที่ได้มาจากคณิตศาสตร์ สถิติศาสตร์ วิทยาการคอมพิวเตอร์ และวิทยาการสารสนเทศ
วิทยากรข้อมูลนำข้อมูลมาการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง อย่างเช่น การปรับปรุงผลิตภัณฑ์ กระบวนการดำเนินงาน ประกอบการตัดสินใจทางธุรกิจ การวางแผนการตลาด และทิศทางขององค์กรในอนาคต วิทยาการข้อมูลเป็นการค้นพบสิ่งที่ไม่เคยรู้มาก่อนจากข้อมูลที่ได้ เช่น รูปแบบการทำนาย (Predictive Model) เพื่อนำไปปฏิบัติจริง การสร้างผลิตภัณฑ์ทางข้อมูล (Data Product) ศึกษาถึงกระบวนการ วิธีการ หรือเทคนิค ในการนำข้อมูลจำนวนมหาศาลมาประมวลผล เพื่อให้ได้องค์ความรู้ เข้าใจ ปรากฏการณ์หรือตีความ ทำนายพยากรณ์ ค้นหารูปแบบหรือแนวโน้มจากข้อมูล และสามารถนำมาวิเคราะห์ต่อยอดเพื่อแนะนำทางเลือกที่เหมาะสม หรือใช้ในการตัดสินใจเพื่อประโยชน์สูงสุดที่จะส่งผลต่อธุรกิจ
จากที่กล่าวมาข้างต้นวิทยาการข้อมูล เป็นสาขาที่เกี่ยวข้องกับการทำเหมืองข้อมูล การเรียนรู้เชิงลึก และข้อมูลขนาดใหญ่ จึงขอกล่าวอธิบายพอสังเขป เพื่อขยายภาพวิทยาการข้อมูล ให้ชัดเจนยิ่งขึ้น ดังนี้
- การทำเหมืองข้อมูล (Data Mining)
การทำเหมืองข้อมูล คือกระบวนการค้นหาสารสนเทศหรือข้อความรู้ที่อยู่ในฐานข้อมูลขนาดใหญ่ที่ซับซ้อน เพื่อนำข้อความรู้ที่ได้ไปใช้ประโยชน์ในการตัดสินใจ สารสนเทศที่ได้อาจนำมาสร้างการพยากรณ์หรือ สร้างตัวแบบสำหรับการจำแนกหน่วยหรือกลุ่ม หรือแสดงความสัมพันธ์ระหว่างหน่วยต่าง ๆ หรือให้ข้อสรุปของสาระในฐานข้อมูล การทำเหมืองข้อมูลประกอบขึ้นด้วยการนำกระบวนการทางสถิติและการเรียนรู้ผ่านระบบคอมพิวเตอร์ เพื่อสร้างตัวแบบ กฎเกณฑ์ รูปแบบ การพยากรณ์และข้อความรู้จากฐานข้อมูลขนาดใหญ่ โดยการทำเหมืองข้อมูลมีขั้นตอนการดำเนินงานหลายขั้นตอนซึ่งต้องอาศัยเทคนิคหรือวิธีการต่าง ๆ เช่น วิธีการจัดกลุ่ม การค้นหาความสัมพันธ์ การพยากรณ์ เป็นต้น การดำเนินงานมักอยู่ในลักษณะของการสร้างตัวแบบ (modeling) ที่อธิบายความเป็นไปหรือสภาพการณ์หนึ่งที่เกิดขึ้นแล้ว หรือที่เราทราบคำตอบ แล้วนำตัวแบบนี้มาใช้อธิบายสถานการณ์ที่ยังไม่เกิดขึ้น หรือที่ไม่ทราบคำตอบ ตัวแบบเหล่านี้อาจเป็นตัวแบบที่เรียบง่ายไปจน ถึงตัวแบบที่ยุ่งยากซับซ้อน และอาจใช้การผสมผสานแนวคิดหรือเครื่องมือต่าง ๆ เข้าด้วยกันเพื่อที่จะสามารถ สกัดข้อความรู้ที่อยู่ในข้อมูลขนาดใหญ่ได้ โดยใช้เทคโนโลยีคลังข้อมูล (Data Warehouse) เข้ามาช่วยในการจัดการข้อมูลเพื่อเพิ่มประสิทธิภาพของการทำเหมืองข้อมูล ดังนั้น ถ้ามีฐานข้อมูลขนาดใหญ่ที่มีข้อมูลคุณภาพดี เทคโนโลยีการทำเหมืองข้อมูลจะช่วยในการค้นหรือแสวงหาโอกาสทางธุรกิจใหม่ โดยการทำเหมืองข้อมูลจะก่อให้เกิดกระบวนการอัตโนมัติในการค้นพบสารสนเทศหรือข้อความรู้ในฐานข้อมูลขนาดใหญ่ ด้วยการใช้วิธีการเช่นการพยากรณ์แนวโน้มและพฤติกรรมการบริโภคแบบอัตโนมัติ หรือเกิดกระบวนการอัตโนมัติในการค้นพบรูปแบบที่ไม่เคยรู้จักมาก่อน ด้วยการใช้วิธีการค้นหาเข้าไปในรายละเอียดของฐานข้อมูลเพื่อหารูปแบบที่ ซ่อนอยู่ในฐานข้อมูลนั้น
- การเรียนรู้เชิงลึก (Deep Learning)
การเรียนรู้เชิงลึก เป็นสาขาหนึ่งของ การเรียนรู้ภาษาของเครื่อง ที่พัฒนาอัลกอริทึมขึ้นมาเพื่อการเรียนรู้ของเครื่อง โดยโครงข่ายใยประสาทเสมือน (Artificial Neuron Networks) นั้นอาศัยแนวคิดและเทคนิคจากการทำงานของระบบโครงข่ายใยประสาทในระบบประสาทของมนุษย์ โดยจำลองการทำงานเหมือนกับกลุ่มเซลล์ประสาทที่เชื่อมโยงกันเป็นระบบประสาทที่สามารถรับรู้หลายๆ สิ่งในเวลาเดียวกัน ด้วยการประมวลผลแบบขนาน (Parallel Network) ทำให้ระบบสามารถตัดสินใจได้ใกล้เคียงกับมนุษย์ การเรียนรู้เชิงลึก ถูกนำมาประยุกต์ใช้ในงานต่างๆ มากมาย เช่น การแยกแยะใบหน้าแต่ละคน ตัวอย่างเช่นในการติดแท็กรูปภาพเพื่อนใน Facebook หรือการแยกวัตถุที่ไม่ใช่คน หรือใช้เป็นส่วนหนึ่งในระบบรถยนต์ไร้คนขับ เป็นต้น
- ข้อมูลมหัต (Big Data)
ข้อมูลมหัต เป็นการใช้ข้อมูลที่มีขนาดใหญ่ทุกชนิดที่อยู่ในองค์กรของเราไม่ว่าจะเป็น ข้อมูลบริษัท ข้อมูลลูกค้า พฤติกรรมผู้บริโภค การเข้าออกของธุรกรรมการเงิน ไฟล์เอกสารต่าง ๆ ที่เกี่ยวข้องทั้งหมด ข้อมูลมหัตถูกนำมาประมวลผล จับสาระ วิเคราะห์ถึงความต้องการของผู้บริโภคเพื่อสร้างสินค้าและบริการที่สามารถตอบสนองโจทย์ของลูกค้าได้ สามารถนำมาต่อยอดโดยการคิดค้น เลือกหา และประยุกต์ใช้ข้อมูลนั้น พัฒนาเป็นแอปพลิเคชัน (Application) ที่ให้ความสะดวกสบายแก่ผู้บริโภค
ในการทำโครงการวิทยาการข้อมูลมีขั้นตอนการทำโครงการวิทยาการข้อมูล อาจเเบ่งเป็น 4 ส่วน ดังนี้
-
การวางแผน ในส่วนนี้เราจะกำหนดเป้าหมายและวิธีการในการดำเนินงาน ประการที่สองคือการจัดระเบียบทรัพยากร ตัวอย่างเช่นเรามีข้อมูลใดบ้างและมีทรัพยากรบุคคลเท่าใด คอมพิวเตอร์ ขนาดไหน และเวลามากน้อยเพียงใด ประการที่สามคือการ ประสานความพยายามระหว่างผู้คนเหล่านั้น มันเป็นภารกิจทางสังคม แต่สำคัญต่อความสำเร็จของโครงการ และในที่สุดในแง่ของการวางแผนมีผลกระทบของการจัดตารางเวลาโครงการ เนื่องจากโครงการวิทยาการข้อมูลมักจะทำงานร่วมกันและทำเพื่อลูกค้าสิ่งนี้อาจเป็นสิ่งสำคัญที่จำเป็นต้องได้รับความสนใจอย่างรอบคอบ
-
การเตรียมข้อมูล ในขั้นตอนนี้สิ่งเเรกคือจัดหาข้อมูลจากแหล่งต่าง ๆ ถัดไปคือการทำความสะอาดข้อมูล นั่นคือทำให้ข้อมูลเหมาะสมกับโครงการของเราและตรวจสอบข้อผิดพลาดตรวจสอบความผิดปกติและตรวจสอบให้แน่ใจว่าสิ่งที่เรากำลังทำงานนั้นถูกต้องและเชื่อถือได้ แล้วสำรวจข้อมูล ดูว่าการกระจายเป็นอย่างไร ดูว่าข้อมูลมีลักษณะอย่างไร แล้วจึงปรับแต่งข้อมูล เราเลือกกรณีที่จะรวมข้อมูล เลือกตัวแปรที่จะใช้ สร้างคุณสมบัติใหม่ที่ต้องการและให้เนื้อหาจริงที่จะใช้งานในส่วนถัดไปของขั้นตอนการคำนวณข้อมูล
-
การวิเคราะห์ข้อมูล คือการสร้างรูปแบบหรือรูปแบบ; ทำหลายอย่าง เมื่อคุณสร้างแบบจำลองหรือหลายแบบคุณจะต้องตรวจสอบความถูกต้องของแบบจำลอง นั่นคือเราต้องตรวจสอบให้แน่ใจว่าแบบจำลองนั้นมีความถูกต้องและเป็นไปในทิศทางที่ดี เเละประเมินโมเดล พยายามที่จะดูว่ามันแม่นยำแค่ไหนและมันบอกเราเกี่ยวกับคำถามที่เราพยายามหาคำตอบมากแค่ไหน สุดท้ายคือปรับแต่งโมเดลจากการประเมินผลเราอาจจะต้องการปรับแต่งเพื่อให้ง่ายต่อการใช้งานและให้ข้อมูลเท่าที่จะทำได้
-
การประเมินโครงงาน เรื่องนี้เกี่ยวข้องกับการนำเสนอรูปแบบ เรามักจะมีลูกค้าและเราจะต้องนำเสนอผลการวิเคราะห์ของเราให้กับพวกเขาในลักษณะที่เหมาะสมกับพวกเขาและพวกเขารู้ว่าจะทำอย่างไรกับมัน การติดตามที่ปรับใช้โมเดล หากคุณกำลังพัฒนารูปแบบการคาดการณ์ที่จะใช้ตัวอย่างเช่นสำหรับเว็บไซต์อีคอมเมิร์ซคุณจะต้องติดตั้งบนเซิร์ฟเวอร์และคุณต้องรับมันเพื่อให้ข้อมูลลูกค้าใหม่เข้ามาและทำการคาดการณ์
วิทยาการข้อมูลจึงเป็นการนำข้อมูลมาการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริงเกี่ยวข้องกับการทำเหมืองข้อมูล การเรียนรู้เชิงลึก และข้อมูลมหัต โดยขั้นตอนการทำโครงการวิทยาการข้อมูล 4 ขั้นตอน ได้แก่ การวางแผน การเตรียมข้อมูล การวิเคราะห์ข้อมูล และการประเมินโครงงาน เป็นต้น
แหล่งที่มา
สุชาดา กีระนันทน์ (5 มิถุนายน 2563). การทำเหมืองข้อมูล. สืบค้นเมื่อ 5 มิถุนายน 2563, จาก https://home.kku.ac.th/wichuda/Knowlage/6DataMining/Datamining_Suchada.pdf
สถาบันส่งเสริมการสอนวิทยาศาสตร์และเทคโนโลยี. (2561). เทคโนโลยี(วิทยาการคำนวณ) ชั้นมัธยมศึกษาปีที่ 5 กรุงเทพฯ : โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
NUTHDANAI WANGPRATHAM. (3 มิถุนายน 2562) Data Science. สืบค้นเมื่อ 5 มิถุนายน 2563, จาก https://medium.com/@nutdnuy/data-science-by-barton-1-แนะนำ-data-science-fc507a8a011b
กลับไปที่เนื้อหา
กระบวนการวิทยาการข้อมูล
กระบวนการวิทยาการข้อมูล (data science process) เป็นขั้นตอนในการดำเนินกิจกรรมเพื่อไม่ให้สับสนหรือพลาดประเด็น นักเรียนสามารถดำเนินการตามกระบวนการของวิทยาการข้อมูลที่ระบุขั้นตอนสำคัญต่าง ๆ ที่ประกอบด้วย การตั้งคำถาม การเก็บรวบรวมข้อมูล การสำรวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ นักเรียนสามารถดำเนินการตามกระบวนการได้ ดังนี้
ขั้นตอนที่ 1 การตั้งคำถาม (ask an interesting question) คือ ตั้งคำถามที่ตนเองสนใจเป็นกระบวนการวิทยาการข้อมูลขั้นตอนแรกในการดำเนินกิจกรรม การตั้งคำถาม เช่น กรมควบคุมโรคต้องการวางแผนเกี่ยวกับการรับมือโรคไข้หวัดใหญ่ ในปีถัดไปเพื่อเป็นการสำรองยาและเวชภัณฑ์ อีกทั้งเป็นการบริหารจัดการวัคซีนของกรมควบคุมโรค เป็นต้น
ขั้นตอนที่ 2 การเก็บรวบรวมข้อมูล (get the data) คือ ต้องคำนึกถึงว่าจะเก็บข้อมูลเรื่องอะไร จากที่ไหนจำนวนเท่าใด และความน่าเชื่อถือของแหล่งข้อมูล ข้อมูลที่เก็บรวบรวมได้จะต้องทำการตรวจสอบ ขจัดข้อมูลที่ผิด หรือข้อมูลที่ไม่สมบูรณ์ เพื่อให้ได้ข้อมูลนำเข้าที่ดี ไปสู่ผลที่ดี เหมือนกับประโยคที่ว่า "garbage in garbage out" เช่น จากข้อมูลของกรมควบคุมโรคในทุกปีในช่วงฤดูฝนตั้งแต่เดือนมิถุนายนถึงกันยายนของทุกปี ซึ่งจะมีผู้ติดเชื้อสูงมากในทุกภาคของประเทศ
ขั้นตอนที่ 3 การสำรวจข้อมูล (explore the date) คือ เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล ในขึ้นตอนนี้เราจะต้องรวบรวมข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อต (plot) ทำให้เป็นภาพ (visualizations) หรือแผนภูมิ (charts) เพื่อให้มองเห็นความหมายที่ซ่อนเร้นอยู่ของข้อมูลผ่านกราฟ ซึ่งอาจพบความผิดปกติของข้อมูลได้ โดยนำเสนอในรูปแบบเส้นกราฟแนวโน้ม หรือ แผนภูมิแท่งในการนำเสนอข้อมูลผู้ติดเชื้อไข้หวัดใหญ่ในทุก ๆ ของปีก่อน
ขั้นตอนที่ 4 การวิเคราะห์ข้อมูล (analyze the data) คือ เพื่ออธิบายความหมาย ความสัมพันธ์ของข้อมูล และทำนายเหตุการณ์ที่จะเกิดขึ้นในอนาคต โดยต้องการทำนายว่าในอนาคตหากเข้าสู่ช่วงฤดูฝน ควรสำรองยาและเวชภัณฑ์ รวมถึงเตียงเพื่อรองรับผู้ป่วยไข้หวัดใหญ่ ให้เพียงพอในช่วงเวลานั้น
การวิเคราะห์ข้อมูลจึงเป็นการเปลี่ยนข้อมูลให้มีคุณค่า โดยนำผลลัพธ์ที่ได้จากการวิเคราะห์มาใช้ประโยชน์ โดยสามารถหาได้จากการวิเคราะห์ข้อมูล 3 ประเภท ดังนี้
-
การวิเคราะห์เชิงพรรณนา (Descriptive Analysis) เป็นการวิเคราะห์ขั้นพื้นฐาน ที่ทำให้เห็นภาพรวมของข้อมูลและความสัมพันธ์ระหว่างข้อมูล ช่วยอธิบายว่าเกิดอะไรขึ้นบ้างในช่วงที่ผ่านมา เพื่อช่วยในการตัดสินใจ เช่น การทำรายงานยอดขายรายเดือนของห้างสรรพสินค้า ปัจจัยในการซื้อซ้ำของลูกค้าต่อผลิตภัณฑ์ เป็นต้น
-
การวิเคราะห์เชิงทำนาย (Predictive Analysis) เป็นการวิเคราะห์ที่ช่วยในการคาดการณ์ หรือทำนายสิ่งที่น่าจะเกิดขึ้นในอนาคต โดยใช้ข้อมูลในอดีตมาช่วยในการทำนาย การทราบถึงความเป็นไปได้ของเหตุการณ์ที่จะเกิดขึ้นในอนาคต ทำให้บุคคลหรือองค์กรสามารถวางแผนการดำเนินงานที่มีประสิทธิภาพได้ เช่น การคาดการณ์ยอดขายในเทศกาลต่าง ๆ ทำให้ร้านค้าทราบถึงปริมาณสินค้าที่ควรจะสั่งซื้อ หรือจัดเก็บให้เพียงพอต่อความต้องการของลูกค้า
-
การวิเคราะห์เชิงแนะนำ (Prescriptive Analysis) เป็นการวิเคราะห์ต่อยอดจากการทำนายผลที่น่าจะเกิดขึ้น โดยการจำลองทางเลือกที่เป็นไปได้ของสถานการณ์ (Simulation) และคาดการณ์ผลที่ได้ของแต่ละสถานการณ์ เพื่อแนะนำทางเลือกที่เหมาะสมที่สุดกับสถานการณ์ที่จะเป็นไปได้ เช่น การเลือกวิธีโฆษณาสินค้าที่จะทำให้ยอดขายสูงที่สุด
กล่าวคือ การวิเคราะห์ข้อมูลนอกจากจะทำให้เห็นภาพรวมของข้อมูลแล้ว ยังช่วยในการคาดการณ์ผลในอนาคตและแนะนำทางเลือกที่เหมาะสมที่สุดสำหรับการตัดสินใจของบุคคลหรือองค์กร โดยการวิเคราะห์เชิงพรรณนาเป็นการวิเคราะห์ขั้นพื้นฐาน การวิเคราะห์เชิงทำนายเป็นการวิเคราะห์เพื่อทำนายสิ่งที่อาจจะเกิดขึ้นในอนาคต ส่วนการวิเคราะห์เชิงแนะนำเป็นการวิเคราะห์ที่ต่อยอดมาจากการวิเคราะห์เชิงพรรณนาและการวิเคราะห์เชิงทำนาย โดยใช้ทักษะการแก้ปัญหาและวางแผน
ขั้นตอนที่ 5 การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ (communicate and visualize the results) คือ เป็นการสื่อสารผลลัพธ์ของข้อมูลโดยการถ่ายทอดเป็นเรื่องราวหรือเป็นภาพให้ผู้อื่นเข้าใจว่าเราได้เรียนรู้อะไรจากข้อมูล โดยข้อมูลที่จะนำไปประชาสัมพันธ์หรือเผยแพร่ให้แก่ผู้รับสารได้รับรู้ถึงสิ่งที่ผู้สร้างต้องการสื่อสาร ให้เข้าใจตรงกัน เป็นเรื่องที่ทำได้ยาก เพราะผู้สร้างจะต้องพยายามศึกษาว่า ข้อมูลส่วนไหนสำคัญ ข้อมูลส่วนไหนมีรูปแบบที่น่าสนใจ หากเป็นตัวเลขจำนวนมาก ผู้ที่พยายามจะทำความเข้าใจข้อมูลนั้น ๆ อาจต้องใช้เวลานาน หรืออาจทำให้ไม่สามารถมองเห็นความรู้ หรือประเด็นสำคัญที่อยู่ภายใต้ข้อมูลนั้น ๆ ได้ แต่วิธีหนึ่งที่จะทำให้ผู้รับสารรับรู้สิ่งที่ผู้สร้างต้องการสื่อสารคือการใช้ภาพ
การสื่อสารด้วยข้อมูล เป็นการถ่ายทอดข้อมูลหรือการสื่อสารจากแหล่งข้อมูลไปยังผู้รับสารนั้น บางครั้งเป็นเรื่องที่ทำได้ยาก จำเป็นที่จะต้องจัดรูปแบบของข้อมูล และนำเสนอข้อมูลไปแสดงในรูปแบบที่เหมาะสม เพื่อให้ผู้รับสารเข้าใจ หรือมองเห็นประเด็นสำคัญ
ภาพการทำผลลัพธ์ให้เป็นภาพ (แผนภูมิ)
ที่มา, https://www.pexels.com/th-th/photo/590022/,Lukas
การทำข้อมูลให้เป็นภาพ ข้อมูลที่เราได้มานั้น ส่วนใหญ่จะอยู่ในรูปของจำนวน และมีเป็นจำนวนมาก แม้ว่าการตอบคำถามที่เราสนใจ หรือสิ่งที่เราอยากจะนำเสนอ จะมีอยู่แล้วในข้อมูลเหล่านั้น แต่ก็ยากที่จะทำความเข้าใจ หรืออาจสื่อสารได้โดยง่าย เช่น ข้อมูลที่อยู่ในรูปแบบตารางถึงแม้จะจัดการนำเสนอข้อมูลแล้ว แต่ตัวเลขที่มีปริมาณมาก เราไม่สามารถเห็นเป็นภาพที่แสดงปริมาณมากน้อยได้ จึงมีความจำเป็นที่จะต้องทำข้อมูลที่อยู่ในตารางเหล่านั้นทำให้เป็นภาพ โดยอาจจะใช้แผนภูมิวงกลม แผนภูมิแท่ง กราฟเส้น หรือในรูปอินโฟกราฟิกอื่น เป็นต้น
กระบวนการวิทยาการข้อมูลจึงประกอบด้วย 5 ขั้น ได้แก่ การตั้งคำถาม การเก็บรวบรวมข้อมูล การสำรวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ จึงทำให้การดำเนินกิจกรรมประสบความสำเร็จและเกิดประสิทธิภาพ
แหล่งที่มา
สถาบันส่งเสริมการสอนวิทยาศาสตร์และเทคโนโลยี. (2561). เทคโนโลยี(วิทยาการคำนวณ) ชั้นมัธยมศึกษาปีที่ 5 กรุงเทพฯ : โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
กลับไปที่เนื้อหา
การคิดเชิงออกแบบสำหรับวิทยาการข้อมูล
การคิดเชิงออกแบบ (Design Thinking) เป็นกระบวนการคิดที่ใช้การทำความเข้าใจในปัญหาต่าง ๆ อย่าง ลึกซึ้ง โดยมีผู้ใช้เป็นศูนย์กลาง และนำเอาความคิดสร้างสรรค์และมุมมองที่หลากหลายมาพัฒนาเป็นแนวในการแก้ไข ปัญหา แนวคิดนี้กำลังได้รับความสนใจและถูกนำไปใช้ในหลายบริบท ไม่ว่าเป็นภาคธุรกิจ การศึกษา เศรษฐกิจ และ สังคม อย่างกว้างขวาง ถึงจะดูเหมือนว่าเป็นสิ่งใหม่ แต่อันจริงแล้ว การคิดเชิงออกแบบมีจุดเริ่มต้นอย่างชัดเจนตั้งแต่ ในทศวรรษที่ 1960 ผ่านพัฒนาการมาอย่างต่อเนื่องจนกระทั่งเปลี่ยนแปลงแนวคิดและเครื่องมือที่ได้รับการใช้อย่าง แพร่หลายในปัจจุบัน การคิดเชิงออกแบบ ถูกนำมาประยุกต์ใช้ใน ฐานะ “เครื่องมือ” “วิธีการ” หรือ “วิธีคิด”
การคิดเชิงออกแบบสำหรับวิทยาการข้อมูล เป็นการนำข้อมูลมาใช้เพื่อสื่อสารถึงแม้จะทำให้เข้าใจปัญหาหรือสถานการณ์มากยิ่งขึ้น แต่ถ้าไม่เข้าใจถึงความต้องการที่แท้จริงของผู้ใช้ ก็จะทำให้การนำเสนอข้อมูลผลลัพธ์ไม่ประสบผลสำเร็จ เนื่องจากผู้ใช้ไม่สามารถใช้ประโยชน์จากข้อมูลที่นำเสนอนั้นได้ เช่น ข้อมูลหนึ่งมีปริมาณมากหรือละเอียดเกินความต้องการ เมื่อผู้ใช้พิจารณาข้อมูลแล้วคิดว่าไม่จำเป็นสำหรับตนเอง ข้อบกพร่องนี้อาจทำให้การพัฒนาสินค้าหรือผลิตภัณฑ์นั้นไม่สามารถเข้าถึงความต้องการของผู้ใช้ได้อย่างแท้จริง
ภาพที่ 1 การคิดเชิงออกแบบฅ
ที่มา, https://www.pexels.com/th-th/photo/3471423/, Fabian Wiktor
กระบวนการคิดเชิงออกแบบสำหรับวิทยาการข้อมูล เป็นกระบวนการที่ให้ความสำคัญต่อผู้ใช้ข้อมูลเป็นหลัก (Human-Centric Design) โดยแบ่งออกเป็น 5 ขั้นตอน ดังนี้
- การสร้างความเข้าใจถึงปัญหา และความต้องการของผู้ใช้อย่างลึกซึ้ง (Empathize)
ในขั้นตอนนี้สิ่งสำคัญที่สุดในขั้นแรกคือ การระบุกลุ่มผู้ใช้งานที่เราต้องเข้าไปทำความเข้าใจ และถึงแม้ว่าเราจะคาดหวังว่าผลงานออกแบบของเราจะสามารถ ตอบโจทย์ของผู้ใช้งานทุกคนได้ การสร้างความเข้าใจผู้ใช้งานกลุ่มต่าง ๆ อย่าง ลึกซึ้ง โดยจะต้องทำความเข้าใจถึงปัจจัยพื้นฐานต่าง ๆ ของผู้ใช้งาน หรือที่เรียกว่าการศึกษาเชิงชาติพันธุ์วรรณนา (Ethnographic Study) ไม่ว่าจะเป็นจากการสังเกตอากัปกิริยา พฤติกรรม และกิจกรรมต่าง ๆ ในชีวิตความเป็นอยู่ และชีวิตการทำงานของผู้ใช้ หรือการสัมภาษณ์เพื่อดึงเอาข้อมูลในเชิงลึกเกี่ยวกับโจทย์ปัญหาหรือวัตถุประสงค์ของ การออกแบบ โดยเป้าหมายสุดท้ายของการสร้างความเข้าใจอย่างลึกซึ้ง คือการทำความเข้าใจปัญหา อุปสรรค ความเจ็บปวด (Pain) ของผู้ใช้งาน รวมถึงสิ่งที่ผู้ใช้งานต้องการ (Need) และสิ่งที่ผู้ใช้งานคาดหวังว่าจะได้รับ (Gain)
- การนิยามหรือการตีกรอบปัญหา (Define)
เป็นขั้นตอนที่สองของกระบวนการในการคิดเชิงออกแบบสำหรับวิทยาการข้อมูล โดยในขั้นตอนนี้ จะเป็นการดึงข้อมูลเชิงลึก (insight) จากการทำความเข้าใจอย่างลึกซึ้ง (Empathize) และทำการจับกลุ่มรูปแบบปัญหา (pattern grouping) เพื่อตีกรอบปัญหาหลักของผู้ใช้งานที่จะต้องทำ การแก้ไขด้วยการออกแบบ โดยการจับกลุ่มรูปแบบปัญหาจะเป็นการหาจุดเชื่อมโยงของแต่ละคนเพื่อทำการแบ่งกลุ่ม รูปแบบปัญหาที่ได้พบจากทุก ๆ กลุ่มผู้ใช้งาน ได้แก่
-
จับกลุ่มตามประเภทของปัญหาที่ได้พบ
-
การวิเคราะห์จุดเชื่อมโยงและความสัมพันธ์ต่าง ๆ ของข้อมูลจากความคล้ายคลึงกันของข้อมูล(Similarities) ข้อมูลซ้ำ (Repetition) หรือความพึ่งพากันของข้อมูล (Dependencies)
-
ทำการดึงข้อมูลเชิงลึก (Insight) ของปัญหาที่สามารถทำการแก้ไขได้ออกมา
- การระดมความคิด (Ideate)
การระดมความคิด เพื่อหาทางออกให้กับปัญหาของผู้ใช้งาน (User) ในขั้นตอนนี้ เป้าหมายคือการค้นหาความคิดสร้างสรรค์ที่จะ สามารถตอบโจทย์ปัญหาและความต้องการของผู้ใช้งานได้มากที่สุด ดังนั้นสิ่งสำคัญคือการส่งเสริมให้สมาชิกในทีมนักวิทยาศาสตร์ข้อมูล หรือนักออกแบบสามารถใช้พลังแห่งความสร้างสรรค์และจินตนาการได้อย่างเต็มที่ผ่านการระดมสมองในทีม (Group Brainstorm) และในขั้นตอนนี้ สิ่งสำคัญที่สุดคือการระดมความคิดเพื่อให้ได้ความคิดที่มีความหลากหลายและมีปริมาณ มากที่สุด ทั้งนี้ก็เพื่อที่จะเพิ่มโอกาสในการค้นพบความคิดที่ดีที่สุดที่จะสามารถตอบโจทย์ปัญหาของผู้ใช้งานได้ โดยความคิดที่ดีจะต้องสามารถที่จะลดความรู้สึกทางด้านลบของผู้ใช้งาน และ เพิ่มความรู้สึกทางด้านบวกของผู้ใช้งานใน ประสบการณ์นั้น ๆ โดยทีมนักออกแบบจะมีกรอบแนวคิดและทักษะที่จำเป็นสำหรับการระดมความคิดได้อย่างอิสระ เพื่อที่จะ สามารถระดมความคิดหรือความคิดออกมาให้ได้มากที่สุด ในส่วนของวิธีการหรือเทคนิคที่ใช้เพื่อระดมสมองหรือระดม ความคิดนั้นสามารถทำได้หลากหลายรูปแบบ โดยจะมุ่งเน้นถึงการทำงานร่วมกันเป็นทีม เพื่อต่อยอดความคิดของ สมาชิกในทีม เพื่อให้ได้ซึ่งความคิดที่นับเป็นความคิดที่ดีที่สุดที่จะสามารถตอบโจทย์ปัญหาได้ หลังจากที่ได้ระดมความคิดจนได้ปริมาณที่มากพอสมควรแล้ว ขั้นตอนต่อไปในการระดมความคิดคือการ ประเมินความคิดที่ได้ แล้วทำการคัดเลือกความคิดที่คาดว่าจะสามารถตอบโจทย์ปัญหาและความต้องการของผู้ใช้งานได้ดี ที่สุด โดยจะเป็นการประเมินจากความยากง่ายในการดำเนินการและความสามารถในการตอบโจทย์ปัญหาของผู้ใช้งาน
- การสร้างต้นแบบ (Prototype)
การสร้างต้นแบบวัตถุประสงค์ของการสร้างต้นแบบ คือ การทดสอบสมมติฐานที่ว่าความคิดที่ได้คิดค้นขึ้นนั้นจะสามารถ ตอบโจทย์ปัญหาและความต้องการของผู้ใช้งานได้จริงหรือไม่ โดยการสร้างต้นแบบจะต้องเป็นการสร้างการจำลอง สถานการณ์นั้น ๆ หรือสร้างต้นแบบผลิตภัณฑ์ที่สามารถทำได้เร็วและทดสอบได้เร็วที่สุด ทั้งนี้ก็เพื่อที่จะให้ทีมงาน สามารถกลับไปปรับปรุงแก้ไขรายละเอียดของต้นแบบได้อย่างรวดเร็ว แล้วทำการทดสอบซ้ำเพื่อให้มั่นใจได้ว่าผลงาน ออกแบบที่คิดขึ้นจะสามารถตอบโจทย์ความต้องการของผู้ใช้งานได้อย่างถูกต้องครบถ้วนที่สุด
คุณลักษณะของต้นแบบที่ดีควรจะต้องสามารถที่จะสื่อสารความคิดของผลิตภัณฑ์หรือข้อมูลออกมาได้อย่างแม่นยำ เพื่อให้ผู้ใช้งานสามารถทำความเข้าใจความคิดนั้นๆ ได้อย่างถูกต้องและให้คำเสนอแนะเพื่อให้ทีมงานกลับไป แก้ไขปรับปรุงได้ดียิ่งขึ้น นอกจากนี้แล้ว ลักษณะของต้นแบบควรจะเป็นการออกแบบเพื่อตอบโจทย์บริบทของผู้ใช้งาน ได้ใกล้เคียงที่สุด เช่นการสร้างต้นแบบและทำการทดสอบในห้องแลบ อาจจะยังไม่สามารถสะท้อนถึงการใช้งาน ต้นแบบนั้นๆได้ในสภาพแวดล้อมจริง สำหรับการสร้างต้นแบบในขั้นต้น เนื่องจากตัวต้นแบบเองควรจะเป็นการสร้าง ขึ้นแบบหยาบ ๆ ด้วยต้นทุนการสร้างที่ต่ำที่สุดและสร้างได้เร็วที่สุดเท่าที่จะทำได้ ต้นแบบแรก ๆ อาจจะมีความแม่นยำที่ต่ำและอาจเป็นการทดสอบในบริบทที่ไม่ใกล้เคียงกับสภาวะจริงมากนัก แต่ในการพัฒนาต้นแบบในครั้งต่อ ๆ ไป ควรจะต้องพัฒนาระดับความแม่นยำและความใกล้เคียงในเชิงบริบทให้ได้มากขึ้น
คุณลักษณะของต้นแบบที่ดีจะคำนึงถึง 2 สิ่งเป็นหลักได้แก่
1) ความถูกต้องหรือความแม่นยำ (Fidelity) ที่จะสามารถสะท้อนถึงความคิดที่จะสื่อออกไปได้อย่างถูกต้อง และครบถ้วนที่สุด โดยในขั้นแรกอาจจะยังไม่ได้มีความแม่นยำสูงนัก แต่จะเป็นการพัฒนาให้มีความแม่นยำและ ใกล้เคียงกับความเป็นจริงมากที่สุดจากการดัดแปลงในแต่ละครั้งหลังทำการทดสอบ
2) บริบทของผู้ใช้งาน (Context) เพราะการทำการทดสอบต้นแบบในบริบทที่แตกต่างกันจะช่วยให้เราสามารถ รวบรวมข้อมูลความคิดเห็นจากบุคคลที่ 3 ในแต่ละบริบทเพื่อนำมาปรับแก้ต้นแบบได้ดียิ่งขึ้น
- การทดสอบ (Test)
เป็นขั้นตอนสุดท้ายในกระบวนการคิดเชิงออกแบบ (Design Thinking) และถือเป็น ขั้นตอนสำคัญในการสร้างความมั่นใจว่าผลิตภัณฑ์ หรือ บริการที่พัฒนาขึ้น จะสามารถตอบโจทย์ปัญหาและความ ต้องการของผู้ใช้งานได้อย่างตรงจุดการทำการทดสอบต้นแบบ คือการประเมินผล เพื่อที่จะทำให้มั่นใจได้ว่าผลงาน สุดท้ายที่ถูกพัฒนาขึ้นจะเป็นผลงานที่สามารถตอบโจทย์ปัญหาและความต้องการของผู้ใช้งานได้อย่างถูกต้อง หลักการ ของการทำการทดสอบคือทีมนักออกแบบจะต้องเปิดใจกับการยอมรับฟังความคิดเห็นของผู้ใช้งาน โดยผู้ใช้งานที่จะทำการทดสอบด้วยนั้น ควรเป็นผู้ใช้งานที่มีคุณลักษณะที่ตรงกับตัวละครสมมติ หรือ กลุ่มเป้าหมายที่เราตั้งไว้ ขั้นตอน การทำการทดสอบประสบการณ์ของผู้ใช้งานสามารถสรุปได้เป็น 5 ขั้นตอนดังนี้:
-
การนิยามวัตถุประสงค์ของโครงการและลักษณะของผู้ใช้งานไว้อย่างชัดเจน
-
การระดมผู้ใช้งานที่จะมาทำการทดสอบ
-
การทำการทดลองประสบการณ์
-
การวิเคราะห์และให้คำแนะนำ
-
การนำเสนอบทเรียนที่ได้รับ
หลังจากการทำการทดสอบต้นแบบในแต่ละครั้ง สิ่งสำคัญที่จะต้องทำก็คือการทำการประเมินผลของการ ทดสอบต้นแบบ เพื่อปรับแก้และปรับปรุงต้นแบบให้มีคุณภาพที่ดีขึ้น และสามารถตอบโจทย์ความต้องการและปัญหา ของผู้ใช้งานได้ดียิ่งขึ้น โดยจะเป็นการประเมินจากการทำงาน (Functionality) ราคาต้นทุน (Cost) ความสวยงาม (Aesthetics) การใช้งาน (Usability) การบำรุงรักษา (Maintenance) ซึ่งจะต้องทำการประเมินในทุก ๆ รุ่น การพัฒนาของต้นแบบ
การคิดเชิงออกแบบสำหรับวิทยาการข้อมูล เป็นการนำข้อมูลมาใช้เพื่อสื่อสาร การนำเสนอเพื่อให้ผู้ใช้ใช้ประโยชน์จากข้อมูลที่นำเสนอนั้นได้ โดยมี 5 ขั้นตอน ได้แก่ การสร้างความเข้าใจถึงปัญหา และความต้องการของผู้ใช้อย่างลึกซึ้ง การนิยามหรือการตีกรอบปัญหา การระดมความคิด การสร้างต้นแบบ และการทดสอบ ทำให้การคิดเชิงออกแบบสำหรับวิทยาการข้อมูล ประสบความสำเร็จในการพัฒนากิจกรรมวิทยาการข้อมูล โดยอาศัยการคิดเชิงออกแบบ
แหล่งที่มา
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี. (2560). การคิดเชิงออกแบบ. สืบค้นเมื่อ 10 มิถุนายน 2563, จาก https://www.nxpo.or.th/th/wp-content/uploads/2019/01/48_TH1.pdf.
สถาบันส่งเสริมการสอนวิทยาศาสตร์และเทคโนโลยี. (2561). เทคโนโลยี(วิทยาการคำนวณ) ชั้นมัธยมศึกษาปีที่ 5 กรุงเทพฯ : โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
กลับไปที่เนื้อหา
ขั้นตอนการนำข้อมูลไปใช้เพื่อการแก้ปัญหา
การสำรวจข้อมูล (explore the date) เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล โดยเราจะต้องรวบรวมข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อต (plot) ทำให้เป็นภาพ (visualizations) หรือแผนภูมิ (charts) เพื่อให้มองเห็นความหมายที่ซ่อนเร้นอยู่ของข้อมูลผ่านกราฟ ซึ่งอาจพบความผิดปกติของข้อมูลได้ โดยนำเสนอในรูปแบบเส้นกราฟแนวโน้ม หรือ แผนภูมิแท่งในการนำเสนอข้อมูล เครื่องมือพื้นฐานในการสำรวจข้อมูล เช่น กราฟเส้น ฮิสโทแกรม แผนภาพกล่อง หรือแผนภาพกระจาย โดยสามารถอธิบายรายละเอียดได้ดังต่อไปนี้
ภาพที่ 1 กราฟเส้น
ที่มา, https://unsplash.com/photos/5gGcn2PRrtc/, Markus Spiske
- กราฟเส้น (Line Graphs) คือ การนำเสนอโดยกราฟเส้นจะเป็นที่นิยมใช้กันมากใช้กับข้อมูลอนุกรมเวลา (Time Series Data) ซึ่งแสดงการเปลี่ยนแปลงลำดับก่อนหลังของเวลาที่ข้อมูลนั้นเกิดขึ้นและมีจำนวนมาก เป็นการสร้างที่ง่าย อาจเป็นเส้นตรงหรือเส้นโค้งก็ได้ ขึ้นอยู่กับลักษณะข้อมูลที่มีอยู่ ใช้เปรียบเทียบระหว่างหลายรายการในระยะยาว
- ฮิสโทแกรม (Histogram) คือกราฟแท่งแบบเฉพาะที่แสดงความสัมพันธ์ระหว่างข้อมูลเป็นหมวดหมู่ที่เรียกว่าชั้นข้อมูลกับความถี่ของข้อมูล เพื่อดูการกระจายของข้อมูล ลักษณะของข้อมูลที่เป็นหมวดหมู่จะเรียงลำดับจากน้อยไปหามากโดยจำนวนหมวดหมู่ของข้อมูลจะจัดตามความเหมาะสม โดยแกนตั้งจะเป็นตัวเลขแสดง “ความถี่” และแกนนอนจะเป็นข้อมูลคุณสมบัติของสิ่งที่เราสนใจ แท่งกราฟแต่ละแท่งจะมีความกว้างเท่ากันซึ่งเท่ากับกว้างของชั้นข้อมูล ส่วนความสูงของกราฟแต่ละแท่งนั้นจะสูงเท่ากับจำนวนความถี่ของแต่ละชั้นข้อมูล
ประโยชน์สำคัญของการใช้ฮิสโทแกรมคือการใช้เพื่อวิเคราะห์ความถี่ของข้อมูลแล้วตัดสินใจว่าการแจกแจงหรือการกระจายข้อมูลแบบใดมีผลต่อผลิตภัณฑ์ไปในทิศทางที่ดีหรือไม่และยังสามารถใช้ในการเปรียบเทียบข้อมูลจากการผลิตก่อนและหลังการปรับปรุงและนำมาใช้วิเคราะห์หาความสามารถของกระบวนการผลิต (Process capability) ได้อีกด้วย
ลักษณะของฮิสโตแกรม (Histogram) ที่พบและการแปลผลที่ได้ดังนี้
1). ฮิสโทแกรมรูปธรรมชาติ (Natural histogram) ถือว่าเป็นลักษณะของข้อมูลดีที่สุด คือเป็นระฆังคว่ำ มีลักษณะสมมาตร มีค่าเฉลี่ยอยู่ตรงกลางและอยู่ภายในขีดจำกัดข้อกำหนดเฉพาะด้านบนและขีดจำกัดข้อกำหนดด้านล่าง
2). ฮิสโทแกรมที่มีลักษณะเบ้ซ้าย (Negativity skewed histogram) คือยอดกราฟไม่ได้อยู่ตรงกลาง แต่จะเอนไปทางขวามือค่าเฉลี่ยของข้อมูลมีค่าค่อนข้างสูง ในกรณีนี้ตั้งข้อสังเกตได้ว่าอาจเกิดจากการปรับตั้งเครื่องจักรไม่ถูกต้อง
3). ฮิสโทแกรมที่มีลักษณะเบ้ขวา (Positively skewed histogram) คือยอดกราฟไม่ได้อยู่ตรงกลาง แต่จะเอนไปทางซ้ายมือค่าเฉลี่ยของข้อมูลมีค่าค่อนข้างต่ำ
4). ฮิสโทแกรมที่มีลักษณะเบ้ซ้าย (Plateau histogram) ข้อมูลที่ค่าใกล้เคียงกันเป็นจำนวนมากอยู่บริเวณตรงกลาง
ฮิสโทแกรมที่มีลักษณะเป็นภูเขา 2 ยอด (Twin peak histogram) ข้อมูลที่เกิดจากการปะปนกันของ 2 การแจกแจงที่มีค่าเฉลี่ยต่างกัน ซึ่งสามารถตั้งข้อสังเกตได้ว่าอาจเกิดจากเครื่องจักร 2 เครื่องที่มีการปรับตั้งค่าการผลิตแตกต่างกัน
- แผนภาพกล่อง (Box-and-whisker plot หรือ Box plot) เป็นแผนภาพง่าย ๆ แต่มีประโยชน์ในการสำรวจและสรุปลักษณะของข้อมูล แผนภาพกล่องจะแสดงลักษณะที่สำคัญของข้อมูลชุดนั้น ๆ ได้แก่ ค่ากลาง การกระจาย ลักษณะสมมาตรของข้อมูล และข้อมูลผิดปกติ (outliers) แผนภาพกล่อง ประกอบด้วย ค่าควอร์ไทล์ทั้งสามค่าต่ำสุดและค่าสูงสุดในข้อมูลชุดนั้น โดยสร้างเป็นภาพกล่องสี่เหลี่ยมผืนผ้าที่อาจจัดวางตามแนวนอนหรือแนวตั้งก็ได้ ด้านหัวและท้ายของกล่องเป็นค่าควอร์ไทล์ที่ 1 กับค่าควอร์ไทล์ที่ 3 ความยาวของกล่องนี้จึงคลุมข้อมูลกึ่งกลางจำนวนร้อยละ 50 ของทั้งหมด
ภาพที่ 2 แผนภาพกล่อง (box plot)
- แผนภาพการกระจาย (Scatter plot) เป็นเครื่องมือที่ช่วยแสดงความสัมพันธ์ระหว่าง 2 แอททริบิวต์ คือผังที่ใช้แสดงว่าข้อมูล 2 ชุดหรือตัวแปร 2 ตัว มีความสัมพันธ์ซึ่งกันและกัน หรือไม่ และระดับความสัมพันธ์นั้นมีมากน้อยเพียงใด โดยจะทำการหาค่าสหสัมพันธ์ (r) ของทั้ง 2 ตัวแปรที่ แสดงด้วยแกน x และแกน y ของกราฟว่าค่าสหพันธ์เป็นบวกหรือเป็นลบ ซึ่งค่าสหสัมพันธ์เป็นบวกนั่นแสดงว่า ตัวแปรทั้ง 2 ตัวมีแปรตามกัน แต่หากเป็นลบก็แสดงว่า ตัวแปรทั้ง 2 ตัวแปรผกผันต่อกัน โดยที่ ตัวแปร X คือ ตัวแปรอิสระ หรือค่าที่ปรับเปลี่ยนไป ตัวแปร Y คือ ตัวแปรตาม หรือผลที่เกิดขึ้นในแต่ละค่าที่เปลี่ยนแปลงไปของตัวแปร X เช่น เรา อยากทราบว่าขนาดความยาวปีกของคอปเตอร์กระดาษมีผลต่อระยะเวลาที่ลอยอยู่ในอากาศโดยตรงหรือไม่ เรา สามารถใช้แผนภูมิการกระจายเพื่อหาความสัมพันธ์ หรือ รายได้เฉลี่ยต่อครัวเรือน และรายจ่ายเฉลี่ยต่อครัวเรือน ถ้าต้องการสำรวจว่าทั้ง 2 แอททริบิวต์นี้มความสัมพันธ์กันหรือไม่ เป็นต้น
ภาพที่ 3 แผนภาพการกระจาย (scatter plot)
- การสำรวจข้อมูลโดยการเขียนโปรแกรม การสำรวจข้อมูลโดยการเขียนโปรแกรม จะต้องนำเข้าข้อมูลสู่โปรแกรมที่ใช้สำหรับการประมวลผล โดยถ้าข้อมูลมีปริมาณไม่มากในขั้นตอนการเตรียมข้อมูล สามารถเตรียมข้อมูลจากไฟล์ที่อยู่ในรูปแบบ xls หรือ csv ก่อนเริ่มการนำเข้าข้อมูล จากนั้นจึงเลือกใช้การประมวลผลด้วยโปรแกรมสำเร็จรูป หรือการเขียนโปรแกรม แต่หากมีข้อมูลมากกว่าที่โปรแกรมสำเร็จรูปจะสามารถจัดเก็บหรือประมวลผลได้ จำเป็นต้องใช้วิธีการนำเข้าข้อมูลและประมวลผลด้วยโปรแกรมภาษา หรือใช้โปรแกรมสำเร็จรูปเฉพาะงานด้านวิทยาการข้อมูล ซึ่งในกรณีนี้ไม่จำเป็นต้องดำเนินการจัดเตรียมข้อมูลตามขั้นตอนที่กล่าวมาแล้วข้างต้น
การสำรวจข้อมูล เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล โดยเราจะต้องรวบรวมข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อตทำให้เป็นภาพ หรือแผนภูมิ โดยใช้เครื่องมือในการสำรวจข้อมูล เช่น กราฟเส้น ฮิสโทแกรม แผนภาพกล่อง แผนภาพการกระจาย การสำรวจข้อมูลโดยการเขียนโปรแกรม เป็นต้น
แหล่งที่มา
มารุต มูเก็ม. (2560). ฮิสโตแกรม สืบค้นเมื่อ 10 มิถุนายน 2563, จาก http://www.mim.psu.ac.th/index.php/2-uncategorised/93-histogram.
สถาบันส่งเสริมการสอนวิทยาศาสตร์และเทคโนโลยี. (2561). เทคโนโลยี(วิทยาการคำนวณ) ชั้นมัธยมศึกษาปีที่ 5 กรุงเทพฯ : โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
กลับไปที่เนื้อหา
นักวิทยาศาสตร์ข้อมูล
วิทยาการข้อมูล (Data Science) เป็นศาสตร์ที่เกี่ยวกับการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง อย่างเช่น การปรับปรุงผลิตภัณฑ์ กระบวนการดำเนินงาน ประกอบการตัดสินใจทางธุรกิจ การวางแผนการตลาด และทิศทางขององค์กรในอนาคตโดยหลักการแล้ววิทยาการข้อมูล ประกอบขึ้นจากองค์ความรู้หลัก ๆ คือ ทักษะด้านวิทยาการคอมพิวเตอร์ เช่น การเขียนโปรแกรมคอมพิวเตอร์ การจัดการฐานข้อมูล เทคโนโลยี Big Data ทักษะทางด้านคณิตศาสตร์และสถิติศาสตร์ และทักษะการนำเสนอข้อมูล วิทยาการข้อมูลเป็นการค้นพบสิ่งที่ไม่เคยรู้มาก่อนจากข้อมูลที่ได้ เช่น รูปแบบการทำนาย (Predictive Model) เพื่อนำไปปฏิบัติจริง การสร้างผลิตภัณฑ์ทางข้อมูล (Data Product) ที่จะส่งผลต่อธุรกิจ
นักวิทยาศาสตร์ข้อมูล จึงเป็นอาชีพเกิดใหม่ในโลกแห่งการจัดการข้อมูล ที่มาของ นักวิทยาศาสตร์ข้อมูล (Data Scientist) ตำแหน่งงานด้านนี้ถูกตั้งขึ้นโดย DJ Patil และ Jeff Hammerbacher ในปี 2008 โดยทั้งคู่เป็น ผู้บุกเบิกการสร้างทีมวิทยาการข้อมูลที่ LinkedIn และ Facebook และตอนนี้ DJ Patil ได้รับแต่งตั้งให้เป็น Chief Data Scientist of the United States ในปัจจุบัน ในปี 2012 วารสาร Harward Business Review ตีพิมพ์บทความชื่อ Data Scientist: The Sexiest Job of the 21st Century ทำให้อาชีพนี้กลายเป็นที่กล่าวถึงในวงการธุรกิจและวงการสื่อ และทำให้เกิดความต้องการจ้างงานจากวงการธุรกิจสูง จนขาดแคลนบุคลากรทางด้านนี้เป็นอย่างมาก ถือเป็นอาชีพที่เกิดขึ้นอย่างฉับพลันในวงการธุรกิจ โดยทักษะที่จำเป็นสำหรับนักวิทยาศาสตร์ข้อมูล มีทักษะดังนี้
- ทักษะการเรียนรู้ภาษาของเครื่อง (Machine Learning) คือระบบที่สามารถเรียนรู้ได้จากตัวอย่างด้วยตนเองโดยปราศจากการป้อนคำสั่งของโปรแกรมเมอร์ ความก้าวหน้าในครั้งนี้มาพร้อมกับความคิดที่ว่าเครื่องคอมพิวเตอร์สามารถเรียนรู้เพียงแค่จากข้อมูลอย่างเดียวเพื่อที่จะผลิตผลลัพธ์ที่แม่นยำออกมาได้ โดยการทำให้ระบบคอมพิวเตอร์เรียนรู้ได้ด้วยตนเอง โดยใช้ข้อมูล ซึ่งมันแตกต่างกับการเขียนโปรแกรมทั่วไป เพราะการเขียนโปรแกรมจะใส่ ข้อมูล (Data) และโปรแกรมเข้าไปเพื่อให้ได้ผลลัพธ์แต่ การเรียนรู้ภาษาของเครื่อง เราไม่ได้โปรแกรมคำตอบ เราใส่ข้อมูล และ ผลลัพธ์ เข้าไป เพื่อให้หาโปรแกรมที่จะนำไปตอบในอนาคตได้ว่าหากป้อนข้อมูลแบบนี้ผลลัพธ์ในอนาคตจะเป็นอะไร
- ทักษะด้านวิทยาการคอมพิวเตอร์ หรือ วิทยาศาสตร์คอมพิวเตอร์ (Computer science) เป็นศาสตร์เกี่ยวกับการศึกษาค้นคว้าทฤษฎีการคำนวณสำหรับคอมพิวเตอร์ และทฤษฎีการประมวลผลสารสนเทศ ทั้งด้านซอฟต์แวร์ ฮาร์ดแวร์ และ เครือข่าย ซึ่งวิทยาการคอมพิวเตอร์นั้นประกอบด้วยหลายหัวข้อที่เกี่ยวข้องกับคอมพิวเตอร์ ตั้งแต่ระดับนามธรรม หรือความคิดเชิงทฤษฎี เช่น การวิเคราะห์และสังเคราะห์ขั้นตอนวิธี ไปจนถึงระดับรูปธรรม เช่น ทฤษฎีภาษาโปรแกรม ทฤษฎีการพัฒนาซอฟต์แวร์ ทฤษฎีฮาร์ดแวร์คอมพิวเตอร์ และ ทฤษฎีเครือข่าย ในแง่ของศาสตร์เกี่ยวกับคอมพิวเตอร์นั้น วิทยาการคอมพิวเตอร์เป็นหนึ่งในห้าสาขาที่เกี่ยวกับคอมพิวเตอร์ ซึ่งประกอบด้วย วิทยาการคอมพิวเตอร์ เทคโนโลยีสารสนเทศ ระบบสารสนเทศ วิศวกรรมซอฟต์แวร์ และวิศวกรรมคอมพิวเตอร์
- ทักษะด้านคณิตศาสตร์และสถิติ ทักษะที่ความรู้ศาสตร์ด้านคณิตศาสตร์และสถิติมาวิเคราะห์ คำนวณ อาจจะเป็นข้อมูลเชิงปริมาณหรือเชิงคุณภาพ โดยมีการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์โดยใช้หลักการทางคณิตศาสตร์ และการนำผลการวิเคราะห์มาสรุปทางสถิติอย่างถูกต้องและลึกซึ้งทั้งทางด้านทฤษฎีและการนำไปประยุกต์ใช้ โดยเน้นการคำนวณและทฤษฎีเป็นหลัก ทฤษฎีสถิติ แคลคูลัส ทฤษฎีการตัดสินใจ คณิตศาสตร์การเงิน แนวคิดหลักมูลทางคณิตศาสตร์ การวิเคราะห์เชิงตัวเลข สถิติประชากรเบื้องต้น ความรู้เบื้องต้นเกี่ยวกับสถิติที่ไม่ใช้พารามิเตอร์ การวิจัยดำเนินงาน เป็นต้น
- ทักษะเฉพาะสาขา (Domain Knowledge) เป็นความรู้ในงานเฉพาะด้าน เช่นการจัดการข้อมูลด้านสาธารณสุข มีความจำเป็นต้องมีความรู้เรื่องของข้อมูลสารสนเทศด้านสาธารณสุข หรือลักษณะงานที่ต้องดำเนินการเช่น ข้อมูลด้านระบาดวิทยา ข้อมูลด้านสาธารณสุขมูลฐาน ข้อมูลด้านอัตรากำลังสาธารณสุข เป็นต้น หรือเเม้กระทั่งด้านการเงินธนาคาร การประกันภัยที่นักวิทยาศาสตร์ข้อมูลจำปฏิบัติงานจำเป็นที่จำต้องมีองค์ความรู้ด้านการเงินการธนาคารในระดับพื้นฐาน ตามหน่วยงานหรือองค์กรต้องการองค์ความรู้ หรือแม้แต่หากจะทำงานในหน่วยงานองค์กรด้านการศึกษาก็มีความจำเป็นที่จะต้องมีองค์ความรู้ด้านการศึกษา เพื่อเป็นพื้นฐานในการจัดการข้อมูล วิเคราะห์ปัญหา และพัฒนาองค์ความรู้ของหน่วยงานที่นักวิทยาศาสตร์ข้อมูลทำงานอยู่
- ทักษะความคิดสร้างสรรค์ เป็นทักษะที่เป็นที่มาของวิธีการใหม่ ๆ นวัตกรรมหรือสินค้าใหม่ ๆ ที่ผู้อื่นหรือที่อื่นไม่มี ทำให้องค์กรนั้นประสบความสำเร็จมากกว่า เช่น องค์กรมีข้อมูลที่เยอะและหลากหลาย นักวิทยาศาสตร์ข้อมูล จะต้องเอาข้อมูลนั้นมาสร้างผลิตภัณฑ์ใหม่ ๆ ลูกค้า พัฒนาแอปพลิเคชันที่สนองตอบต่อด้านข้อมูลขอลูกค้า เป็นต้น ความคิดสร้างสรรค์เป็นความสามารถของมนุษย์ที่คิดได้กว้างไกลหลายแง่มุมหลายทิศทาง นำไปสู่การคิดประดิษฐ์สิ่งของและเกิดแนวทางการแก้ปัญหาต่าง ๆ ซึ่งเป็นผลจากการทำงานของสมอง ในส่วนที่เกี่ยวกับอารมณ์ความรู้สึกหรือสมองซีกขวา ซึ่งสามารถเกิดขึ้นได้จากการไม่ยึดติดกับกรอบความคิดเดิม กฎเกณฑ์เดิม ความคิดสร้างสรรค์คิดได้หลายแง่มุม คิดได้มากที่สุดเท่าที่จะคิดได้ ความคิดสร้างสรรค์จึงเป็นการมองปัญหาในแนวกว้างผู้ที่มีความคิดสร้างสรรค์จะมีลักษณะสำคัญ 4 ประการ ได้แก่ ความคิดริเริ่ม ความยืดหยุ่นในการคิด ความคิดคล่องแคล่ว ความคิดละเอียดลออ
นักวิทยาศาสตร์ข้อมูลจึงเป็นอาชีพเกี่ยวกับการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง โดยอาศัยทักษะที่มีความจำเป็นต่ออาชีพ ได้แก่ ทักษะการเรียนรู้ภาษาของเครื่อง ทักษะด้านวิทยาการคอมพิวเตอร์ ทักษะด้านคณิตศาสตร์และสถิติ ทักษะเฉพาะสาขา ทักษะความคิดสร้างสรรค์ ที่จะทำให้นักวิทยาศาสตร์ข้อมูลพัฒนางานและองค์ความรู้ด้านวิทยาการข้อมูลออกมาอย่างหลากหลาย สร้างนวัตกรรมด้านวิทยาการข้อมูลให้กับหน่วยงานและองค์กรไปใช้ประโยชน์ได้ โดยอาศัยข้อมูลที่องค์กรรวบรวมจัดเก็บ และสามารถนำมาพัฒนานาต่อยอดสร้างนวัตกรรมได้
แหล่งที่มา
มหาวิทยาลัยศรีปทุม. (10 มิถุนายน 2563). นักวิทยาศาสตร์ข้อมูล. สืบค้นเมื่อ 10 มิถุนายน 2563, จาก https://www.admissionpremium.com/it/news/3079.
.
กลับไปที่เนื้อหา
-
11677 หน่วยวิทยาการข้อมูล /lesson-technology/item/11677-2020-06-30-07-39-50เพิ่มในรายการโปรด