ข้อมูลสังเคราะห์คืออะไร? เป็นประโยชน์ต่อวงการ Data อย่างไร?

Credit: Freepik.com

การที่ธุรกิจจะสามารถเติบโตได้อย่างต่อเนื่องและแม่นยำ “ข้อมูล” คือสิ่งจำเป็นที่ช่วยสนับสนุนการตัดสินใจต่าง ๆ ในการดำเนินธุรกิจ ทว่า ข้อมูลบางอย่างก็มีข้อจำกัดในการใช้งานหรือมีความไม่เป็นกลางแฝงอยู่ นั่นจึงทำให้เกิดการคิดค้นวิธีนำข้อมูลมาใช้ได้อย่างอิสระอย่างเช่นการสร้าง “ข้อมูลสังเคราะห์” ขึ้นมานั่นเอง ในบทความนี้ เราจะพาผู้อ่านทุกคนไปทำความรู้จักกับข้อมูลสังเคราะห์ ทั้งนิยามของมัน การสังเคราะห์ข้อมูล ประโยชน์ และความท้าทายในการใช้งาน

ข้อมูลสังเคราะห์คืออะไร?

ข้อมูลสังเคราะห์ คือข้อมูลที่ถูกสร้างขึ้นมาโดยอ้างอิงจากข้อมูลที่มีอยู่บนโลกจริง ซึ่งเลียนแบบลักษณะสำคัญที่จำเป็นต่อการประมวลผลหรือทดสอบระบบ อย่างที่ได้กล่าวไว้ข้างต้น ข้อมูลสังเคราะห์ถูกสร้างขึ้นมาเพื่อทดแทนข้อมูลที่ไม่สามารถนำไปใช้งานได้หากไม่ได้รับอนุญาต เช่น ชื่อ เบอร์โทรศัพท์ บ้านเลขที่ หรือช่วยเสริมข้อมูลที่มีอคติเจือปนอยู่ให้เท่าเทียมกันมากขึ้น ไม่ว่าจะเป็นความคิดเห็นในโลกโซเชียลหรือกลุ่มประชากรของข้อมูลที่เอนเอียงไปในทิศทางใดทิศทางหนึ่งนั่นเอง การสร้างข้อมูลใหม่ขึ้นมาใช้งานทดแทนข้อมูลจากโลกจริงจึงเป็นทางออกสำหรับประเด็นดังกล่าว

Credit: Freepik.com

ข้อมูลสังเคราะห์สร้างขึ้นมาได้อย่างไร?

ข้อมูลสังเคราะห์นั้นสร้างขึ้นมาโดยอัลกอริธึมที่ประมวลผลและจำลองข้อมูลที่มีอยู่ และนำไปให้ปัญญาประดิษฐ์หรือ AI ผลิตข้อมูลที่มีลักษณะคล้ายกันขึ้นมา หากดูจากผิวเผิน ข้อมูลที่สร้างขึ้นมานี้จะดูเหมือนข้อมูลที่มาจากมนุษย์จริง ๆ แต่อาจจะมีรายละเอียดบางส่วนหรือทุกส่วนที่ไม่มีเจ้าของในโลกแห่งความจริงเลย ยกตัวอย่างเช่นรูปภาพบุคคลในเว็บไซต์ www.unrealperson.com/ ที่ดูละม้ายคล้ายคนจริง ๆ แต่กลับเป็นภาพบุคคลที่ AI สร้างอย่างแยบยล

3 เทคนิคดังต่อไปนี้คือวิธีการที่ใช้โดยทั่วไปในการสร้างข้อมูลสังเคราะห์ขึ้นมา

1. สร้างแบบจำลองโดยใช้ตัวแทน

เทคนิคการจำลองข้อมูลนี้เป็นการสร้างโมเดลที่มีลักษณะปฏิสัมพันธ์คล้ายชุดข้อมูลของจริง โดยการสร้างโมเดลที่ว่านั้น ผู้สร้างข้อมูลต้องศึกษารูปแบบปฏิสัมพันธ์ของข้อมูลจริงก่อนเพื่อที่จะนำมาคัดลอกรูปแบบเพื่อสร้างเป็นข้อมูลสังเคราะห์ขึ้นมา

2. สอนเครื่องจักรให้เรียนรู้และจำลองลักษณะสำคัญของข้อมูล

Machine Learning หรือการเรียนรู้ของเครื่องจักรนั้นเป็นอีกหนึ่งตัวช่วยสำคัญที่ช่วยในการสังเคราะห์ข้อมูล โดย Machine Learning Engineer จะต้องสอนโมเดลการเรียนรู้ให้สามารถจับรูปแบบที่เป็นเอกลักษณ์ของข้อมูลให้ได้ เมื่อจับรูปแบบได้แล้วก็สอนให้โมเดลนั้นสร้างชุดข้อมูลที่คล้ายกันขึ้นมา โดยมีลักษณะเฉพาะที่จำเป็นต่อการวิเคราะห์ต่อไปเท่านั้น

3. ใช้เทคนิคขั้นสูงในการเลียนแบบข้อมูลที่ซับซ้อน

ข้อมูลที่ซับซ้อนที่ว่านั้นหมายถึงข้อมูลที่มีมิติในด้านอื่น ๆ อย่างความเป็นธรรมชาติ ความสมจริง หรือรูปแบบบางอย่างที่คาดการณ์ไม่ได้เป็นองค์ประกอบ เช่น รูปภาพหรืออนุกรมเวลา ซึ่งต้องอาศัยเทคนิค Deep Learning ของ AI ในการสร้างแบบจำลองข้อมูลชนิดนี้ขึ้นมา ตัวอย่างของเทคโนโลยีการสร้างโมเดลข้อมูลที่ซับซ้อนนี้ ได้แก่ Generative Adversarial Network (GANs) และ Variational Autoencoders (VAE)

Credit: Freepik.com

ธุรกิจได้ประโยชน์จากข้อมูลสังเคราะห์อย่างไรบ้าง?

ด้วยความที่ข้อมูลสังเคราะห์นั้นมีหลากหลายรูปแบบมาก ตั้งแต่ชุดตัวเลข ตาราง กราฟ ไปจนถึงรูปภาพ จึงทำให้ธุรกิจต่าง ๆ สามารถนำข้อมูลสังเคราะห์นี้ไปใช้ได้ในหลากหลายวิธี ไม่ว่าจะเป็นการนำข้อมูลไปวิเคราะห์เพื่อใช้ในการตัดสินใจ วิจัย ทดสอบระบบ พัฒนาแผนธุรกิจหรือเทคโนโลยีใหม่ ๆ ไปจนถึงการฝึกการเรียนรู้ของเครื่องจักรนั่นเอง ซึ่งธุรกิจที่สามารถใช้ประโยชน์จากข้อมูลสังเคราะห์ได้นั้นมีทั้งสายนวัตกรรม การแพทย์ การเงิน ยานยนต์ และอื่น ๆ อีกมากมาย

ประโยชน์ของข้อมูลสังเคราะห์ที่มีต่อธุรกิจต่าง ๆ มีดังนี้

  • ลดขั้นตอนการขออนุญาตใช้ความเป็นส่วนตัว เนื่องจากข้อมูลที่สร้างขึ้นมานี้ไม่ได้มาจากคนจริง ๆ ทำให้ไม่ติดข้อจำกัดในการใช้งานทั้งด้านความเป็นส่วนตัวและความปลอดภัยของข้อมูล
  • เพิ่มความเท่าเทียมให้กับข้อมูล การที่เราสามารถสร้างข้อมูลขึ้นมาทดแทนในส่วนที่ขาดไปหรือยังไม่สมดุลได้นั้น เป็นการช่วยให้ชุดข้อมูลมีความเป็นกลางมากขึ้น ลดความคาดเคลื่อนที่เกิดจากอคติได้
  • ประหยัดเงินและเวลา เพราะว่าข้อมูลเหล่านี้สามารถสร้างขึ้นมาได้อย่างไม่มีขีดจำกัด ทำให้ผู้ที่ต้องการใช้ข้อมูลจำนวนมากไม่ต้องออกไปตามหาข้อมูลทั้งหมดด้วยตัวเองให้ลำบาก และลดระยะเวลาในการเก็บข้อมูลลงไปได้
  • ควบคุมข้อมูลไปในทิศทางที่ต้องการได้ ในการทดสอบระบบของโปรแกรมต่าง ๆ ที่ต้องการฟังก์ชั่นคัดแยกข้อมูลหรือตรวจจับความผิดปกติของข้อมูล การสร้างข้อมูลสังเคราะห์ขึ้นมาเพื่อใช้ในการทดสอบนั้นช่วยให้ผู้ทดสอบปรับระดับหรือจำนวนของข้อมูลที่ต้องการให้ตรวจจับได้ตามที่ต้องการ

Credit: Freepik.com

ทักษะและความรู้ที่ต้องมีในการสร้างข้อมูลสังเคราะห์มีอะไรบ้าง?

  • ความรู้เฉพาะทางในสายงานนั้น ๆ เช่น การแพทย์ การเงิน
  • ทักษะด้านคณิตศาสตร์และสถิติ
  • ความรู้และทักษะด้าน Machine Learning และ AI
  • ภาษา Python
  • ทักษะการคิดวิเคราะห์ ความละเอียดรอบคอบ

ข้อมูลสังเคราะห์นับได้ว่าเป็นอีกหนึ่งนวัตกรรมในแวดวง Data ทั่วโลกที่ช่วยให้ธุรกิจสามารถทะลุข้อจำกัดและช่วยเพิ่มความปลอดภัยให้กับผู้ใช้งานได้อย่างเหลือเชื่อ ก้าวสู่ความเชี่ยวชาญในสายงานแห่งอนาคต เรียนรู้ทักษะและวิธีคิดที่จำเป็นต่ออาชีพด้าน Data รวมถึงไขเทคนิคการใช้ข้อมูลให้เกิดประโยชน์สูงสุดได้ที่สาขาวิชาวิทยาการข้อมูลและปัญญาประดิษฐ์ (Data Science and Artificial Intelligence) วิทยาลัยนานาชาติ สถาบันเทคโนโลยี ไทย-ญี่ปุ่น (TNIC) ศึกษาข้อมูลเพิ่มเติมได้ที่ https://tnic.tni.ac.th/th/dsa-program-th/

แหล่งที่มา

Amazon.com

Statice.ai

Edps.europa.eu

Techtarget.com

Syntho.ai

Turing.com