ทีมนักวิจัย Data Science มช. พัฒนาเครื่องมือรวบรวมชุดข้อมูลขนาดใหญ่ที่มีคุณภาพและลดแรงงาน สำหรับสอน AI ให้ฉลาดขึ้น

8 กันยายน 2564

คณะวิทยาศาสตร์

             นักวิจัย Data Science มช. พัฒนาเทคนิคสำหรับสร้างชุดข้อมูลลายมือเขียนหลากหลายอักษร โดยใช้ความหนาแน่นของข้อมูลหลายมิติ สำหรับนำไปใช้ในการสร้างแบบจำลองเชิงพยากรณ์ สามารถลดแรงงานในการสร้างชุดข้อมูล และได้ชุดข้อมูลที่มีคุณภาพสูง

             การเรียนรู้ของเครื่อง (Machine Learning) ถูกนำมาประยุกต์ใช้อย่างแพร่หลายในการสร้างแบบจำลองปัญญาประดิษฐ์ (Artificial Intelligent) และการวิเคราะห์ข้อมูลด้วยวิทยาการข้อมูล ชุดข้อมูลขนาดใหญ่เป็นสิ่งสำคัญที่ขาดไม่ได้ในการประยุกต์ใช้งานเทคนิคการเรียนรู้ของเครื่อง เพื่อสร้างแบบจำลองที่มีประสิทธิภาพ การเตรียมชุดข้อมูลสำหรับฝึกสอนแบบจำลองเป็นงานที่ต้องใช้เวลาและแรงงานมาก

กลุ่มวิจัยจากภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ ได้ร่วมมือกับอาจารย์จากวิทยาลัยนานาชาตินวัตกรรมดิจิทัล มหาวิทยาลัยเชียงใหม่ ได้พัฒนาเทคนิคการสร้างชุดข้อมูลขนาดใหญ่แบบกึ่งอัตโนมัติโดยใช้ความหนาแน่นของข้อมูลหลายมิติ สำหรับนำไปใช้ในการสร้างแบบจำลองเชิงพยากรณ์ เทคนิคที่นำเสนอถูกทดสอบประสิทธิภาพด้วยชุดข้อมูลภาพอักษรลายมือเขียนหลากหลายอักษร พบว่าสามารถช่วยลดแรงงานในการสร้างชุดข้อมูลลงไปได้อย่างมาก อีกทั้งชุดข้อมูลที่ได้ยังมีคุณภาพสูงในด้านความถูกต้องของข้อมูลเมื่อเปรียบเทียบกับเทคนิควิธีอื่นๆ ที่มีในปัจจุบัน

นอกจากนี้การนำชุดข้อมูลที่ถูกจัดทำขึ้นด้วยเทคนิควิธีที่นำเสนอไปใช้สร้างแบบจำลองสำหรับรู้จำลายมือเขียน ยังพบว่าตัวแบบจำลองที่ได้มีความถูกต้องเทียบเท่ากับแบบจำลองที่สร้างขึ้นจากชุดข้อมูลที่สร้างด้วยแรงงานคนทั้งหมด การงานผลการค้นคว้านี้ถูกรายงานในวารสาร Knowledge-Based Systems เมื่อเดือนพฤษภาคมที่ผ่านมา



นักวิจัย
อาจารย์ ดร.ปภังกร อิ่นแก้ว ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่
รองศาสตราจารย์ ดร.จีรยุทธ ไชยจารุวณิช ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่
อาจารย์ ดร.ปิยะฉัตร อุดมวงษ์ วิทยาลัยนานาชาตินวัตกรรมดิจิทัล มหาวิทยาลัยเชียงใหม่

อ้างอิง
ผู้สนใจสามารถอ่านข้อมูลเพิ่มเติมได้ที่ Inkeaw, P., Udomwong, P., & Chaijaruwanich, J. (2021), Density based semi-automatic labeling on multi-feature representations for ground truth generation: Application to handwritten character recognition, Knowledge-Based Systems, 220, 106953.

Q1 (ISI) with impact factor 8.038

อ่านงานวิจัย https://doi.org/10.1016/j.knosys.2021.106953


#CMU #ChiangMaiUniversity #มช #มหาวิทยาลัยเชียงใหม่

#มหาวิทยาลัยเชียงใหม่มหาวิทยาลัยชั้นนำที่รับผิดชอบต่อสังคมและการพัฒนาที่ยั่งยืน

#CMUSDGs #CMUSDG4 #CMUSDG9
แกลลอรี่