เทคโนโลยี AI สำหรับถอดเสียงและสรุปการประชุม
JUL 14, 2024

ทุกวันนี้การประชุมเป็นหนึ่งในกิจกรรมที่สำคัญในทุกหน่วยงานทั้งภาครัฐและเอกชน การประชุมทั่วไปมีหลากหลายประเภท เช่น การประชุมอภิปราย การประชุมคณะกรรมการ การประชุมวางแผนการทำงาน การประชุมนำเสนองานกับลูกค้า เป็นต้น ผลลัพธ์ที่ต้องการจากการประชุม คือ การสรุปประเด็นสำคัญหรือทำรายงานการประชุม เพื่อให้ผู้เข้าร่วมประชุมเข้าใจประเด็นตรงกันและยังสามารถเก็บไว้เป็นหลักฐานหรือสำหรับอ้างอิงได้

บทความนี้จะแนะนำให้ทุกท่านได้รู้จักเทคโนโลยีปัญญาประดิษฐ์ หรือ AI ที่ช่วยถอดเสียงและสรุปรายงานอัตโนมัติ อย่างขั้นตอนในการถอดเสียงและสรุปการประชุม เริ่มจากการบันทึกไฟล์เสียงการประชุม หลังจากนั้นไฟล์เสียงจะถูกส่งไปเข้ากระบวนการถอดเสียงด้วยโปรแกรมแปลงเสียงพูดเป็นข้อความ (Speech-To-Text หรือ Automatic Speech Recognition) ข้อความที่ได้จะถูกส่งไปประมวลผลด้วยโปรแกรมสรุปข้อความ (Text Summarization) เพื่อสรุปเป็นประเด็นหรือสาระสำคัญของการประชุม ผลลัพธ์ที่เป็นไฟล์รายงานสามารถนำออก (Export) เป็นไฟล์เอกสารในรูปแบบ docx หรือ pdf เพื่อนำไปใช้งานต่อไป

ความถูกต้องแม่นยำของการถอดเสียงขึ้นอยู่กับหลายปัจจัย ได้แก่
1. รูปแบบการประชุม
● การประชุมที่เป็นทางการหรือ formal meeting จะมีการกำหนดวาระการประชุมที่ชัดเจน ประธานในที่ประชุมจะเป็นผู้ควบคุมการประชุม และผู้เข้าร่วมประชุมจะพูดทีละหนึ่งคน ในห้องประชุมโดยมากจะมีอุปกรณ์ไมโครโฟนสำหรับกดพูด รูปแบบการประชุมแบบเป็นทางการจะได้ไฟล์บันทึกเสียงการประชุมที่มีคุณภาพสูง ทำให้รายงานจากการถอดเสียงมีความถูกต้องแม่นยำสูง
● การประชุมแบบไม่เป็นทางการ เช่น team meeting มักจะใช้ภาษาพูดแบบไม่เป็นทางการ อาจมีการพูดซ้อนทับหรือแทรกกัน โดยมากจะไม่มีอุปกรณ์ไมโครโฟนสำหรับกดพูด และไม่ได้อยู่ในห้องประชุมที่เก็บเสียงได้ดี การประชุมแบบไม่เป็นทางการมักจะได้ไฟล์บันทึกเสียงคุณภาพไม่สูง มีความไม่ชัดและไม่สม่ำเสมอของเสียงพูดและอาจมีเสียงรบกวน ทำให้รายงานจากการถอดเสียงมีความถูกต้องไม่สูงมาก
● การประชุมแบบออนไลน์ โดยใช้โปรแกรม conference หรือ online meeting (เช่น MS Team, Zoom, Google Meet, WebEx) ในช่วงระบาดของโรค Covid-19 ทำให้หลายหน่วยงานหันมาใช้โปรแกรมประชุมออนไลน์กัน และหลายหน่วยงานก็ยังคงใช้อย่างต่อเนื่องมาถึงปัจจุบัน เพื่อความสะดวกสบายของผู้เข้าร่วมประชุม โดยมากการประชุมแบบออนไลน์จะสามารถให้ผู้ควบคุมหรือเจ้าของการประชุมนั้น ๆ บันทึกไฟล์เสียงการประชุมได้ โดยที่คุณภาพของไฟล์เสียงจะขึ้นอยู่กับหลายปัจจัย เนื่องจากผู้เข้าร่วมประชุมใช้อุปกรณ์ microphone และ speaker ที่แตกต่างยี่ห้อและคุณภาพ รวมทั้งสถานที่ที่ใช้ประชุมมีความหลากหลาย หากมีเสียงดังรบกวนก็จะส่งผลให้คุณภาพของไฟล์เสียงไม่ดีเท่าที่ควร
2. ปัจจัยอื่น ๆ ที่ส่งผลต่อความถูกต้องแม่นยำของการถอดเสียง ได้แก่
● ผู้พูด ซึ่งอาจจะมีรูปแบบหรือสไตล์การพูดที่แตกต่างกันไปหรือผู้พูดบางคนอาจจะพูดเร็วและรัว พูดเบาฟังไม่ชัด หรือติดสำเนียงถิ่น ส่งผลให้การถอดเสียงได้ไม่ถูกต้องเท่าที่ควร
● อุปกรณ์บันทึกเสียง โดยทั่วไปการบันทึกเสียงอาจจะเก็บจากตู้ควบคุมหรือ Audio Mixer ซึ่งจะได้คุณภาพเสียงที่ดี แต่จะมีปัญหาในกรณีที่ผู้พูดไม่กดไมโครโฟนตอนพูด หรืออาจจะเก็บโดยอุปกรณ์อื่น ๆ เช่น Conference Microphone เครื่องบันทึกไฟล์เสียงแบบพกพา (MP3 Recorder) หรือโทรศัพท์มือถือ (Mobile Phone) ซึ่งคุณภาพเสียงที่ได้จะแตกต่างกันไปทั้งในเรื่องของประสิทธิภาพของอุปกรณ์ รวมทั้งเรื่องของตำแหน่งในวางอุปกรณ์ในห้องประชุม ถ้าหากวางไว้ไกลจากแหล่งเสียงก็จะทำให้คุณภาพของการถอดเสียงไม่ดีเท่าที่ควร
● สภาพแวดล้อมของสถานที่หรือห้องประชุม ถ้าสถานที่สำหรับประชุมมีเสียงรบกวน ไม่ว่าจะเป็นเสียงคนพูดหรือเสียงแอร์ดังลอดเข้ามา ก็จะส่งผลต่อคุณภาพของการถอดเสียงได้เช่นเดียวกัน
บริษัทเอไอไนน์เป็นผู้พัฒนาแพลตฟอร์มพรรณา PANANA สำหรับให้บริการถอดเสียงและสรุปรายงานการประชุม โดยสามารถรองรับการประชุมทั้งรูปแบบออนไซต์และออนไลน์ จากประสบการณ์การนำระบบไปใช้งานสำหรับการถอดความเสียงการประชุมของสำนักงานเลขาธิการสภาผู้แทนราษฎร พบว่ามีความถูกต้องแม่นยำของการถอดเสียงมากกว่า 90% และยังสามารถช่วยประหยัดเวลาของการจัดทำรายงานการประชุมได้ถึง 88%
หากหน่วยงานของท่านกำลังมองหาเทคโนโลยี AI หรือโซลูชันที่สามารถช่วยในการถอดเสียงและสรุปรายงานการประชุม สามารถติดต่อเราเพื่อรับคำปรึกษาและทดสอบการใช้งานได้โดยไม่มีค่าใช้จ่าย
บทความที่น่าสนใจ

มาตรฐานการจัดการปัญญาประดิษฐ์ (AI) ISO/IEC 42001:2023
MAY 16, 2025

พัฒนา chatbot ยุคใหม่ด้วยเทคโนโลยี Generative AI (ตอนที่ 1)
APR 28, 2025
