文章

AUDIO AI

11/11/2024

คุณจรีพร จารุกรสกุล

ประธานคณะกรรมการบริหารและประธานเจ้าหน้าที่บริหารกลุ่ม

บริษัท ดับบลิวเอชเอ คอร์ปอเรชั่น จำกัด (มหาชน)

ในช่วงระยะเวลาที่ผ่านมา Generative AI ได้ก้าวเข้ามามีบทบาทสำคัญในการขับเคลื่อนการเปลี่ยนแปลงทางธุรกิจเป็นอย่างมาก โดยเฉพาะอย่างยิ่งในด้านการเพิ่มประสิทธิภาพการทำงาน และการประยุกต์ใช้เพื่อสร้างสรรค์เป็นนวัตกรรมต่าง ๆ ท่ามกลางการพัฒนาอย่างรวดเร็วนี้ ยังมี "Audio AI" ซึ่งเป็นอีกหนึ่งแขนงของ AI ที่น่าจับตามอง ด้วยศักยภาพการเติบโตที่โดดเด่น สะท้อนให้เห็นผ่านมูลค่าอุตสาหกรรมซึ่งคาดว่าจะขยายตัวอย่างรวดเร็ว จาก 1.38 พันล้านดอลลาร์สหรัฐในปี 2566 เป็น 4.29 พันล้านดอลลาร์สหรัฐภายในปี 2575 หรือคิดเป็นอัตราการเติบโตเฉลี่ยต่อปี (CAGR) 15.2%

Audio AI ถือเป็นเทคโนโลยีที่เกิดขึ้นจากการพัฒนาของ Deep Learning และความสามารถในการประมวลผลของคอมพิวเตอร์ ทำให้มีความสามารถในการรับรู้และประมวลผลสัญญาณเสียงได้คล้ายกับระบบการได้ยินของมนุษย์ โดยอาศัยการทำงานผ่านกระบวนการสำคัญ 4 ขั้นตอน เริ่มต้นจากการแปลงสัญญาณเสียงอนาล็อกให้เป็นข้อมูลดิจิทัล จากนั้นจึงทำการวิเคราะห์ลักษณะของเสียง เช่น ความถี่ ความดัง จังหวะ โทนเสียง รวมถึงองค์ประกอบของเสียงอื่น ๆ อาทิ เสียงพูด เสียงรบกวน โดยใช้เทคนิคการประมวลผลขั้นสูงเพื่อเรียนรู้ลักษณะเฉพาะของเสียงที่แตกต่างกัน ข้อมูลที่ได้จะถูกป้อนเข้าสู่โมเดลเพื่อนำไปวิเคราะห์ทำความเข้าใจรูปแบบและความสัมพันธ์ของเสียง ก่อนแปลงเป็นผลลัพธ์ในรูปแบบที่ต้องการ เช่น ข้อความ คำสั่ง หรือเสียงสังเคราะห์ และสามารถโต้ตอบกับผู้ใช้แบบ Real-time ได้อย่างมีประสิทธิภาพ ซึ่งเทคโนโลยีเหล่านี้ไม่เพียงแต่เปลี่ยนแปลงวิธีการที่เราใช้สื่อสารและโต้ตอบกับอุปกรณ์อิเล็กทรอนิกส์เท่านั้น แต่ยังมีศักยภาพที่จะนำไปประยุกต์ใช้ในหลากหลายอุตสาหกรรม

โดยอุตสาหกรรมโลจิสติกส์นับเป็นหนึ่งในภาคธุรกิจที่ได้รับประโยชน์จากการพัฒนาของ Audio AI โดยเฉพาะในด้านการทำ Predictive Maintenance ที่ช่วยให้สามารถตรวจจับความผิดปกติของเครื่องจักรผ่านการวิเคราะห์เสียง เพื่อป้องกันการเกิดความเสียหายรุนแรงและลดการหยุดชะงักในกระบวนการผลิต สำหรับในส่วนของการจัดการคลังสินค้าเทคโนโลยีนี้จะช่วยเพิ่มประสิทธิภาพการตรวจสอบให้แม่นยำมากยิ่งขึ้น เช่น เสียงของระบบสายพานลำเลียงเพื่อค้นหาจุดชำรุด อีกทั้งยังสามารถช่วยในด้านการขนส่งด้วยระบบ Smart Fatigue Detection หรือระบบที่ใช้ Audio AI ในการวิเคราะห์เสียงผู้ขับขี่เพื่อตรวจจับความเหนื่อยล้าและแจ้งเตือนเมื่อควรหยุดพัก พร้อมกับระบบแปลภาษาผ่านเสียงแบบ  Real-time ที่ช่วยเพิ่มประสิทธิภาพการสื่อสารระหว่างการขับขี่ ส่งผลให้การขับขี่มีความปลอดภัยขึ้นและลดความเสี่ยงในการเกิดอุบัติเหตุ

แม้ Audio AI จะมีศักยภาพสูงในการปฏิวัติการทำงาน แต่การนำมาใช้ในสถานการณ์จริงยังต้องเผชิญกับความท้าทายหลายประการ โดยเฉพาะความซับซ้อนของเสียงที่ระบบต้องแยกแยะสัญญาณเสียงท่ามกลางเสียงรบกวนต่าง ๆ เช่น เครื่องจักร การจราจร หรือเสียงมนุษย์ที่ปะปนร่วมกันอยู่ นอกจากนี้ ความหลากหลายของข้อมูลเสียง ทั้งในด้านคุณภาพ รูปแบบ และมาตรฐาน ยังสร้างความท้าทายในการพัฒนาโมเดลให้สามารถปรับใช้ได้อย่างมีประสิทธิภาพในทุกสถานการณ์ ท้ายที่สุด ประเด็นด้านความเป็นส่วนตัวและการปฏิบัติตามกฎหมายคุ้มครองข้อมูลส่วนบุคคลก็ถือเป็นอีกหนึ่งความท้าทายด้วยเช่นกัน

อย่างไรก็ตาม Audio AI ยังคงเป็นเทคโนโลยีที่มีศักยภาพในการปฏิวัติอุตสาหกรรมโลจิสติกส์และอีกหลากหลายอุตสาหกรรม ด้วยความสามารถในการช่วยเพิ่มประสิทธิภาพการทำงาน การลดความเสียหายที่อาจเกิดขึ้นและการยกระดับมาตรฐานด้านความปลอดภัย ซึ่งการผสานเทคโนโลยีนี้เข้ากับระบบที่มีอยู่เดิมจะพัฒนาระบบอัตโนมัติให้ชาญฉลาดยิ่งขึ้น เพื่อให้พร้อมรับมือกับสถานการณ์ที่มักเปลี่ยนแปลงอย่างรวดเร็วได้ ฉะนั้น ผู้ประกอบการที่ติดตาม เข้าใจ และเล็งเห็นศักยภาพของเทคโนโลยีนี้จะสามารถคว้าโอกาสทางธุรกิจใหม่ๆ และนำพาองค์กรก้าวสู่ความสำเร็จในยุคดิจิทัลได้อย่างมั่นคง