ด้วยกระแสความโด่งดังของเทคโนโลยี AI ในปัจจุบัน หลายๆ คนก็คงจะรู้สึกกันว่า AI นี่มันทำได้ทุกอย่างเลยใช่ไหม เพราะยิ่งเวลาผ่านไปความสามารถของมันก็ดูจะยิ่งน่าจับตาขึ้นเรื่อยๆ เลย
อย่างล่าสุดนี้เอง ทางบริษัทชื่อดังอย่าง Microsoft ก็เพิ่งจะออกมาเปิดตัว AI ตัวใหม่ ที่จะเลียนแบบเสียงของเราได้ จากตัวอย่างเสียงแค่ 3 วินาทีเท่านั้น
AI ตัวใหม่นี้มีคือว่า VALL-E โดนมันเป็น AI แปลงข้อความเป็นคำพูด (Text-to-speech) ซึ่งได้รับการพัฒนาให้เรียนรู้ตัวอย่างเสียงจากกลุ่มเสียงตัวอย่างที่ไม่ใหญ่มากได้
ก่อนที่จะนำเสียงดังกล่าวไปวิเคราะห์ เพื่อเลียนเสียงให้สมจริงที่สุด และใช้มันอ่านข้อความที่เราระบุให้มันอีกที
โดยทางผู้พัฒนาอ้างว่า VALL-E จะมาพร้อมการใช้งานที่หลากหลาย ซึ่งร่วมถึงการทำงานร่วมกับ AI อย่าง GPT-3 ของ OpenAI เพื่อสร้างบทสนทนาหรือแม้แต่เนื้อหายาวๆ ประกอบเสียงพากย์ ที่สมจริงอย่างไม่น่าเชื่อเลย
แต่แม้ระบบนี้จะฟังดูมีศักยภาพมากก็ตาม VALL-E ก็มาพร้อมกับเสียงวิพากษ์วิจารณ์เรื่องความเหมาะสมทางจริยธรรม และปัญหาความปลอดภัยที่อาจจะตามมาเช่นกัน
เพราะในทางทฤษฎีมันไม่ใช่เรื่องยากเลยที่ผู้ไม่หวังดีจะนำตัวอย่างเสียงของคนบางคน ไปสวมรอยคนที่พวกเขาต้องการ สร้างข่าวปลอมหรือความเข้าใจผิด
ซึ่งทาง Microsoft ก็ยืนยันเช่นกันว่าพวกเขาไม่ได้เพิกเฉยต่อความกังวลนี้ (เป็นเหตุผลที่พวกเขาไม่เปิดเผยโค้ดของระบบดังกล่าว) และพวกเขาก็จะมีการทำระบบเพื่อรับมือกับปัญหาที่อาจจะเกิดขึ้นต่อไปด้วย
ที่มา
arstechnica.com/information-technology/2023/01/microsofts-new-ai-can-simulate-anyones-voice-with-3-seconds-of-audio/
futurism.com/the-byte/new-microsoft-ai-clone-your-voice