Microsoft เปิดตัว “VALL-E” AI ใหม่ ที่อ้างว่า “เลียนเสียงเราได้” จากตัวอย่างเสียง แค่ 3 วินาที

ด้วยกระแสความโด่งดังของเทคโนโลยี AI ในปัจจุบัน หลายๆ...

17 January 2023 One Min Read

565 Views

ด้วยกระแสความโด่งดังของเทคโนโลยี AI ในปัจจุบัน หลายๆ คนก็คงจะรู้สึกกันว่า AI นี่มันทำได้ทุกอย่างเลยใช่ไหม เพราะยิ่งเวลาผ่านไปความสามารถของมันก็ดูจะยิ่งน่าจับตาขึ้นเรื่อยๆ เลย

อย่างล่าสุดนี้เอง ทางบริษัทชื่อดังอย่าง Microsoft ก็เพิ่งจะออกมาเปิดตัว AI ตัวใหม่ ที่จะเลียนแบบเสียงของเราได้ จากตัวอย่างเสียงแค่ 3 วินาทีเท่านั้น

AI ตัวใหม่นี้มีคือว่า VALL-E โดนมันเป็น AI แปลงข้อความเป็นคำพูด (Text-to-speech) ซึ่งได้รับการพัฒนาให้เรียนรู้ตัวอย่างเสียงจากกลุ่มเสียงตัวอย่างที่ไม่ใหญ่มากได้

ก่อนที่จะนำเสียงดังกล่าวไปวิเคราะห์ เพื่อเลียนเสียงให้สมจริงที่สุด และใช้มันอ่านข้อความที่เราระบุให้มันอีกที

โดยทางผู้พัฒนาอ้างว่า VALL-E จะมาพร้อมการใช้งานที่หลากหลาย ซึ่งร่วมถึงการทำงานร่วมกับ AI อย่าง GPT-3 ของ OpenAI เพื่อสร้างบทสนทนาหรือแม้แต่เนื้อหายาวๆ ประกอบเสียงพากย์ ที่สมจริงอย่างไม่น่าเชื่อเลย

แต่แม้ระบบนี้จะฟังดูมีศักยภาพมากก็ตาม VALL-E ก็มาพร้อมกับเสียงวิพากษ์วิจารณ์เรื่องความเหมาะสมทางจริยธรรม และปัญหาความปลอดภัยที่อาจจะตามมาเช่นกัน

เพราะในทางทฤษฎีมันไม่ใช่เรื่องยากเลยที่ผู้ไม่หวังดีจะนำตัวอย่างเสียงของคนบางคน ไปสวมรอยคนที่พวกเขาต้องการ สร้างข่าวปลอมหรือความเข้าใจผิด

ซึ่งทาง Microsoft ก็ยืนยันเช่นกันว่าพวกเขาไม่ได้เพิกเฉยต่อความกังวลนี้ (เป็นเหตุผลที่พวกเขาไม่เปิดเผยโค้ดของระบบดังกล่าว) และพวกเขาก็จะมีการทำระบบเพื่อรับมือกับปัญหาที่อาจจะเกิดขึ้นต่อไปด้วย

ที่มา

arstechnica.com/information-technology/2023/01/microsofts-new-ai-can-simulate-anyones-voice-with-3-seconds-of-audio/

futurism.com/the-byte/new-microsoft-ai-clone-your-voice

อ่านอะไรดี?

ติดตามแคทดั๊มบ์