Alibaba ได้ส่งเสียงท้าทายยักษ์ใหญ่เทคโนโลยีสหรัฐฯ ด้วยการเปิดตัว Qwen3-Omni โมเดล AI รูปแบบใหม่ที่รองรับการประมวลผลหลายรูปแบบทั้งข้อความ, ภาพ, เสียง, และวิดีโอ พร้อมให้ใช้งานแบบโอเพนซอร์สภายใต้ลิขสิทธิ์ Apache 2.0 ซึ่งทำให้มันเป็นทางเลือกที่ดีสำหรับองค์กรที่ต้องการใช้ AI แบบไม่เสียค่าใช้จ่ายในการปรับใช้แบบกว้างขวาง
Qwen3-Omni ใช้สถาปัตยกรรม Thinker-Talker โดยแบ่งงานออกเป็นสองส่วน: Thinker รับผิดชอบในการสร้างข้อความ ขณะที่ Talker สร้างเสียงพูด โดยรับข้อมูลจาก Thinker เพื่อลดการหน่วงเวลาในการสตรีมเสียง โมเดลนี้ยังประสบความสำเร็จในด้านการประมวลผลเสียง ซึ่งสร้างความประทับใจให้กับนักวิเคราะห์ว่า องค์กรต่างๆ อาจได้พบกับประสิทธิภาพการทำงานที่เหนือกว่าโมเดลที่ไม่เปิดเผยซอร์สโค้ดอย่าง Gemini 2.5 Pro หรือ GPT-4o-Transcribe
การเปิดตัว Qwen3-Omni ไม่เพียงแต่จะเสริมสร้างตำแหน่งของ Alibaba ในตลาด AI แบบโอเพนซอร์ส แต่ยังสามารถขยายเครือข่ายพันธมิตรทั่วโลกได้อีกด้วย นักวิเคราะห์ระบุว่าการเปิดให้ Qwen3-Omni ใช้งานภายใต้ลิขสิทธิ์ที่อนุญาตสามารถช่วยลดการล็อกผู้ขายและทำให้การทดลองและปรับแต่งโมเดลง่ายขึ้น
ทั้งนี้ Alibaba Cloud มีประวัติในการปล่อยโมเดลโอเพนซอร์สตั้งแต่ต้น และ Qwen ได้มีการดาวน์โหลดมากกว่า 400 ล้านครั้งในทั่วโลก ขณะนี้มีนักพัฒนามากกว่า 140,000 รายที่สร้างโมเดลใหม่จาก Qwen บนแพลตฟอร์มดังกล่าว
หาก Qwen3-Omni ทำผลงานได้ตามที่คาดหวัง มันอาจเป็นตัวเร่งให้การเปลี่ยนแปลงกลยุทธ์ AI ในองค์กรเร็วขึ้น โดยแนวโน้มหนึ่งจะเห็นองค์กรหันมาใช้งาน AI หลายโมเดลพร้อมกัน สลับระหว่างโมเดลเปิดและที่เป็นกรรมสิทธิ์ เพื่อให้เหมาะสมกับความต้องการ และมีการลงทุนเพิ่มในโครงสร้างพื้นฐานและความปลอดภัยเพื่อรองรับการใช้งาน AI ที่มีประสิทธิภาพ
อย่างไรก็ตาม ผู้เชี่ยวชาญแนะนำว่าการพัฒนาเทคโนโลยีควรมีการควบคุมเกี่ยวกับความปลอดภัยและการปฏิบัติตามกฎหมาย โดยเฉพาะเมื่อเทคโนโลยีเหล่านี้มีความสามารถในการจัดการข้อมูลในหลายรูปแบบ
Qwen3-Omni อาจเป็นแรงผลักดันให้เกิดการพัฒนาโมเดลที่หลากหลายมากขึ้นในปีหน้า ซึ่งจะช่วยให้การนำ AI ไปใช้ในธุรกิจมีความคล่องตัวและมีประสิทธิภาพได้มากขึ้น