บริษัท Lightricks จากอิสราเอลได้เปิดตัวโมเดลการแปลงข้อความเป็นวิดีโอที่ชื่อว่า LTX Video ซึ่งสามารถผลิตวิดีโอคุณภาพสูงได้ภายในเวลาประมวลผลเพียง 4 วินาทีสำหรับวิดีโอที่มีความยาว 5 วินาที จุดเด่นที่สำคัญคือ โมเดลนี้สามารถทำงานบนคอมพิวเตอร์ทั่วไปที่มีการ์ดวิดีโอคุณภาพสูง และเป็น open sources ที่นักพัฒนาสามารถเข้าถึงและปรับปรุงได้
“เราต้องการดึงดูดผู้ที่ชื่นชอบ AI ที่ทำงานกับคอมพิวเตอร์ที่บ้านด้วย” ดร. Zeev Farbman ผู้ก่อตั้งและซีอีโอของบริษัทกล่าวกับ Calcalist
ในเดือนกุมภาพันธ์ที่ผ่านมา OpenAI ได้เปิดตัวโมเดล Sora ซึ่งเป็นการแปลงข้อความเป็นวิดีโอที่ใช้ปัญญาประดิษฐ์ ซึ่งนำมาซึ่งผลลัพธ์ที่น่าทึ่งและสามารถกระทบต่ออุตสาหกรรมหลากหลาย ตั้งแต่วงการฮอลลีวูดไปจนถึงธุรกิจต่างๆ ที่ใช้การสร้างเนื้อหาวิดีโอ
LTX Video นับเป็นโมเดลแปลงข้อความเป็นวิดีโอรุ่นแรกที่พัฒนาในอิสราเอล โดยมีความสามารถพิเศษที่แตกต่างจากคู่แข่ง นั่นคือ การผลิตวิดีโอที่รวดเร็วและสามารถทำงานได้บนฮาร์ดแวร์ระดับผู้บริโภค
ความสามารถและความพิเศษของ LTX Video
Yaron Inger ผู้ร่วมก่อตั้งและ CTO ของ Lightricks กล่าวว่า “โมเดลนี้เป็นตัวแทนของยุคใหม่ของการสร้างวิดีโอด้วยปัญญาประดิษฐ์ ด้วยการออกแบบโมเดลการเข้ารหัสวิดีโอที่ทรงพลังที่บีบอัดวิดีโอให้มีขนาดเล็กมาก เราจึงสามารถผลิตวิดีโอได้อย่างรวดเร็วและมีความสม่ำเสมอของการเคลื่อนไหวและความต่อเนื่องของภาพที่ดี”
วิดีโอที่สร้างโดย LTX Video นั้นมีความสมจริงและน่าทึ่ง ตัวอย่างเช่น มีภาพของผู้หญิงผิวสีในสำนักงาน ชายในชุดเกราะมองไปไกล และฉากต่างๆ เช่น กระรอกบนทางเท้า และฝูงช้างเดินในป่า แม้ว่าวิดีโอจะมีความยาวเพียงห้าวินาที แต่ภาพที่ซับซ้อนและสมจริงนั้นทำให้แยกแยะได้ยากว่าวิดีโอเหล่านี้สร้างขึ้นด้วย AI หรือไม่
การใช้งานและข้อจำกัด
ผู้ใช้สามารถอัปโหลดภาพนิ่งเพื่อใช้เป็นจุดเริ่มต้นในการสร้างวิดีโอได้ เช่น การอัปโหลดภาพของ Tyrion Lannister จาก Game of Thrones และสร้างวิดีโอที่ดูสมจริงของตัวละครนี้ แม้ว่าจะไม่เคยถ่ายทำมาก่อนก็ตาม
ปัจจุบัน LTX Video จำกัดความยาวของวิดีโอที่ 5 วินาที Farbman อธิบายว่า ระบบสามารถสร้างเฟรมได้ระหว่าง 41 ถึง 257 เฟรม ถ้าวิดีโอมีความยาวมากกว่านี้ ผลลัพธ์อาจมีข้อผิดพลาดเพิ่มขึ้น และความซับซ้อนของฉากจะมีผลต่อการสะสมข้อผิดพลาด
เวลาตอบสนองที่รวดเร็วและการเข้าถึง
หนึ่งในข้อได้เปรียบหลักของ LTX Video คือเวลาตอบสนองที่รวดเร็ว ทำให้สามารถทำงานแบบโต้ตอบและเปลี่ยนแปลงได้อย่างรวดเร็ว Farbman กล่าว “นี่คือสิ่งที่ไม่สามารถทำได้ด้วยโมเดลอื่น ถ้าคุณต้องรอห้านาทีหลังจากแต่ละคำสั่ง แสดงว่าไม่เหมาะสำหรับการทำงานปกติ ในโมเดลของเรา การดูวิดีโอต้องใช้เวลานานกว่าการสร้างวิดีโอ”
Lightricks ยังเน้นถึงการเข้าถึงโมเดล opensources โดยวิพากษ์วิจารณ์การจำกัดการเข้าถึงของบริษัทอื่นๆ เช่น OpenAI ซึ่งได้จำกัดการเข้าถึงโมเดลที่ดีที่สุดของตน Farbman กล่าว “เมื่อ OpenAI เปิดเผยโมเดลของตนในปี 2022 มีช่วงเวลาแห่งความสุขที่ AI จะเปิดกว้างและเข้าถึงได้สำหรับทุกคน แต่ในทางปฏิบัติ OpenAI ได้ใช้ประโยชน์จากข้อได้เปรียบเชิงกลยุทธ์และจำกัดการเข้าถึง ปัจจุบัน โมเดลที่ดีที่สุดในตลาดเป็นแบบปิด”
ในอนาคต Lightricks มีแผนที่จะเปิดตัวโมเดลที่ใหญ่กว่าและดีกว่าเพื่อปรับปรุงผลลัพธ์ของโมเดลที่มีอยู่ โดยไม่ต้องการฮาร์ดแวร์ที่ซับซ้อนในการใช้งาน
สรุป
การเปิดตัว LTX Video ของ Lightricks ไม่เพียงแต่ท้าทายยักษ์ใหญ่ในวงการ AI แต่ยังเปิดโอกาสใหม่ๆ ในการสร้างเนื้อหาวิดีโอด้วยความเร็วและคุณภาพที่สูง ทั้งยังเป็นโอเพ่นซอร์สที่นักพัฒนาทุกคนสามารถเข้าถึงและพัฒนาต่อได้ในอนาคต
ที่มา : calcalistech