در ماههای اخیر سیستمهای هوش مصنوعی مختص تبدیل متن به تصاویر، در سرخط خبرها قرار گرفتهاند. حالا در این میان، محققان هوش مصنوعی شاغل در شرکت متا، از یک سیستم هوشمند برای تبدیل متن به ویدیو رونمایی کردهاند. این سیستم Make-A-Video نام دارد و با دریافت توصیفی از صحنه، میتواند ویدیوی کوتاهی در رابطه با متن نوشته شده ایجاد کند. مصنوعی بودن این ویدیوها به وضوح مشخص است اما در هر صورت همین سیستم از پیشرفت فوقالعاده در این حوزه خبر میدهد.
مارک زاکربرگ، مدیرعامل متا، در پست منتشر شده این سیستم را یک «پیشرفت حیرتانگیز» توصیف کرده و گفته:«تولید ویدیو توسط هوش مصنوعی بسیار سختتر از تصاویر است زیرا در کنار خلق هر پیکسل، سیستم موردنظر باید روند تغییر پیکسل را هم پیشبینی کند.»
کلیپها طولانیتر از ۵ ثانیه نیستند و صدا ندارند ولی در کل طیف وسیعی از درخواستها را در بر میگیرند. در ادامهی این مطلب میتوانید تعدادی از کلیپهایی که از طرف متا منتشر شده را ببینید. با توجه به اینکه خارج از متا هنوز کسی به این سیستم دسترسی ندارد، احتمالا بهترین کلیپها از طرف این شرکت انتخاب شدهاند.
همانطور که گفتیم با وجود اینکه در حال حاضر این ویدیوها جذابیت چندانی ندارند، اما با توجه به پیشرفت سریع سیستمهای هوش مصنوعی مربوط به ایجاد تصاویر، بدون شک در آیندهی نزدیک سیستمهای ایجاد ویدیوها هم به طور قابل توجهی بهبود پیدا میکنند. متا در پست منتشر شده نوشته که چنین سیستمی برای هنرمندان کاربردهای زیادی خواهد داشت. اما در این میان، این نوع سیستمها چشمانداز نگرانکنندهای هم ترسیم میکنند. به عنوان مثال احتمالا برای تبلیغات و ویدیوهای جعلی هم در آینده مورد استفاده قرار خواهند گرفت.
باید خاطرنشان کنیم متا در زمینهی توسعهی سیستمهای هوش مصنوعی مربوط به این حوزه تنها نیست. به عنوان مثال، ماهها قبل تعدادی از محققان چینی از مدل هوش مصنوعی برای تبدیل متن به ویدیو رونمایی کردند. در مقالهی منتشر شده از طرف متا، به چالشهای مربوط به ایجاد ویدیوهای طولانیتر از ۵ ثانیه، ویدیوهای مبتنی بر صحنههای متنوع و رزولوشن بالاتر هم اشاره شده است.
منبع: The Verge