واقعی شدن ویدئوها با هوش مصنوعی Lumiere و انتشار کلیپ های پنج ثانیه ای با این مدل نشان می دهند که چگونه ابزارهای هوش مصنوعی می توانند ویدئوها را واقعی تر نشان دهند. Google Lumiere از مدل انتشار جدیدی به نام Space-Time-U-Net یا STUNet استفاده می کند. این مدل تشخیص می دهد اشیا در یک ویدیو کجا هستند و چگونه به طور همزمان حرکت می کند.
با این روش به جای کنار هم قرار دادن فریم های ثابت کوچک تر، ویدیو طی یک فرآیند ایجاد می شود. تا به حال ویدیوهایی که توسط Google Lumiere طراحی می شوند به نظر مصنوعی و غیر واقعی هستند. به خصوص اگر از نزدیک به اجزای ویدئو نگاه کنید.
برای آزمایش، ویدیوی معرفی Lumiere را برای یک ویرایشگر ویدیو حرفه ای فرستادند. او به این نکته اشاره کرد که شما می توانید به وضوح بگویید این ویدئو کاملا واقعی نیست. مدل های دیگر، ویدیوها را از فریم های کلیدی تولید و در جایی که حرکت قبلاً اتفاق می افتد به هم می چسبانند. در حالی که STUNet به Lumiere این امکان را می دهد تا بر اساس جایی که محتوای تولید شد در یک زمان معین، ویدیو بر روی حرکت تمرکز کند.
Lumiere هنوز برای آزمایش در دسترس نیست. اما توانایی گوگل برای توسعه یک پلتفرم ویدئویی هوش مصنوعی را نشان می دهد که قابل مقایسه با تولیدکننده های ویدئوی هوش مصنوعی معمولی مانند Runway و Pika کمی بهتر است.