امروز مدل SDXL 0.9 از استارتاپ Stability منتشر شد. این مدل پیشرفتهترین مدل در مجموعه مدلهای Diffusion مولد متن به تصویر است. بعد از اینکه نسخه بتا Stable Diffusion XL منتشر شد، حالا نوبت مدل SDXL 0.9 است تا چشمها را به سمت خود بکشاند.
این مدل جزئیات و ترکیب بندی را نسبت به مدلهای دیگر Stability بهتر نشان میدهد. این مدل توانایی فوقالعادهای در طراحی صحنه فیلم، موسیقیریال و ویدیوهای آموزشی دارد. برخی از نمونههای آزمایشی را در عکسهای زیر میبینید.
به ترتیب هرکدام از تصاویر سمت راست با نسخه SDXL 0.9 و تصاویر سمت چپ با SDXL ساخته شدند. پرامپتهای این تصاویر نیز از سمت راست به ترتیب چنین است.
الف) فضاییهای زیبا در بین ما در لاس وگاس قدم میزنند. ب) یک گرگ در پارک کلی یوسمیتی، عکاسی مستند ج) دستی خوش فرم که یک قهوه در دست دارد، عکس اینستاگرامی که در ساحل سپیده دم سر زده است و سرد است. د) منظره زیبای طبیعت در بطری شیشهای، بطری بنفش کهکشانی. ه) رئالیسم جادویی و انگشتان خوش فرم که تکه از شیشه را با شکل قلب رو به خورشید گرفته است.
این مدل بیشترین تعداد پارامتر را در مدلهای مشابه اوپن سورس دارد. مدل SDXL 0.9 دو مرحلهای است و مدل مرحله دوم روی جزئیات دقیق تصویر خروجی تمرکز دارد. سیستم مورد نیاز برای اجرای SDXL 0.9، یک ویندوز 10 یا 11 یا یک سیستم عامل لینوکس است که 16 گیگابایت رم دارد. کارت گرافیک GeForce RTX 20 انویدیا استاندارد یا بالاتر نیز برای اجرای آن ضروری است. هشت گیگابایت رام نیز نیاز است. کاربران لینوکس نیز میتوانند از کارت AMD سازگار با 16 گیگابایت ویرام استفاده کنند.
این مدل از امروز در هاگینگ فیس و ClipDrop در دسترس است. API آن به زودی عرضه میشود.