احتمالا شما هم اسم deepfake یه گوشتان خورده! هاون فناوری دردسرساز که بسیاری از کشور ها استفاده از آن را محدود کردند. اما اصلا deepfake چیست؟! در این مقاله خواهیم فهمید این فناوری دردسرساز دقیقا چیست و به چه کاربرد هایی دارد!
deepfake یکی از انواع هوش مصنوعی میباشد که برای تولید و ایجاد تصاویر و حتی فایل های صوتی غیر واقعی و جعلی استفاده میشود. در واقع این اصطلاح هم فناوری و هم محتوای ساخته شده توسط آن را شامل میشود. بزرگ ترین خطری که دیپ فیک ایجاد میکند، انتشار اطلاعات غلط است که ظاهرا از منابع معتبر و قابل اعتماد آمده است. به عنوان مثال سال 2022 ویدیویی از ولادیمر زلنسکی، رئیس جمهور اوکراین منتشر شد که در آن از سربازانش میخواهد تسلیم شوند. با وجود اینکه دیپ فیک تهدیدی جدی محسوب میشود، در مواردی میتواند مفید واقع شود مانند صداگذاری بازی های ویدیویی.
فهرست:
- deepfake چگونه کار میکند؟
- رویکرد های خاص برای ایجاد deepfake
- فناوری های مورد نیاز برای توسعه deepfake
- آیا دیپ فیک قانونی است؟
- راه های تشخیص دیپ فیک
________________________________________________________________________________________________________________
Deepfake چگونه کار میکند؟
دیپ فیک از دو الگوریتم تحت عنوان تولید کننده( generator) و متمایز کننده( discriminator) استفاده میکند. الگوریتم تولید کننده مجموعه دادهی آموزشی را بر اساس خروجی مورد نظر ایجاد میکند و محتوای جعلی اولیه را ایجاد میکند. این در حالی است که الگوریتم متمایز کننده، وظیفهی تشخیص واقعی و جعلی بودن محتوای ساخته شده را به عهده دارد. این فرایند تکرار میشود و تولید کننده را در ایجاد محتوای واقعی، یاری میبخشد.
deepfake از دو روش برای ایجاد ویدیو های جعلی استفاده میکند. یکی از روش ها، استفاده از منبع ویدیویی اصلی است. روش دیگر، تعویض چهرهی فرد با دیگر افراد است.
رویکرد های خاص برای ایجاد deepfake:
- ویدیوی منبع: هنگام استفاده از یک ویدیوی منبع، یک رمزگذار خودکار مبتنی بر شبکه های عصبی، محتوا را برای درک ویژگی های هدف مانند حالات چهره و زبان بدن، تجزیه و تحلیل میکند. سپس این ویژگی ها را در ویدیوی اصلی قرار میدهد.
- دیپ فیک ها صوتی: در این رویکرد، دیپ فیک صدای شخصی را شبیه سازی میکند. در واقع مدلی بر اساس الگو های صوتی ایجاد میشود که از آن برای ایجاد صدای مورد نظر سازنده، استفاده میشود.
- همگام سازی لب با صدا: در این رویکرد، دیپ فیک صدای ضبط شده را روی ویدیو میگذارد. این گونه است که به نظر میرسد شخصی که در ویدیو است در حال گفتن کلمات ضبط شده میباشد.
فناوری های مورد نیاز برای توسعه deepfake:
- شبکه های عصبی کانولوشنال( CNN): شبکه های عصبی کانولوشنال، الگو ها را در داده های بصری تحلیل میکند. همچنین آن ها برای تشخیص چهره و ردیابی حرکات استفاده میشوند.
- رمزگذار های خودکار( autoencoder): رمزگذار های خودکار، یکی از فناوری های شبکهی عصبی است که ویژگی های مرتبط مثل حالات چهره و حرکات بدن را شناسایی کرده سپس این ویژگی ها را روی ویدیوی منبع میگذارد.
- پردازش زبان طبیعی(NLP): برای ایجاد صدای دیپ فیک استفاده میشود. الگوریتم های NLP، ویژگی های گفتار را تحلیل کرده سپس متن اصلی را با استفاده از آن ویژگی ها تولید میکنند.
آیا دیپ فیک قانونی است؟
دیپ فیک ها علیرغم تهدید های جدی که میتوانند ایجاد کنند، اغلب قانونی هستند. تنها در صورتی دیپ فیک غیر قانونی است که قوانین موجود در فضای مجازی را نقض کند. با این وجود، سه ایالت تگزاس، ویرجینیا و کالیفرنیا در آمریکا قوانینی در خصوص دیپ فیک وضع کرده اند. عدم وجود قوانین علیه دیپ فیک به این دلیل است که بسیاری از مردم از فناوری های جدید، کاربرد آن ها و خطراتشان بی اطلاع هستند.
راه های تشخیص دیپ فیک:
روش های مختلفی برای تشخیص دیپ فیک وجود دارد. موارد زیر نشانه های احتمالی برای وجود محتوای دیپ فیک است:
- پوزیشن و وضعیت غیر معمول صورت
- حرکت غیر طبیعی صورت یا بدن
- رنگ آمیزی غیر طبیعی
- صدای ناسازگار
- افرادی که در ویدیو پلک نمیزنند
همچنین در دیپ فیک های متنی چند روش وجود دارد از قبیل:
- غلط املایی
- آدرس ایمیل منبع مشکوک
- عبارتی که با فرستنده فرضی مطابقت ندارد
بیشتر بدانید: همه چیز درباره ابزار caption و کاربرد آن