نایل موهان، مدیرعامل YouTube، ادعا کرد که شرکت پیشروی Open AI از دادههای YouTube و ویدیوهای آن برای آموزش مدل خود استفاده کرده است. موهان مدعی است که این کار برخلاف قوانین و سیاستهای یوتیوب و حریم خصوصی و قانون کپی رایت است. همین موضوع هم واکنشهایی دربر داشت.
یکی از اعضای هیئت مدیره شرکت Open AI این خبر را تکذیب کرد و گفت چنین اتفاقی رخ نداده و اگر هم رخ داده از آن خبر ندارد.
امروز نیویورک تایمز در خبری دست به افشاگری زد. طبق اخبار این شرکت قوانین را علنی نقض کرده است اما نه برای آموزش مدل جدیدش Sora!
شرکت Open AI با میلیونها ساعت ویدیوی یوتیوب به دو مدل خود یعنی Whisper و Chat GPT-4 آموزش میداده است.
واکنش Open AI به این ادعا درباره ویدیوهای YouTube
سم آلتمن میگوید از اطلاعات عمومی و در دسترس عموم برای آموزش مدلشان استفاده میکنند. اگر هم اطلاعاتی عمومی نباشد نیمهعمومی است و مشکلی ایجاد نمیکند. در واقع استفاده نکردن از این اطلاعات کمی ناعادلانه هم هست.
حالا گوگل درمورد دادههای YouTube و استفاده از آنها میگوید که چه دانلود و چه استفاده و جمع آوری آنها برخلاف سیاستهای تعریفی است. این شرکت باید درباره چنین کاری توضیحات کاملی ارائه کند.
با توجه به شکایتهای گستردهای که از Open AI میشود بعید نیست که ماجرای این شرکت و گوگل هم به شکایت برسد. تنها در صورتی که این شرکت مدارکی ارائه کند که اطلاعات به دست آمده را تکذیب کند از این ماجرا سربلند بیرون میآید.