رسانههای دانمارکی از آرشیو Common Crawl خواستند مقالات آنها را از دیتاست خود حذف کند. این درخواست مربوط به شرکت Open AI و استفاده غیر قانونی آنها از اطلاعات کاربران و ناشران است.
سایت Common Crawl میخواهد این درخواست را اجرا کند. دلیل اجرای این درخواست نیز ناتوانی این سایت برای مبارزه قانونی و دادگاهی است. رهبری کمپین شکایت رسانههای دانمارکی به دست اتحادیه حقوق دانمارک رهبری میشود. این اتحادیه قدرت زیادی دارد و میتواند از طریق قانون حقوق رسانهها را پس بگیرد.
سال کذشته نیویورک تایمز نیز از این سایت شکایت کرد. پس از آن از شرکت Open AI بابت استفاده بدون مجوز از اطلاعات آنها شکایت شد. نیویورک تایمز در شکایت خود نوشت دیتای سایت Common Crawl به صورت انبوه در مجموعه دیتای GPT-3 وجود دارد.
این سایت را به طور خاص برای آموزش مدلهای هوش مصنوعی طراحی نکردند. اما اطلاعات حاکی از این است که منبع بزرگی برای آموزش مدلهای مختلف من جمله GPT است. این سایت در گگذشته منبعی تحقیقاتی برای کاربران با اعداف مختلف بود. امروزه که نوع کاربری آن تغییر کرده است رسانههای دانمارک خواستار حذف دیتاست آنها هستند.
سایت Common Crawl بسیار سریع درخواست نیویورک تایمز و رسانههای دانمارکی را پذیرفت. این کار با واکنشهای مختلفی رو به رو شد. برخی میگویند چنین کاری توهین به اینترنت به حساب میایدو اینترنت برای جستجو و دسترسی به دادههای مختلف است و نباید وب را اینگونه نابود کرد. نظر شما چیست آیا دسترسی به اطلاعات نباید بسته شود؟
بیشتر بدانید: دیتاسنتر چیست و چگونه کار میکند؟