حذف دیتاست دانمارک از آرشیو Common Crawl

حذف دیتاست دانمارک از آرشیو Common Crawl

رسانه‌های دانمارکی از آرشیو Common Crawl خواستند مقالات آن‌ها را از دیتاست خود حذف کند. این درخواست مربوط به شرکت Open AI و استفاده غیر قانونی آن‌ها از اطلاعات کاربران و ناشران است.

سایت Common Crawl می‌خواهد این درخواست را اجرا کند. دلیل اجرای این درخواست نیز ناتوانی این سایت برای مبارزه قانونی و دادگاهی است. رهبری کمپین شکایت رسانه‌های دانمارکی به دست اتحادیه حقوق دانمارک رهبری می‌شود. این اتحادیه قدرت زیادی دارد و می‌تواند از طریق قانون حقوق رسانه‌ها را پس بگیرد.

سال کذشته نیویورک تایمز نیز از این سایت شکایت کرد. پس از آن از شرکت Open AI بابت استفاده بدون مجوز از اطلاعات آن‌ها شکایت شد. نیویورک تایمز در شکایت خود نوشت دیتای سایت Common Crawl به صورت انبوه در مجموعه دیتای GPT-3 وجود دارد.

این سایت را به طور خاص برای آموزش مدل‌های هوش مصنوعی طراحی نکردند. اما اطلاعات حاکی از این است که منبع بزرگی برای آموزش مدل‌های مختلف من جمله GPT است. این سایت در گگذشته منبعی تحقیقاتی برای کاربران با اعداف مختلف بود. امروزه که نوع کاربری آن تغییر کرده است رسانه‌های دانمارک خواستار حذف دیتاست آن‌ها هستند.

سایت Common Crawl بسیار سریع درخواست نیویورک تایمز و رسانه‌های دانمارکی را پذیرفت. این کار با واکنش‌های مختلفی رو به رو شد. برخی می‌گویند چنین کاری توهین به اینترنت به حساب میایدو اینترنت برای جستجو و دسترسی به داده‌های مختلف است و نباید وب را اینگونه نابود کرد. نظر شما چیست آیا دسترسی به اطلاعات نباید بسته شود؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *