اپل از ماه گذشته تلاش دارد وارد دنیای هوش مصنوعی شود. چند وقت پیش داروین را خرید و الان هم ادعای توسعه نرمافزاری را دارد که بهتر از Chat GPT است. این سیستم جدید Reference Resolution As Language Modeling نام دارد که با نام اختصاری ReaLM شناخته خواهد شد.
این مدل قرار است تمام اطلاعات موجود روی صفحه گوشی مثل پیامها، تصاویر، ویدیوها، صداها و … را بخواند.
کاربر تجربه تعاملی بهتری با مدلی که میتواند این اطلاعات را بخواند دارد. توسعه دهندگان این برنامه اپل میگویند این مدل نسبت به چت جیبیتی 4 و مدلهای مشابه خیلی نتیجه بهتری نشان میدهد. علاوه بر اینها، چون این مدل میتواند به راحتی روی تلفن هوشمند عرضه شود دیگر دردسرهای مدلهای مذکور را نخواهد داشت.
تفاوت ReaLM با رقیبش چیست؟
فرض کنید شما از سیری و چت جیبیتی میپرسید هوا چطور است؟ همزمان هم میخواهید بگوید اطلاعات مربوط به پروازهای مختلف را به شما بدهند. در این حالت هر دوی این مدلها ارور میدهند و از شما اطلاعات بیشتری میخواهند. این مشکل در ReaLM وجود ندارد.
مدل چت جیبیتی 4 با تصاویر واقعی آموزش دیده و میتواند اطلاعات آن را تجزیه تحلیل کند و بخواند. ReaLM اما میتواند اطلاعات روی تصاویر، متنها را بخواند. به عبارت بهتر، این مدل میتواند حتی از روی اسکرینشات کاربران هم اطلاعات را استخراج کند. با توجه به آن اطلاعات به سوالات پاسخ دهد یا حتی میتواند کارهای مختلفی اجرا کند.
هنوز این مدل به طور رسمی منتشر نشده است. احتمال زیاد اواخر امسال اپل از این مدل روی Siri استفاده خواهد کرد. مشخص نیست که آیا این ادعاها صحت دارد یا خیر؟ اما اگر صحیح باشد، توانایی خواندن اطلاعت مختلف از روی اشکرینشاتها یک تجربه جدید و قابل توجه در دنیای هوش مصنوعی خواهد بود.