تمام حیات روی زمین با چهار حرف DNA ظاهر میشود. یک هوش مصنوعی از آن حروف استفاده کرد تا ژنومهای کاملاً جدید را از ابتدا تصور کند.
این هوش مصنوعی که Evo نام دارد، از مدلهای زبان بزرگ یا LLM الهام میگیرد، مانند رباتهای گفتگوی محبوب ChatGPT OpenAI و Claude Anthropic. این مدلها به دلیل تواناییشان در ایجاد پاسخهای انسانمانند، دنیا را بهشدت تحت تأثیر قرار دادهاند. از کارهای ساده، مانند تعریف یک کلمه مبهم، خلاصه کردن مقالات علمی LLMها وارد زندگی روزمره ما شدهاند.
تیمی از دانشگاه استنفورد و موسسه آرک این نظریه را مورد آزمایش قرار دادند. به جای آموزش Evo بر روی محتوای خراشیده شده از اینترنت، آنها هوش مصنوعی را بر روی تقریباً سه میلیون ژنوم که بالغ بر میلیاردها خط کد ژنتیکی از میکروبهای مختلف و ویروسهای آلوده کننده باکتری هستند، آموزش دادند.
Evo در پیشبینی اینکه چگونه جهش در مواد ژنتیکی DNA و RNA میتواند عملکرد را تغییر دهد، بهتر از مدلهای قبلی هوش مصنوعی بود. هوش مصنوعی همچنین خلاق شد و چندین مؤلفه جدید را برای ابزار ویرایش ژن، CRISPR در نظر گرفت. حتی جالبتر اینکه هوش مصنوعی ژنومی بیش از یک مگاباز طولانی تولید کرد که تقریباً به اندازه برخی از ژنومهای باکتری میباشد.
به طور کلی، Evo نشان دهنده یک مدل پایه ژنومی است. با یادگیری واژگان ژنومی، الگوریتمهایی مانند Evo میتوانند به دانشمندان در کاوش تکامل، رمزگشایی عملکرد درونی سلولهای ما، مقابله با اسرار بیولوژیکی و زیستشناسی مصنوعی با طراحی زیستمولکولهای دشوار جدید کمک کنند.
بیشتر بخوانید: الگوریتم ژنتیک چیست؟ بررسی نقش این الگوریتم در هوش مصنوعی
ژنومهای جدید در راه است!
در مقایسه با 26 حرف الفبای انگلیسی، DNA فقط دارای A، T، C و G است. این حروف مخفف چهار مولکول آدنین (A)، تیمین (T)، سیتوزین (C) و گوانین (G) هستند.
زبان انسان به صورت کلمات، عبارات، و برای انتقال اطلاعات به جملات نشانه گذاری میشود. در مقابل، DNA پیوستهتر است و اجزای ژنتیکی سخت هستند. حروف DNA حاوی «رشتههای موازی اطلاعات» است.
حروف DNA حاوی اطلاعات زیادی در مورد پیچیدگی ژنوم است. و هر تغییری میتواند عملکرد پروتئین را به خطر بیندازد و در نتیجه بیماری ژنتیکی و سایر مشکلات سلامتی را به همراه داشته باشد. این امر باعث میشود که هوش مصنوعی در وضوح تک حروف DNA کار کند.
اما برای هوش مصنوعی تا حدی به دلیل هزینههای محاسباتی بالا دشوار است که رشتههای مختلف اطلاعات را در مقیاس بزرگ تنها با تجزیه و تحلیل حروف ژنتیکی به دست آورد. تلاشهای قبلی، حروف DNA را در بلوکهایی «بستهبندی» کردهاند که کمی شبیه ساختن کلمات مصنوعی است.
محققان سپس هوش مصنوعی را بر روی پایگاه دادهای از نزدیک به سه میلیون ژنوم از باکتریها و ویروسهایی که باکتریها معروف به فاژها را درگیر میکنند، آموزش دادند. همچنین از پلاسمیدها، تکههای دایرهای از DNA که اغلب در باکتریها یافت میشوند که اطلاعات ژنتیکی را بین میکروبها منتقل میکنند، تکامل را تحریک میکنند و مقاومت آنتیبیوتیکی را تداوم میبخشند، آموخته است.
هنوز مشخص نیست که آیا Evo میتواند ژنومهای بسیار طولانیتری مانند ژنومهای گیاهان، حیوانات یا انسانها را رمزگشایی یا تولید کند. تئودوریس نوشت، اگر این مدل بتواند مقیاسپذیر باشد، «پیامدهای تشخیصی و درمانی فوقالعادهای برای بیماری خواهد داشت».