ИИ изобрел белок, на который потребовалось бы 500 миллионов лет эволюции

На модерации Отложенный

Новая модель искусственного интеллекта (ИИ) ESM3 может создавать новые белки, которые не встречаются в природе.

Ученые использовали ESM3 для создания нового флуоресцентного белка, который имеет только 58% общих последовательностей с природными флуоресцентными белками. Исследование опубликовано 2 июля в препринте базы данных bioRxiv. 

Исследовательская группа из компании EvolutionaryScale выпустила сокращенную версию модели по некоммерческой лицензии. Полноценная модель будет доступна только для коммерческих исследователей. Согласно заявлению компании, технология может быть полезна в самых разных областях - от открытия лекарств до разработки новых химических веществ.

ESM3 - это большая языковая модель (LLM), похожая на GPT-4 от OpenAI. Ученые обучили модель на 2,78 миллиардах белков. Для каждого белка они извлекли информацию о последовательности (порядке аминокислотных строительных блоков, из которых состоит белок), структуре (трехмерная свернутая форма белка) и функции (что делает белок).

Используя эти данные, модель может генерировать новые белки с определенными функциями. Один из экспертов, ознакомившийся с результатами, назвал создание ESM3 "потрясающим моментом для биологии".

В своем эксперименте исследователи использовали модель для создания нового флуоресцентного белка — разновидности белка, который улавливает свет и отдает его обратно на большей длине волны, придавая ему новый оттенок зеленого. 

Модель сгенерировала 96 белков с последовательностями и структурами, которые, вероятно, вызывают флуоресценцию. Затем исследователи выбрали тот, у которого было меньше всего совпадений с существующими флуоресцентными белками. Этот белок был в 50 раз менее ярким, чем натуральные белки, поэтому ESM3 сгенерировал еще одну итерацию, которая привела к появлению новых последовательностей, увеличивающих яркость, — и в результате получился зеленый флуоресцентный белок, не похожий ни на один из встречающихся в природе, получивший название "esmGPF". На достижение этих итераций, выполняемых ИИ за считанные секунды, потребовалось бы 500 миллионов лет эволюции, подсчитала команда EvolutionaryScale.