Молодые российские ученые опередили в престижном конкурсе 700 команд со всего мира
Юрий МедведевКоманда молодых российских ученых выиграла престижный конкурс, проводившийся знаменитым Стэнфордским университетом, опередив более 700 команд со всего мира.Их победа — это показатель, что, несмотря на свою молодость, они настоящие профессионалы. / из личного архива
Участники соревновались, кто создаст систему искусственного интеллекта, которая наиболее точно сможет предсказать трехмерную структуру молекул РНК. Это сегодня одна из наиболее заманчивых и сложных задач в биологии. Ее решение открывает серьезные перспективы, прежде всего в медицине. Ведь, зная структуры РНК, можно создавать более эффективные, чем существующие сегодня средства, РНК-вакцины и медицинские препараты для терапии рака и других опасных болезней.
Отметим, что в геномике сегодня нейросети — это один из самых популярных и эффективных инструментов. Причина состоит в том, что они позволяют получать прорывные результаты, не проводя сложные и очень дорогие эксперименты. Самый «громкий» и недавний пример — ситуация с получением трехмерных структур белков человека. Над этой задачей ученые бились давно. Учитывая, что у каждого из нас в организме множество белков, последовательности которых могут за счет мутаций отличаться от «средней» по человечеству, понятно, что экспериментальное получение структур всех вариантов таких белков попросту невозможно и стоило бы очень много.
Нейросети стали быстро строить структуру огромного количества белков. Это открыло принципиально иные возможности для разработки новых методов лечения и лекарств
Нейросети кардинально изменили ситуацию. Они справляются с задачей во много раз дешевле. Но для этого их надо обучить. Вначале нейросети показывают последовательности аминокислот различных белков и одновременно их трехмерные структуры, которые ранее были получены экспериментально. Чем больше таких наглядных примеров, тем более качественное «образование» получает интеллект.
Когда после такого обучения его «выпустили» в жизнь, он стал самостоятельно быстро и дешево строить структуру огромного количества белков. Это открыло перед медиками и фармакологами принципиально новые возможности по созданию новых методов лечения и разработке новых лекарств.
А вот с трехмерной структурой молекулы РНК пока все обстоит гораздо сложнее. Напомним, что наша ДНК хранит генетическую информацию, а РНК отвечает за ее передачу и синтез белков, но, кроме того, имеет еще много важных функций, как регуляторных, так и традиционно приписываемых белкам. (Вообще есть гипотеза, что именно молекуле РНК мы обязаны возникновением жизни. А уже потом появились ДНК).
— В принципе задача нейросети в данном случае аналогичная: по последовательности нуклеотидов предсказать трехмерную структуру РНК, — объясняет лидер российской команды разработчиков, аспирант Института общей генетики РАН и преподаватель факультета биоинженерии и биоинформатики МГУ Дмитрий Пензар. — Проблема в том, что для белков экспериментальных данных, чтобы обучать нейросети, было много, а вот для РНК во много раз меньше. Поэтому учить их фактически не на чем. Нет «учебников».
Задача казалась нерешаемой. Но ученые Стэнфордского университета предложили обходной путь. Они смогли собрать данные о возможной структуре более миллиона различных РНК. Правда, не прямых данных, а косвенных. Можно сказать, что это были «наводки» на возможную структуру. Но и они получены в дорогих экспериментах, которые как раз и должен заменить искусственный интеллект.
— Жюри подготовило для участников два блока данных: миллион разных последовательностей нуклеотидов РНК, и для каждой полученные в эксперименте «наводки». Задача научить ИИ самому предсказывать «наводки» по последовательности РНК, не используя данные эксперимента, — объясняет Дмитрий Пензар. — Наша модель сделала это лучше всех, опередив остальных участников. Это открывает возможность сделать следующий и решающий шаг — предсказывать трехмерную структуру молекул РНК.
В команде победителей престижного конкурса помимо Дмитрия Пензара участвовали научный сотрудник Института общей генетики РАН Арсений Зинкевич, а также студенты факультета биоинженерии и биоинформатики МГУ Валерий Вяльцев, Артемий Бакулин и Елизавета Носкова. Статья об этой работе выходит в блоке самого авторитетного научного журнале Nature.
Вычислительные биологи из Института общей генетики РАН не первый раз выигрывают международные конкурсы «предсказателей». Например, в 2016 году и 2022 годах сотрудники лаборатории занимали первые места в конкурсах, объявленных одним из крупнейших научных международных консорциумов DREAM.
Комментарий
Всеволод Макеев, член-корреспондент РАН:
— В конкурсе участвовали очень сильные команды не только из ведущих мировых научных центров и университетов, но и крупных фирм. Тем весомей победа наших ребят.
Что важно в их работе? Существуют разные методы предсказаний, которые, если их объединять, как правило, мешают друг другу. Так вот наши ученые смогли сделать, казалось бы, невозможное. Им удалось так объединить эти методы, что они стали друг другу помогать. Это во многом и позволило добиться успеха.
Вообще задачи, связанные с искусственным интеллектом, довольно специфические. Помимо основных приемов и правил, по которым они создаются, требуется интуиция.
Автор должен «почувствовать», что вот это будет работать, а вот это не будет. И ребята это продемонстрировали в полной мере. Так что их победа — это показатель, что, несмотря на свою молодость, они настоящие профессионалы.
Кто-то может удивиться: как такие молодые люди победили в столь престижном конкурсе? На самом деле это нормально. Ведь речь идет о задачах, которые появились совсем недавно. Их надо научиться решать. Люди постарше учатся медленнее, а молодые берутся за них с особым азартом. Им, как поется в песне, открывается дорога.
Российская газета — Федеральный выпуск: №50(9292)
Источник