Россия и Китай наложили вето на проект резолюции по Ормузскому проливу
7 апреля, 22:56
Мужчина попытался похитить девушку как в "Кавказской пленнице" и поплатился за это
7 апреля, 22:22
На двух российских трассах в апреле повысят скоростной режим
7 апреля, 21:32
Трамп назвал Карлсона "человеком с низким IQ"
7 апреля, 21:24
Терпение на исходе: Трампа предложили отправить в отставку
7 апреля, 20:56
"Совершенные клоуны": в Белом доме резко опровергли слухи о ядерном ударе
7 апреля, 20:47
Вэнс озвучил крайний срок для ответа Ирана на предложения США
7 апреля, 20:34
Исследователи НИУ ВШЭ научили нейросеть предсказывать взаимодействия между белками
7 апреля, 20:01
КСИР заявил о "красных линиях" и жестко осадил США
7 апреля, 20:01
Гололедица возвращается: москвичей просят пересесть на метро 8 апреля
7 апреля, 19:24
Трап протаранил кабину пилотов дважды за месяц в аэропорту Австралии
7 апреля, 19:14
Новые рейсы запускаются из Москвы в Дубай
7 апреля, 18:47
Не оставил следов: житель Таганрога застрелил своих родителей и сбежал
7 апреля, 18:45
Спрос на новостройки в Москве стабильно и ощутимо падает
7 апреля, 18:41
Назван срок хранения квитанций по оплате ЖКХ
7 апреля, 18:32

Исследователи НИУ ВШЭ научили нейросеть предсказывать взаимодействия между белками

Тематическое фото Сгенерировано при помощи qwen.ai
Тематическое фото
Фото: Сгенерировано при помощи qwen.ai

StolicaMedia, 7 апреля. Ученые НИУ ВШЭ создали нейросеть, которая с точностью 95% предсказывает, будут ли белки взаимодействовать друг с другом. Разработка может ускорить поиск молекулярных механизмов болезней, биомаркеров и потенциальных мишеней для новых лекарств. Исследование опубликовано в журнале Scientific Reports (18+).

Модель получила название GSMFormer-PPI. Она учитывает три типа данных о каждом белке в предполагаемой паре: аминокислотную последовательность, трехмерную структуру и свойства молекулярной поверхности. Для обработки этих данных авторы использовали существующие алгоритмы: белковую языковую модель, графовую нейронную сеть и отдельный модуль для анализа поверхности.

Главное отличие разработки — в способе обработки информации. В отличие от предыдущих подходов, где признаки просто объединялись в один вектор, GSMFormer-PPI анализирует связи между разными типами данных с помощью трансформерного модуля. Это позволило значительно повысить точность предсказаний.

Понимание того, какие белки могут взаимодействовать друг с другом, критически важно для изучения механизмов заболеваний. Нарушения в таких связях приводят к неправильной работе клеток. Экспериментальная проверка всех возможных пар белков занимает слишком много времени, особенно когда речь идет о десятках или сотнях молекул. Новая нейросеть поможет биологам быстрее находить перспективные направления для исследований.

"При взаимодействии белков особенно важна их поверхность: именно через нее молекулы распознают друг друга и на ней сосредоточены физико-химические свойства, от которых зависит связывание. В нашей модели мы попытались учесть эту информацию вместе с последовательностью и трехмерной структурой белка, а затем не просто объединить признаки, а дать алгоритму возможность анализировать связи между ними. Именно это и позволило точнее предсказывать белок-белковые взаимодействия", — сказала один из авторов статьи, директор Центра биомедицинских исследований и технологий Института ИИиЦН ФКН НИУ ВШЭ Мария Попцова.

Чтобы проверить, насколько хорошо работает новая модель, исследователи протестировали ее на наборе данных PINDER — крупной базе известных белковых взаимодействий.  В экспериментах GSMFormer-PPI показала точность 95,7% и превзошла популярные графовые модели, например GCN и GAT. Также исследователи провели тест с более простым вариантом GSMFormer-PPI — без модуля, который анализирует связи между разными типами данных. Эта версия работала хуже, что доказывает: дело не только в самих данных о белке, но и в том, как именно модель их сопоставляет.

Дополнительные тесты показали, что для точного прогноза важны все три типа данных: последовательность, пространственная структура и свойства поверхности белка. Когда исследователи поочередно убирали один из компонентов, качество предсказания снижалось. Иными словами, модель работает лучше именно потому, что рассматривает белок сразу на нескольких уровнях. В перспективе такие системы могут помочь быстрее отбирать пары белков при изучении механизмов болезней и поиске мишеней для лекарств.

Работа выполнена при поддержке гранта для исследовательских центров в области искусственного интеллекта Министерства экономического развития РФ, реализуемого на базе НИУ ВШЭ.  

161150
121
185