Крупнейшую судостроительную верфь полного цикла открыли в Москве
21:00
Москвичка набросилась на беременную девушку с покупками
20:00
Суд по делу актрисы Аглаи Тарасовой проходит в Подмосковье
17:53
Пара влюбленных украла электросамокаты в Подмосковье
17:46
Бастрыкин потребовал доклад об истязании ребенка в Якутии
16:39
Подход к помощи детям с аутизмом предлагают изменить в России
16:13
Бастрыкин взялся за дело о гибели женщины в Петербурге
15:51
У властей Москвы большие планы на знаменитую хрущевку из "Операции Ы"
14:50
Следователи ходатайствуют по делу об обезглавливании мальчика в Москве
14:21
Москва отреагировала на "близкий мир" на Украине
13:48
Сильнейшие морозы ударили в Москве
12:57
2-летняя малышка погибла при ДТП в Подмосковье
12:35
Голубей-биодронов создали в России
11:44
Новый способ штрафовать нарушителей хотят ввести в России
11:27
Мировую премьеру в стиле Сан-Ремо привез в Москву театр из Рязани
11:23

Ученые НИУ ВШЭ оптимизировали обучение генеративных потоковых нейросетей

21 августа, 20:32 Общество
Тематическое фото unsplash.com
Тематическое фото
Фото: unsplash.com
Нашли опечатку?
Ctrl+Enter

Исследователи факультета компьютерных наук НИУ ВШЭ усовершенствовали метод обучения генеративных потоковых нейросетей (GFlowNets), которые помогают работать со сложными и неструктурированными задачами. Новая технология позволит эффективнее искать лекарства и другие вещества с нужными свойствами. Пресс-релиз НИУ ВШЭ имеется в распоряжении ИА StolicaMedia. 

Генеративные потоковые сети — это алгоритмы, которые поэтапно "собирают" сложные объекты. Их применяют, например, в биологии и фармацевтике — для поиска белков и лекарств, а также в логистике и других сферах, где нужно находить оптимальные решения.

Принцип работы можно сравнить с конструктором: сеть добавляет элемент за элементом, пока не получится цельная структура. Каждому объекту присвоена своя ценность: модель растения может быть "дороже" модели животного. В отличие от классических алгоритмов, которые стремятся получить строго один лучший вариант, GFlowNets генерируют множество решений, чаще выбирая те, что выгоднее.

Поиск решений ведётся с помощью двух связанных моделей:

  • прямая — "строитель", который предсказывает следующий шаг,
  • обратная — "эксперт", который восстанавливает, каким был предыдущий ход.

Чтобы система работала эффективно, модели должны быть сбалансированы. Однако это трудно. Дело в том, что  обратная модель обычно слишком жесткая и не умеет подстраиваться под прямую.
Команда ВШЭ предложила способ сделать обратную модель гибкой — метод Trajectory Likelihood Maximization (TLM). Он позволяет обратной модели постоянно сверяться с действиями прямой и адаптироваться.

"Мы сделали так, что поиск оптимального решения стал похож на переговоры, в которых обе стороны готовы менять свою позицию. В задачах с большой степенью неизвестности обратная модель — лишь вспомогательный инструмент, улучшающий результаты прямой модели", —объяснил Тимофей Грицаев, стажер-исследователь Международной лаборатории стохастических алгоритмов и анализа многомерных данных.

После внедрения TLM функция вознаграждения усложнилась. При этом сама система стала работать быстрее и результативнее.

"Наш метод заметно быстрее просматривает пространство возможных решений и находит больше качественных вариантов. Этот подход в целом сближает генеративные модели с методами обучения с подкреплением",— отметил Никита Морозов, младший научный сотрудник Центра глубинного обучения и байесовских методов.

Разработчики уверены: новый подход поможет в самых разных областях — от поиска лекарств и проектирования материалов до настройки крупных языковых моделей. Благодаря улучшенной эффективности GFlowNets можно быстрее исследовать огромные пространства решений и находить оптимальные варианты с меньшими затратами вычислительных ресурсов.

Ранее ИА StolicaMedia писало, что  ученые НИУ ВШЭ с помощью суперкомпьютерного моделирования изучили поведение ионов и молекул растворителя с водой внутри нанопор суперконденсаторов. Анализ показал, что даже незначительное количество воды меняет распределение заряда и влияет на емкость устройства. 

233994
121
185