Задержана организатор сети реабилитационных центров, где пытали подростков
22:00
Мужчина изнасиловал ребенка в Москве
21:00
В любимом новогоднем блюде может прятаться опасный паразит
20:00
Аномальную погоду пообещали Москве в последние дни ноября
17:43
Центр встал, дороги закрыты: что творится в Москве 28 ноября
17:39
Такси протаранило ограждение в тоннеле на юге Москвы
17:27
Спустя четверть века в Москве раскрыли жестокое убийство супругов
17:02
Люди застряли на аттракционе в популярном парке развлечений в Москве
16:44
Поезда встали на МЦД-2 из-за сбоя
16:39
Москвичку будут судить после скандала в судебном зале
16:25
Назван способ защитить сделки с недвижимостью от мошенников в России
15:41
Обворовавших Долину мошенников отправили в тюрьму на 4-7 лет
14:47
Ученые ВШЭ ускорили оптимизацию нейросетей до 500 раз
14:25
Зимние аттракционы откроются в Москве на Красной площади
13:36
Московские врачи спасли ребенка с игрушкой в ноге
12:06

Ученые ВШЭ ускорили оптимизацию нейросетей до 500 раз

Тематическое фото unsplash.com
Тематическое фото
Фото: unsplash.com
Нашли опечатку?
Ctrl+Enter

StolicaMedia, 28 ноября. Исследователи НИУ ВШЭ — Санкт-Петербург разработали способ многократно ускорять сжатие нейросетей с помощью законов статистической физики. Метод работает без потери качества и уже доступен разработчикам. Об этом говорится в пресс-релизе НИУ ВШЭ, который имеется в распоряжении ИА StolicaMedia.

Команда ученых Лаборатории социальной и когнитивной информатики ВШЭ — Санкт-Петербург под руководством Сергея Кольцова предложила новый способ сжимать нейросети, используя методы статистической физики. Работа опубликована в журнале Physica A: Statistical Mechanics and its Applications (18+). 

Современные модели ИИ становятся все больше и требуют огромных ресурсов — иногда сотни гигабайт памяти. Это создает проблемы для организаций, которые работают в закрытых системах: банков, медучреждений и госструктур. Им нужны компактные модели, способные работать на обычных серверах или даже ноутбуках.

Сжатие нейросетей обычно занимает много времени. Так, нужно по шагам уменьшать модель и каждый раз проверять ее качество. Исследователи заметили, что поведение нейросети похоже на физические системы с большим числом частиц. Так удалось найти точки, в которых модель сохраняет лучшее соотношение размера и точности — без долгих экспериментов.

Новый метод проверили на моделях с 7–10 млрд параметров. Он оказался значительно быстрее. В зависимости от архитектуры ускорение составляло от 10 до 500 раз.

Метод уже доступен для разработчиков и может быть использован в любых проектах. Сейчас ученые продолжают работу и пытаются определить, сколько слоев и блоков нужно нейросети для оптимальной работы еще до начала ее обучения.

233994
121
185