Физический факультет
Московский государственный университет имени М. В. Ломоносова
МЕНЮ
Статья

Активационные функции для глубокого обучения построенные на основе обобщённых энтропий

Р. А. Рудаменко, А. М. Савченко, К. М. Семенов

Вестн. Моск. ун-та. Сер. 3. Физ. Астрон. 2026. № 2. 2620101

  • Статья
Аннотация

Энтропия Шеннона (Больцмана--Гиббса) является фундаментом классической статистической механики и глубокого обучения, однако она имеет сложности с описанием динамики неэкстенсивных систем . В данной работе предлагается применение обобщённых энтропий для построения новых фундаментальных блоков в архитектурах глубоких нейронных сетей. Предложенный подход обобщает классический слой softmax с использованием параметрических энтропий Реньи, Тсаллиса и Шарма-Миттала. Параметры \(q\) и \(r\) контролируют форму распределения: при \(q \to 1\) оптимальное распределение сходится к softmax, а при \(q = 2\) --- к sparsemax. В частности, рассматривается вариант, соответствующий \(q\)-entmax, где адаптивность достигается изменением параметра \(q\) при фиксированном \(r\). Исследование включает получение аналитических выражений якобиана по параметрам \(q\) и \(r\) с целью оптимизации через методы явного дифференцирования. Проведен сравнительный анализ с существующими подходами --- softmax, sparsemax и entmax (при \(q \in \{1.25,1.5,1.75\}\)). Полученные результаты демонстрируют рост метрик качества относительно подходов с softmax, sparsemax и q-entmax для задачи классификации со скоррелированными метками классов, что позволяет сделать вывод о преимуществе метода на основе Шарма-Миттала для поставленной задачи.

Поступила: 28 января 2026
Статья подписана в печать: 26 апреля 2026
PACS:
05.20.-y Classical statistical mechanics
05.70.-a Thermodynamics
05.90.+m Other topics in statistical physics, thermodynamics, and nonlinear dynamical systems
English citation: Activation functions for deep learning based on generalized entropies
R. A. Rudamenko, A. M. Savchenko, K. M. Semenov
Авторы
Р. А. Рудаменко, А. М. Савченко, К. М. Семенов
$^1$Московский государственный университет имени М.\,В.~Ломоносова, физический факультет, кафедра квантовой статистики и теории поля.
Выпуск 2, 2026

Moscow University Physics Bulletin

Бюллетень «Новости науки» физфака МГУ

Это новое информационное издание, целью которого является донести до сотрудников, студентов и аспирантов, коллег и партнеров факультета основные достижения ученых и информацию о научных событиях в жизни университетских физиков.