Алгебраические, логические и статистические методы машинного обучения и их применение в прикладных задачах анализа данныхНИР

Algebraic, logical and statistical machine learning methods and their application in applied data analysis

Соисполнители НИР

МГУ имени М.В. Ломоносова Координатор

Источник финансирования НИР

госбюджет, раздел 0110 (для тем по госзаданию)

Этапы НИР

# Сроки Название
1 1 января 2016 г.-31 декабря 2016 г. Алгебраические, логические и статистические методы машинного обучения и их применение в прикладных задачах анализа данных
Результаты этапа: В результате проведённых в 2016 году исследований по проекту были получены следующие основные результаты: 1. Было показано, что в задаче анализа сигналов кровяного давления метрики DTW и TWED повышают качество идентификации по пульсовой волне и позволяют строить новые алгоритмы (например, применять новые методы усреднения профилей). Задача классификации пациента по фотоплетизмограмме была решена с достаточно высокой точностью: 70% (для выборки из 150 сигналов 25 человек). 2. Предложены модели представления корпусных данных на основе трехдольной модели данных. Предложен и реализован новый метод визуализации корпусных данных по набору экспертных требований. 3. Проанализирован комплекс методов оценивания параметров отдельных компонентов смеси распределений для задержек передачи информации, отобраны одновременно точные и вычислительно эффективные методы. 4. Разработана метрика различия формы изображений гибких объектов на основе деформаций непрерывных морфологических моделей. 5. Предложена иерархическая регрессионная модель, позволяющая получать оценки для весовых коэффициентов потенциальных функций, удовлетворяющие требованиям селективности, состоятельности, несмещённости, непрерывности, обладающие способностью отбирать коррелированные регрессоры и имеющие конечную верхнюю оценку риска. 6. Разработан новый стохастический метод оптимизации с суперлинейной локальной скоростью сходимости. Для данного метода доказана также глобальная линейная скорость сходимости. 7. Разработана программа управления роботом Khepera2 с помощью морганий глаз человека, определяемых с помощью анализа электроэнцефалограммы головного мозга. 8. Разработан новый алгоритм синтеза обратимых схем, имеющий асимптотически оптимальную сложность и позволяющий (в некоторых случаях) получать обратимые схемы с лучшими характеристиками. Предложены новые подходы к синтезу схем, использующие спектры Рида-Маллера и разложение Гильберта. Получены оценки сложности обратимых схем некоторых специальных типов.
2 1 января 2017 г.-31 декабря 2017 г. Алгебраические, логические и статистические методы машинного обучения и их применение в прикладных задачах анализа данных
Результаты этапа: В результате проведённых в 2017 году исследований по проекту были получены следующие основные результаты: 1. Разработан новый метод оптимизации для вероятностных моделей машинного обучения на основе гауссовских процессов для решения задач классификации. Проведённые эксперименты показывают, что разработанный метод опережает по качеству аналоги на широком наборе задач классификации. Кроме того, данный метод не имеет параметров, настраиваемых пользователем, что существенно облегчает применение метода на практике. 2. Разработан ряд моделей для автоматического обучения стратегий оптимизации. Данные модели хорошо себя показывают в задачах нестохастической оптимизации, при этом не требуя дополнительной настройки гиперпараметров во время оптимизации тестовых функций. Наиболее перспективными с точки зрения дальнейшего изучения является применение данных моделей к задачам стохастической оптимизации. Предварительные эксперименты показывают, что модели показывают достаточно хорошие результаты, однако нужно предпринять дополнительные меры по предотвращению переобучения и разработке иных методов обучения для применения данной модели для оптимизации нейросетей. 3. Исследованы решающие правила (процедуры преобразования оценок принадлежностей к классам в ответы алгоритма) и методы деформаций (процедуры изменения ответов алгоритма) в прикладных задачах классификации и регрессии. Проведены эксперименты по повышению качества классификации с помощью деформаций и специальных решающих правил в задачах банковского скоринга, классификации фотоплетизмограмм и кардиограмм. 4. Проведено исследование по распознаванию некоторых мимических движений на показаниях, полученных с электроэнцефалографа. 5. Создана программа на языке PYTHON 2.7 для управления роботизированной рукой Katana по показаниям электроэнцефалографа Emotiv EPOC 6. Исследовалось применение обратимых схем для реализации вычислительно асимметричных преобразований. Предложен новый быстрый и эффективный алгоритм синтеза обратимой схемы, задающей подстановку на множестве (Z2)n с малым числом подвижных точек. Доказаны асимптотические верхние и нижние оценки сложности, глубины и квантового веса рассмотренных обратимых схем.
3 1 января 2018 г.-31 декабря 2018 г. Алгебраические, логические и статистические методы машинного обучения и их применение в прикладных задачах анализа данных
Результаты этапа: В результате проведённых в 2018 году исследований по проекту были получены следующие основные результаты: 1. Разработан новый метод обучения вероятностной модели машинного обучения на основе гауссовских процессов. Данный метод обладает линейной сложностью как по количеству тренировочных объектов, так и по количеству признаков. Кроме того, в данном методе можно использовать значительно большее количество т.н. индуцированных точек по сравнению с известными подходами. Кроме того, предложена схема объединения модели с гауссовскими процессами вместе с обучением представлений с помощи глубокой нейросети. 2. Разработан новый рандомизированный блочно-координатный метод оптимизации для задач огромных размеров. Проведён теоретический анализ скорости сходимости разработанного метода. Показано, что новый метод является эффективным в случае, если для матрицы квадратичной формы есть зазор между наибольшим и tau-наибольшим собственными значениями. 3. Исследованы алгоритмы выявления аномалий в работе оборудования, лучше всех проявил себя метод «изолирующий лес»: 97% точности и 87% полноты, ансамблирование разных алгоритмов несущественно улучшает его качество. Кроме поломок, он сигнализирует также о любой некорректной работе и смене режимов работы. 4. Получены результаты по асимптотической сложности и глубине обратимых сбоеустойчивых схем. Предложен оригинальный метод синтеза сбоеустойчивых обратимых элементов в поляризованном пространстве Хэмминга, обладающий высокой способностью корректировать как единичные, так и многократные ошибки. 5. Предложен способ разметки обучающих наблюдений в задачах верификации, учитывающий разделение наблюдений по классам, по уровням качества подделок и по уровням информированности изготовителей подделок. Предложен и исследован метод преобразования такого описания объектов в метрические описания. На модельных и реальных задачах показан рост качества и скорости работы систем верификации. 6. Предложен новый метод автоматической стилизации изображений за счет учета дальности от каждого объекта на изображении до зрителя. Традиционный метод приводит к плоскому результату стилизации, в котором информация о глубине пикселей теряется. Однако учет этой информации за счет вариативной степени сохранения содержимого картинки относительно стиля позволяет производить стилизацию с сохранением глубины, повышая реалистичность и качество работы метода.
4 1 января 2019 г.-31 декабря 2019 г. Алгебраические, логические и статистические методы машинного обучения и их применение в прикладных задачах анализа данных
Результаты этапа: 1. Разработан новый метод генерации выборок из распределений, задаваемых нейросетевыми моделями с ортогональными матрицами. Доказана корректность предложенного метода. 2. Разработан новый метод вариационного байесовского вывода с использованием семейства матричных нормальных распределений. 3. Предложен новый римановый метод оптимизации для параметров матричных нормальных распределений и продемонстрировано его использование в рамках процедуры вариационного байесовского вывода. 4. Предложен новый римановый метод оптимизации для нейросетевых моделей, в которых часть параметров задаётся тензорами в формате тензорного поезда.
5 1 января 2020 г.-31 декабря 2020 г. Алгебраические, логические и статистические методы машинного обучения и их применение в прикладных задачах анализа данных
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".