Аннотация:В рамках данной работы проведено исследование и разработаны методы
автоматического аннотирования электронной почты. Произведен обзор существующих
подходов к аннотированию документов, определен общий подход к автоматическому
аннотированию. Были исследованы классические и нейросетевые текстовые модели,
предложены алгоритмы на основе модели автоэнкодера, превосходящие классические
алгоритмы. Измерено качество разработанных алгоритмов согласно метрикам семейства
ROUGE на наборе BC3 аннотированных писем электронной почты, а также на наборе
CNN/Daily Mail электронных статей. Для проведения экспериментов разработан программный
стенд, включающий в себя основные этапы работы с последовательностью сообщений:
очистка текста, получение векторных представлений предложений, ранжирование и выборка
итоговой аннотации.