Исследование и разработка методов обнаружения аномального поведения пользователей на основе анализа содержимого потока обрабатываемых текстовых данных для задач информационной безопасностикурсовая работа (Магистр)
Аннотация:В данной курсовой работе рассматривается задача выявления аномального поведе-
ния пользователей. Большинство современных методов решения этой задачи исполь-
зуют только структурированные поведенческие данные пользователей - контекст. При
таком подходе упускается информация, содержащаяся в неструктурированных поведен-
ческие данных - контенте.
Предлагается использовать не только структурированные поведенческие данные -
контекст, но и неструктурированные - контент. В жизни контент может быть содер-
жимым файлов пользователя, посещаемых веб-страниц.
В работе задача поиска аномалий решается с помощью методов машинного обуче-
ния, конкретно - нейронных сетей. Поведенческие данные представляют собой после-
довательность действий пользователя (и связанный с ними контент), поэтому исполь-
зуется LSTM-автокодировщик для поиска аномалий в поведенческих данных.
Для того, чтобы оценить влияние использования контентных поведенческих данных,
а также выбрать лучшей сценарий обучения моделей и поиска аномалий, проводится
экспериментальное исследование на наборе данных CERT 6.2. CERT 6.2 имеет реали-
стичное количество вредоносных пользователей, контент в нем представлен связными
предложениями. Экспериментальное исследование позволило выбрать лучший сцена-
рий обучения моделей и поиска аномалий.