Применение методов интеллектуального анализа текстовой информации для предотвращения утечек данныхстатья
Статья опубликована в журнале из списка RSCI Web of Science
Статья опубликована в журнале из перечня ВАК
Статья опубликована в журнале из списка Web of Science и/или Scopus
Дата последнего поиска статьи во внешних источниках: 24 января 2020 г.
Аннотация:В настоящее время наибольшие риски для информационной безопасности организаций представляют не внешние, а внутренние угрозы. Для минимизации рисков, связанных с внутренними угрозами, используются DLP-системы. Основной функционал DLP-систем направлен на предотвращение утечки конфиденциальных данных, однако, в современных реалиях при сравнении DLP-систем на первое место начинают выходить их возможности по анализу перехваченной информации и удобстве проведения ретроспективных расследований. В статье представлен новый подход ретроспективного анализа работы корпоративного пользователя с текстовой информацией. Идея предлагаемого подхода состоит в тематическом анализе сложившихся в прошлом тенденций работы пользователя с текстовым контентом различных категорий, в том числе конфиденциальных, и прогнозировании его дальнейшего поведения. Тематический анализ работы пользователя предполагает определение основных тематик его текстового контента и соответствующие им веса в заданные интервалы времени. На основе отклонений поведения в работе пользователя с контентом от прогнозируемого можно выявить интервалы времени, когда работа с документами той или иной категории отличается от обычной (исторической) и когда велась работа с документами несвойственных категорий. Экспериментальные исследования предложенного подхода были проведены на примере реальной корпоративной переписки пользователей, сформированной из тестового набора данных Enron.