Применение временных рядов в задаче фоновой идентификации пользователей на основе анализа их работы с текстовыми даннымистатья

Статья опубликована в журнале из списка RSCI Web of Science
Статья опубликована в журнале из перечня ВАК
Дата последнего поиска статьи во внешних источниках: 19 октября 2015 г.

Работа с статьей


[1] Применение временных рядов в задаче фоновой идентификации пользователей на основе анализа их работы с текстовыми данными / В. Ю. Королев, А. Ю. Корчагин, И. В. Машечкин и др. // Труды Института системного программирования РАН (электронный журнал). — 2015. — Т. 27, № 1. — С. 151–172. В статье представлен подход идентификации пользователя на основе отклонений его тематической направленности при работе с текстовой информацией. Для решения указанной задачи был предложен подход, состоящий в тематическом анализе сложившихся в прошлом тенденций работы (поведения) пользователя с текстовым контентом различных (в том числе конфиденциальных) категорий и прогнозировании его дальнейшего поведения. Тематический анализ работы пользователя предполагает определение основных тематик его текстового контента и расчёт соответствующих им весов в заданные интервалы времени. На основе отклонений поведения в работе пользователя с контентом от прогноза осуществляется идентификация данного пользователя. В рамках данного подхода был предложен собственный оригинальный метод прогнозирования временных рядов, основанный на ортонормированной неотрицательной матричной факторизации (ОНМФ). Важно отметить, что ранее метод ОНМФ не использовался для решения задачи прогнозирования временных рядов. Проведённое экспериментальное исследование на примере реальной корпоративной переписки пользователей, сформированной из набора данных Enron, показало применимость предложенного подхода идентификации пользователя. [ DOI ]

Публикация в формате сохранить в файл сохранить в файл сохранить в файл сохранить в файл сохранить в файл сохранить в файл скрыть