![]() |
ИСТИНА |
Войти в систему Регистрация |
ИПМех РАН |
||
Объектом исследования является процесс автоматического анализа больших коллекций документов при решении задач обеспечения безопасности. Целью работы является проведение аналитический обзора современной научно-технической, нормативной и методической литературы в области информационного поиска, автоматической обработки текстов, анализа поиска закономерностей в данных, методов эффективной обработки коллекций текстовых данных применительно к задачам обеспечения безопасности. В ходе работы были решены следующие задачи. Выработаны основные технические требования к системе мониторинга СМИ. Проведены поисковые исследования и разработка новых математических моделей и алгоритмов выделения дат, имен, географических объектов, источников и других параметров из информационных сообщений для увеличения точности информационного поиска по конкретным событиям и персонам. Проведены поисковые исследования и разработка новых математических моделей и алгоритмов, позволяющих: автоматизировать выделение фактов и описаний, а также предоставляющих возможность определять их достоверность из коллекций текстовых документов. Проведена адаптация уже существующих и создание новых методик и алгоритмов поиска и интеллектуального анализа информации, в том числе в областях: тематического поиска информации; анализа массивов текстов для выявления новых тематических направлений; анализа текстовой информации для выявления специальных терминов; анализа взаимосвязей разнородных текстов для выявления скрытой структуры информационных ресурсов; выделения фактов, дат, имен, географических объектов, источников и других параметров; выявления скрытых характеристик информации; визуализации информации; автоматического реферирования информации для возможности быстрой оценки экспертом результатов поиска; ранжирования результатов выполнения поискового запроса с использованием информации о времени загрузки при визуализации результатов поиска. Основной областью применения полученных результатов могут стать адаптация существующих и создание новых математических моделей и алгоритмов для системы мониторинга открытых информационных источников Интернет с целю выявления информации террористической направленности, в области нарушений информационной безопасности и о потенциальных угрозах критически важным объектам. Результаты данного этапа НИР рекомендуется использовать при построении специализированных систем обработки текстов на естественном языке.