Аннотация:В дипломной работе А.А. Свиридова исследуются методы аппроксимации множества документов социальных сетей, посвященных некоторому сложному резонансному событию. К особенностям такой задачи относится, прежде всего, средний небольшой размер документов в социальных сетях. Наличие большого количества релевантных документов, многие из которых не имеют между собой лексического пересечения существенно затрудняет решение задачи. Также затрудняет решение задачи общее большое количество документов в коллекции, что требует разработки специальной технологии обработки коллекции.
В дипломной работе рассматриваются два основных подхода к решению задачи: во-первых, приближение целевого множества путем расширения некоторого начального запроса, во-вторых, путем расширения некоторого начального множества релевантных документов.