Аннотация:Рассматривается задача категоризации текстов с использованием методов машинного обучения. Исследованы подходы предварительной обработки текста и создана коллекция датасетов для обучения методов и вычислительных экспериментов. Проведено сравнение на следующих методах: логистическая регрессия, наивный байесовский классификатор, деревья решений. Для каждого метода получена оценка качества работы, выбран наиболее эффективный метод: логистическая регрессия.