Аннотация:При решении задач классификации перед исследователем встаёт вопрос выбора метода, который с минимальными временными, вычислительными и прочими затратами позволит получить максимально точный результат.
Лопатников А. рассмотрел следующие методы классификации: метод K ближайших соседей (K-neighbours), решающее дерево (DecisonTree), линейный классификатор на основе обучения с помощью стохастического градиентного спуска (SGD Linear Classifier) и случайный лес (ансамбль решающих деревьев, RandomForest), и постарался отметить их сильные и слабые стороны при использовании в решении конкретной задачи бинарной классификации.
Работа выполнена в виде скрипта IPython, позволяющего читателю непосредственно воспроизвести необходимые эксперименты с тем или иным классификатором на предложенной автором или же другой задаче.