Аннотация:В данной работе рассматриваются повороты признакового пространства и то,
как они способны улучшить качество классификации деревьев в ансамбле. Как по-
вороты могут помочь деревьям при классификации, поясним на примере. Пусть
данные имеют четко выраженную линейную структуру, тогда дереву
придется сделать множество разрезов, параллельных осям координат, для того
чтобы корректно отделить один класс от другого. Похожие ситуации часто про-
исходят в бустинге: одно дерево вряд ли сможет уловить такую структуру, но
если строить очень большой ансамбль, то при помощи уменьшающихся разрезов
можно добиться квази-линейной границы. Но если к тем же данным применить
поворот осей (Рис. 1b), то решающему дереву потребуется всего один разрез для
достаточно хорошего разделения классов.
Найти правильные повороты не так просто, особенно если данные многомер-
ные. Кроме того, отсутствие потенциально полезных поворотов всех признаков
одновременно не означает, что мы не сможем найти подпространство, где поворот
признаков будет оправдан.
Интересным примером ансамбля, невероятно успешно применяющим идею по-
воротов, является алгоритм Rotation Forest, о котором подробно говорится ниже.
Возникает множество вопросов о том, можно ли применять идеи данного алго-
ритма для других композиций. В рамках данной работы данный подход применен к алгоритму AdaBoost и его преимущество продемонстрировано на вычислительных экспериментах.