Организация, в которой проходила защита:
Московский физико-технический институт (Национальный исследовательский университет)
Год защиты:2020
Аннотация:В настоящей работе проведен анализ семейства признаков сейсмологических временных рядов с точки зрения их пользы для классификации записей по наличию/отсутствию сигналов землетрясений. С этой целью рассмотрен комплекс ML-алгоритмов и получены оценки качества классификации на большой выборке сигналов с кросс-валидацией.
Показано, что классификация с применением конволюционной нейронной сети по массиву псевдоизображений (вейвлет-спектров) подвержена явлению переобучения и не является достаточно эффективной. В тоже время, предложена оптимальная ML-модель, реализующая метод градиентного бустинга над решающими деревьями. На основе этого метода построен устойчивый алгоритм с высокими результирующими значениями метрик качества классификации.