Гибридные модели экстремального градиентного бустинга для восстановления пропущенных значений в данных об осадкахстатья
Статья опубликована в журнале из списка RSCI Web of Science
Информация о цитировании статьи получена из
Scopus
Статья опубликована в журнале из перечня ВАК
Статья опубликована в журнале из списка Web of Science и/или Scopus
Дата последнего поиска статьи во внешних источниках: 12 февраля 2020 г.
Аннотация:В статье проведено сравнение классического метода экстремального градиентного бустинга, реализованного во фреймворке XGBoost, и категориальной модификации CatBoost, которая достаточно редко встречается в научных исследованиях. Предложены некоторые гибридные модели классификации-регрессии для повышения точности заполнения пропусков в реальных данных на примере 14 станций в Германии. Достигнутая точность в задачах классификации составила до 92% при весьма умеренных значениях ошибок прогнозов в метрике RMSE. Гибридные методы превзошли по качеству предсказания простые модели классификации и регрессии. Развиваемые подходы могут быть успешно использованы как для непосредственного анализа метеорологических данных методами машинного обучения, так и для улучшения качества предсказания на основе физических моделей атмосферных процессов.