Прогнозирование биологической активности потенциальных лекарственных веществ на основе анализа траекторий молекулярной динамики лиганд-белковых комплексов с помощью искусственных нейронных сетейНИР

Prediction of bioactivity of potential drug compounds based on the analysis of molecular dynamics trajectories of ligand-protein complexes by means of artificial neural networks

Источник финансирования НИР

грант РФФИ

Этапы НИР

# Сроки Название
1 19 марта 2019 г.-31 декабря 2019 г. Прогнозирование биологической активности потенциальных лекарственных веществ на основе анализа траекторий молекулярной динамики лиганд-белковых комплексов с помощью искусственных нейронных сетей
Результаты этапа: В ходе работы были сформированы обучающая выборка, построенная на основе базы данных PDBbind v.2017 (356 комплексов), а также две независимые контрольные выборки для валидации моделей, содержащие 31 комплекс на основе данных ресурса Community Structure-Activity Resource (CSAR) и 57 комплексов танкиразы с известными ингибиторами. Для каждой из выборок было проведено моделирование молекулярной динамики небольшой длительности (2 нс) с помощью программного пакета GROMACS 2018. В качестве входных данных для моделей машинного обучения выступали двумерные тензоры, содержащие векторы дескрипторов лиганд-белкового взаимодействия для каждого записанного кадра траектории. В работе использовали дескрипторы, рассчитываемые с помощью стандартных функций GROMACS (например, значения среднеквадратического отклонения для лиганда и сайта связывания, а также электростатической и ван-дер-ваальсовой энергии взаимодействия лиганда с белком), а также дескрипторы, основанные на компонентах оценочной функции AutoDock Vina / Smina. Для прогнозирования аффинности лигандов к белкам-мишеням были построены модели на основе архитектур сверточных и рекуррентных нейронных сетей, а также модели сравнения на основе случайного леса и многослойных нейронных сетей. Наилучшие результаты показала модель, основанная на сверточных нейронных сетях (коэффициенты корреляции для контрольных выборок CSAR и ингибиторов танкиразы составили 0.62 и 0.73). Модель значительно превосходит по качеству прогноза как модели сравнения, так и часто применяемые в задачах виртуального скрининга и молекулярного дизайна оценочные функции молекулярного докинга и оценки свободной энергии связывания методом MM-PBSA. Учитывая относительно невысокую вычислительную сложность предложенного подхода, его можно использовать в качестве эффективного фильтра на поздних этапах виртуального скрининга и для ранжирования соединений по приоритетности.

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".