ИСТИНА |
Войти в систему Регистрация |
|
ИПМех РАН |
||
Во многих областях науки по мере накопления экспериментальных данных и результатов моделирования становятся все более актуальны проблемы их хранения, эффективной обработ- ки и обмена данными в междисциплинарных исследованиях. Одним из примеров является изу- чение механизмов химических и фотофизических процессов в белковых системах. С развитием технологий сверхбыстрой рентгеновской спектроскопии становится возможным исследовать структуры промежуточных состояний и интермедиатов реакций с высоким временным разре- шением. Полученные экспериментальные данные для каждой реакции являются четырехмер- ными: это серии трехмерных карт электронной плотности для различных интервалов во време- ни по ходу протекания химического процесса. Сравнение полученных данных с результатами моделирования помогает уточнить экспериментальные структуры и установить механизм про- цесса. В настоящий момент количество экспериментальных данных по сверхбыстрой рентге- новской спектроскопии и результатов их моделирования не очень велико и подобный анализ может быть проделан вручную. Однако ожидается значительный рост их количества в бли- жайшие годы, и актуальной становится проблема их автоматического анализа. Одной из важных проблем, возникающих при накоплении экспериментальных и расчетных данных по электронной плотности для реакций, является проблема их хранения. Помимо того, что данные могут занимать большой объем, необходимо обеспечить надежность их хранения и постоянную их доступность. В то же время, желательно, чтобы способ хранения данных не ска- зывался на эффективности доступа к ним. Одним из перспективных способов решения данных проблем является использование облачных технологий. В описываемой архитектуре для хране- ния и обработки данных по электронным плотностям реакций, результаты экспериментов и мо- делирования хранятся в распределенном хранилище, построенном на базе обычных серверов и даже персональных компьютеров и виртуальных машин. Надежность и доступность обеспечи- вается частичной репликацией данных между узлами. Для ускорения обработки данных пред- полагается запускать программы анализа локально на тех узлах, которые хранят копии необхо- димых файлов. Управление операциями обеспечивается с помощью системы оркестрации Kubernetes. За короткий срок была развернута территориально-распределенная информационная среда, позволяющая гибкую настройку политики доступа к вычислительным ресурсам и массиву дан- ных. Важным аспектом работы среды является поддержка сервисов хранения достаточно большого объема данных, а также возможность проведения расчетов с использованием высо- копроизводительных вычислительных средств, таких как кластеры. Мы полагаем, что в буду- щем среда будет востребована для решения широкого круга научных проблем. В первую оче- редь, это сопоставление результатов теоретических расчетов трехмерного распределения элек- тронной плотности интермедиатов ферментативных реакций с экспериментальными данными рентгеноструктурного анализа. Также, с помощью данного сервиса можно будет проводить по- иск схожих распределений электронной плотности в базе данных не только по их атрибутам, но и по сформированным индексам. Потенциальной областью применения являются также мето- дические исследования – сравнение точности и эффективности методов теоретического иссле- дования ферментативных процессов, что позволит пользователям выбирать оптимальный ме- тод для изучения разных классов белковых систем.