Аннотация:Работа посвящена улучшению работы менеджера задач SLURM, который используется на суперкомпьютерах «Ломоносов» и «Ломоносов-2», в частности улучшению его интеграции с системами мониторинга и получению сводки о состоянии суперкомпьютера с точки зрения менеджера ресурсов. Конкретной целью работы является реализация возможности запуска произвольных задач перед и после запуска задач (помимо системных пролога и эпилога, так как вмешивание в их работу нежелательно), а также реализация визуализации состояния занятости ресурсов суперкомпьютера.
Проведен ряд исследований современных систем мониторинга, и определены их возможности и недостатки в приложении к данной задаче. На основе проведённого анализа был выбран путь решения поставленных задач.
Для обоих поставленных задач проведены раздельные реализации, которые успешно прошли апробацию на суперкомпьютере «Ломоносов-2».