ИСТИНА |
Войти в систему Регистрация |
|
ИПМех РАН |
||
Авторы предлагают подход, когда в определенный момент времени весь вычислительный кластер или какая-то его часть подвергаются специальному тестированию, в процессе которого измеряются задержки передачи данных в различных режимах. Цель проведенного тестирования - уточнить структуру задержек, чтобы полуавтоматически обнаружить аномалии в коммуникациях, тем самым дать полезный инструмент для балансировки нагрузки в параллельных программах, для решения задачи назначений вычислений на узлы вычислительного кластера, а также дать инструмент системным администраторам для выявления несоответствий спецификации производителя вследствие некорректной работы оборудования или изменившихся условий эксплуатации всей системы целиком. Наработки авторов собраны в проект с открытым исходным кодом "HPC cluster benchmarking toolkit", или сокращенно clustbench.