Аннотация:При анализе данных биологических исследований традиционно применяются статистические методы. С ростом вычислительной мощности компьютеров относительно недавно для анализа таких данных начали получать распространение различные методы машинного обучения. Особенности кластерного анализа заключаются в отсутствии первичных допущений и требований к распределению данных и использовании несопоставимо больших объёмов выборок. В последние годы объем анализируемых экспериментальных биологических данных значительно вырос, и во многих случаях применение традиционных статистических методов оказывается недостаточно эффективным, в то время как кластерный анализ при обработке большого количества данных получает значительные преимущества. Для оценки возможностей кластерного анализа при работе с биологическими данными были использованы данные трех экспериментов по действию ионов тяжелых металлов Сu2+, Сd2+ и Сr2O72– на проростки гороха Pisum sativum L. в течение нескольких суток. В каждом эксперименте ежедневно проводилась регистрация индукционных кривых быстрой и замедленной флуоресценции хлорофилла а. Для анализа кинетики индукции флуоресценции был использован JIP-тест, параметры которого в дальнейшем использовались для кластерного анализа. Для уменьшения размерности данных с помощью метода главных компонент выделялись две или три главные компоненты, которые и были использованы для дальнейшей кластеризации. Кластеризация проводилась тремя методами: полной связи, k-средних и OPTICS. Для характеристики полученных кластеров был проведен анализ параметров JIP-теста в каждом из них. Было показано, что кластеры были сгруппированы по степени подверженности растения стрессу. Кроме того, дополнительно был проведен статистический анализ с помощью многофакторного дисперсионного анализа с поправкой на множественные сравнения для анализа наличия различий между выборками с учетом концентрации токсиканта и времени инкубации. Комплексный анализ показал, что на малой выборке с разреженными данными алгоритм OPTICS лучше остальных методов демонстрирует подверженность растений стрессу. При этом для Сu2+ фактор времени инкубации вызывал больший стресс у растений, чем действие самого токсиканта. В дальнейшем для выявления действия Сu2+необходимо использовать его в больших концентрациях. В случаях действияСd2+ и Сr2O72– для последнего была показана наибольшая корреляция с дозой токсиканта.