ИСТИНА |
Войти в систему Регистрация |
|
ИПМех РАН |
||
Цифровой гербарий МГУ – крупнейшая в России база данных по биоразнообразию. Она была создана в рамках гранта РНФ № 14-50-00029 (2015–2018) и продолжает развиваться по грантам РФФИ и GBIF, а также в ходе текущей работы Гербария МГУ, сопутствующих научных исследований коллег из других учреждений и благодаря помощи волонтёров. Цифровой гербарий МГУ доступен в интернете по адресу https://plant.depo.msu.ru/, открытая версия (оптимизирована в т.ч. для мобильных устройства) находится на https://plant.depo.msu.ru/open/, GBIF-зеркало коллекции доступно по адресу https://doi.org/10.15468/cpnhcc . На сегодняшний день Цифровой гербарий МГУ состоит из шести оцифрованных коллекций общим объемом 1 011 930 образцов, которые принадлежат 37 872 видам. Это собственно (1) Гербарий МГУ, (2) Гербарий мохообразных МГУ, (3) Типовой гербарий МГУ, (4) Herbarium Alchemillarum В.Н. Тихомирова, (5) Коллекция ДНК, (6) DigiPic: Digital Pictures of Living Plants, (7) Гербарий ГБС РАН (московский раздел). Сканирование гербарных материалов при разрешении 300 dpi сопровождалось внесением для каждого образца названия вида, под которым он хранится в коллекции; индекса района (одного из 60); идентификатора (номер штрихкода). Это позволило пользователям быстро ориентироваться в отсканированных материалах и работать с ними, используя как таксономические, так и географические выборки. С лета 2018 г. в качестве обязательных метаданных каждого образца мы добавили дату сбора и первого коллектора для всех образцов, в которых указана единственная и ясная дата сбора и хотя бы фамилия коллектора. На сегодняшний день, таких образцов 79%. Первые полнотекстовые расшифровки появились в Цифровом гербарии МГУ в июле 2017 г. В тот момент их было 1207, к сентябрю 2017 г. их число превысило 5000 штук. Постепенный ввод этикеток со вполне очевидным приоритетом в пользу ввода данных для образцов с территории России привел к заметному росту этого показателя. К 3 сентября 2019 г. в систему введены этикетки 314 257 образцов. Ещё около 20 тыс. этикеток ожидают проверки и будут опубликованы в ближайшем будущем. Массив геопривязок растет более интенсивно, чем ввод текстовых данных. Первые геоданные появились в Цифровом гербарии МГУ также в июле 2017 г. В тот момент их было 2910, спустя пару месяцев их число превысило 5 000 штук. На 3 сентября 2019 г. 420 749 образцов (42%) привязаны к карте. Для работы с геопривязками используется три основных инструмента – (1) ввод координат с образцов, если они там ясно указаны непосредственно на этикетках, (2) ручная геопривязка образцов операторами с использованием доступных картографических и текстовых источников, (3) использование алгоритмов ИСТРА (Интеллектуальной Системы Топонимического Распознавания и Атрибутирования). По окончанию гранта РНФ, перед нами встала задача поиска источников финансирования для завершения начатой работы - стопроцентного ввода данных с этикеток и полной геопривязки всех образцов Цифрового гербария МГУ. В 2019 г. наша работа идёт по трем грантам РФФИ (19-34-70018, 19-44-233012, 19-44-710002) и одному гранту GBIF (Russia2019_14).