Древняя ДНК растений: баркодинг неидентифированых образцов исторического фонда Гербария МГУ и археологических находок растительного происхождения из Средней РоссииНИР

Plants Ancient DNA: barcoding of unidentified samples of the Lomonosov Moscow State University historic herbarium and archaeological remains of plant origin from Central Russia.

Источник финансирования НИР

грант РФФИ

Этапы НИР

# Сроки Название
1 1 апреля 2021 г.-15 февраля 2022 г. Древняя ДНК растений: баркодинг неидентифированых образцов исторического фонда Гербария МГУ и археологических находок растительного происхождения из Средней России
Результаты этапа: При анализе препаратов ДНК, которые были получены из гербарных образцов, собранных во Вьетнаме в 2015 году, было показано, что во всех образцах ДНК присутствуют фрагменты, длина которых находится в диапазоне 70-800 п.н. При этом во всех образцах отмечали наличие фракции длинных фрагментов, около 2,5-3 тысяч п.н., хотя доля таких фрагментов в образцах была не высока. При оценке длин фрагментов ДНК, полученной из образцов гербария 1989 года и более старых (гербарий видов сем. Solanaceae) было выявлено, что у основная доля фрагментов ДНК приходилась на низкомолекулярную фракцию: у 62% образцов, которые находились в гербарных фондах около 30 лет, длины фрагментов не превышали 500 п.н., у остальных длины фрагментов не превышали 300 п.н. У 27% образцов из обеих групп, дополнительно присутствовали длинные фрагменты ДНК (средняя длина фрагментов в этой фракции составляла 2,5-2,8 тысяч п.н.) Однако, их концентрация была незначительна. Средняя длина фрагментов ДНК, полученных из образцов, собранных на Филиппинах и хранившихся в гербарных фондах около 185 лет, находилась в диапазоне 15-150 п.н. При этом в 38% таких образцов присутствовали фрагменты ДНК длиной около 2,5 тыс. п.н. Получение продукта амплификации протяженных участков ДНК (маркерных последовательностей, которые возможно использовать для бакродирования) увенчалось успехом для 71% образцов, срок хранения в гербарных фондах составлял 30 и менее лет. Для образцов, срок хранения которых приближался к 185 годам, получить при амплификации участков ДНК, которые соответствовали участку ядерной ДНК ITS1 и ITS2 удалось только для 48% образцов, тогда как участок гена хлоропластов (rbcL) удалось наработать только у 14% образцов. Полученные ампликоны были отсеквенированы (для каждого образца секвенировали смесь ампликонов, всего секвенировали 59 образцов) и сейчас проводится их сборка и анализ с использованием базы данных NCBI. Эти данные готовятся для загрузки в базу данных NCBI в соответствующий BioProject. Опробованные протоколы обогащения образца фрагментом ITS1 показали положительный результат (был получен продукт амплификации) для всех образцов, которые были взяты в работу и для которых наработка более длинных фрагментов традиционным способом была неудачной. После анализа фрагментов ДНК гербарных образцов 2015 и 1989 годов сбора (Вьетнам) с использованием базы данных NCBI удалось установить таксономическую принадлежность 28 образцов из проанализированных 45. Год сбора, образец, род, семейство 2015, MW0755668, Duperrea sp., Rubiaceae 2015, MW0755669, Impatiens sp., Balsaminaceae 2015, MW0755676, Ophiorrhiza sp., Rubiaceae 2015, MW0755677, Stauranthera, Gesneriaceae 2015, MW0755680, Marsdenia sp., Apocinaceae 1989, MW0753181, MW0753180, Vernonia sp., (Decaneuropsis sp.), Asteraceae 1989, MW0753179, Capparis sp., Capparaceae 1989, MW0753177, Saraca sp., Fabaceae 1989, MW0753176, Aglaia sp., Meliaceae 1989, MW0753173, Beilschmiedia sp., Lauraceae 1989, MW0753170, Mitragyna sp., Rubiaceae 1989, MW0753162, Maesa sp., Primulaceae 1989, MW0753158, Kadsura sp./ Schisandra sp., Schisandraceae 1989, MW0753157, Hypserpa, Menispermaceae 1989, MW0753153, Prasoxylon sp. / Astrotrichilia sp., Meliaceae 1989, MW0753147, Dalbergia sp., Fabaceae 1989, MW0753146, Cratoxylum sp., Hypericaceae 1989, MW0753145, Aporosa sp., Phyllanthaceae 1989, MW0753144, Symplocos sp., Symplocaceae 1989, MW0753141, Canarium sp., Burseraceae 1989, MW0753139, Croton sp., Euphorbiaceae 1989, MW0753138, Tecomella sp., Bignoniaceae 1989, MW0753136, Claoxylon sp., Euphorbiaceae 1989, MW0753135, Salacia sp., Celastraceae 1989, MW0753134, Tabernaemontana sp., Apocynaceae 1989, MW0753133, Claoxylon sp., Euphorbiaceae 1989, MW0753132, Piper sp., Piperaceae 1989, MW0753131, Viburnum sp., Adoxaceae После того, как были проведена молекулярно-биологическая часть исследования, проведение сопоставления морфологических признаков, характерных для строения листовых пластинок определенных гербарных образцов, показало, что фрагменты растений, заложенных в гербарий имеют сходные морфологические признаки с представителями этого рода. Оценивали форму размер листовой пластинки, жилкование, листорасположение. При верификации нескольких образцов были получены противоречивые данные, которые не позволяли однозначно трактовать систематическое положение растений. Анализ результатов секвенирования библиотеки, обогащенной целевым фрагментом ITS1, образца MW0755678 показал, что данный сбор с высокой долей вероятности, является образцом нового, еще не описанного вида, относящегося к сем. Acanthaceae. После биоинформатической обработки данных секвенирования обогащенной библиотеки было собрано 17 контигов (длина максимального собранного контига – 165 п.н, минимального – 65 п.н.), с покрытием больше 23х. При сравнении их с данными из базы данных NCBI было показано, что половина из них на 88,46 - 97,18 % идентичны последовательности ITS1 Spathacanthus hoffmannii [AF289802.1], 4 контига на 92,37-98,7% сходны с ITS1 Justicia prominens [KY632590.1], 3 контига на 92 – 93,5% ITS1 Pseuderanthemum tunicatum [MW464271.1]. Единичные контиги оказались на 94,63% идентичными ITS1 Chamaeranthemum gaudichaudii [MW464275.1] и на 93,62% - Schaueria malifolia [KJ535212.1]. Данные полногеномного секвенирования этого образца дополнили полученный результат секвенирования обогащенных библиотек данными о длинных пластомных последовательностях (всего было собрано 3839 контигов, N50 = 741, максимальная длина собранного контига – 41560 п.н.). После выравнивания на базу данных nt с помощью blastn, таксономия полученных последовательностей была получена с помощью MEGAN6 методом LCA. Оказалось, что участок хлоропластного генома на 98% сходен с пластомами Pseuderanthemum haikangense, Clinacanthus nutans и Justicia flava. Дополнительно, были просеквенированы геномные библиотеки еще трех видов этого семейства (Acanthaceae), в результате биоинформатической обработки и сборки данных были получены длинные прочтения хлоропластных геномов: для 6(3) g_6 5 (3081 штука, N50 = 903, макс. длина = 19110), для образца Ac3 r g_1 (6450 штук, N50 = 691, макс. длина = 33374), и для Ac1 r g_2 (5781 штука, N50 = 685, макс. длина = 26224). Полученные контиги также были выровнены на базу данных nt с помощью blastn, таксономия полученных последовательностей была получена с помощью MEGAN6 методом LCA. И эти геномные сборки оказались на 95-99% идентичные последовательностям пластомов рода Justicia. Исходя из полученных данных секвенирования на сегодняшний день нами было принято решение продолжить работы, связанные с уточнением таксономической принадлежности этого образца с привлечением специалистов, занимающихся данной группой растений. В результате секвенирования обогащенной библиотеки для образца (MW0753166), были собраны 6 контигов длиной от 71 до 243 п.н., с минимальным покрытием 15,3х, участка ядерного генома ITS1. Максимальным оказалось покрытие для самой длинной собранной последовательности (9831х). При сравнении полученных последовательностей с данными базы данных NCBI было показано, что все они сходны с последовательностями ITS1 видов рода Derris. Оценка верности определения по морфологическим признакам показала, что этот сбор действительно может принадлежать какому-либо виду, относящемуся к роду Derris. В целом, можно сказать, что предложенный нами метод обогащения библиотек целевыми фрагментами действительно помогает получать данные, позволяющие уточнить систематическое положение. Более точно мы сможем сделать вывод об эффективности методики после попарного сравнения данных секвенирования полногеномных библиотек и библиотек, полученных по протоколу с применением анкерной пцр (для одного и того же образца). Точность определения может зависеть, в том числе, и от наполненности баз данных, с которыми проводится сравнение получаемых в процессе работы последовательностей. При этом использование ограниченного числа маркерных последовательностей упрощает биоинформатическую обработку получаемых данных секвенирования, при этом не снижая эффективность определения образца. При проведении оценки стоимости расходных материалов (реактивов, пластика, расходных материалов) по ценам на март 2022 года (по курсу 1 доллар – 85 рублей) (файл в приложении) стоимость секвенирования одного образца, с использованием обогащенных библиотек (по 1 маркерной последовательности) находится в районе 18,5 тыс рублей. При дополнении образца другими последовательностями, стоимость незначительно увеличивается. Если будет проводится обогащение 2 маркерными последовательностями, то стоимость секвенирования 1 образца увеличится на 280 рублей, если обогащение будет проводится 3 маркерными последовательностями – на 520 рублей (увеличится стоимость реакционных смесей и праймеров для проведения обогащения). Поскольку количество информации, которое возможно получить на 1 обогащенный образец более чем достаточно для того, чтобы определить необходимую последовательность с глубиной чтения не менее 30х, то стоимость самого секвенирования практически не изменится. Кроме того, необходимо отметить, что для секвенирования обогащенных библиотек необходимо соблюдение правила: при секвенировании обогащенных однотипным материалом образцов их доля в общем количестве ДНК не должна превышать 30%. Соответственно, при секвенировании подобных образцов с использованием тех же сиквенсовых реактивов возможно дополнительно проанализировать до 10-15 геномных библиотек. Стоимость секвенирования одного полногеномного образца (при условии, что с использованием 1 чипа и 1 набора секвенирования будет проводиться анализ 48 образцов) оказывается примерно в 1,5 раза выше и составляет около 31 тыс. руб. Трудозатраты на биоинформатический анализ получаемых данных секвенирования обоих вариантов примерно одинаковы, поскольку требуют разных подходов при работе с полученным материалом. Для определения систематической принадлежности образцов с использованием однотипного материала проводится с использованием специализированных баз данных, которые, как правило создаются под определенные проекты и требуют значительных трудозатрат. При этом мы гарантированно получаем данные о строении интересующих нас участков геномов. С другой стороны, анализ полногеномных образцов позволяет, при желании, получить более разнообразную информацию, в том числе и о тех участках генома, для которых не проводили обогащение, не затрачивая на это дополнительных средств для проведения секвенирования. Однако, работа с образцами, в которых ДНК сильно деградировала и размер самых длинных фрагментов не превышает 150 п.н. (а в случае с образцами, которые находят при проведении археологических раскопок фрагменты ДНК не более 20 п.н.) скорее всего окажется более успешной именно при применении протоколов, позволяющих провести обогащение целевыми последовательностями.

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".