Описание:Целью курса является знакомство с основами геномики растений. Курс состоит из двух частей, теоретической и практической. В рамках теоретической части курса рассматриваются такие вопросы как структура и величина ядерного, хлоропластного, митохондриального генома растений. Информация о базах данных, содержащих информацию о геномах растений, о необработанных данных высокопроизводительного секвенирования. Поиск информации в базах данных. Семейство компьютерных программ BLAST, подходы к поиску гомологов белков или нуклеиновых кислот. Методы секвенирования геномов растений. Основные принципы секвенирования по Сэнгеру, а также высокопроизводительного секвенирования (основной упор на платформы Illumina и Ion Torrent). Одноконцевые и парноконцевые прочтения. Производительность секвенаторов. Основные принципы создания геномных библиотек для высокопроизводительного секвенирования. Форматы файлов, содержащих информацию о последовательностях (*.fasta, *.fastq и т.п.). Основные подходы к сборке геномов, в том числе оценка качества результатов секвенирования, тримминг, референсная сборка геномов, сборка геномов de novo. Понятия «контиг», «скаффолд». Оценка результатов сборки геномов, статистика длин набора контигов N50, L50 и т.п. Аннотация последовательностей. Депонирование последовательностей в базы данных.
В рамках практической части курса слушателям предлагается решить практические задачи, такие как: провести поиск в базах данных и определить каков размер и сколько известно ядерных, митохондриальных, хлоропластных геномов (для заданного семейства растений). Осуществить поиск заданной информации с помощью BLAST. Рассчитать теоретически, какое количество информации при высокопроизводительном секвенировании генома заданного вида растения необходимо получить для успешной сборки. Знакомство с программой FastQC, оценка качества секвенирования (на примере данных Illumina и Ion Torrent). Знакомство с программой CLC Genomic Workbench, проведение тримминга, проведение референсной сборки пластома (на предложенном примере данных секвенирования Illumina), проведение сборки de novo (на тех же данных), оценка и сравнение полученных результатов. Знакомство с комплексом программ GeSeq. Аннотация собранных последовательностей.