Метод выявления химерных последовательностей и коррекции ошибок во флоуграммах при секвенировании геномастатья
Статья опубликована в журнале из списка RSCI Web of Science
Статья опубликована в журнале из перечня ВАК
Статья опубликована в журнале из списка Web of Science и/или Scopus
Дата последнего поиска статьи во внешних источниках: 23 сентября 2021 г.
Аннотация:Предложен новый метод исправления ошибок в ридах/флоуграммах, полученных при секвенировании генома, и выявления так называемых «химерных» ридов/флоуграмм. Метод базируется на том, что каждый фрагмент генома покрывается, вообще говоря, несколькими ридами/флоуграммами. Метод может быть потенциально применен при использовании различных технологий секвенирования, однако разрабатывался он главным образом для технологий, порождающих флоуграммы (в частности, пиросеквенирования и полупроводникового секвенирования). Применение алгоритма, осуществляющего исправление ошибок и выявление химерных последовательностей, перед начальной сборкой генома позволяет существенно уменьшить количество ошибок в ридах/флоуграммах, и, тем самым, повысить качество начальной сборки.
Предложенный метод был апробирован на данных, полученных при модельной симуляции секвенирования. Тестирование показало, метод позволяет исправить 97.7-99.3% ошибок. При этом большинство неисправленных ошибок связано с длинными гомополимерами и/или локализуется в малом числе позиций генома. Также методы был применен к набору флоуграмм, полученных при пиросеквенировании. Результаты исправления оказались самосогласованными, в большинстве случаев осуществленные исправления подтверждались контигами, полученными из набора флоуграмм сборщиком Newbler (454 Life Sciences).