![]() |
ИСТИНА |
Войти в систему Регистрация |
ИПМех РАН |
||
В последнее время все большую популярность набирает использование подходов машинного обучения для предсказания различных сигналов в последовательности ДНК. Новейшие подходы способны предсказывать, в частности, эффекты геномных вариантов с высокой точностью. Тем не менее, эти подходы не способны обобщать информацию, полученную из данных различного масштаба (десятки и тысячи пар оснований). В данный момент наша лаборатория участвует в коллаборации GRECO-BIT, организующей конкурс IBIS по созданию лучшей модели мотива связывания ТФ. В рамках нее российскими участниками консорциума был проведен систематический анализ массива экспериментальных данных по более чем ста факторам транскрипции человека, многие из которых ранее не исследовалась. Срез данных включает результаты секвенирования ДНК, полученной в экспериментах пяти типов: ChIP-seq, PBM, HT-SELEX, Genomic HT-SELEX и SMiLE-seq. В этой работе мы планируем: * Создать индивидуальные архитектуры для каждого из пяти типов данных, способную качественно предсказывать аффинность конкретной последовательности в эксперименте соответствующего типа. * Обучить интегративную нейросетевую модель мотива связывания ТФ, способную производить предсказание достоверного связывания с различным разрешением в последовательностях разной длины. * Провести валидацию полученной модели на данных по влиянию на экспрессию однонуклеотидных замен и аллель-специфичного связывания (ASB).