Расширение применения геномных последовательностей с помощью «растений Kmasker»

В биоинформатике термин k-mer используется для описания нуклеотидной последовательности определенной длины «k."Определяя и подсчитывая такие последовательности, исследователи могут количественно определять повторяющиеся последовательности в геноме, который они изучают, и назначать им соответствующие позиции. Еще в 2014 году исследователи IPK в Гатерслебене использовали этот подход для разработки in-silico (компьютерного) инструмента «Kmasker.«Он был использован для обнаружения повторов в характеристике генома ячменя (Schmutzer et al., 2014).
Использование NGS становится все более и более важным, но безошибочная композиция сложных геномов на основе результатов NGS все еще остается проблемой. По этой причине исследователи недавно решили возродить и расширить этот первоначальный экспериментальный проект.

Под руководством доктора. Томас Шмутцер, ранее работавший в исследовательской группе «Биоинформатика и информационные технологии» в IPK, а теперь связанный с MLU, ученые из MLU, IPK, Wageningen University & Research и IPB Halle работали в тесном сотрудничестве над редизайном и разработкой « Kmasker заводы.«Это сотрудничество было в значительной степени поддержано двумя сервисными центрами« GCBN »и« CiBi »из Немецкой сети биоинформатической инфраструктуры» de.NBI."
«Растения Kmasker» позволяют проводить быстрый и безреференсный скрининг нуклеотидных последовательностей с использованием производных k-меров всего генома.

В дополнение к предыдущей версии, инструмент биоинформатики теперь также позволяет проводить сравнительные исследования между различными сортами или близкородственными видами и поддерживает идентификацию последовательностей, подходящих в качестве зондов для флуоресцентной гибридизации in situ (FISH) или управляющих РНК, специфичных для CRISPR / Cas9. Кроме того, «Растения Kmasker» были опубликованы вместе с веб-сервисом, который содержит предварительно рассчитанные индексы для выбранных экономически важных сельскохозяйственных культур, таких как ячмень или пшеница.

Доктор. Шмутцер подчеркивает, что «этот инструмент позволит исследователям растений во всем мире тестировать геномы растений и, таким образом, например, идентифицировать свободные от повторения части интересующей их последовательности.«Скорее, он считает, что улучшенные функции позволят обнаруживать области-кандидаты последовательностей, которые размножились в геноме одного вида, но отсутствуют у других видов или встречаются в меньших количествах копий.

Это общий эффект, который способствует фенотипической изменчивости агрономической значимости различных культур. Ярким примером является ген Vrn-H2, который присутствует в единственном экземпляре у озимого ячменя, в то время как он отсутствует в линиях ярового ячменя.

Веб-сервис «Растения Kmasker» теперь доступен как часть IPK Crop Analysis Tool Suite (CATS) и, следовательно, как услуга de.Платформа обслуживания NBI. В качестве альтернативы исходный код "Kmasker plant" можно получить напрямую и установить через GitHub.