Как показывают исследования, GenBank можно доверять: 4 сравнения.7 миллионов последовательностей мтДНК показывают, что GenBank надежен для идентификации животных

«Мы хотели использовать GenBank для идентификации ДНК в образцах воды океана, когда мы оцениваем состояние коралловых рифов и других морских экосистем, но мы были обеспокоены сообщениями, ставящими под сомнение точность этих данных», – сказал Матье Лерэ, научный сотрудник Смитсоновский институт тропических исследований (STRI). «При сравнении последовательностей мы обнаружили меньше ошибок, чем предполагали люди, и это очень хорошая новость, потому что программы мониторинга и усилия по сохранению все больше полагаются на анализ ДНК окружающей среды."
Надежность данных в GenBank, виртуальной библиотеке, поддерживаемой U.S. Национальный центр биотехнологической информации при Национальном институте здравоохранения, куда генетики депонируют последовательности ДНК всех живых существ, в прошлом подвергался сомнению.

Статья под названием «Можете ли вы сделать ставку на GenBank??", опубликованная в журнале Trends in Ecology and Evolution в 2003 г., ссылалась на исследования, показывающие, что половина последовательностей митохондриальной ДНК человека содержит ошибки и что существуют значительные различия в последовательностях, депонированных для плодовых мушек. В другой статье сообщалось, что 12 из 51 вида очень ядовитого гриба Amanita были неправильно идентифицированы.

«Мы предполагали, что обнаружим множество ошибок, когда начали исследование», – сказала Нэнси Ноултон, почетный ученый STRI и Национального музея естественной истории Смитсоновского института.
«Некоторые люди думают, что GenBank – это просто свалка данных», – сказал Лерэ. "Никто не проверяет, правильно ли введены данные.

Исследователи просто загружают свои данные о последовательности, и им не нужно размещать образец в каком-либо конкретном месте, поэтому, если есть вопрос, может не быть способа вернуться к источнику, чтобы узнать, верна ли последовательность. Нам нужно было убедиться, что GenBank – хороший инструмент для идентификации морских организмов в наших образцах, поэтому мы решили выяснить."

Совместно с коллегами из Academia Sinica и Университета Джорджа Вашингтона Лерэй и Ноултон оценили долю последовательностей с неправильными названиями родов, семейств, порядков, классов и типов. В целом, менее 1 процента последовательностей были помечены неправильно. Они определили определенные группы животных, которые вызывают особые проблемы, и некоторые из потенциальных источников ошибок, такие как неправильная маркировка и заражение от людей, грызунов, лабораторных животных, продуктов питания, комаров и домашних животных, таких как собаки и кошки.

«Например, когда вы вводите данные последовательности, в какой-то момент появляется раскрывающееся меню, дающее возможность выбора различных видов», – сказал Лерэ. "Некоторые люди, очевидно, просто выбрали неправильный вид, тот, который находится над или под названием вида, в который они пытались войти. Эту часть процесса можно исправить, чтобы еще больше снизить частоту ошибок."

Прямая идентификация ДНК – это быстрый и недорогой способ ответить на многие вопросы об окружающей среде, а GenBank – надежный инструмент для определения источника ДНК. Авторы пришли к выводу: «Наши обнадеживающие результаты предполагают, что быстрое внедрение подходов, основанных на ДНК, поддерживается биоинформатической инфраструктурой, способной оценивать как потери биоразнообразия, вызванные глобальными изменениями, так и эффективность природоохранных усилий, направленных на замедление или обращение вспять этих потерь."