Этот метод описан в статье в Proceedings of the National Academy of Sciences на этой неделе.
«Ключевым достижением является алгоритм кодирования, который позволяет точно извлекать информацию, даже если нити ДНК частично повреждены во время хранения», – сказал Илья Финкельштейн, доцент кафедры молекулярной биологии и один из авторов исследования.
Люди создают информацию с экспоненциально более высокой скоростью, чем мы раньше, что способствует потребности в способе эффективного хранения большего количества информации таким образом, чтобы его хватило на долгое время. Такие компании, как Google и Microsoft, входят в число тех, кто исследует использование ДНК для хранения информации.
«Нам нужен способ хранения этих данных, чтобы они были доступны, когда и где это необходимо, в удобочитаемом формате», – сказал Стивен Джонс, ученый-исследователь, который сотрудничал над проектом с Финкельштейном; Билл Пресс, профессор информатики и интегративной биологии; и Ph.D. выпускник Джон Хокинс. "Эта идея использует то, что биология делала на протяжении миллиардов лет: хранение большого количества информации в очень маленьком пространстве, которое длится долгое время. ДНК не занимает много места, ее можно хранить при комнатной температуре и прослужить сотни тысяч лет."
ДНК примерно в 5 миллионов раз эффективнее существующих методов хранения. Другими словами, капля ДНК объемом один миллилитр может хранить такой же объем информации, как два Walmarts, заполненные серверами данных. И ДНК не требует постоянного охлаждения и жестких дисков, подверженных механическим сбоям.
Есть только одна проблема: ДНК подвержена ошибкам.
А когда в генетическом коде есть ошибки, это сильно отличается от ошибок в компьютерном коде. Ошибки в компьютерных кодах, как правило, проявляются как белые пятна в коде.
Ошибки в последовательностях ДНК проявляются в виде вставок или удалений. Проблема в том, что когда что-то удаляется или добавляется в ДНК, вся последовательность сдвигается, и нет пустых пятен, чтобы кого-то предупредить.
Раньше, когда информация хранилась в ДНК, фрагмент информации, который нужно было сохранить, например, абзац из романа, повторялся от 10 до 15 раз.
Когда информация была прочитана, повторения будут сравниваться, чтобы исключить любые вставки или удаления.
«Мы нашли способ построить информацию, больше похожую на решетку», – сказал Джонс. "Каждый фрагмент информации подкрепляет другие фрагменты информации. Таким образом, его нужно прочитать только один раз."
Язык, разработанный исследователями, также позволяет избежать участков ДНК, которые подвержены ошибкам или трудночитаемы.
Параметры языка также могут меняться в зависимости от типа хранимой информации. Например, пропущенное слово в романе не так важно, как пропущенный ноль в налоговой декларации.
Чтобы продемонстрировать извлечение информации из деградированной ДНК, команда подвергла код «Волшебник страны Оз» воздействию высоких температур и экстремальной влажности. Несмотря на то, что нити ДНК были повреждены в этих суровых условиях, вся информация по-прежнему успешно расшифровывалась.
«Мы пытались решить как можно больше проблем с процессом одновременно», – сказал Хокинс, который недавно работал в Оденском институте вычислительной техники и наук UT. "То, что у нас получилось, весьма примечательно."