Статья с описанием исследования ученых Пенсильванского университета и Корнельского университета появится 10 марта 2021 года в журнале Nature.
«Когда я впервые узнал о ДНК, меня учили думать о геноме как о библиотеке, содержащей все книги, когда-либо написанные», – сказал Мэтью Дж. Росси, доцент-исследователь Пенсильванского университета и первый автор статьи. «Геном хранится как часть комплекса ДНК, РНК и белков, называемого хроматином.’Взаимодействие белков и ДНК регулирует, когда и где гены экспрессируются для производства РНК (i.е. читать книгу, чтобы узнать или сделать что-то конкретное). Но при всей этой сложности меня всегда интересовало, как найти подходящую книгу, когда она вам понадобится??
Это вопрос, на который мы пытаемся ответить в этом исследовании."
То, как клетка выбирает правильную книгу, зависит от регуляторных белков и их взаимодействия с ДНК в хроматине, что можно назвать регуляторной архитектурой генома.
Клетки дрожжей могут реагировать на изменения в окружающей их среде, изменяя эту регуляторную архитектуру, чтобы включать или выключать разные гены. В многоклеточных организмах, таких как люди, разница между мышечными клетками, нейронами и всеми другими типами клеток определяется регулированием набора генов, которые эти клетки экспрессируют. Поэтому расшифровка механизмов, контролирующих эту дифференциальную экспрессию генов, жизненно важна для понимания реакции на окружающую среду, развития организма и эволюции.
«Белки должны быть задействованы и собраны в генах, чтобы они могли быть включены», – сказал Б. Франклин Пью, профессор молекулярной биологии и генетики в Корнеллском университете и руководитель исследовательского проекта, который был начат, когда он был профессором Пенсильванского университета. «Мы составили наиболее полную карту этих белков с высоким разрешением, показывающую места, которые они связывают с геномом дрожжей, и раскрывающие аспекты того, как они взаимодействуют друг с другом, чтобы регулировать экспрессию генов."
Команда использовала технику под названием ChIP-exo, версию ChIP-seq с высоким разрешением, чтобы точно и воспроизводимо отобразить места связывания около 400 различных белков, которые взаимодействуют с геномом дрожжей, некоторые в нескольких местах, а другие в тысячах. локации. В ChIP-exo белки химически сшиты с ДНК внутри живых клеток, тем самым запирая их в нужном положении.
Затем хромосомы удаляются из клеток и разрезаются на более мелкие части. Антитела используются для захвата определенных белков и участка ДНК, с которым они связаны.
Затем местоположение взаимодействия белок-ДНК можно определить путем секвенирования ДНК, прикрепленной к белку, и сопоставления последовательности с геномом.
«В традиционных ChIP-seq фрагменты ДНК, прикрепленные к белкам, по-прежнему довольно большие и различаются по длине – от 100 до 500 пар оснований за пределами фактического сайта связывания белка», – сказал Уильям К.M. Лай, доцент Корнельского университета и автор статьи. «В ChIP-exo мы добавляем дополнительный этап обрезки ДНК с помощью фермента, называемого экзонуклеазой.
Это удаляет любую избыточную ДНК, которая не защищена сшитым белком, что позволяет нам получить гораздо более точное местоположение события связывания и лучше визуализировать взаимодействия между белками."
Команда провела более 1200 индивидуальных экспериментов с ChIP-exo, в результате чего были получены миллиарды отдельных точек данных. Для анализа огромных данных использовались суперкомпьютерные кластеры Пенсильванского университета и потребовалось разработать несколько новых биоинформатических инструментов, включая многогранный вычислительный рабочий процесс, предназначенный для выявления закономерностей и выявления организации регуляторных белков в геноме дрожжей.
Анализ, который похож на выбор повторяющихся типов объектов на земле из сотен спутниковых изображений, выявил удивительно небольшое количество уникальных белковых комплексов, которые многократно используются в геноме дрожжей.
«Разрешение и полнота данных позволили нам идентифицировать 21 группу белков, а также идентифицировать отсутствие специфических регулирующих сигналов в генах домашнего хозяйства», – сказал Шон Махони, доцент кафедры биохимии и молекулярной биологии Пенсильванского университета и автор книги бумага. «Вычислительные методы, которые мы разработали для анализа этих данных, могут послужить отправной точкой для дальнейшего развития исследований регуляции генов в более сложных организмах."
Традиционная модель регуляции генов включает белки, называемые «факторами транскрипции», которые связываются со специфическими последовательностями ДНК, чтобы контролировать экспрессию соседнего гена. Однако исследователи обнаружили, что большинство генов дрожжей не соответствуют этой модели.
«Мы были удивлены, обнаружив, что домашним генам не хватает архитектуры белок-ДНК, которая позволяла бы связывать определенные факторы транскрипции, что является отличительной чертой индуцибельных генов», – сказал Пью. "Этим генам просто необходим общий набор белков, которые обеспечивают доступ к ДНК и ее транскрипции без особой необходимости в регулировании. Сохраняется ли эта закономерность в многоклеточных организмах, таких как человек, еще предстоит увидеть.
Это гораздо более сложное предложение, но, подобно тому, как секвенирование генома дрожжей предшествовало секвенированию генома человека, я уверен, что в конечном итоге мы сможем увидеть регуляторную архитектуру генома человека с высоким разрешением."
Работа поддержана U.S.
Национальные институты здоровья, США.S. Национальный научный фонд, Государственный институт вычислительной техники и данных Пенсильвании, а также Advanced CyberInfrastructure (ROAR) в Пенсильванском государстве.