Глубокое машинное обучение завершает информацию о биоактивности одного миллиона молекул

Используя искусственные нейронные сети, ученые получили экспериментальные данные для миллиона соединений и разработали пакет программ для оценки любого типа молекулы.
Работа опубликована в журнале Nature Communications.
Лаборатория структурной биоинформатики и сетевой биологии, возглавляемая научным сотрудником ICREA доктором. Патрик Элой завершил сбор информации о биоактивности миллиона молекул, используя вычислительные модели глубокого машинного обучения.

Он также раскрыл инструмент для прогнозирования биологической активности любой молекулы, даже когда нет экспериментальных данных.
Эта новая методология основана на Chemical Checker, крупнейшей на сегодняшний день базе данных профилей биоактивности псевдофармацевтических препаратов, разработанной той же лабораторией и опубликованной в 2020 году. Chemical Checker собирает информацию из 25 областей биоактивности для каждой молекулы. Эти пространства связаны с химической структурой молекулы, мишенями, с которыми она взаимодействует, или изменениями, которые она вызывает на клиническом или клеточном уровне.

Однако эта очень подробная информация о механизме действия является неполной для большинства молекул, подразумевая, что для конкретной молекулы может быть информация для одного или двух пространств биологической активности, но не для всех 25.
С помощью этой новой разработки исследователи интегрируют всю экспериментальную информацию, доступную с помощью методов глубокого машинного обучения, чтобы можно было составить все профили активности, от химического до клинического уровня, для всех молекул.

«Новый инструмент также позволяет нам прогнозировать области биологической активности новых молекул, и это имеет решающее значение в процессе открытия лекарств, поскольку мы можем выбрать наиболее подходящих кандидатов и отбросить те, которые по той или иной причине не будут работать», – объясняет Доктор. Элой.

Библиотека программного обеспечения находится в свободном доступе для научного сообщества по адресу bioactivitysignatures.org, и исследователи будут регулярно его обновлять по мере появления новых данных о биологической активности. С каждым обновлением экспериментальных данных в Chemical Checker искусственные нейронные сети также будут пересматриваться для уточнения оценок.
Прогнозы и надежность
Данные о биоактивности, предсказанные моделью, имеют большую или меньшую степень надежности в зависимости от различных факторов, включая объем имеющихся экспериментальных данных и характеристики молекулы.

Помимо прогнозирования аспектов активности на биологическом уровне, система, разработанная доктором. Команда Элоя обеспечивает меру степени надежности прогноза для каждой молекулы. "Все модели неправильные, но некоторые полезны! Мера уверенности позволяет нам лучше интерпретировать результаты и выделять, какие области биоактивности молекулы точны, а в каких можно учитывать частоту ошибок ", – поясняет доктор. Мартино Бертони, первый автор произведения.

Тестирование системы с помощью библиотеки соединений IRB Barcelona
Чтобы проверить этот инструмент, исследователи провели поиск в библиотеке соединений IRB Barcelona в поисках тех, которые могут быть хорошими кандидатами в лекарства для модуляции активности фактора транскрипции, связанного с раком (SNAIL1), активность которого практически невозможно модулировать из-за прямого воздействия. связывание лекарств (считается «недосягаемой» целью). Из первого набора из 17000 соединений модели глубокого машинного обучения предсказывали характеристики (в их динамике, взаимодействии с целевыми клетками и белками и т. Д.) для 131, которые соответствуют целевому.

Способность этих соединений разлагать SNAIL1 была подтверждена экспериментально, и было замечено, что для высокого процента эта способность к разложению согласуется с тем, что предсказывали модели, что подтверждает правильность системы.
Эта работа стала возможной благодаря финансированию правительства Каталонии, Министерства науки и инноваций Испании, Европейского исследовательского совета, Европейской комиссии, Государственного исследовательского агентства и ЕФРР.

2 комментария к “Глубокое машинное обучение завершает информацию о биоактивности одного миллиона молекул”

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *