Модели искусственного интеллекта для анализа изображений рака используют ярлыки, которые вносят предвзятость

Новое исследование, проведенное учеными из Чикагского университета, показывает, что модели глубокого обучения, обученные на больших наборах генетических данных рака и гистологии тканей, могут легко идентифицировать учреждение, предоставившее изображения. Модели, которые используют методы машинного обучения, чтобы «научиться» распознавать определенные признаки рака, в конечном итоге используют сайт отправки в качестве ярлыка для прогнозирования результатов для пациента, объединяя их вместе с другими пациентами из того же места вместо того, чтобы полагаться на биология отдельных пациентов.

Это, в свою очередь, может привести к предвзятости и упущению возможностей лечения у пациентов из групп расовых или этнических меньшинств, которые с большей вероятностью будут представлены в определенных медицинских центрах и уже испытывают трудности с доступом к медицинской помощи.
«Мы обнаружили явную дыру в текущей методологии разработки моделей глубокого обучения, которая делает определенные регионы и группы пациентов более уязвимыми для включения в неточные алгоритмические прогнозы», – сказал Александр Пирсон, доктор медицинских наук, доцент кафедры медицины в Калифорнийском университете в Чикаго.

Медицина и соавтор. Исследование было опубликовано 20 июля в Nature Communications.
Одним из первых шагов в лечении онкологического пациента является взятие биопсии или небольшого образца ткани опухоли.

На предметное стекло прикрепляют очень тонкий срез опухоли, который окрашивают разноцветными красками для просмотра патологоанатомом для постановки диагноза. Затем можно создавать цифровые изображения для хранения и удаленного анализа с помощью сканирующего микроскопа. Хотя эти шаги в основном являются стандартными для лабораторий патологии, незначительные различия в цвете или количестве пятен, методах обработки тканей и в оборудовании для визуализации могут создавать уникальные подписи, такие как метки, на каждом изображении. Эти зависящие от местоположения сигнатуры не видны невооруженным глазом, но легко обнаруживаются мощными алгоритмами глубокого обучения.

Эти алгоритмы потенциально могут стать ценным инструментом, позволяющим врачам быстро анализировать опухоль и определять варианты лечения, но введение такого рода предвзятости означает, что модели не всегда основывают свой анализ на биологических сигнатурах, которые они видят в изображения, а скорее артефакты изображения, созданные различиями между отправляющими сайтами.
Пирсон и его коллеги изучили производительность моделей глубокого обучения, обученных на данных из Атласа генома рака, одного из крупнейших хранилищ генетических данных рака и данных изображений тканей.

Эти модели могут прогнозировать показатели выживаемости, паттерны экспрессии генов, мутации и многое другое на основе гистологии тканей, но частота этих характеристик пациентов широко варьируется в зависимости от того, какие учреждения предоставили изображения, и модель часто по умолчанию использует «самый простой» способ различения между образцами – в данном случае отправляющий сайт.
Например, если больница A обслуживает в основном состоятельных пациентов с большими ресурсами и лучшим доступом к медицинской помощи, изображения, представленные из этой больницы, обычно будут указывать на лучшие результаты для пациентов и показатели выживаемости.

Если больница B обслуживает более обездоленное население, которое испытывает трудности с доступом к качественной помощи, изображения, представленные сайтом, обычно предсказывают худшие результаты.
Исследовательская группа обнаружила, что после того, как модели определили, какое учреждение предоставило изображения, они, как правило, использовали это в качестве замены для других характеристик изображения, включая происхождение. Другими словами, если методы окрашивания или визуализации для слайда выглядели так, как будто они были представлены в больнице A, модели предсказывали бы лучшие результаты, тогда как они предсказывали бы худшие результаты, если бы они выглядели как изображение из больницы B. И наоборот, если бы все пациенты в больнице B имели биологические характеристики, основанные на генетике, которые указывали на худший прогноз, алгоритм связал бы худшие результаты с паттернами окраски в больнице B, а не с тем, что он видел в тканях.
«Алгоритмы предназначены для поиска сигнала для различения изображений, и он делает это лениво, идентифицируя сайт», – сказал Пирсон. «Мы действительно хотим понять, какая биология внутри опухоли с большей вероятностью предрасполагает к устойчивости к лечению или к раннему метастатическому заболеванию, поэтому мы должны отделить эту специфичную для сайта цифровую гистологическую сигнатуру от истинного биологического сигнала."

Ключом к предотвращению такого рода предвзятости является тщательный анализ данных, используемых для обучения моделей. Разработчики могут гарантировать, что различные исходы заболеваний распределяются равномерно по всем сайтам, используемым в обучающих данных, или путем изоляции определенного сайта во время обучения или тестирования модели, когда распределение результатов неравномерно.

В результате будут созданы более точные инструменты, которые могут предоставить врачам информацию, необходимую им для быстрой диагностики и планирования лечения больных раком.
«Обещание искусственного интеллекта заключается в том, что он сможет обеспечить точное и быстрое восстановление здоровья большему количеству людей», – сказал Пирсон. «Однако, чтобы удовлетворить потребности обездоленных членов нашего общества, мы должны иметь возможность разрабатывать алгоритмы, которые являются компетентными и делают соответствующие прогнозы для всех."