Улучшение компьютерного зрения для ИИ

Под руководством Сумита Джа, профессора факультета компьютерных наук в UTSA, команда изменила традиционный подход, используемый для объяснения решений машинного обучения, который основан на однократном введении шума во входной слой нейронной сети.
Команда показывает, что добавление шума – также известное как пикселизация – на нескольких уровнях сети обеспечивает более надежное представление изображения, которое распознает ИИ, и создает более надежные объяснения решений ИИ.

Эта работа помогает в разработке так называемого «объяснимого ИИ», который стремится обеспечить высоконадежные приложения ИИ, такие как получение медицинских изображений и автономное вождение.
"Речь идет о добавлении шума в каждый слой", – сказал Джа. "Теперь сеть вынуждена изучать более надежное представление входных данных на всех своих внутренних уровнях. Если каждый слой испытывает больше возмущений при каждом обучении, то представление изображения будет более надежным, и вы не увидите, что ИИ не сработает только потому, что вы изменили несколько пикселей входного изображения."
Компьютерное зрение – способность распознавать изображения – имеет множество бизнес-приложений.

Компьютерное зрение может лучше определять проблемные области в печени и мозге онкологических больных. Этот тип машинного обучения также может использоваться во многих других отраслях. Производители могут использовать его для обнаружения уровня дезертирства, дроны могут использовать его для обнаружения утечек в трубопроводе, а агрономы начали использовать его для выявления ранних признаков болезней сельскохозяйственных культур с целью повышения урожайности.

Посредством глубокого обучения компьютер обучается выполнять такие действия, как распознавание речи, идентификация изображений или создание прогнозов. Вместо того, чтобы организовывать данные для обработки наборов уравнений, глубокое обучение работает с базовыми параметрами набора данных и обучает компьютер учиться самостоятельно, распознавая шаблоны с использованием многих уровней обработки.
Работа команды, возглавляемой Джа, является большим шагом вперед по сравнению с предыдущей работой, которую он проводил в этой области.

В документе 2019 года, представленном на семинаре по безопасности искусственного интеллекта, совмещенном с Международной объединенной конференцией по искусственному интеллекту (IJCAI) в этом году, Джа, его студенты и коллеги из Национальной лаборатории Ок-Ридж продемонстрировали, как плохие природные условия могут привести к возникновению опасной нейронной сети. представление. Систему компьютерного зрения попросили распознать минивэн на дороге, и она сделала это правильно. Затем его команда добавила небольшое количество тумана и снова задала сети тот же запрос: ИИ идентифицировал минивэн как фонтан. В результате их статья была лучшим кандидатом на публикацию.

В большинстве моделей, основанных на нейронных обыкновенных дифференциальных уравнениях (ОДУ), машина обучается с одним входом через одну сеть, а затем распространяется по скрытым слоям, чтобы создать один ответ в выходном слое. Эта команда исследователей UTSA, UCF, AFRL и SRI использует более динамичный подход, известный как стохастические дифференциальные уравнения (SDE). Использование связи между динамическими системами, чтобы показать, что нейронные SDE приводят к менее шумным, визуально более четким и количественно надежным атрибуциям, чем те, которые вычисляются с использованием нейронных ODE.

Подход SDE учится не только на одном изображении, но и на наборе соседних изображений из-за введения шума в несколько слоев нейронной сети. По мере того, как вводится больше шума, машина будет изучать развивающиеся подходы и находить лучшие способы дать объяснения или атрибуции просто потому, что модель, созданная в начале, основана на развивающихся характеристиках и / или условиях изображения. Это улучшение нескольких других подходов к атрибуции, включая карты значимости и интегрированные градиенты.
Новое исследование Джа описано в статье «О более гладких атрибутах с использованием нейро-стохастических дифференциальных уравнений»."Соавторы этого нового подхода включают Ричард Эвец из UCF, Альваро Веласкес из AFRL и Сумит Джа из SRI.

Лаборатория финансируется Агентством перспективных оборонных исследовательских проектов, Управлением военно-морских исследований и Национальным научным фондом. Их исследования будут представлены на конференции IJCAI 2021 года, на которой будет принято около 14% заявок.

Среди прошлых докладчиков на этой весьма избирательной конференции были Facebook и Google.
«Я рад поделиться фантастической новостью о том, что наша статья об объяснимом ИИ только что была принята в IJCAI», – добавил Джа. "Это отличная возможность для UTSA принять участие в глобальном обсуждении того, как машина видит."