Это задача группы ученых из США.S. Аргоннская национальная лаборатория Министерства энергетики (DOE) работает над преодолением. Искусственный интеллект стал универсальным решением проблем, связанных с обработкой больших данных. Для ученых, которые используют Advanced Photon Source (APS), пользовательский объект Управления науки Министерства энергетики США в Аргонне, для обработки 3D-изображений, это может быть ключом к превращению рентгеновских данных в видимые, понятные формы с гораздо большей скоростью.
Прорыв в этой области может иметь последствия для астрономии, электронной микроскопии и других областей науки, зависящих от больших объемов 3D-данных.
Исследовательская группа, в которую входят ученые из трех аргоннских подразделений, разработала новую вычислительную структуру под названием 3D-CDI-NN и показала, что она может создавать 3D-визуализации из данных, собранных в APS, в сотни раз быстрее, чем традиционные методы. Исследование команды было опубликовано в журнале Applied Physics Reviews, изданном Американским институтом физики.
CDI означает когерентную дифракционную визуализацию, рентгеновский метод, который включает отражение ультраярких рентгеновских лучей от образцов. Эти лучи света затем будут собираться детекторами в качестве данных, и требуются некоторые вычислительные усилия, чтобы превратить эти данные в изображения. Отчасти проблема, как объясняет Мэтью Черукара, руководитель группы вычислительной рентгеновской науки в отделе рентгеновских исследований Аргонны (XSD), заключается в том, что детекторы улавливают только часть информации от лучей.
Но в недостающих данных содержится важная информация, и ученые полагаются на компьютеры, чтобы заполнить эту информацию. Как отмечает Черукара, в то время как это занимает некоторое время в 2D, для 3D-изображений требуется еще больше времени. Таким образом, решение состоит в том, чтобы обучить искусственный интеллект распознавать объекты и микроскопические изменения, которым они претерпевают, прямо из необработанных данных, без необходимости заполнять недостающую информацию.
Для этого команда начала с моделирования рентгеновских данных для обучения нейронной сети.
NN в названии фреймворка, нейронная сеть – это серия алгоритмов, которые могут научить компьютер предсказывать результаты на основе данных, которые он получает. Генри Чан, ведущий автор статьи и научный сотрудник Центра наномасштабных материалов (CNM), Научно-исследовательского центра Министерства энергетики США в Аргонне, руководил этой частью работы.
«Мы использовали компьютерное моделирование для создания кристаллов разных форм и размеров, и мы преобразовали их в изображения и дифракционные картины для обучения нейронной сети», – сказал Чан. "Простота быстрого создания множества реалистичных кристаллов для обучения – преимущество моделирования."
Эта работа была выполнена с использованием ресурсов графического процессора в Аргоннской объединенной лаборатории оценки систем, которая развертывает передовые испытательные стенды для проведения исследований новых высокопроизводительных вычислительных платформ и возможностей.
По словам Стефана Хрушкевича, физика и руководителя группы в отделе материаловедения Аргонна, после обучения сети она может довольно быстро прийти к правильному ответу.
Тем не менее, есть еще возможности для доработки, поэтому структура 3D-CDI-NN включает в себя процесс, позволяющий довести сеть до конца. Хрушкевич вместе с аспирантом Северо-Западного университета Саугатом Канделом работали над этим аспектом проекта, что снижает потребность в длительных итеративных шагах.
«Отдел материаловедения заботится о когерентной дифракции, потому что вы можете видеть материалы с длиной в несколько нанометров – примерно в 100 000 раз меньше ширины человеческого волоса – с помощью рентгеновских лучей, которые проникают в окружающую среду», – сказал Хрушкевич. "Этот документ является демонстрацией этих передовых методов, и он значительно облегчает процесс получения изображений.
Мы хотим знать, что такое материал и как он меняется с течением времени, и это поможет нам лучше его отображать при проведении измерений."
В качестве последнего шага способность 3D-CDI-NN заполнять недостающую информацию и создавать трехмерную визуализацию была протестирована на реальных рентгеновских данных крошечных частиц золота, собранных на канале 34-ID-C в APS.
Результатом является вычислительный метод, который в сотни раз быстрее на смоделированных данных и почти так же быстро на реальных данных APS. Тесты также показали, что сеть может восстанавливать изображения с меньшим объемом данных, чем обычно требуется для компенсации информации, не полученной детекторами.
Следующим шагом этого исследования, по словам Чана, является интеграция сети в рабочий процесс APS, чтобы он учился на данных по мере их получения. По его словам, если сеть будет учиться на данных на канале передачи, она будет постоянно улучшаться.
Для этой команды в этом исследовании также есть элемент времени. Как указывает Черукара, в настоящее время ведется масштабное обновление APS, и объем данных, генерируемых сейчас, будет экспоненциально увеличиваться после завершения проекта. Модернизированный APS будет генерировать рентгеновские лучи, которые будут до 500 раз ярче, а когерентность луча – характеристика света, которая позволяет ему дифрагировать таким образом, чтобы кодировать больше информации об образце, – будет значительно увеличена.
Это означает, что, хотя сейчас для сбора данных когерентной дифракционной визуализации от образца и получения изображения требуется от двух до трех минут, сбор данных в рамках этого процесса скоро будет в 500 раз быстрее. Процесс преобразования этих данных в пригодное для использования изображение также должен быть в сотни раз быстрее, чем сейчас, чтобы не отставать.
«Чтобы в полной мере использовать возможности обновленного APS, мы должны заново изобрести аналитику данных», – сказал Черукара. "Наших нынешних методов недостаточно, чтобы не отставать. Машинное обучение может в полной мере использовать и выходить за рамки того, что возможно в настоящее время."
Помимо Чана, Черукары и Хрушкевича, авторами статьи являются Субраманиан Шанкаранараянан и Росс Хардер, оба из Аргонна; Юсеф Нашед из Национальной ускорительной лаборатории SLAC; и Саугат Кандел из Северо-Западного университета.