Разработка может привести к созданию интеллектуальных систем камер, которые определяют то, что они видят, просто по образцам света, проходящим через трехмерную конструкцию материала. В их новом дизайне используются преимущества распараллеливания и масштабируемости оптических вычислительных систем.
Например, такие системы могут быть встроены в беспилотные автомобили или роботов, помогая им принимать почти мгновенные решения быстрее и потребляя меньше энергии, чем компьютерные системы, которым требуется дополнительное время для идентификации объекта после того, как он был замечен.
Технология была впервые представлена группой UCLA в 2018 году. Система использует серию напечатанных на 3D-принтере пластин или слоев с неровными поверхностями, которые пропускают или отражают падающий свет – по внешнему виду и эффекту они напоминают матовое стекло. Эти слои имеют десятки тысяч точек пикселей – по сути, это искусственные нейроны, которые образуют искусственный объем материала, который вычисляется полностью оптически.
Каждый объект будет иметь уникальный световой путь через созданные 3D-слои.
За этими слоями находится несколько детекторов света, каждый из которых ранее был назначен в компьютере для определения того, что является входным объектом, по тому, где больше всего света попадает после прохождения через слои.
Например, если он обучен вычислять рукописные цифры, то детектор, запрограммированный на идентификацию «5», будет видеть большую часть света, попадающего на этот детектор после того, как изображение «5» прошло через слои.
В этом недавнем исследовании, опубликованном в журнале с открытым доступом Advanced Photonics, исследователи UCLA значительно повысили точность системы, добавив к ней второй набор детекторов, и поэтому каждый тип объекта теперь представлен двумя детекторами, а не одним.
Исследователи стремились увеличить разницу сигналов между парой детекторов, привязанной к типу объекта. Интуитивно это похоже на взвешивание двух камней одновременно левой и правой рукой – так легче различить, имеют ли они одинаковый вес или разный вес.
Эта схема дифференциального обнаружения помогла исследователям Калифорнийского университета в Лос-Анджелесе повысить точность прогнозов неизвестных объектов, которые были замечены их оптической нейронной сетью.
«Такая система выполняет задачи машинного обучения с взаимодействием света с веществом и оптической дифракцией внутри трехмерной структуры изготовленного материала со скоростью света и без необходимости в большой мощности, за исключением освещения и простой схемы детектора», – сказал Айдоган. Озджан, канцлерский профессор электротехники и вычислительной техники и главный исследователь исследования. «Этот прогресс может позволить использовать интеллектуальные камеры для конкретных задач, которые выполняют вычисления на сцене, используя только фотоны и взаимодействие света и материи, что делает его чрезвычайно быстрым и энергоэффективным."
Исследователи проверили точность своей системы с использованием наборов данных изображений рукописных цифр, предметов одежды и более широкого набора различных транспортных средств и животных, известного как набор данных изображений CIFAR-10.
Они обнаружили, что точность распознавания изображений составляет 98.6%, 91.1% и 51.4% соответственно.
Эти результаты очень выгодны по сравнению с предыдущими поколениями полностью электронных глубоких нейронных сетей.
Хотя более современные электронные системы имеют лучшую производительность, исследователи предполагают, что полностью оптические системы имеют преимущества в скорости вывода, малом энергопотреблении и могут быть масштабированы для размещения и идентификации гораздо большего количества объектов параллельно.