Разработка Мюллера основана на более простой и точной модели местоположения звука, чем предыдущие подходы, которые традиционно моделировались на основе человеческого уха. Его работа знаменует собой первую новую идею определения местоположения звука за 50 лет.
Результаты были опубликованы в журнале Nature Machine Intelligence Мюллером и бывшим доктором наук.D. студентка, ведущий автор Сяоянь Инь.
«Я давно восхищался летучими мышами за их сверхъестественную способность ориентироваться в сложных природных условиях на основе ультразвука и подозревал, что необычная подвижность ушей животного может иметь какое-то отношение к этому», – сказал Мюллер.
Новая модель звуковой локации
Летучие мыши ориентируются во время полета, используя эхолокацию, определяя, насколько близко находится объект, непрерывно издавая звуки и слушая эхо. Ультразвуковые сигналы излучаются изо рта или носа летучей мыши, отражаясь от элементов окружающей среды и возвращаясь в виде эха. Они также получают информацию из окружающих звуков. Сравнение звуков для определения их происхождения называется эффектом Доплера.
Эффект Доплера работает по-другому в человеческом ухе. Открытие 1907 года показало, что люди могут находить местоположение благодаря наличию двух ушей, приемников, которые передают звуковые данные в мозг для обработки.
Работа с двумя или более приемниками позволяет определить направление звуков, которые содержат только одну частоту, и будут знакомы каждому, кто слышал звук автомобильного гудка, когда он проходит. Гудок – это одна частота, и уши работают вместе с мозгом, чтобы построить карту того, куда едет машина.
Открытие 1967 года показало, что когда количество приемников сокращается до одного, одно человеческое ухо может найти местоположение звуков, если встречаются разные частоты. В случае проезжающей машины это может быть автомобильный гудок в сочетании с ревом двигателя автомобиля.
По словам Мюллера, работа человеческого уха вдохновила прошлые подходы к точному определению местоположения звука, в которых использовались приемники давления, такие как микрофоны, в сочетании с возможностью либо собирать несколько частот, либо использовать несколько приемников. Основываясь на исследованиях с летучими мышами, Мюллер знал, что их уши являются гораздо более универсальными приемниками звука, чем человеческое ухо. Это побудило его команду преследовать цель одной частоты и одного приемника вместо нескольких приемников или частот.
Создание уха
Работая на основе одночастотной модели с одним приемником, команда Мюллера стремилась воспроизвести способность летучей мыши двигать ушами.
Они создали мягкое синтетическое ухо, вдохновленное подковы и летучих мышей Старого Света, и прикрепили его к веревке и простому мотору, чтобы ухо трепетало одновременно с входящим звуком.
У этих летучих мышей есть уши, которые позволяют комплексно преобразовывать звуковые волны, поэтому готовый дизайн природы был логичным выбором. Это преобразование начинается с формы внешнего уха, называемого ушной раковиной, которая использует движение уха, когда оно получает звуки, для создания нескольких форм приема, которые направляют звуки в слуховой проход.
Самая большая проблема, с которой Инь и Мюллер столкнулись в своей одночастотной модели с одним приемником, заключалась в интерпретации входящих сигналов. Как превратить входящие звуковые волны в читаемые и интерпретируемые данные?
Команда поместила ухо над микрофоном, создав механизм, похожий на механизм летучей мыши. Быстрые движения трепещущей ушной раковины создавали сигнатуры доплеровского сдвига, которые были четко связаны с направлением источника, но их трудно интерпретировать из-за сложности рисунков. Чтобы справиться с этим, Инь и Мюллер задействовали глубокую нейронную сеть: подход машинного обучения, который имитирует многоуровневую обработку, обнаруженную в мозге.
Они реализовали такую сеть на компьютере и обучили его определять направление источника, связанное с каждым полученным эхо-сигналом.
Чтобы проверить производительность системы, состоящей из уха и машинного обучения, они установили ухо на вращающуюся установку, которая также включала лазерную указку. Затем звуки издавались из громкоговорителя, который располагался в разных направлениях относительно уха.
Как только направление звука было определено, управляющий компьютер вращал установку так, чтобы лазерный указатель попадал в цель, прикрепленную к громкоговорителю, определяя местоположение с точностью до половины градуса.
Человеческий слух обычно определяет местоположение в пределах 9 градусов при работе двумя ушами, а лучшие технологии позволяют определять местоположение в пределах 7 градусов.5 градусов.
«Возможности полностью выходят за рамки того, что в настоящее время доступно технологиям, и все же все это достигается с гораздо меньшими усилиями», – сказал Мюллер. "Наша надежда – обеспечить надежную и функциональную автономность сложной внешней среде, включая точное земледелие и лесное хозяйство; наблюдение за окружающей средой, такое как мониторинг биоразнообразия; а также приложения, связанные с обороной и безопасностью."
Видео: https: // www.YouTube.com / watch?v = buFM5KkAnEo