Технические
науки/6.Электротехника и радиоэлектроника
магистрант Кириленко Н.
Е., д.т.н. Щербань И. В.,
аспирант Красников С. О.
Южный федеральный университет, Россия
РАСПОЗНАВАНИЕ РЕАКЦИИ МАКРОСМАТИКА
НА ПРЕДЪЯВЛЕНИЕ РАЗЛИЧНЫХ ЗАПАХОВ ПО ЭЭГ
Известно, что многие
виды живых организмов обладают чрезвычайно высокой обонятельной
чувствительность, многократно превышающей чувствительность существующих
технических устройств. Особенно высокой обонятельной чувствительностью обладают
макросматики, в частности, крысы, рецепторные нейроны которых содержат тысячи
различных рецепторных белков. Решается задача идентификации фокальной
активности обонятельной луковицы макросматиков при предъявлении им различных
запахов.
Решение построено на
основе использования аппарата MEL-частотных кепстральных коэффициентов [1,2].
Известно, что Мел-частотные кепстральные коэффициенты (Mel-frequency cepstral
coefficients, MFCC) хорошо зарекомендовали себя как в задачах распознавания речи,
так и в задачах распознавания специфических паттернов [1,2].
Использовались
результаты импульсных и фокальных электрических ответов обонятельного нерва и
обонятельной луковицы крысы при предъявлении двух типов целевых запахов. Для
длительной и устойчивой регистрации биоэлектрических откликов, возникающих в
ответ на появление во вдыхаемом воздухе молекул пахучих веществ, разработана
методика хронического вживления электродов.
Входные данные
регистрировались во временном окне длительностью 250мс, "бегущем" по
файлу измерений с фиксированным шагом смещения 150 мс. Таким образом повышается
вероятность верного распознавания. Каждый кадр переносится в частотную область
с помощью процедуры дискретного преобразования Фурье (FFT), после чего возводится в квадрат, образуя спектральную
плотность мощности сигнала.
Количество фильтров
выбрано равным 18, а начальная и конечная частоты, в диапазоне которых
предполагалось наличие частотного отклика на предъявляемый запах, соответственно,
равными 20 Гц и 200 Гц.
Выбранный частотный
диапазон переносится в MEL-область, которая делится на равные участки и, тем
самым, определяются значения так называемых опорных точек. Число точек
совпадает с количеством фильтров. Значения опорных точек по обратной формуле
переносятся в частотную область.
При помощи полученных
значений создается MEL-фильтр, позволяющий просуммировать количество энергии на
определенном диапазоне частот. Фильтр представляет собой набор треугольных
функций. Следующим этапом является свертка или перемножение MEL-фильтра на
полученную ранее спектральную плотность мощности сигнала.
После наложения фильтра
для сжатия результатов и повышения значимости первичных коэффициентов к сигналу
применяется процедура дискретного косинусного преобразования второго типа (DCT2)
[1]. Анализируемый паттерн преобразуется в последовательность кепстральных
коэффициентов.
Характерные графики MEL-коэффициентов
при отсутствии запахов (верхние рисунки) и при предъявлении запахов двух типов
("2 канал", "3 канал") представлены на рисунке.


Рисунок – Характерные графики MEL-коэффициентов при
отсутствии
запахов (верхние рисунки) и при предъявлении запахов двух
типов
Сравнение наборов MFCC
выполнялось на основе непосредственного оценивания корреляционных связей и на
основе оценивания энергетических характеристик потоков. При этом характерный
паттерн идентифицировался на основе сравнения отношений между энергиями
эталонного паттерна и паттерна, регистрируемого в "бегущем" окне.
В ходе сканирования
определялась длина вектора энергии анализируемого паттерна. Полученное значение
сравнивалось с длиной вектора энергии эталонного паттерна, характеризуемого
воздействием эталонного запаха на обонятельную луковицу крысы. Определялось
минимальное векторное расстояние для каждого входного паттерна. В формируемом
при этом массиве коэффициентов индекс максимального значения и соответствует искомому
паттерну.
Недостатком
разработанного подхода является тот факт, что невозможно записать в память ЭВМ
уже готовые значения свойств сигналов, а необходимо содержать в памяти все
элементы свойств дискретного образа, что проблематично при высокой частоте дискретизации.
В ходе исследований частота дискретизации выбиралась из двух возможных значений
– 500 и 1000 Гц.
В то же время, выбранный
подход имеет ряд преимуществ в сравнении, например, с классическими подходами
анализа временных рядов измерений на основе нейросетевых методов. Во-первых,
переход из временной области в частотную позволяет исключать высокочастотные
шумы измерений и, во-вторых, он
достаточно прост в реализации, так как не требует использования традиционных,
весьма сложных и не всегда реализуемых процедур формирования обучающих и
валидационных выборок [2].
Рис.
3
Литература:
1. Местецкий, Л.М. Математические методы
распознавания образов/ Л. М. Местецкий. – М.: МГУ, 2004. –
85 с.
2. Ярушкина, Н.Г. Интеллектуальный анализ
временных рядов/ Ярушкина Н.Г., Афанасьева Т.В., Перфильева И.Г. – Ульяновск: УлГТУ, 2010. – 310 с.