Р.В. Зюбіна, О.М. Весельська, Є.М. Шуневич

Національний авіаційний університет

АНАЛІЗ ТА КЛАСИФІКАЦІЯ СИСТЕМ РОЗПІЗНАВАННЯ МОВНИХ СИГНАЛІВ

Сучасні методи біометричного захисту дають можливість значно підвищити роботу систем розмежування доступу до об’єктів захисту. Біометричні системи дозволяють використовувати унікальні характеристики людського тіла у якості ідентифікаторів, наприклад відбитки пальців, геометрію обличчя, голос та інші.

Питання розпізнавання диктора постає у розрізі вдосконалення сучасних систем забезпечення інформаційної безпеки у різних областях, таких як захист від несанкціонованого доступу, забезпечення надійності доступу до інформаційних систем, фінансова безпека та інших.

Розпізнавання диктора – процес автоматичного визначення того, хто говорить на основі простору признаків мовного сигналу. В залежності від поставленої задачі, розпізнавання диктора ділиться на процес ідентифікації та верифікації

Процес розпізнавання диктора в системі складається з двох основних частин – реєстрація диктора в системі та сам процес розпізнавання. На першому етапі користувачі реєструються в системі, тобто зразки голосу кожного диктора додається в базу даних. Далі кожний зразок обробляється і визначається простір признаки за якими буде проводитись розпізнавання.

В цілому, загальна схема розпізнавання диктора ділиться на 3 етапи:

- Етап обробки сигналу (фільтрація, визначення інформативних складових);

- Етап моделювання (модулювання системи обробки інформаційних ресурсів для подальшого прийняття рішення);

- Етап прийняття рішення (визначення порогу прийняття рішення та остаточний результат розпізнавання).

Ідентифікація диктора — процес визначення особистості за зразком голосу шляхом порівняння даного зразка з шаблонами, що зберігаються в базі. У результаті виконання такої процедури отримують список кандидатів, голоси яких найбільше співпадають з обраним зразком. У випадку, коли співпадіння не виявлено, система додає зразок голосу до бази даних на підставі попередньо визначеного порогового значення Рис.2. Якщо в системі ідентифікації є можливість додавання незареєстрованого користувача до бази даних, то мова йде про відкриту множину. У випадку, коли процес ідентифікації проводиться з визначеною базою даних, то говорять про замкнуту множину. [2-3]

Рис.2. Структурно-логічна схема системи ідентифікації диктора

Верифікація диктора – процес підтвердження чи відхилення співпадіння фрази сказаної диктором. Процес верифікації передбачає пред’явлення системі свого унікального ідентифікатора, результатом чого виступає його прийняття та підтвердження дозволу на доступ, або навпаки відхилення доступу у зв’язку з невідповідністю ідентифікатора. Відповідно до поставленої задачі верифікації, користувач системи зацікавлений у збереженні початкової структури голосового паролю Рис.3.

Використання голосової біометрії має значну перевагу у порівнянні з іншими біометричними методами, особливо в умовах підвищеної секретності. Оскільки відбитки пальців, сітківка ока, риси обличчя є відносно сталими параметрами і не можуть бути змінені, в свою чергу, голос людини залежить від різних психофізичних факторів, а у процесі верифікації взагалі може бути змінений повністю безліч кількість разів і ускладнений більш довгим повідомленням. Ще однією перевагою використання голосової біометрії є можливість розпізнавання диктора у темному приміщенні чи, навіть, шляхом використання мобільного каналу.

Рис.3. Структурно-логічна схема системи верифікації диктора

Системи розпізнавання диктора можна розділити на такі, що залежать від диктора і такі, що не залежать. У першому випадку використовуються системи, в яких заздалегідь записані фіксовані фрази, або згенеровані безпосередньо системою і запропоновані користувачу фрази. В свою чергу незалежні від тексту системи розпізнавання диктора не залежать від певних фраз і призначені розпізнавати довільну мову

Висновок

В роботі було проведено аналіз та класифікацію сучасних методів розпізнавання голосу диктора в задачах ідентифікації та верифікації. Визначено, що розпізнавання голосу ділиться на ідентифікація та верифікацію, що в багатьох джерелах не завжди коректно представлен. Розроблено структурно-логічні схеми процесів ідентифікації та верифікації аудіосигналу. Література

1. Юдін О. К., Зюбіна Р. В. Класифікація методів ідентифікації частоти основного тону //Наукоємні технології. – 2017. – Т. 33. – №. 1.

2. Первушин Е. А. Обзор основных методов распознавания дикторов //Математические структуры и моделирование. – 2011. – №. 3 (24).

3. Алимурадов А. К., Чураков П. П. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи //Измерение. Мониторинг. Управление. Контроль. – 2015. – №. 2 (12).