Современные информационные технологии

Дубчак О. В., Максімов Ю.О.

Національний авіаційний університет, Україна

ОЦІНЮВАННЯ ТОЧНОСТІ БІОМЕТРИЧНИХ МЕТОДІВ ЗАХИСТУ ІНФОРМАЦІЙНИХ РЕСУРСІВ

Вступ Стрімкий  розвиток інформаційних технологій висуває високі вимоги до захисту інформаційних ресурсів від несанкціонованого доступу. У зв'язку із цим зростає  необхідність точної ідентифікації особистості під час контролю доступу до інформації, наприклад, при перевірці документів. На жаль, звичайні документи й фейс - контроль не в змозі належним чином задовольнити високі вимоги безпеки.

Актуальність Сьогодні все частіше забезпечення цілісності й доступності інформації в сучасні інформаційних системах пов'язано з використанням біометричних технологій, які дозволяють ідентифікувати й аутентифікувати  особистості значної кількості користувачів, що проходять через точку контролю доступу до інформаційних ресурсів.

На користь актуальності біометричних методів захисту свідчить активний розвиток міжнародної нормативної технічної й правової бази: при Міжнародній організації по стандартах (ISO) створений підкомітет по біометрії, покликаний оперативно розробити й затвердити єдині міжнародні стандарти використання, обміну й зберігання біометричних даних. Аналогічні комітети створені в багатьох національних органах по стандартах, багато держав  готуються до введення електронних паспортів, що містять біометричну інформацію їхніх власників.

Постановка завдання Під біометричними технологіями розуміють автоматичні або автоматизовані методи розпізнавання особистості людини за його біологічними характеристиками або проявами. [1]

При всьому теоретичному різноманітті біометричних технологій можливих методів, застосовних на практиці, серед них небагато. Власно, основних методів три - розпізнавання за відбитком пальця, за зображенням особи (двомірним або тривимірним - 2D - або 3D - фото) і за райдужною оболонкою ока.

Існують різні критерії оцінювання біометричної системи, такі як універсальність, розрізнення, перманентність, вимірність, стійкість до навколишнього середовища, стійкість до підробки, точність. [2] Розглянемо один з них - точність і визначимо метод оцінки цього критерію шляхом використання статистичних характеристик.

Серед основних параметрів біометричних систем можна виділити ймовірність виникнення помилок:

-                   FRR (False Rejection Rate)  - коефіцієнт помилкової відмови в доступі — доступ заборонений користувачеві, зареєстрованому в системі; іменується «помилкою 1 роду»;

-                   FAR (False Acceptance Rate)  - коефіцієнт помилкового допуску, ураховує випадки  надання системою доступу неавторизованому користувачеві. Інакше кажучи, це - процентний поріг, що визначає ймовірність того, що один користувач може бути прийнятий за іншого,  іменується також  «помилкою 2 роду».

Величина  називається чутливістю, а величина  - специфічністю. [1]

Будь-яку біометричну систему можна налаштувати на різний ступінь точності, тобто на різне значення ймовірності помилкового розпізнавання FAR. Зрозуміло, чим нижче FAR, тобто чим точніше система, тим вище ймовірність помилкового нерозпізнавання FRR - система стає  менш чутливою. Залежно від конкретного завдання можливе настроювання на певний компроміс між припустимими значеннями FRR і FAR, або, як їх прийнято називати в теорії статистичних рішень і як зазначено вище, помилками 1-го й 2-го роду.

Для оцінки точності роботи будь-якої біометричної системи прийнято використовувати характеристичну криву. Саме характеристична крива, або ROC - крива (Receiver Operating Characteristic) установлює залежність між вищевказаними помилками. [2] Приклади ROC - кривих в умовному виді наведено на рисунку 1.

Рис.1.Приклади ROC - кривих.

ROC - крива  - характеристика, що найбільш часто використовується для подання результатів бінарної класифікації. Назва взята з методології аналізу якості прийому сигналу (Signal Detection Analysis). Теорія, на якій ґрунтується цей аналіз, - теорія визначності сигналу (TSD - Theorie of Signal Detectability), хоча й бере початок з електроніки й електротехніки, може також бути застосована для аналізу взаємодії чутливості й показності біометричного тестування. Оскільки існуючих (бінарних) класів два, один з них називається класом з позитивними результатами, другий - з негативними. ROC - крива показує залежність кількості вірно класифікованих позитивних прикладів від кількості невірно класифікованих негативних прикладів. У термінології ROC - аналізу перші називаються істинно позитивною, другі - помилково негативною множиною. При цьому передбачається, що в класифікатора є деякий параметр, варіюючи який, можна одержувати ту або іншу розбивку на два класи. Цей параметр часто називають порогом, або точкою відсікання (cut-off value). Залежно від його значення  будуть виходити різні величини помилок 1 і 2 роду.

Для розуміння суті вказаних помилок слід розглянути таблицю сполученості (confusion matrix) (див.табл.1). Вона побудована на основі результатів класифікації моделлю й об'єктивною приналежністю прикладів до класів.

                Таблиця сполученості                   Таблиця 1

Модель

Об'єктивно

позитивно

негативно

позитивно

TP

FP

негативно

FN

TN

-                   TP (True Positives) – вірно класифіковані позитивні приклади - істинно позитивні випадки;

-                   TN (True Negatives) – вірно класифіковані негативні приклади - істинно негативні випадки;

-                   FN (False Negatives) – позитивні приклади, класифіковані як негативні  - помилка 1 роду. Це так званий "помилковий пропуск", коли подія, що цікавить, помилково не виявляється - помилково негативні приклади;

-                   FP (False Positives) – негативні приклади, класифіковані як позитивні - помилка 2 роду.  Це помилкове виявлення, тому що при відсутності події помилково виноситься рішення про її присутність  - помилково позитивні випадки.

При аналізі частіше оперують не абсолютними показниками, а відносними - частками (rates), вираженими у відсотках. При цьому:

-                   частка істинно позитивних прикладів (True Positives Rate)

-                   частка помилково позитивних прикладів (False Positives Rate)

Як згадувалося, існують ще два визначення: чутливість і специфічність моделі. Ними визначається об'єктивна цінність будь-якого бінарного класифікатора.

Чутливість (Sensitivity) - це і є частка істинно позитивних випадків:

Специфічність (Specificity) - частка істинно негативних випадків, які були правильно ідентифіковані моделлю:

Помітимо, що .

Модель із високою чутливістю часто дає вірний результат при наявності позитивного результату, тобто виявляє позитивні приклади. Навпаки, модель із високою специфічністю частіше дає вірний результат при наявності негативного результату, тобто при виявленні негативних прикладів.

ROC - крива отримується шляхом побудови графіка залежності: по осі Y відкладається чутливість Se, по осі X – , або, що те ж саме, FPR – частка помилково позитивних випадків.

При візуальній оцінці ROC - кривих їх взаємне розташування відносно одна одної вказує на їхню порівняльну ефективність. Крива, розташована вище, свідчить про більшу передбачувальну здатності моделі, у цьому випадку - біометричного методу захисту інформаційного ресурсу. Так, на рисунку 1 дві ROC - криві сполучені на одному графіку. Видно, що модель, розташована ближче до діагоналі,  показує більш точний результат.

Але візуальне порівняння ROC - кривих не завжди дозволяє виявити найбільш ефективну модель. Своєрідним методом порівняння ROC- кривих є оцінка площі під кривими. Ця оцінка може бути отримана безпосередньо обчисленням площі під багатогранником, обмеженим ліворуч і знизу осями координат і праворуч угорі - експериментально отриманими точками. Чисельний показник площі під кривою називається AUC (Area Under Curve). [3]

Висновок  Отже, використання ROC - аналізу – апарата для аналізу якості моделей, дозволяє істотно полегшити процес оцінювання однієї з найважливіших характеристик біометричних технологій – точності вжитого методу. Слід зауважити, що при аналізі й порівнянні ROC - кривих дуже важливо розуміти, за якою методикою тестування вони отримані, зокрема, які були умови, обставини тестування, сценарій використання системи, вихідна сукупність користувачів, що підлягали тестуванню, тощо. Залежно від методики розрізняють технологічне, сценарне й операційне тестування. Результати, отримані по різних методиках тестування, можуть значно розрізнятися для однієї й тої ж системи.

Звичайно для будь-якого конкретного біометричного методу можна зафіксувати припустиме значення FAR, і тоді значення FRR буде служити інтегральним критерієм точності для даної системи.[2]

Література:

1.                 http://ru.wikipedia.org

2.                 http://www.biometrics.ru/

3.                 http://www.basegroup.ru/library/analysis/regression/logistic/