Современные информационные технологии / 3. Программное обеспечение
Ліхоузова
Т.А., Носенко К.М.
Національний технічний університет України
«Київський політехнічний інститут»
Проблеми
оцінки якості передачі мови в IP-телефонії
Однією з важливих задач,
що потребують рішення в мережах
IP-телефонії, є вибір метода оцінки якості передачі мови з метою мінімізувати
витрати на повторну оцінку при зміні факторів впливу.
До параметрів, які
пов'язані з терміналом і впливають на якість наданих послуг на підставі
методики QoS (Quality of Service) для канального рівня моделі OSI, відноситься
тип кодека і затримка, а до параметрів пов'язаним з мережею відносяться втрати
пакетів, затримка та варіації затримки. Це означає, що для забезпечення деякого
рівня, якість необхідно розглядати як термінал і мережу в комплексі,
пред'являючи до кожного з них певний набір вимог.
Загальна затримка
складається із затримки кодування та пакетизації мовного сигналу, затримки
маршрутизації в мережі, затримки поширення сигналу і затримки, пов'язаної з
ємністю буфера, а також те, що джіттер вноситься мережею, але компенсується
терміналом, можна зробити висновок, що затримка на терміналі - величина стала,
а затримка в мережі є функцією від відстані і точок маршрутизації.
Отже, виникає задача
обрати метод, який охоплює фактори, які впливають на мову, що передається, на
всьому шляху від мовця до слухача. Також потрібно визначити метод, який при
зміні параметрів якості, буде переоцінювати саме зміни, вносячи корективи у вже
наявну оцінку.
Методи оцінки якості
системи передачі звукового сигналу визначаються призначенням та специфікою цієї
системи (мова, музика тощо). Спільною ознакою для цих систем є те, що всі вони
в кінцевому результаті приходять до системи слухового сприйняття людини. При
передачі по каналах зв'язку мова розглядається як випадковий процес,
характеристики якого визначають параметри переданого сигналу (динамічний
діапазон, смугу, відношення сигнал / шум). Всі ці параметри піддаються
вимірюванню і можуть бути точно визначені. Однак, враховуючи, що мовний сигнал
сприймається людиною, слід зазначити, що з точки зору людини мовний сигнал
оцінюється суб'єктивно, підкоряючись законам психофізіології слуху.
Суб'єктивні методи
оцінки якості ґрунтуються на статистичній обробці суб'єктивних оцінок якості
досить великого числа слухачів-експертів. Найбільш широко використовувана
методика суб'єктивної оцінки якості описана в Рекомендації МСЕ Р.800 і відома
як методика MOS (Mean Opinion Score).
В основу об'єктивного
методу покладена так звана Е-модель, яка пов'язана з вимірюванням характеристик
терміналів і мереж. Результатом обчислення відповідно до Е-моделі є число,
зване R-фактором ("коефіцієнтом рейтингу"). Е-модель є
багатокритеріальною оцінкою якості переданої мови в мережах IP і R-фактор та
визначається діапазоном значень від 0 до 100, де 100 відповідає найвищому рівню
якості.
Психоакустичні методи
оцінки якості враховують особливості людського сприйняття звуку в цілому і
мовлення зокрема. Особливість даних методів в тому, що оцінюється тільки
суб'єктивна якість сигналу за допомогою технічних і програмних засобів. Таким
чином вони більше відносяться до об'єктивних методів, але побудовані виходячи з
особливостей суб'єктивного сприйняття звуку людиною. Найбільш поширеними є
оцінка PESQ, визначена в рекомендації МСЕ-Т P.862. Вона являє собою об'єктивну
методику визначення якості мовного зв'язку в телефонних системах, яка прогнозує
результати суб'єктивної оцінки якості цього виду зв'язку слухачами-експертами.
Для визначення якості передачі мови в PESQ передбачено порівняння вхідного, або
еталонного, сигналу з його спотвореною версією на виході системи зв'язку.
Результатом порівняння вхідного і вихідного сигналів є оцінка якості зв'язку,
яка аналогічна усередненої суб'єктивній оцінці MOS.
Щоб порівняти вище
описані методи, необхідно задатися параметрами, що впливають не тільки на
рівень спотворення голосу і природність його звучання, а ще й на затримки мережі
та терміналу. Тому для порівняння методів оцінки якості були обрані параметри,
оцінюючи які, можна віднести надавані послуги передачі мови, а також параметри
мережі та терміналу до певного класу якості.
Основними якісними
характеристиками були обрані:
• сумарна затримка передачі мовної інформації між абонентами;
• час встановлення з'єднання;
• ймовірність втрати пакетів;
• рівень спотворення голосу;
• відсутність або наявність луни;
• спотворення, що вносяться кодеками.
Основними кількісними
характеристиками були обрані наступні параметри:
• загальна оцінка якості передачі;
• якість мови, що є більш прийнятною слухачем;
• затримка з кінця в кінець.
Методика MOS дає оцінку
відсутності чи наявності відлуння, спотворення голосу, затримці з кінця в
кінець, загальну оцінку якості мови, як суб'єктивну оцінку експертів. Ця оцінка
формується як арифметичне середнє, де основними оціночними параметрами є:
розбірливість, природність звучання голосу і рівень зусиль слухача. Ця методика
не основана на певній математичної моделі порівняння і як результат, не дає
можливості виявити вплив якогось окремого фактора. З цієї точки зору можна
розглянути метод E-моделі і PESQ. Е-модель дає характеристику практично всіх
вибраних параметри, крім оцінки якості мови безпосередньо слухачем. Цей метод
оцінює спотворення терміналу і мережею окремо. У розрахунку R-фактора
враховується 20 параметрів, де основними параметрами є:
• однонаправлена затримка;
• коефіцієнт втрати пакетів;
• втрати даних через переповнення буфера джіттера;
• спотворення, що вносяться при перетворенні аналогового сигналу в
цифровий і наступному стисканні (обробка сигналу в кодеках);
• вплив відлуння;
• сумарна наскрізна затримка (з кінця в кінець);
• спотворення, що вносяться обладнанням.
Оцінка PESQ враховує
наступні фактори:
• спотворення сигналу при кодуванні;
• помилки при передачі;
• час затримки передачі пакетів і флуктуацію цього часу;
• фільтрацію сигналів в аналогових мережевих компонентах.
Але при цьому в її
оцінку не входять деякі фактори, що залежать від параметрів мережі і сприйняття
мовлення:
• зміна рівня сигналу мережі;
• наявність відлуння сигналу;
• кругова затримка.
З цього випливає, що
оцінка PESQ схожа на E-модель, але дає оцінку меншій кількості факторів мережі.
Таблиця
1
|
Фактори |
MOS |
E-модель |
PESQ |
|
Сумарна затримка передачі мовної
інформації між абонентами |
- |
+ |
+ |
|
Час встановлення з'єднання |
- |
+ |
- |
|
Ймовірність втрати пакетів |
- |
+ |
+ |
|
Рівень спотворення голосу |
+ |
+ |
+ |
|
Відсутність або наявність луни |
+ |
+ |
- |
|
Спотворення, що вносяться кодеками |
- |
+ |
+ |
|
Загальна оцінка якості передачі |
+ |
+ |
+ |
|
Якість мови, сприймається слухачем |
+ |
- |
- |
|
Затримка з кінця в кінець |
- |
+ |
- |
Методика оцінки MOS дає
однозначну оцінку якості, але при цьому є неможливим виявлення конкретних
параметрів, які не відповідають характеристикам класів мереж. Так само при
зміні параметрів мереж, терміналів, кодування виникає необхідність повторного
набору групи експертів, що є трудомістким процесом. Методи оцінки за допомогою
Е-моделі і PESQ більш точно пов'язують якість переданої мови з класами
надаваних послуг та мереж, вказують на конкретні параметри, які можуть бути
вдосконалені. Їх оцінка залежить від використаного кодека, тому при зміні
кодеків оцінку якості необхідно повторити. З точки зору використовуваних
параметрів Е-модель є більш точним методом оцінки якості переданої мови.
СПИСОК
ВИКОРИСТАНИХ ДЖЕРЕЛ
1. Сергієнко В.С. Стиснення даних, мови, звуку і зображень в
телекомунікаційних системах / Сергієнко В.С., Баринов В.В., ИП «РадіоСофт»,
2009
2. МСЕ-Т P.800
3. Росляков А.В. IP-телефонія / Росляков А.В., Самсонов М.Ю., Шибаєва И.В.,
Из-во "Еко-трендз", 2001г.