Современные информационные технологии / 2. Вычислительная техника и программирование

Омельчук С.С.

Хмельницький національний університет, Україна

Сучасні мовні засоби реалізації онтологій

Стрімке поширення застосування комп’ютерної техніки, зростання її потужностей та масштабне використання локальних і глобальних мереж призвело до накопичення значних масивів даних, які, в багатьох випадках, є неструктурованими та мало придатними до формалізованої обробки. Тому нагальною є потреба у поширенні застосування формальних способів опису інформації, одним із яких є застосування онтологій.

Онтологія – це загальноприйнята і загальнодоступна концептуалізація певної області знань (світу, середовища), яка містить базис для моделювання цієї області знань і визначає шляхи для взаємодії між агентами, які використовують знання з цієї області, і, нарешті, включає домовленості про представлення теоретичних основ даної області знань.

В рамках комп’ютерних наук онтологія – це формальна назва і визначення типів, властивостей і взаємовідносин суб’єктів, що дійсно, або принципово, існують в обраному контексті (предметній області). Вони є практичним застосуванням філософського поняття онтології за допомогою таксономії.

Онтологія – це детальна формалізація деякої області знань, подана за допомогою концептуальної схеми. Така схема складається з ієрархічної структури понять, зв’язків між ними, теорем та обмежень, прийнятих у певній предметній області (ПО) [1].

Результати наукових досліджень, які здійснювались два останні десятиліття, привели до активного використання онтологій як концептуальних схем реляційних баз даних, що покладено в основу інформаційних систем [1, 2]. У такому контексті поняття онтології і концептуальної схеми використовуються як рівнозначні. Онтологія предметної області задається у вигляді базових понять, організованих у таксономію, і сукупності зв’язків між ними. Дані подаються у вигляді множини різнотипних інформаційних об'єктів – екземплярів понять і відношень онтології. У сукупності об'єкти утворюють контент або інформаційне наповнення системи. Кожний об'єкт визначається поняттям або відношенням онтології і, як екземпляр класу, має задану ним структуру.

Онтології зазвичай кодуються з використанням мов онтології. Мова опису онтологій – формальна мова, що використовується для кодування онтології.

OWL (англ. Web Ontology Language) – нова мова онтологій для семантичних мереж, розроблена World Wide Web Consortium (W3C) Web Ontology Working Group. OWL, в першу чергу, призначена для подання інформації про категорії об'єктів і, те, як об'єкти взаємопов'язані – сортування інформації, яку часто називають онтологією. OWL може також представляти інформацію про самі об'єкти – сортування інформації, що часто сприймається як дані. Ця мова побудована на форматах RDF і RDFS, вона призначена для обробки інформації в мережі. Мова OWL має 3 ступені деталізації, що є новим словом у комп'ютерних технологіях. Вона також легко масштабується й узгоджується з найсучаснішими мережними стандартами. У 2008 році було прийнято новий стандарт OWL 2. Теоретичною основою OWL є описова логіка.

Описова логіка – сімейство з класів на основі концепції формалізованого подання знань. Вони характеризуються використанням різних конструкторів для створення складних класів із простіших, акцент на можливості розв'язання ключових проблем міркування. Описова логіка і висновки з її дослідження мали сильний вплив на конструкції OWL, особливо, на формалізацію семантики, вибір мови конструкторів та інтеграції типів даних і значень даних. OWL DL і OWL Lite (два з трьох видів OWL) можна розглядати як виразну описову логіку, з онтологіями, що є еквівалентними до бази знань описової логіки.

Як OIL і DAML+OIL, OWL використовує описову логіку для формалізації значень мови. Це було визнано важливою особливістю для всіх трьох мов, так як це дозволяє онтологій та інформації, за допомогою словникового запасу, визначеного онтологією, ділитись і змінюватись без суперечок. Потреба в такого роду формальності була посилена досвідом роботи з ранніми версіями RDF і RDFS специфікації, де відсутність формальності незабаром привело до створенння мовних конструкцій таких як обмеженнями доменів і діапазонів [3].

У цілому OWL як мова web-онтологій забезпечує:

− синтаксис опису понять, зручний для всіх користувачів мережі Інтернет (людей та програмних агентів);

− максимальну виразність механізмів опису понять та зв’язків між ними;

− механізми еволюції описів та спільного використання онтологій в середовищі Інтернету [4].

Логічним продовженням OWL стала мова OWL 2. OWL 2 Web Ontology Language, неофіційно OWL 2, є мовою онтологій для Semantic Web з формально визначеним змістом. OWL 2 онтології надають можливість працювати з класами, властивостями, індивидами і значеннями даних, також зберігати їх в Semantic Web документах. OWL 2 онтології можуть бути використані разом з інформацією, написаною в RDF. OWL 2 онтології самі, в першу чергу, обмінюються документами в RDF.

На рисунку 1 представлений короткий огляд мови OWL 2. Еліпс в центрі представляє абстрактне поняття онтології, яке можна розглянути або як абстрактну структуру, або як граф RDF. Вгорі знаходяться різні конкретні синтаксиси, які можуть бути використані для серіалізації та обміну онтологіями. Внизу малюнка розташовуються дві семантичні специфікації, які визначають значення онтологій OWL 2 [5].

На даний момент актуальною вважається друга версія мови OWL, в якій визначаються такі різновиди:

– OWL-Lite є найпростішою з погляду синтаксису. Її найкраще використовувати під час побудови простої ієрархії класів та визначення семантичних обмежень.

– OWL 2 Full призначений для користувачів, яким потрібна максимальна виразність і синтаксична свобода RDF без гарантій обчислення.

Рисунок 1 – Огляд мови OWL 2

– OWL 2 DL призначено для користувачів, яким потрібна максимальна виразність при збереженні повноти обчислень (всі логічні висновки, що припускаються тією чи іншою онтологією, будуть гарантовано обчислювані) і вирішуваності (всі обчислення завершаться за певний час). OWL DL включає всі мовні конструкції OWL, але вони можуть використовуватися тільки згідно певним обмеженням (наприклад, клас може бути підкласом багатьох класів, але не може сам бути представником іншого класу). Існує три підмножини OWL DL, звані "профілями":

– OWL 2 EL, призначений для використання в додатках з великою кількістю властивостей і класів. На EL-онтологіях основні алгоритми логічного висновку гарантовано завершуються за поліноміальний час.

– OWL 2 QL, особливо корисний для онтологій, що містять безліч індивідів. У цьому профілі основний акцент припадає на забезпечення високої швидкості запитів до даних – вони відпрацьовують за логарифмічний час.

– OWL 2 RL призначений для запуску алгоритмів, заснованих на мовах правил. Включає відмінний від EL набір засобів і позиціонується як мова, що дозволяє підвищити виразність існуючих RDFS-онтологій.

Онтології можуть бути використані скрізь, де потрібна обробка даних, що враховує їх семантику. У силу початкової орієнтованості мови OWL на машинну обробку, правильне застосування онтологій може, з одного боку, істотно спростити і, з іншого боку, відкрити нові можливості в розробці додатків, що вирішують завдання автоматизованої обробки і доступу до даних [2, 5].

Література

1. Gruber T. A translation approach to portable ontologies / T.Gruber // Knowledge Acquisition. – 1993. – № 5 (2). – P. 199-220.

2. Литвин В. В. Бази знань інтелектуальних систем підтримки прийняття рішень: монографія / В. В. Литвин. – Львів: Видавництво Львівської політехніки, 2011. – 240 с.)

3. Згуровський М.З., Петренко А.І. Е-наука на шляху до семантичного Грід. Частина 2 семантичний WEB- і семантичний грід // Системні дослідження та інформаційні технології. – 2010. – № 1. – С. 26-38.

4. Д.Г. Досин, Р.Р. Даревич, Н.В. Шкутяк Розробка онтології матеріалознавства засобами Protégé-OWL // Штучний інтелект. – 2008. – № 3. – С. 70-77.

5. Офіційний сайт : OWL 2 Web Ontology Language. – Режим доступу: http://www.w3.org/TR/owl2-overview/ – Дата доступу: 21.08.2016.