Кожушко Г.В.

Вінницький торговельно-економічний інститут КНТЕУ

Поняття OLAP-систем та їх класифікація

Розглянуті теоретичні питання поняття OLAP-систем та їх класифікація. Сформульовано основні положення  OLAP-систем та зображено ефективність роботи даної системи.

Ключові слова: інформаційні системи, OLAP, інформація, оперативне планування.

Постановка проблеми. На сьогоднішній день широкого застосування набувають системи оперативного планування  матеріальних ресурсів – OLAP-системи. Розроблено безліч продуктів, що реалізують технологію оперативної аналітичної обробки даних OLAP (OnLine Analytical Processing), дана система є не конкретний продукт а ціла технологія. Узагальненням OLAP є оперативна аналітична обробка даних, існують різноманітні моделі OLAP, число які з кожним роком збільшується.

Також, аналітичне обробляння можна назвати онлайновим та інтерактивним, але «оперативне» як найкраще описує зміст OLAP-технології.

Метою нашого дослідження є розгляд OLAP-систем, що дозволяють систематизувати операційне планування матеріальних ресурсів на промислових підприємствах.

Аналіз наукових досліджень. Ідея обробки багатовимірних даних виникла в 1962 році. К.Айверсон опублікував свою роботу "Мова програмування" (мова програмування, APL). APL - це математично обґрунтована мова з багатовимірними перемінними і витонченими, але досить абстрактними операторами. У 70-і і 80-і роки APL активно використовувалась в багатьох ділових додатках, функціонально схожих з сучасними OLAP-системами [2].

У 1970 році вперше з'явився прикладний програмний продукт для багатовимірного аналізу даних - Express. Певні модифікації даного продукту широко використовується в сучасних OLAP додатках, однак споконвічні концепції 70-х років залишилися далеко позаду.

У 1992 році був випущений Essbase - перший OLAP продукт, що отримав велику популярність на ринку (з 1997 року Essbase має найбільшу частку на ринку OLAP-серверів).

У 1993 році виходить у світ стаття Е.Ф.Кодда (EFCodd), в якій вперше було дано формальне визначення OLAP-технології. Дана праця набула популярності і привернула увагу до можливостей багатовимірного аналізу.

Ідея обробки багатовимірних даних виникла в 1962 році. К.Айверсон опублікував свою роботу "Мова програмування" (мова програмування, APL). APL - це математично обґрунтована мова з багатовимірними перемінними і витонченими, але досить абстрактними операторами. У 70-і і 80-і роки APL активно використовувалась в багатьох ділових додатках, функціонально схожих з сучасними OLAP-системами.

У 1970 році вперше з'явився прикладний програмний продукт для багатовимірного аналізу даних - Express. Певні модифікації даного продукту широко використовується в сучасних OLAP додатках, однак споконвічні концепції 70-х років залишилися далеко позаду.

У 1992 році був випущений Essbase - перший OLAP продукт, що отримав велику популярність на ринку (з 1997 року Essbase має найбільшу частку на ринку OLAP-серверів).

У 1993 році виходить у світ стаття Е.Ф.Кодда (EFCodd), в якій вперше було дано формальне визначення OLAP-технології. Дана праця набула популярності і привернула увагу до можливостей багатовимірного аналізу. У статті були описані дванадцять правил OLAP, до яких трохи пізніше (в 1995 році) були додані ще кілька. Всі ці правила були розділені на чотири групи і названі "характеристиками" (features).

За визначенням, запропонованим Б. Коддом, багатовимірне концептуальне представлення (multi-dimensional conceptual view) - це множинна перспектива, що складається з кількох незалежних вимірювань, уздовж яких можуть бути проаналізовані визначені сукупності даних. Одночасний аналіз за кількома вимірюваннями визначається як багатовимірний аналіз.

Виклад основного матеріалу. On-Line Analytical Processing (OLAP) - технологія оперативної аналітичної обробки даних, що використовує методи і засоби для збору, зберігання та аналізу багатовимірних даних з метою підтримки процесів прийняття рішень.

Основним призначенням даних систем є підтримка аналітичної діяльності довільних запитів користувачів, тобто це аналітичний інструмент який ґрунтувався на багатовимірних базах даних (ВБД), що розроблені для підтримки аналізу кількісних даних з великою чисельністю вимірювань та містять дані у багатовимірному вигляді.

OLAP надає можливість сформувати вимірювання у виді ієрархії, де представлені дані, як гіперкуби (куби). Дані гіперкуби є фізичними та логічними моделями показників, які спільно використовують вимірювання та ієрархії в них.

Кожне вимірювання системи може бути представлене у вигляді ієрархічної структури, а деякі вимірювання можуть мати декілька видів ієрархічного представлення. На перетинах осей вимірювань (Dimensions) розташовуються дані, що кількісно характеризують аналізовані факти, - міри (Measures) [3].

На архітектуру конкретних OLAP-систем впливають певні фактори, серед яких:

-       взаємодія з джерелами даних,

-       особливості організації зберігання даних в OLAP-системі

-       підхід до обробки даних в системі.

Дані системи рідко використовуються як засіб зберігання та модифікації даних (окрім простих і малих систем бюджетування, обліку та аналізу продажів). Дані, що використовуються в OLAP для аналізу, формуються в інших інформаційних системах ( ERP , CRM , HRM).

Вимоги до даних системи описуються, як зберігання даних в спеціальних оптимізованих під типові завдання OLAP структурах та  вилучення даних з існуючих систем у процесі аналізу може призвести до зниження їх продуктивності.

Основною вимогою є забезпечення міцної зв'язки імпорту-експорту між існуючими системами, які виступають у якості джерела даних і OLAP-системою, а також OLAP-системою і зовнішніми додатками аналізу даних і звітності. Зв'язка має забезпечити вимоги підтримки імпорту-експорту з декількох джерел даних, здійснення процедур очищення і трансформації даних, уніфікації використовуваних класифікаторів та довідників. Крім того, до цих вимог додається необхідність обліку різних циклів оновлення даних в існуючих інформаційних системах та уніфікації необхідного рівня деталізації даних. Складність і багатогранність цієї проблеми призвела до появи концепції сховищ даних , і, у вузькому сенсі, до виділення окремого класу утиліт конвертації і перетворення даних - ETL .

Всі OLAP-системи використовують багатовимірну модель для зберігання активних, "робочих" даних системи. Модель зберігання активних даних впливає на всі вказані FASMI-тестом вимоги, особливо за цією ознакою окреслюють  підтипи OLAP. Підтипи було описано на рисунку 1.

Рисунок 1 - Підтипи OLAP- системи

Розглянемо основні види OLAP систем:

ROLAP (Relational OLAP - реляційні OLAP системи) - цей вид OLAP системи працює з базами даних. Щоб отримати дані здійснюється звернення  безпосередньо до реляційної бази даних. У вигляді реляційних таблиць здійснюється зберігання даних. За допомогою SQL інструментів та спеціальних запитів користувачі можуть здійснювати багатовимірний аналіз у традиційних OLAP системах.

До переваг ROLAP відносять:

-    ефективна обробка великого об’єму даних,

-    ефективна обробка текстових та числових даних.

До недоліків ROLAP відносять:

-    порівнюючи з традиційними OLAP системами спостерігається зниження продуктивності, тож сервер OLAP виконує обробку даних,

-    обмеження функціональності через використання SQL.

Розглянемо ROLAP систему, зобразивши її структуру на рисунку 2.

 

 

 

 


Рисунок 2 - Структура ROLAP системи

MOLAP (Multidimensional OLAP - багатовимірні OLAP системи) відносять до традиційних. Традиційна система відрізняється тим, що виконує попередню підготовку та оптимізацію даних. Попередня обробка даних виконується на виділеному сервері даної системи, а дані формуються в багатовимірні масиви - OLAP куби.

Дана система дозволяє переорганізувати та структурувати дані під різні запити, тож є самою ефективною при обробці даних.

До переваг MOLAP відносять:

-       аналітичні інструменти ( надають можливість обробляти непрості розрахунки),

-       швидке отримання результатів та бистрота формування звітів, що забезпечується  сформованими раніше OLAP кубами.

Щоб отримати багатовимірні куби у різних аспектах необхідно копіювати дані системи, через надлишковість даних та обмеження їх обсягів обробки.

 

 

 

 

 


Рисунок 3 - Структура МOLAP системи

HOLAP (Hybrid OLAP - гібридні OLAP системи) являється об’єднаною системою MOLAP та ROLAP. В даній системі об’єднано переваги двох попередніх систем, а саме:

-       використання багатовимірних баз даних,

-       управління реляційними базами даних.

Система надає можливість зберігати великий об’єм  даних в реляційних таблицях, а в раніше створених багатовимірних OLAP кубах розміщують дані.

Перевагами  HOLAP систем є:

-       масштабованість даних,

-       ефективна та більш швидша обробка даних,

-       доступ до джерел даних.

 

 

 

 

 

 


Рисунок 4 - Структура НOLAP системи

Також, до підвидів основних видів OLAP систем відносять:

-       DROLAP (перевершує ROLAP і MOLAP в ефективності управління простором і обробки запитів. Основою системи є використання щільних областей (dense regions) в кубах даних,використовують алгоритм EDEM (Efficient Dense Region Mining). Також підхід DROLAP краще управляє не тільки дисковим простором, але і кластерізованими багатовимірними даними)

-       OOLAP (OOLAP дозволяє працювати з об'єктними базами даних, а використовувані в ROLAP зв'язки між первинним і зовнішнім ключами в OOLAP замінюються зв'язками атрибут-домен)

-       RTOLAP (R-ROLAP) (Для зберігання агрегатів не створюються додаткові реляційні таблиці, а агрегати розраховуються в момент запиту. Тільки явно введені дані зберігаються в багатовимірному кубі.)

-       In-memory OLAP (Використовуються переваги основної пам'яті. Забезпечується деяка проміжна система баз даних, яка обробляє запити.)

-       DOLAR (Однорівнева технологія з невеликими кубами даних, користувач може сам створити куб щоб не підключатись до сервера)

-       Application OLAP (Продуктами цій області в основному є клієнти багатовимірних баз даних. Це може бути просто програма перегляду (viewer) або додаток, що покращує обслуговування користувачів)

-       WOLAR(припускає використання можливостей Web, истеми виконують аналітичні функції, такі як агрегування і деталізація, забезпечують високу продуктивність у поєднанні з усіма перевагами, які дає Web-додаток)

-       SOLAR (просторова аналітична обробка призначена для вивчення просторових даних)

-       SeOLAP (орієнтована на семантичні методи пошуку та вилучення даних і знань)

-       Mobile OLAP (дозволяє працювати з OLAP-даними і додатками віддалено через мобільні пристрої)

-       JOLAP (специфікація, призначена для створення і підтримки OLAP даних і метаданих на корпоративній платформі Java) [1].

 Переваги OLAP систем напряму мають залежність від точності, правдивості та обсягу вихідних даних. Дані системи надають можливість підприємствам прогнозувати та аналізувати різні ситуації, що прямо пропорційні перспективам розвитку та поточній діяльності підприємства. Тож, дані системи описуються додатком до систем автоматизації на рівні організацій. Розглянемо основні переваги OLAP-технології на рисунку 5.

Рисунок 5 - Основні переваги OLAP-технологій

Узгодженість вихідної інформації та результатів аналізу надає можливість за наявності OLAP систем прослідкувати основне джерело надходження інформації, та визначити зв'язок між вихідними даними і отриманими результатами, хоча простежується зниження суб'єктивності результатів при здійсненні багатоваріантного аналізу.

Проведення багатоваріантного аналізу на основі набору вихідних даних можливо простежити Моделюються ситуації за принципом «що буде, якщо», з використанням інструментів аналізу.

Управління деталізацією представляє собою надання результатів в залежності від потреб споживачів, де немає необхідності повторно виконувати обчислення на налаштування системи. Для прийняття рішення звіт містить необхідну інформацію.

Створення єдиної платформи відбувається для покращення процесу прогнозування та аналізу, що здійснюється за допомогою використання  OLAP системи. Зокрема, дані OLAP системи, є основою для побудови прогнозів бюджету, прогнозу продажів, прогнозу закупівель, плану стратегічного розвитку та ін.

Тож, до переваг OLAP-системи відносять такі:

-       підвищення продуктивності виробничого персоналу, розробників прикладних програм

-       своєчасний доступ до стратегічної інформації;

-       надання користувачам достатніх можливостей для внесення власних змін у схему.

Додатки OLAP спираються на сховища даних та системи OLTP, отримуючи від них актуальні дані, що надає зберігання контролю цілісності корпоративних даних та зменшує можливість перенавантаження на системи OLTP і сховища даних.

OLAP-додатки оперують з великими масивами даних, уже накопиченими в оперативних базах даних OLTP-систем, взятими з електронних таблиць або з інших джерел даних. Щоб підкреслити особливий спосіб організації даних, які можуть ефективно використовуватися для аналізу додатками OLAP і Data Mining, до них застосовують спеціальний термін «сховища даних» (DataWare House) [4].

Технологія OLAP, так само як і data mining використовується в додатках класу analytical CRM. Однак у той час як технологія data mining використовується, в основному, для побудови прогнозів, технологія OLAP лише дозволяє поглянути на дані з різних сторін, в основному, надаючи можливість аналізу агрегованих даних. Втім, це анітрохи не применшує достоїнств даної технології.

Висновки. В результаті дослідження визначено основні поняття OLAP-системою їх класифікацію та особливості. Дана технологіє є основоположником оперативного планування на підприємствах, за допомогою своєї властивості оперувати великими масивами даних. Схематично зобразили роботу інформаційної системи будь-якого призначення. На основі, OLAP-систем було побудовано процес поліпшення ефективності операцій в промисловому підприємстві.

Список використаних джерел:

1.     www.olap.ru

2.     Бергер А. Microsoft SQL Server 2005 Analysis Services. и многомерный анализ данных / А. Бергер. СП б : БХВ-П етербург , 2007. 928 с . OLAP і багатовимірний аналіз даних / А. Бергер. - СП б: БХВ-Петербург, 2007. - 928 с.

3.     Барсегян А.А. и Data Mining / А.А. Методи і моделі аналізу даних: OLAP і Data Mining / А.А. Барсегян, М. С. Купріянов, В. В. Степаненко, І. І. Холод. - СПб.: БХВ-Петербург, 2004. - 336 с.

4.     Коровкін С. Д. Вирішення проблеми комплексного оперативного аналізу інформації сховищ даних / С.Д. Коровкін, І.А. Левенець, І.Д. Ратманова, В.А. Старих, Л.В. Щавелєв / / СУБД. - 1997. - № 5-6. - С. 47-51с.