Технические
науки/12.автоматизированные системы управления на производстве
Жикеев
А.А.
Костанайский
государственный университет имени А. Байтурсынова
Анализ объекта
исследований применением
OLAP-технологии
В 1993 г. Е. Кодд – «изобретатель» реляционных баз
данных сформулировал 12 определяющих принципов OLAP. OLAP - это Online
Analytical Processing, т. е. оперативный анализ данных. Позже его определение
было переработано в тест FASMI, требующий, чтобы OLAP-приложение предоставляло
возможности быстрого и подробного анализа разделяемой
многомерной информации.
Тест FASMI:
-
Fast (Быстрый) - анализ должен производиться одинаково быстро по всем аспектам
информации. Приемлемое время отклика - 5 с или менее;
-
Analysis (Анализ) - возможность осуществлять основные типы числового и
статистического анализа, предопределенного разработчиком приложения или
произвольно определяемого пользователем;
-
Shared (Разделяемой) - множество пользователей должны иметь доступ к данным,
при этом необходимо контролировать доступ к конфиденциальной информации;
-
Multidimensional (Многомерной) - это основная, наиболее существенная
характеристика OLAP;
-
Information (Информации) - приложение должно иметь возможность обращаться к
любой нужной информации, независимо от ее объема и места хранения.
OLAP предоставляет удобные быстродействующие
средства доступа, просмотра и анализа деловой информации. Пользователь получает
естественную, интуитивно понятную модель данных, организуя их в виде
многомерных кубов (Cubes). Осями многомерной системы координат служат основные
атрибуты анализируемого бизнес-процесса. К примеру, для
продаж это могут быть товар, регион, тип покупателя. В качестве одного из
измерений используется время. На пересечениях осей - измерений (Dimensions) -
находятся данные, количественно характеризующие процесс - меры (Measures). Это
могут быть объемы продаж в количестве, штуках или в денежном
выражении, остатки на складе, издержки и т. п. Пользователь, анализирующий
информацию, может "разрезать" куб по разным направлениям, получать
сводные (например, по месяцам, годам) или, наоборот, детальные (по неделям)
сведения и осуществлять различные решения, которые необходимы в процессе
анализа.
Все, что описано про OLAP, относится к
многомерному представлению данных. Многомерность в OLAP-приложениях разделена
на три уровня:
-
многомерное представление данных - средства конечного пользователя,
обеспечивающие многомерную визуализацию и манипулирование данными; слой
многомерного представления абстрагирован от физической структуры данных и воспринимает
данные как многомерные;
-
многомерная обработка - средство (язык) формулирования многомерных запросов
(реляционный язык SQL здесь непригоден) и процессор, умеющий обработать и
выполнить такой запрос;
-
многомерное хранение - средства физической организации данных, обеспечивающие
эффективное выполнение многомерных запросов.
Первые два уровня в обязательном порядке
присутствуют во всех OLAP-средствах. Третий уровень, является широко
распространенным, но не обязателен, так как данные для многомерного
представления могут извлекаться и из обычных реляционных структур; процессор
многомерных запросов в этом случае транслирует многомерные запросы в
SQL-запросы, которые выполняются реляционной СУБД.
Конкретные OLAP-продукты, как правило,
представляют собой либо средство многомерного представления данных, OLAP-клиент
(например, Pivot Tables в Excel фирмы Microsoft или ProClarity фирмы Knosys),
либо многомерную серверную СУБД, OLAP-сервер (например, Oracle Express Server или Microsoft OLAP
Services).
Термин «OLAP» неразрывно связан с термином «хранилище
данных» (Data Warehouse). Хранилище данных - это предметно-ориентированное,
привязанное ко времени и неизменяемое собрание данных для поддержки процесса
принятия управляющих решений. Данные в хранилище попадают из оперативных систем
(OLTP-систем), которые предназначены для автоматизации бизнес-процессов. Кроме
того, хранилище может пополняться за счет внешних источников, например
статистических отчетов. Таким образом, задача хранилища - предоставить «информацию»
для анализа в одном месте и в простой, понятной структуре.
Подводя итог, можно определить OLAP как
совокупность средств многомерного анализа данных, накопленных в хранилище.
Варианты хранения информации. Как детальные
данные, так и агрегаты могут храниться либо в реляционных, либо в многомерных
структурах. Многомерное хранение позволяет обращаться с данными как с
многомерным массивом, благодаря чему обеспечиваются одинаково быстрые
вычисления суммарных показателей и различные многомерные преобразования по
любому из измерений. Ранее OLAP-продукты поддерживали либо реляционное, либо
многомерное хранение. Сегодня, как правило, один и тот же продукт обеспечивает
оба этих вида хранения, а также третий вид - смешанный. Применяются следующие
термины:
-
MOLAP (Multidimensional OLAP) - и детальные данные, и агрегаты хранятся в
многомерной БД. В этом случае получается наибольшая избыточность, так как
многомерные данные полностью содержат реляционные;
-
ROLAP (Relational OLAP) - детальные данные остаются там, где они
"жили" изначально - в реляционной БД; агрегаты хранятся в той же БД в
специально созданных служебных таблицах;
-
HOLAP (Hybrid OLAP) - детальные данные остаются на месте (в реляционной БД), а
агрегаты хранятся в многомерной БД.
Каждый из этих способов имеет свои преимущества
и недостатки и должен применяться в зависимости от условий - объема данных,
мощности реляционной СУБД и т. д.
При хранении данных в многомерных структурах
возникает потенциальная проблема «разбухания» за счет хранения пустых значений.
Если в многомерном массиве зарезервировано место под все возможные комбинации
меток измерений, а реально заполнена лишь малая часть (например, ряд продуктов
продается только в небольшом числе регионов), то большая часть куба будет
пустовать, хотя место будет занято. Проблемы данного плана решаются средствами
современных OLAP-продуктов.
Литература:
1. www.olap.ru
3. www.interface.ru/.
4.
www. technet.microsoft.com/ru/.
5.
www. aspirantura.mipt.ru/.
7.
Федоров А. Введение в
OLAP-технологии Microsoft. - М.: Диалог-МИФИ, 2002.
8.
Барсегян
А.А. Методы и модели анализа данных: OLAP и Data
Mining. - СПб.: БХВ-Петербург, 2004.