Технические науки/12.автоматизированные системы управления на производстве

Жикеев А.А.

Костанайский государственный университет имени А. Байтурсынова

Анализ объекта исследований применением

OLAP-технологии

В 1993 г. Е. Кодд – «изобретатель» реляционных баз данных сформулировал 12 определяющих принципов OLAP. OLAP - это Online Analytical Processing, т. е. оперативный анализ данных. Позже его определение было переработано в тест FASMI, требующий, чтобы OLAP-приложение предоставляло возможности быстрого и подробного анализа разделяемой многомерной информации.

Тест FASMI:

- Fast (Быстрый) - анализ должен производиться одинаково быстро по всем аспектам информации. Приемлемое время отклика - 5 с или менее;

- Analysis (Анализ) - возможность осуществлять основные типы числового и статистического анализа, предопределенного разработчиком приложения или произвольно определяемого пользователем;

- Shared (Разделяемой) - множество пользователей должны иметь доступ к данным, при этом необходимо контролировать доступ к конфиденциальной информации;

- Multidimensional (Многомерной) - это основная, наиболее существенная характеристика OLAP;

- Information (Информации) - приложение должно иметь возможность обращаться к любой нужной информации, независимо от ее объема и места хранения.

OLAP предоставляет удобные быстродействующие средства доступа, просмотра и анализа деловой информации. Пользователь получает естественную, интуитивно понятную модель данных, организуя их в виде многомерных кубов (Cubes). Осями многомерной системы координат служат основные атрибуты анализируемого бизнес-процесса. К примеру, для продаж это могут быть товар, регион, тип покупателя. В качестве одного из измерений используется время. На пересечениях осей - измерений (Dimensions) - находятся данные, количественно характеризующие процесс - меры (Measures). Это могут быть объемы продаж в количестве, штуках или в денежном выражении, остатки на складе, издержки и т. п. Пользователь, анализирующий информацию, может "разрезать" куб по разным направлениям, получать сводные (например, по месяцам, годам) или, наоборот, детальные (по неделям) сведения и осуществлять различные решения, которые необходимы в процессе анализа.

Все, что описано про OLAP, относится к многомерному представлению данных. Многомерность в OLAP-приложениях разделена на три уровня:

- многомерное представление данных - средства конечного пользователя, обеспечивающие многомерную визуализацию и манипулирование данными; слой многомерного представления абстрагирован от физической структуры данных и воспринимает данные как многомерные;

- многомерная обработка - средство (язык) формулирования многомерных запросов (реляционный язык SQL здесь непригоден) и процессор, умеющий обработать и выполнить такой запрос;

- многомерное хранение - средства физической организации данных, обеспечивающие эффективное выполнение многомерных запросов.

Первые два уровня в обязательном порядке присутствуют во всех OLAP-средствах. Третий уровень, является широко распространенным, но не обязателен, так как данные для многомерного представления могут извлекаться и из обычных реляционных структур; процессор многомерных запросов в этом случае транслирует многомерные запросы в SQL-запросы, которые выполняются реляционной СУБД.

Конкретные OLAP-продукты, как правило, представляют собой либо средство многомерного представления данных, OLAP-клиент (например, Pivot Tables в Excel фирмы Microsoft или ProClarity фирмы Knosys), либо многомерную серверную СУБД, OLAP-сервер (например, Oracle Express Server или Microsoft OLAP Services).

Термин «OLAP» неразрывно связан с термином «хранилище данных» (Data Warehouse). Хранилище данных - это предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений. Данные в хранилище попадают из оперативных систем (OLTP-систем), которые предназначены для автоматизации бизнес-процессов. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов. Таким образом, задача хранилища - предоставить «информацию» для анализа в одном месте и в простой, понятной структуре.

Подводя итог, можно определить OLAP как совокупность средств многомерного анализа данных, накопленных в хранилище.

Варианты хранения информации. Как детальные данные, так и агрегаты могут храниться либо в реляционных, либо в многомерных структурах. Многомерное хранение позволяет обращаться с данными как с многомерным массивом, благодаря чему обеспечиваются одинаково быстрые вычисления суммарных показателей и различные многомерные преобразования по любому из измерений. Ранее OLAP-продукты поддерживали либо реляционное, либо многомерное хранение. Сегодня, как правило, один и тот же продукт обеспечивает оба этих вида хранения, а также третий вид - смешанный. Применяются следующие термины:

- MOLAP (Multidimensional OLAP) - и детальные данные, и агрегаты хранятся в многомерной БД. В этом случае получается наибольшая избыточность, так как многомерные данные полностью содержат реляционные;

- ROLAP (Relational OLAP) - детальные данные остаются там, где они "жили" изначально - в реляционной БД; агрегаты хранятся в той же БД в специально созданных служебных таблицах;

- HOLAP (Hybrid OLAP) - детальные данные остаются на месте (в реляционной БД), а агрегаты хранятся в многомерной БД.

Каждый из этих способов имеет свои преимущества и недостатки и должен применяться в зависимости от условий - объема данных, мощности реляционной СУБД и т. д.

При хранении данных в многомерных структурах возникает потенциальная проблема «разбухания» за счет хранения пустых значений. Если в многомерном массиве зарезервировано место под все возможные комбинации меток измерений, а реально заполнена лишь малая часть (например, ряд продуктов продается только в небольшом числе регионов), то большая часть куба будет пустовать, хотя место будет занято. Проблемы данного плана решаются средствами современных OLAP-продуктов.

 

Литература:

 

1.       www.olap.ru

2.       www.olapreport.com/.

3.       www.interface.ru/.

4.       www. technet.microsoft.com/ru/.

5.       www. aspirantura.mipt.ru/.

6.       Бергер А. Microsoft SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных. - СПб: БХВ-Петербург, 2007.

7.       Федоров А. Введение в OLAP-технологии Microsoft. - М.: Диалог-МИФИ, 2002.

8.       Барсегян А.А. Методы и модели анализа данных: OLAP и Data Mining. - СПб.: БХВ-Петербург, 2004.