Современные информационные технологии/4.Программное обеспечение

Нурпеисова Ж.С.,магистр экон.наук, старший преподаватель

Костанайский государственный университет имени А.Байтурсынова

АНАЛИЗ ЭКОЛОГИЧЕСКИХ ДАННЫХ В СРЕДЕ DEDUCTOR ACADEMIC

В последние десятилетия среди специалистов многих отраслей науки отмечается постоянно растущий интерес к использованию математико-статистических методов и компьютерных технологий для анализа данных.

Все существующие алгоритмы первичной обработки результатов экологического мониторинга и их применение немыслимы без программных вычислительных средств, которых на данный момент огромное количество. Часть из программ имеют специальную направленность, часть являются универсальными.

Технология, рассмотренная в примере, система Deductor Academic – это аналитическая платформа, основа для создания законченных прикладных решений в области анализа данных. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: от консолидации данных до построения моделей и визуализации полученных результатов.

Рассмотрим пример статистического анализа экологических данных в среде Deductor Academic.

Шаг 1. Создание входного файла данных. Исходные данные внесем в текстовый файл и сохраним для дальнейшего ввода данных в программу и последующего их анализа.

Рисунок 1 – исходный текстовый файл

Шаг 2. Импорт текстового файла данных в Deductor Academic. Запустим Deductor Academic. Используя мастер импорта данных, импортируем данные.

Рисунок 2 – мастер импорта данных

Для 1 столбца «Районы» тип данных определим как строковый, для 2 столбца «Количество загрязняющих веществ» тип данных определим как вещественный. Далее выберем следующие способы отображения данных: Таблица, Статистика, Графики.  Нажав кнопку «Готово» получим исходные данные, представленные так, как показано на рисунке 3.

Рисунок 3 – Результаты импорта исходных данных

В режимах отображения данных: Таблица, Статистика, Диаграмма, Гистограмма непосредственно проводится статистический анализ.

Режим отображения данных Таблица. В режиме отображения данных «Таблица» активизируем кнопку «Показать онлайн статистику». В результате в нижней части рабочей области отобразится статистическая информация: среднее значение, максимальное значение, минимальное значение, отклонение, сумма всех значений, количество.

Среднее количество загрязняющих веществ по Костанайской области в 2013 году составило 24763,609 тонн. Проведем фильтрацию данных с целью подсчета количества районов, в которых количество загрязняющих веществ соответственно ниже и выше среднего показателя по области. 

Для этого активизируем кнопку «Фильтрация» и настроим окно. В итоге получаем, что в 18 регионов из 20 рассматриваемых количество загрязняющих веществ ниже среднего показателя по области. Соответственно в 2 регионах из 20 данный показатель выше среднего. К ним относятся Житикаринский район и г.Рудный.

Следует также отметить что максимальное количество загрязняющих веществ зафиксировано в г.Рудном, минимальное – в Жангельдинском районе.

Режим отображения данных «Статистика». В режиме отображения данных «Статистика» дополнительно к основным статистическим характеристикам можно выполнить обзор статистики. Однако в нашем примере на каждый регион приходится по одному значению, поэтому группировка с указанием процентной доли, приходящейся на каждый регион одинаковая – по 5%. Следует также отметить, что среднее отклонение показателей каждого региона от среднего показателя по области составляет 85234,760 тонн. Данное значение в 3,4 раза превышает среднее значение, что характеризует достаточно высокую степень вариации (изменчивости) исследуемого показателя.

Режим отображения данных «Диаграмма». В данном режиме отображается удельный вес количества загрязняющих веществ каждого региона в процентах от общего по области.

Рисунок 5 – Режим отображения данных Диаграмма

По данным диаграммы можно сказать следующее: наибольший удельный вес загрязненности наблюдается в г.Рудном – 77,44% от общего показателя по области и в Житикаринском районе – 16,48%. В г.Костанай – 1,93%, в остальных регионах удельный вес количества загрязняющих веществ ниже 1% от общего показателя по области.

По данным диаграммы можно сказать следующее: наибольший процент загрязненности наблюдается в г.Рудном – 77,44% от общего показателя по области и в Житикаинской районе – 16,48%. В г.Костанай – 1,93%, в остальных регионах показатель количества загрязняющих веществ ниже 1 процента.

Режим отображения данных «Гистограмма». В режиме отображения данных «Гистограмма» мы с вами можем увидеть группировку по показателю «Количество загрязняющих веществ». Группировка  будет произведена в количестве 5 интервалов.

Количество загрязняющих веществ в интервале от 317,92 до 76044,8 тонн имеют 18 регионов области. Количество загрязняющих веществ в интервале от  76044,8 до 151772 тонн имеет 1 регион. Количество загрязняющих веществ в интервале от 303226 до 378953 тонн имеет 1 регион. В соответствующих режимах отображения данных можно изменять направления осей, параметры отображения данных, типы графиков, метки и значения, проценты и т.д.

Современный   уровень   сложности   задач,     решаемых   с    помощью информационных систем,  постоянно растет.  Именно  поэтому  с  позиций  даже самого   сдержанного    оптимизма    вполне   логично    ожидать  дальнейшую оптимизацию  уже  существующих  информационных  систем  и  создание   новых, многоцелевых      систем      глобального       масштаба,      функционально обеспечивающих  решение  вопросов   от   банального  справочного  общения  с компьютером  до  автоматизированного  сбора  и  интерпретации    информации,    управления,  проектирования,   моделирования   и   прогнозирования различных процессов.

Литература:

1.       http://www.basegroup.ru – Технологии анализа данных

2.       http://kostanay-priroda.kzсайт Управления природных ресурсов и регулирования природопользования акимата Костанайской области.