Современные информационные технологии/4.Программное
обеспечение
Нурпеисова Ж.С.,магистр экон.наук, старший преподаватель
Костанайский государственный университет имени
А.Байтурсынова
АНАЛИЗ ЭКОЛОГИЧЕСКИХ ДАННЫХ В СРЕДЕ DEDUCTOR ACADEMIC
В последние десятилетия среди
специалистов многих отраслей науки отмечается постоянно растущий интерес к
использованию математико-статистических методов и компьютерных технологий для анализа
данных.
Все существующие алгоритмы первичной обработки
результатов экологического мониторинга и их применение немыслимы без
программных вычислительных средств, которых на данный момент огромное
количество. Часть из программ имеют специальную направленность, часть являются
универсальными.
Технология, рассмотренная в примере, система Deductor Academic – это аналитическая платформа, основа для создания
законченных прикладных решений в области анализа данных. Реализованные в
Deductor технологии позволяют на базе единой архитектуры пройти все этапы
построения аналитической системы: от консолидации данных до построения моделей
и визуализации полученных результатов.
Рассмотрим пример
статистического анализа экологических данных в среде Deductor Academic.
Шаг 1. Создание входного файла
данных. Исходные данные внесем в текстовый файл и сохраним для дальнейшего
ввода данных в программу и последующего их анализа.

Рисунок 1 – исходный
текстовый файл
Шаг 2. Импорт текстового файла
данных в Deductor Academic. Запустим Deductor Academic. Используя мастер
импорта данных, импортируем данные.

Рисунок 2 – мастер
импорта данных
Для 1 столбца «Районы»
тип данных определим как строковый, для 2 столбца «Количество загрязняющих
веществ» тип данных определим как вещественный. Далее выберем следующие способы
отображения данных: Таблица, Статистика, Графики. Нажав кнопку «Готово» получим исходные данные, представленные так,
как показано на рисунке 3.

Рисунок 3 – Результаты
импорта исходных данных
В режимах отображения
данных: Таблица, Статистика, Диаграмма, Гистограмма непосредственно проводится
статистический анализ.
Режим отображения данных
Таблица.
В режиме отображения данных «Таблица» активизируем кнопку «Показать онлайн
статистику». В результате в нижней части рабочей области отобразится
статистическая информация: среднее значение, максимальное значение, минимальное
значение, отклонение, сумма всех значений, количество.
Среднее количество
загрязняющих веществ по Костанайской области в 2013 году составило 24763,609
тонн. Проведем фильтрацию данных с целью подсчета количества районов, в которых
количество загрязняющих веществ соответственно ниже и выше среднего показателя
по области.
Для этого активизируем
кнопку «Фильтрация» и настроим окно. В итоге получаем, что в 18 регионов из 20
рассматриваемых количество загрязняющих веществ ниже среднего показателя по
области. Соответственно в 2 регионах из 20 данный показатель выше среднего. К
ним относятся Житикаринский район и г.Рудный.
Следует также отметить
что максимальное количество загрязняющих веществ зафиксировано в г.Рудном,
минимальное – в Жангельдинском районе.
Режим отображения данных
«Статистика». В
режиме отображения данных «Статистика» дополнительно к основным статистическим
характеристикам можно выполнить обзор статистики. Однако в нашем примере на
каждый регион приходится по одному значению, поэтому группировка с указанием
процентной доли, приходящейся на каждый регион одинаковая – по 5%. Следует
также отметить, что среднее отклонение показателей каждого региона от среднего
показателя по области составляет 85234,760 тонн. Данное значение в 3,4 раза
превышает среднее значение, что характеризует достаточно высокую степень
вариации (изменчивости) исследуемого показателя.
Режим отображения данных «Диаграмма». В данном режиме
отображается удельный вес количества загрязняющих веществ каждого региона в
процентах от общего по области.

Рисунок 5 – Режим
отображения данных Диаграмма
По данным диаграммы
можно сказать следующее: наибольший удельный вес загрязненности наблюдается в
г.Рудном – 77,44% от общего показателя по области и в Житикаринском районе –
16,48%. В г.Костанай – 1,93%, в остальных регионах удельный вес количества
загрязняющих веществ ниже 1% от общего показателя по области.
По данным диаграммы
можно сказать следующее: наибольший процент загрязненности наблюдается в
г.Рудном – 77,44% от общего показателя по области и в Житикаинской районе –
16,48%. В г.Костанай – 1,93%, в остальных регионах показатель количества загрязняющих
веществ ниже 1 процента.
Режим отображения данных
«Гистограмма». В
режиме отображения данных «Гистограмма» мы с вами можем увидеть группировку по
показателю «Количество загрязняющих веществ». Группировка будет произведена в количестве 5 интервалов.
Количество загрязняющих
веществ в интервале от 317,92 до 76044,8 тонн имеют 18 регионов области.
Количество загрязняющих веществ в интервале от
76044,8 до 151772 тонн имеет 1 регион. Количество загрязняющих веществ в
интервале от 303226 до 378953 тонн имеет 1 регион. В соответствующих режимах
отображения данных можно изменять направления осей, параметры отображения
данных, типы графиков, метки и значения, проценты и т.д.
Современный уровень
сложности задач, решаемых с помощью
информационных систем, постоянно
растет. Именно поэтому
с позиций даже самого сдержанного
оптимизма вполне логично
ожидать дальнейшую
оптимизацию уже существующих информационных
систем и создание
новых, многоцелевых
систем глобального масштаба, функционально обеспечивающих
решение вопросов от
банального справочного общения
с компьютером до автоматизированного сбора
и интерпретации информации, управления,
проектирования,
моделирования и прогнозирования различных процессов.
Литература:
1. http://www.basegroup.ru – Технологии анализа
данных
2. http://kostanay-priroda.kz – сайт
Управления природных ресурсов и регулирования природопользования акимата
Костанайской области.