к.г.н. Е.А. Прохорова, В.Н. Семин
Московский государственный университет имени М.В.Ломоносова,
Россия
Информационные ресурсы для создания баз данных и решения
задач социально-экономического картографирования
Современные
методы составления карт - от простейших картографических схем до сложных
тематических произведенеий и технологий конструирования их в компьютерных
сетях, предполагают создание способов и возможностей хранения и
обработки пространственной информации. Требования, предъявляемые к цифровым картам,
должны быть другими, поскольку обработка данных рассчитана не только и не
столько на зрительный анализ, сколько на компьютерные возможности и
воспроизводство бумажного оригинала.
Цифровая
карта создается с полным соблюдением нормативов и правил картографирования и
является элементом картографической
базы данных, одним из важнейших элементов информационного обеспечения
географических справочных систем. В современном обществе картографическая
информация используется во многих сферах деятельности, не связанных
непосредственно с профессиональной картографией, поэтому картографические базы
данных становятся все более востребованными, а круг лиц, использующих их в
рамках профессиональной деятельности, растет.
При
социально-экономическом картографировании для отображения взаимодействия
природы и общества, изменений, происходящих
в отраслях экономики и политике, требуется большой объем новой, оперативно
поступающей информации, сформированной и структурированной в картографических
базах данных, которые должны стать обобщением многих источников:
картографических, статистических, литературных и аналитических изданий, данных
дистанционного зондирования и пр. Сейчас, однако, большинство этих материалов
разрознены и рассеяны в картографических фондах, библиотеках, на сайтах сети
интернет и т.д., и требуются
значительные затраты времени на их поиск и систематизацию.
Картографические
базы данных (КБД) – это информационная модель, представляющая собой
совокупность взаимосвязанных картографических данных (в нашем случае –
пространственных и атрибутивных данных социально-экономической тематики),
организованных по определенным правилам и по общим принципам [3]. Их назначение – это хранение данных и их использование в
научно-исследовательских и проектных работах, при проведении маркетинговых
исследований, в учебном процессе и др.
Статистические
данные – составной элемент национальной информационной инфраструктуры и важная
часть исследовательской базы для научных
проектов. Рост объема данных приводит к необходимости их структурирования,
обработки и хранения, предоставления
для вторичного анализа. Регулярный сбор данных осуществляется
правительственными ведомствами, в результате чего формируется основа системы
статистических ресурсов страны. Ведомственная отчетность обычно шире рамок
государственной статистики и может дать много дополнительного и уточняющего
материала для создания баз данных.
Основной
статистический источник для создания картографических баз данных – Центральная
база статистических данных Росстата (ЦБСД), куда входит более 2500 показателей
по России и субъектам РФ. Однако информационные ресурсы для
социально-экономического картографирования наиболее нестабильны и динамичны
среди прочих сведений, используемых географической наукой; чаще всего доступ к наиболее актуальным данным о состоянии экономики, транспорте, землепользовании, обеспечивают интернет-технологии.
Основная
проблема, возникающая при получении информации
из разных источников, – перекрывающиеся или противоречащие друг другу
данные. Сведения, полученные из вполне надежного источника, в дальнейшем могут
мигрировать по разным изданиям и базам данных,
дробиться на части, в результате чего
накапливаются ошибки. Первичной базой данных чаще всего служит
электронная система, и дальнейшая ее репликация должна происходить по
договоренности с владельцем, с сохранением первичной информации.
Другая
проблема заключается в том, что необходимые для конкретной работы показатели
могут быть предоставлены в разных разделах, сборниках, сгруппированы в разные
по структуре таблицы. Например, данные
о занятости населения на транспорте могут фигурировать в разделах «Транспорт», «Население», «Социальная
инфраструктура», поэтому важно тщательно изучить информацию, чтобы
оптимизировать запросы в базу данных и избежать их дублирования [4].
Если
интересующие нас взаимосвязанные данные представлены в различных форматах (HTML, MS Word и др.), то это
сдерживающий фактор при их
единовременной обработке, поэтому актуально приведение всех данных к единому
формату, например, в формат таблицы реляционной базы данных.
Работа
над формированием базы статистических ресурсов для исследования
социально-экономических процессов и социально-экономического картографирования
– специальная научная задача. Определяется круг основных источников, который составит
основу базы, и систематизируется полученная информация. Трудности связаны не
только с поиском необходимых статистических данных, но и с приведением их к
сопоставимому виду. Массив данных приводят к единому формату и интегрируют в
базу данных. Для целей социально-экономического картографирования наиболее востребованы базы по населению и населенным пунктам,
основным отраслям экономики, транспорту, земельным ресурсам, экологии и
природопользованию. Такие фонды целесообразно формировать в определенной
последовательности, например, от общих элементов к частным.
При
создании картографических баз данных приходится учитывать прежде всего тематику
и имеющуюся в наличии информацию, предназначенную для построения различных
карт. Любой исследователь или специалист, которому это необходимо, может
использовать одну из устоявшихся известных систем управления базами данных
(СУБД), например, MSSQL, MySQL, Oracle, Ingres, Excess и др. Однако при работе
с картографическими базами данных пользователям приходится самим разрабатывать
программное обеспечение для того, чтобы сделать возможным выполнение требуемых
задач.
Необходимость
создания или приобретения специализированного программного обеспечения,
позволяющего анализировать выбранные показатели, преобразовать исходные данные
в необходимый формат, применять отдельные методы исследования с учетом
специфики анализируемых показателей, а также правильно интерпретировать
результаты представляет основную задачу
и проблему при создании КБД.
Как
правило, картографическая база данных состоит из взаимосвязанной информации
(картографической и атрибутивной), специализированного программного
обеспечения, разработанного для решения
определенного типа задач, и одной из вышеперечисленных классических СУБД.
СУБД,
или, точнее, СУ КБД (система управления картографическими базами данных),
предоставляет доступ к данным и выполняет запросы пользователя по поиску и
обработке информации.
Чаще
всего в силу отсутствия устоявшихся
стандартов (что существует и в классических базах данных) функциональность СУ КБД обеспечивается за
счет совместного использования классических промышленных СУБД, коммерческих ГИС (ArcGIS или
MapINFO) и специализированного программного обеспечения, создаваемого
разработчиком картографической базы данных.
Построение
эффективно действующей картографической базы данных невозможно без правильно
организованной информации. В основе
любой КБД лежит не только картографическая информация, важную роль играет также смысловая,
атрибутивная информация. В ряде случаев она даже важнее картографической
составляющей, например, в кадастровых системах.
Принципиальное
отличие картографической информации (характеристики населенных пунктов, дорог,
отдельных сооружений и т.д.), привязанной к пространственным объектам, состоит
в том, что она не может быть независима, т.е. должна быть прямо или косвенно
связана с картой или привязана к карте.
При
проектировании КБД социально-экономических явлений важная роль отводится разработке классификаторов.
Это строгий логический процесс переработки информации, без которого невозможно
систематизированное распределение явлений и объектов на определенные секции,
группы, классы, позиции, виды на основании их сходства и различия. Без классификаций нельзя создать базу данных, так как классификация дает четкое представление о
виде, назначении, содержании информации,
в каком виде ее необходимо
хранить, как должна быть
осуществлена система отбора объектов.
Современная
технология обработки социально-экономической информации и обмен данными между
различными системами базируются на комплексе государственных стандартов.
Важнейший из них, обеспечивающий информационную совместимость систем управления
и баз данных, – это система стандартных общероссийских классификаторов
технико-экономической и социальной информации (ОК ТЭСИ) [5].
Общероссийские
классификаторы, являясь частью статистической инфраструктуры, обеспечивают
систематизацию, структурирование, группирование и идентификацию
социально-экономических объектов и явлений, что позволяет пользователям
проводить анализ статистической информации и решать конкретные прикладные задачи.
Оптимальные классификаторы для социально-экономических объектов
должны иметь древовидную структуру, например, транспорт – железные и
автомобильные дороги – грузоперевозки.
При
формировании баз данных следует предусмотреть, с какой детальностью эта информация
будет использована впоследствии. Это будет зависеть от параметров создаваемых
карт, степени подготовленности потребителей и способа использования карт.
Обработка
атрибутивной информации в базах данных может происходить двумя путями. Первый –
переработка данных с целью получения новых производных данных, при этом не
требуется визуализации результата. Во
втором случае – при переработке числовых данных в графическую форму карты –
сложность заключается в том, что необходимо учитывать весь многообразный комплекс
явлений, взаимосвязей между ними и внутри них. Так как связи отличаются по
значимости, то характеризующие их показатели должны быть ранжированы [1].
Картографические
изображения, получаемые вторым способом, можно разделить на три основных вида,
отличающихся по реализации, признакам и применению.
Первой
и наиболее простой – картографическая модель, хранящаяся в базе данных в
качестве основы, как источник картографических данных в виде отдельных «слоев»
информации. Она служит для
визуализации, привязки различных атрибутивных данных, согласования
картографической информации, контроля за качеством работы и процесса
редактирования.
При
переработке информации с помощью математико-картографического моделирования
возникает второй, промежуточный, вид моделей, в котором уже применяются
условные знаки, хотя и несколько упрощенные. Они выводятся либо на экран
дисплея, либо с помощью периферийных устройств (принтеров, плоттеров), в том
числе не отличающихся высокой точностью и качеством исполнения, используются только
самими создателями для оценки успешности проведения предыдущих стадий и
уточнения дальнейших процессов обработки.
Третий
вид изображений ориентирован на
потребителя и является итогом моделирования. Их распечатывают более
качественно, часто в многоцветном оформлении в соответствии с принятыми
картографическими стандартами.
Целесообразно
создавать многоуровневое методологическое сопровождение базы, включающее возможность вызова кратких и
развернутых методологических пояснений к каждому объекту (группе
объектов), гиперсcылочный доступ к
терминам.
Интеграция
различных, в том числе статистических, данных с картографическим обеспечением
необходима, ведь в результате создаются картографические базы данных, и далее -
любые карты, оперативно отражающие изменение социальной ситуации в стране,
регионе, городе.
Важное
условие для развития информационного общества в России – формирование ее
единого информационного пространства. Часть этого пространства составляет
инфраструктура пространственных данных (ИПД) – информационно-телекоммуникационная
система, обеспечивающая доступ пользователей к государственным распределенным
ресурсам пространственных данных. ИПД несет тематическую, в том числе
социально-экономическую, информацию, что дает возможность распространять и обмениваться ею в интернете для
формирования отчетных документов, презентационных материалов, размещения
готовых картографических продуктов на сайтах.
Основанные
на ГИС картографические базы данных могут быть непрерывными (без деления на
отдельные листы и регионы) и не связанными с конкретным масштабом или
картографической проекцией. На основе этих баз можно создавать карты (в
электронном или бумажном виде) на любую территорию, любого масштаба, с любой
нужной нагрузкой. Базу данных всегда можно пополнять новыми данными (например,
из других баз), а имеющиеся в ней данные можно редактировать и тут же
отображать на экране по мере необходимости [1].
В
дальнейшем развитие баз данных для социально-экономического картографирования
приведет к созданию онлайновых статистических
сервисов, в том числе визуального анализа данных с помощью различных видов
графиков и диаграмм, а также моментального создания производных карт.
Пользователю должна быть предоставлена возможность описания процесса получения
вторичных данных на основе уже имеющихся и способа их отображения, или
пользователь может воспользоваться одним
из заранее подготовленных сценариев с готовыми сюжетами.
Стандартизировать
все социально-экономические показатели невозможно, но вполне реально – создать язык для их описания. Важнейшая
задача – выработка стандартов языка для описания метаданных (информации об используемых данных, в нашем
случае – социально-экономических).
Разработка языка для описания метаданных совершенно необходима для
создания каталогов социально-экономической информации, чтобы эти метаданные
были понятны всем пользователям, поскольку данные имеют сложную структуру,
разные форматы, часто большой объем.
Функция
языка при этом состоит в том, чтобы составлять предложения, где одни и те же
данные, закодированные разными способами, будут описывать структуру и
содержимое социально-экономических показателей.
Стандартизация
описаний и создание специализированных каталогов – одно из главных направлений
при создании национальных инфраструктур социально-экономической информации.
Набор
средств для описания процесса
получения данных, а также набор
сценариев должны предоставлять пользователю возможность учитывать специфику
обрабатываемых данных и быть адекватны решаемой задаче.
Работа
выполнена в рамках проекта РФФИ (грант 13-05-41233).
Литература:
1. Дейт К.Дж.
Введение в системы баз данных. М.:
Вильямс, 2006.
2. Капралов Е.Г.,
Кошкарев А.В., Тикунов В.С. и др. Геоинформатика. М.: Академия, 2006.
3. Лурье И.К. Геоинформационное картографирование. М.:
Изд-во КДУ, 2008.
4. Прохорова Е.А.
Социально-экономические карты. М.: Изд-во КДУ, 2010.
5. Соколин В.Л. Система государственной статистики: тактика и стратегия развития // Вопр.статистики, 2001. № 1.