Современные информационные технологии/3. Программное
обеспечение
Моложенко Е.С., Губарев В.В.
Новосибирский государственный технический
университет, Россия
Обработка и анализ больших данных для умных городов будущего
В городах генерируются большие объемы социально-экономических,
энергетических, транспортных и многих других данных. Обработка и анализ всей
совокупности таких данных позволит ответить на ряд вопросов и улучшить принятие
решений в научных, политических, управленческих и других областях. В этой
статье предлагается теоретическое обоснование использования облачных средств и
технологий для обработки и анализа больших данных.
Умные города в экономическом и социальном
аспектах устремлены в будущее. Они ведут постоянный мониторинг важнейших
объектов инфраструктуры - автомобильных дорог, мостов, туннелей, железных
дорог, метро, аэропортов, морских портов, систем связи, водоснабжения,
энергоснабжения, а также важнейших зданий - в целях оптимального распределения
ресурсов и обеспечения безопасности. Они постоянно наращивают число
предоставляемых населению услуг, обеспечивая устойчивую среду, которая
способствует благополучию и сохранению здоровья горожан.
Главное отличие умного города от города
традиционного заключается в характере взаимоотношений с горожанами. В обычном
городе услуги на основе ИКТ не могут так же гибко реагировать на изменения
экономических, культурных и социальных условий, как услуги в умном городе.
Таким образом, умный город прежде всего ориентирован на человека, базируется на
инфраструктуре ИКТ и непрерывном городском развитии при постоянном учете
требований экологической и экономической устойчивости.
С технической точки зрения умные города
представляют собой различные устройства с поддержкой концепции «Интернет
вещей», например, уличные фонари, оснащенные интеллектуальными датчиками, RFID
метки, смартфоны, беспроводные сенсорные сети и другие IoT устройства.
В связи с быстрым распространением подобных взаимосвязанных
устройств и систем, объем собираемых данных возрастает быстрыми темпами. Для функционирования
умных городов необходимо иметь возможность анализировать эти данные и получать
на их основе аналитическую информацию быстро и экономично. Что касается анализа
больших данных и других аналитических задач, текущие решения не обеспечивают
скорость реакции системы, необходимую для обработки заданий анализа, что
снижает производительность пользователя и затягивает процесс принятия решений.
Анализ больших данных может помочь городским и
региональным администрациям с пользой задействовать колоссальные объемы
имеющейся у них информации. Платформа для обработки и анализа больших данных
станет основой создания умного города.
Платформа для обработки и анализа больших данных
должна включать средства для интеллектуального анализа данных, статистического
моделирования и машинного обучения. Кроме того, должны быть задействованы
существующие инструменты вроде R, RapidMiner в
комбинации с технологиями, подобными Hadoop MapReduce или Spark MapReduce. В существующей литературе
отмечается, что интеллектуальных анализ больших данных намного сложнее, чем
традиционный анализ данных [1]. Это утверждение справедливо и для анализа
данных умных городов, вследствие мультидисциплинарности исходных данных.
Умные города предоставляют новую сферу применения
для аналитики больших данных и недостаточно освещены в литературе. Обзор
существующих идей применения облачной модели для решения задач обработки и
анализа показывает, что она может решить большую часть проблем. Например, Burnap P. описывает проект COSMOS [2], который представляет из себя
облачный сервис на основе Hadoop для
анализа больших данных, поступающих из социальных сетей.
Облачные сервисы для работы с большими данными
дают возможность сократить усилия по настройке и конфигурированию собственных
кластеров, а также дают уверенность, что вы платите за то, что используете.
Самая главная проблема всегда будет связана с местоположением данных, так как
отправить данные при этом медленно и дорого. Самыми эффективными решениями
больших данных в облаке будут те, в
которых данные также собраны в облаке.
Литература:
1. Lin
J, Ryaboy D (2012) Scaling big data mining infrastructure: The twitter
experience. SIGKDD Explorations: ACM 14:6-19
2. Burnap P, Rana O, Williams M, Housley W,
Edwards A, Morgan J, Sloan L, Conejero JCOSMOS: Towards an Integrated and
Scalable Service for Analysing Social Media on Demand. International Journal of
Parallel, Emergent and Distributed Systems. http://orca.cf.ac.uk/59478/.