Д.э.н., проф. Дроговоз П.А., Иванов П.Д.
МГТУ им. Н.Э. Баумана, Россия
Анализ состояния и перспективы
развития технологий
Big Data.
Технологии Big Data – серия подходов, инструментов и методов
обработки структурированных и неструктурированных данных огромных объемов и
значительного многообразия. Данные технологии применяются для получения
воспринимаемых человеком результатов, эффективных в условиях непрерывного
прироста, распределения по многочисленным узлам вычислительной сети. Они
сформировались в конце 2000-х годов в качестве альтернативы традиционным
системам управления базами данных и решениям класса Business Intelligence. В
настоящее время большинство крупнейших поставщиков информационных технологий
для организаций в своих деловых стратегиях используют понятие о больших данных,
а основные аналитики рынка информационных технологий посвящают концепции
выделенные исследования.
Термин Big Data относится к наборам данных, размер которых
превосходит возможности типичных баз данных по хранению, управлению и анализу
информации. В настоящее время множество компаний следят за развитием технологий
Big Data. Аналитическая компания IDC представила в декабре 2012 г. отчет «Big
Data, Bigger Digital Shadows, and Biggest Growth in the Far East», в котором
предсказывалось, что объемы
информации будут удваиваться
каждые 2 года в течение следующих 8 лет. За ближайшие 7 лет количество данных в
мире достигнет 40 ЗБ (1 ЗБ = 1021 байт), а это значит, что на каждого жителя
Земли будет приходиться по 5200 ГБ данных [1].
В современных условиях организации создают большое количество
неструктурированных данных, таких как текстовые документы, изображения,
видеозаписи, машинный код, таблицы и т.д. Вся эта информация хранится во
множестве репозиториев, порой даже за пределами организации. Компании могут иметь доступ к огромному
массиву своих данных и не иметь необходимых инструментов, которые могли бы
установить взаимосвязи между этими данными и сделать на их основе значимые
выводы. Традиционные методы анализа информации не могут угнаться за огромными
объемами постоянно растущих и обновляемых данных, что в итоге и открывает
дорогу технологиям Big Data.
Можно выделить следующие особенности технологий Big Data [2;
3]:
·
работа
с информацией огромного объема и разнообразного состава;
·
информация
весьма часто обновляется и находится в разных источниках;
·
качественно
отличающийся метод открывающей аналитики для выявления практических знаний,
которые непосредственно монетизируются в прибыль;
·
наглядное
отображение отчетов и возможности сценарного анализа («что, если…»);
·
цель
применения технологий Big Data – увеличение эффективности работы, создание
новых продуктов и повышение конкурентоспособности.
Согласно отчету компании McKinsey «Global Institute, Big data:
The next frontier for innovation, competition, and productivity», данные стали
важным фактором производства наряду с трудовыми и капитальными ресурсами.
Использование больших данных станет основой конкурентного преимущества и роста
компаний.
Объем информации на предприятии неуклонно растет за счет данных,
полученных с датчиков, измерительных и «умных» устройств. Самыми перспективными
устройствами считаются датчики, которые могут передавать данные в режиме
реального времени. Все устройства на предприятии с помощью таких датчиков могут
быть объединены в сеть, а технологии Big Data позволят обрабатывать информацию,
поступающую с них, и проводить необходимые мероприятия в автоматическом режиме.
Например, предприятия могут с помощью датчиков получать ежеминутные данные о
состоянии своего оборудования и на основе этих данных предсказывать оптимальное
время для замены и обслуживания. Слишком ранняя замена приведет к
дополнительным расходам, а поздняя – к потере прибыли вследствие простоя
оборудования. По оценке компании Cisco, к 2017 г. будет существовать более 1,7
млрд межмашинных соединений [4].
Сферы деятельности, в которых прогнозируется наибольший эффект
от применения Big Data, представлены на рис. 1.

Рис. 1. Сферы
деятельности с наиболее ощутимым прогнозируемым эффектом от применения больших
данных
Большинство
продуктов для работы с Big Data обладают высокоэффективной системой обработки
огромных объемов информации и ее аналитики в реальном времени.
Ожидаемый
эффект от внедрения Big Data может варьироваться в зависимости от типа
деятельности и реализуемой политики конкретного предприятия. При работе с
большими данными применяют методы манипуляции знаниями: различные методы теории
распознавания и классификации, методы разведывательного анализа и обобщения
данных, интеллектуальные подходы в виде генетических алгоритмов, нейросетей и
других ответвлений искусственного интеллекта.
Большие
данные — это не очередной ажиотаж на ИТ-рынке, это системный, качественный
переход к составлению цепочек ценностей, основанных на знаниях. По эффекту его
можно сравнить с появлением доступной компьютерной техники в конце прошлого
века. Сейчас эта технология находится в фазе ожидания инвесторов: они следят,
схлынут ли спекуляции вокруг новой технологии, или же это значимая инновация в
стадии проникновения на рынок. В ближайшие 5 лет произойдет исправление
недостатков технологии, и к 2020 г. начнется ее широкое распространение.
В
то время как недальновидные консерваторы будут применять глубоко устаревшие
подходы, предприятия, уже сейчас использующие технологии Big Data, в будущем
окажутся на лидирующих позициях.
ЛИТЕРАТУРА
1.
Иванов П.Д., Вампилова
В.Ж. Технологии Big Data и их применение на современном промышленном
предприятии. Инженерный журнал: наука и инновации, 2014, вып. 8. URL: http://engjournal.ru/catalog/it/asu/1228.html/
2. Тиндал Сьюзен. Большие данные: все, что вам необходимо знать. PC Week/RE, 2012, № 25 (810). URL: http://www.pcweek.ru/idea/article/detail.php?ID=141962/
3.
Gantz John, Reinsel
David. The digital universe in 2020: Big Data, Bigger Digital Shadow s, and
Biggest Grow th in the Far East. URL:
http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf
4.
Acquia, Examples of Big
Data Projects. URL: http://www.acquia.com/examples-big-data-projects/