Современные информационные технологии/2. Вычислительная техника и программирование
Д.т.н. Хачумов В.М., аспирант Лебедев А.С.
ФГБУН Институт системного анализа Российской академии
наук (ИСА РАН), ООО «ТСА»,
Россия
Высокопроизводительная обработка изображений
Практика
потоковой обработки изображений и распознавания графических образов показала
эффективность гетерогенного подхода к высокопроизводительным вычислениям для
достижения реального времени решения указанных задач. В первую очередь это
связано с появлением и активным распространением универсальных многоядерных
процессоров (CPU) и графических
ускорителей (GPU), сделавших доступной концепцию массивного параллелизма для
рабочих станций и вычислительных узлов, ранее присущую только распределенным
вычислительным системам. На их основе можно создать программно-аппаратную среду
для решения задач со структурным параллелизмом на уровне данных.
С
2013 года в ИСА РАН развертывается высокопроизводительный вычислительный
комплекс при финансовой поддержке Программы фундаментальных исследований
Президиума РАН «Алгоритмы и математическое обеспечение для вычислительных
систем сверхвысокой производительности». Его назначение – поддержка выполнения
научной работы и инженерных расчетов ряда научных учреждений и вузов. Комплекс
представляет собой гетерогенную вычислительную систему с распределенной памятью
и удаленным доступом. Общая архитектура системы представлена на рисунке 1. Вычислительные
узлы комплекса имеют одинаковые аппаратные характеристики, что облегчает
масштабирование вычислений при потоковой обработке данных. Каждый
вычислительный узел оснащен двумя ускорителями NVidia Tesla M2050 с количеством ядер CUDA 448 и пиковой производительностью операций с
плавающей точкой - 1.03 TFLOP. В настоящее
время в составе комплекса функционируют два вычислительных узла (node).

Рисунок 1
− Архитектура вычислительной системы
Среди
актуальных задач, требующих высокопроизводительных вычислений, назовем поиск целевых
объектов в базах космических снимков и видео. Поиск основывается на
использовании методов цветового и структурного анализа изображений, комбинирования
мультиспектральных характеристик. Распознавание выделенных объектов
осуществляется на основе выделенных информативных признаков комитетом классификаторов
и метрик. Основной недостаток подобных систем – низкая скорость обработки
потоков снимков – преодолевается внедрением современных технологий
гетерогенных вычислений.
Исследования,
проводимые в рамках гранта РФФИ в ООО «ТСА», посвящены разработке методов,
алгоритмов и программных средств, позволяющих распараллелить программный код
применительно к современным многоядерным процессорам и графическим ускорителям.
Программирование параллельных микроархитектур требует от специалиста предметной
области глубокого анализа задачи и разработки эффективных алгоритмов с
машинно-зависимыми оптимизациями. Практическая значимость работы обеспечивается
построением среды исполнения программ для целевой параллельной архитектуры и
проведением реальных экспериментов.
Один из результатов тестирования гетерогенной
установки на задаче обработки потока изображений с целью выделения целевых
объектов спектрографическим методом [1]
приведен на рисунке 2.

Рисунок 2 – Масштабирование вычислений
В
настоящее время с применением гетерогенного вычислительного комплекса ИСА РАН
решаются следующие актуальные задачи [2]:
1)
разработка и тестирование методов автоматического распараллеливания программ
для универсальных многоядерных и графических процессоров;
2)
исследование возможности расширения существующих подходов к распараллеливанию
программ для устройств с динамическим параллелизмом;
3)
исследование и разработка методов динамического распараллеливания программ (just-in-time).
Цикл
актуальных исследований выполняется в том числе на установке ИСА РАН в рамках
проекта РФФИ 14-37-50316 мол_нр и Программы фундаментальных исследований
Президиума РАН №18 «Алгоритмы и математическое обеспечение для вычислительных
систем сверхвысокой производительности» (Тема «Исследование и разработка
математического обеспечения и инструментальных программных средств параллельной
обработки видеоданных и данных широкого назначения для интеллектуального
управления видеокамерами и обеспечения на этой основе моделирования проводки
беспилотных летательных аппаратов с применением параллельной среды программирования.
Литература:
1.
Смирнова А.И., Хачумов В.М. Метод обработки мультиспектральных снимков
дистанционного зондирования Земли. – Авиакосмическое приборостроение, №2, 2013,
с.50-56.
2. Lebedev A., Khachumov
V. Offload acceleration of scientific calculations within .NET assemblies. //
Third International Conference on High Performance Computing (HPC-UA
2013): Collection of scientific papers.
– National Technical University of Ukraine
«Kyiv Polytechnic Institute», 2013, p. 233–238.