К.т.н.
П.В. Желтов, к.т.н. В.И. Семенов, А.К. Шурбин
Чувашский государственный университет,
Россия
Сжатие изображений с использованием
вейвлет-преобразования
До 90-х годов прошлого столетия
наиболее распространенные методы сжатия, применяющиеся в стандартах JPEG
и MPEG, основаны на Фурье-преобразовании сигнала (дискретное
косинусное преобразование - ДКП). JPEG (Joint Photographic Experts Group) – группа экспертов по фотографиям - стандарт
кодирования и сжатия неподвижных изображений. MPEG (Moving Picture Experts Group) – группа экспертов по движущимся изображениям - стандарт
кодирования и сжатия движущихся объектов, видеоизображений. В начале 90-х годов был разработан новый
стандарт, названный вейвлет-компрессией.
В стандарте JPEG-2000 для сжатия изображений применяется дискретное
вейвлет-преобразование. Практическое выполнение видеокомпрессии осуществляется
посредством двухполосного банка фильтров, известного как субполосное
кодирование. Под видеокомпрессией обычно понимается сокращение объема памяти,
необходимой для хранения цифровых видеоданных и передачи их по каналам связи.
Цель видеокомпрессии – более компактное представление изображений. Разработка
эффективных алгоритмов видеокомпрессии важна для создателей цифровых систем
видеонаблюдения, графики, видео и т.д. Видеокомпрессия происходит в
несколько этапов, на одном из этих этапов осуществляется
сжатие с применением дискретного вейвлет-преобразования. На других этапах
происходит удаление временной избыточности, т.е. удаление одинаковых областей в
кадрах, квантование с переменной длиной (кодирование энтропийное, Хаффмана),
архивация данных. Сжатие с вейвлет-преобразованием, как и сжатие с дискретным
косинусным преобразованием, основано на том, что большая часть энергии
сосредоточивается в малом количестве коэффициентов, которые квантуются в
соответствии с их значением. Концентрация энергии в немногих значимых
коэффициентах называется локализацией энергии, она является основной
предпосылкой для сжатия данных [1]. Алгоритм реконструкции, использующий
кратномасштабный анализ – это способ сконцентрировать всю имеющуюся информацию
в сигнале в немногих значимых коэффициентах. Различают сжатие изображений без
потерь и с потерями. Первое характеризуется незначительными коэффициентами
сжатия. При сжатии изображения с допустимыми потерями коэффициент сжатия может
быть большим. Вейвлет-преобразование можно использоваться для сжатия изображения,
как без потерь, так и с потерями. Несмотря на то, что с 2001 года официально
действует расширенная спецификация стандарта JPEG-2000, которая допускает использование альтернативной схемы
кодирования на основе вейвлет-преобразования, кодирование с применением ДКП
остается основным и наиболее распространенным методом, реализованным в многочисленных программных продуктах и
различной аппаратуре [2].
Для обработки изображений, авторами используется алгоритм непрерывного сверхбыстрого вейвлет-преобразования [3]. Программы
написаны на языках Visual C++ и Visual
Basic for Applications для работы с
электронной таблицей Excel.
Операционная система – Windows
XP.
При обработке изображений каждый
пиксель из цветного трехкомпонентного пространства (Красный - Red, Зеленый - Green,
Синий - Blue) – (R ,G, B) не
переводится в представление (Y, Cr, Cb) как в JPEG-2000. Компонента Y называется яркостной, а компоненты Cr, Cb –
цветоразностными составляющими. Если смотреть на цветные компоненты изображения
по отдельности, можно заметить, что каждый цвет повторяет структуру
изображения, то есть цветные компоненты подобны в соседних строках или
столбцах, но имеют разную величину. Поэтому в работе, сначала, все изображение пилообразной
разверткой по горизонтали и по вертикали считывается в массивы, а потом подвергается
разложению на разномасштабные компоненты с помощью вейвлет-преобразования. Например,
изображение размером 512х512 пикселей декомпозируется на 18 уровней для каждого
цвета. Вейвлет-коэффициенты соседних 8 строк или 8 столбцов для красного,
синего и зеленого цвета вместе подвергаются Фурье преобразованию. Так как
алгоритм вычисляет вейвлет-коэффициенты в частотной области, время такого
преобразования занимает меньше минуты на языке Visual С++ для компьютера
с оперативной памятью 1 Гбайт и
тактовой частотой 2.5 Ггц. Для сжатия изображения используется пороговая обработка,
то есть удаляются коэффициентов с малыми значениями. На рис. 1 представлено
изображение девушки с различными коэффициентами сжатия. На рис. 1 а)
коэффициент сжатия равен 1. На рис. 1 б), в), г) коэффициент сжатия равен 8.3,
54.9 и 257
а) б)
в) г)
Рис. 1. Изображение девушки
соответственно. Для сжатия не
применялись специально статистические методы кодирования. А использовался
архиватор WINRAR. После пороговой обработки
данные записывались в файл и подвергались архивации. Восстановленные
изображения после разархивации представлены на рис 1.
Литература:
3. Штарк Г.-Г. Применение вейвлетов для ЦОС/ Г.-Г. Штарк. М.: Техносфера, 2007. 192 с.
2. Умняшкин С.В. Теоретические основы цифровой обработки и представления сигналов: учеб. пособие. – М..: ИД «ФОРУМ»: ИНФРА-М, 2009. - 304 с. - (Высшее образование).
3. Свидетельство о государственной регистрации программы для ЭВМ № 2010616103. Непрерывное сверхбыстрое вейвлет-преобразование / Семенов В.И..; зарегистрировано в Реестре программ для ЭВМ 16 сентября 2010 г.