Сжатие вейвлета для изображений

В Сжатии данных Вейвлета мы обратились к аспектам, в частности связанным со сжатием с помощью вейвлетов. Однако в дополнение к алгоритмам, связанным с вейвлетами как DWT и IDWT, необходимо использовать другие компоненты относительно режима квантования и типа кодирования для того, чтобы иметь дело с истинным сжатием.

Этот более комплексный процесс может быть представлен следующей фигурой.

Эффекты квантования

Давайте покажем эффекты квантования на визуализации изображения цифрового отпечатка. Это индексируемое изображение соответствует матрице целых чисел, располагающихся между 0 и 255. Посредством квантования мы можем сократить число цветов, которое здесь равно 256.

Следующая фигура иллюстрирует, как уменьшиться с 256 до 16 цветов путем работы над значениями оригинального изображения.

Мы видим на этом рисунке:

Наверху
- Слева: оригинальное изображение
- Справа: соответствующая гистограмма значений
В нижней части
- Слева: восстановленное изображение
- Справа: соответствующая гистограмма квантованных значений

Это квантование приводит к сжатию изображения. Действительно, с двоичным кодом фиксированной длины, 8 бит на пиксель необходимы к цветам кода 256 и 4 бита на пиксель к цветам кода 16. Мы замечаем, что изображение, полученное после квантования, имеет хорошее качество. Однако в рамках истинного сжатия, квантование не используется на оригинальном изображении, но на его разложении вейвлета.

Давайте анализировать изображение цифрового отпечатка на уровне 4 с вейвлетом Хаара. Гистограмма коэффициентов вейвлета и квантованная гистограмма нормированы так, чтобы значения варьировались между –1 и +1. 15 интервалов квантования не имеют той же длины.

Следующая фигура иллюстрирует, как уменьшить информацию раскладыванием на содействующих значениях вейвлета оригинального изображения.

Мы видим на этом рисунке:

Наверху
- На левом: оригинальное изображение
- Справа: соответствующая гистограмма (центральная часть) содействующих значений
В нижней части
- Слева: восстановленное изображение
- Справа: соответствующая гистограмма (центральная часть) квантованных содействующих значений

Ключевой пункт - то, что гистограмма квантованных коэффициентов в широком масштабе сконцентрирована в классе, сосредоточенном в 0. Давайте обратим внимание, что все снова и снова полученное изображение имеет хорошее качество.

Истинные методы сжатия

Основные идеи, представленные выше, используются тремя методами, которые располагаются каскадом на одном шаге, содействующая пороговая обработка (глобальная переменная или уровнем), и кодирование квантованием. Зафиксированное или Кодирование методом Хаффмана может использоваться в квантовании в зависимости от метода.

Следующая таблица обобщает эти методы, часто названные Содействующими методами задания порога (CTM), и дает имя MATLAB^®, используемое истинными инструментами сжатия для каждого из них.

Имя MATLAB	Имя метода сжатия
`'gbl_mmc_f'`	Глобальная пороговая обработка коэффициентов и зафиксированное кодирование
`'gbl_mmc_h'`	Глобальная пороговая обработка коэффициентов и Кодирование методом Хаффмана
`'lvl_mmc'`	Пороговая обработка поддиапазона коэффициентов и Кодирование методом Хаффмана

Более сложные методы доступны, которые комбинируют разложение вейвлета и квантование. Это - основной принцип прогрессивных методов.

С одной стороны прогрессивность позволяет во время декодирования получить изображение, разрешение которого постепенно увеличивается. Кроме того, возможно получить набор коэффициентов сжатия на основе длины сохраненного кода. Это сжатие обычно включает потерю информации, но этот вид алгоритма включает также сжатие без потерь.

Такие методы основаны на трех идеях. Первые два, уже упомянутые, являются использованием разложения вейвлета, чтобы гарантировать разреженность (большое количество нулевых коэффициентов) и классические методы кодирования. Третья идея, решающая для использования вейвлетов в сжатии изображения, состоит в том, чтобы использовать существенно древовидную структуру разложения вейвлета. Определенные коды разработали из 1 993 до 2000 использования эту идею, в частности, алгоритм кодирования EZW, введенный Шапиро. См. [Sha93] в Ссылках.

EZW комбинирует пошаговую пороговую обработку и прогрессивное квантование, фокусирующееся на более эффективном способе закодировать коэффициенты изображений, для того, чтобы минимизировать коэффициент сжатия. Двумя вариантами SPIHT и STW (см. следующую таблицу) являются усовершенствованные версии оригинального алгоритма EZW.

После немного отличающейся цели WDR (и улучшение ASWDR) фокусируется на том, что в целом некоторые фрагменты данного изображения требуют более усовершенствованного продвижения кодирования к лучшему перцепционному результату, даже если обычно существует маленькая цена, чтобы заплатить в терминах коэффициента сжатия.

Полный анализ этих прогрессивных методов находится в ссылке Уокера [Wal99] в Ссылках.

Следующая таблица обобщает эти методы, часто названные Прогрессивными содействующими методами значения (PCSM), и дает закодированное имя MATLAB, используемое истинными инструментами сжатия для каждого из них.

Имя MATLAB	Имя метода сжатия
`'ezw'`	Встроенный вейвлет Zerotree
`'spiht'`	Установите разделение в иерархических деревьях
`'stw'`	Вейвлет дерева ориентации в пространстве
`'wdr'`	Сокращение различия в вейвлете
`'aswdr'`	Адаптивно отсканированное сокращение различия в вейвлете
`'spiht_3d'`	Установите Разделение В Иерархических Деревьях, 3D для изображений истинного цвета

Количественные и перцепционные качественные меры

Следующие количественные измерения и меры перцепционного качества полезны для анализа сигналов вейвлета и изображений.

M S E — Среднеквадратичная погрешность (MSE) является нормой в квадрате различия между данными и сигналом или приближением изображений, разделенным на число элементов. MSE задан:
$M S E = \frac{1}{m n} \sum_{i = 0}^{m = 1} \sum_{j = 0}^{n = 1} {| X (i, j) - X_{c} (i, j) |}^{2}$
Max Error — Максимальная погрешность является максимальным абсолютным отклонением в квадрате в приближением изображений или сигнале.
L2-Norm Ratio — Отношение L2-нормы является отношением L2-нормы в квадрате сигнала или приближения изображений к входному сигналу или изображению. Для изображений изображение изменено как вектор-столбец прежде, чем взять L2-норму
P S N R — Пиковое отношение сигнал-шум (PSNR) является мерой пиковой ошибки в децибелах. PSNR значим только для данных, закодированных в терминах битов на демонстрационные или биты на пиксель. Чем выше PSNR, тем лучше качество сжатого или восстановленного изображения. Типичные значения для сжатия с потерями изображения между 30 и 50 дБ. Когда PSNR больше 40 дБ, затем два изображения неразличимы. PSNR задан:
$P S N R = 10 \cdot \log_{10} (\frac{255^{2}}{M S E})$
B P P — Отношение бит на пиксель (бит/пкс) является количеством битов, требуемых сохранить один пиксель изображения. Бит/пкс является коэффициентом сжатия, умноженным на 8, принимая один байт на пиксель (8 битов).
Comp Ratio — Коэффициент сжатия является отношением числа элементов в сжатом изображении, разделенном на число элементов в оригинальном изображении, выраженном как процент.

Больше информации об истинном сжатии

Можно найти примеры, иллюстрирующие режим командной строки и инструменты приложения для истинного сжатия в Сжатии Вейвлета для Изображений и странице с описанием для wcompress.

Больше информации об истинном сжатии для изображений и более точно на методах сжатия находится в [Wal99], [Sha93], [Sai96], [StrN96] и [Chr06]. Смотрите Ссылки.

Документация