Дискретное косинусное преобразование

Определение DCT

Дискретное косинусное преобразование (DCT) представляет изображение как сумму синусоид переменных значений и частот. Функция dct2 вычисляет двумерное дискретное косинусное преобразование (DCT) изображения. DCT имеет свойство, что для типичного изображения большая часть визуально значительной информации об изображении сконцентрирована во всего нескольких коэффициентах DCT. Поэтому DCT часто используется в приложениях сжатия изображения. Например, DCT является в основе международного стандарта алгоритмом сжатия изображения с потерями, известным как JPEG. (Название происходит от рабочей группы, которая разработала стандарт: формат графических данных JPEG.)

Двумерный DCT матрицы M на n A задан можно следующим образом.

$\begin{array}{l} \begin{matrix} B_{p q} = α_{p} α_{q} \sum_{m = 0}^{M - 1} \sum_{n = 0}^{N - 1} A_{m n} потому что \frac{π (2 m + 1) p}{2 M} потому что \frac{π (2 n + 1) q}{2 N}, & \begin{array}{l} 0 \leq p \leq M - \\ 10 \leq q \leq N - 1 \end{array} \end{matrix} \\ \begin{matrix} α_{p} = {\begin{cases} 1 / \sqrt{M}, \\ \sqrt{2 / M}, \end{cases} & \begin{array}{l} p = \\ 01 \leq p \leq M - 1 \end{array} & α_{q} = {\begin{cases} 1 / \sqrt{N}, \\ \sqrt{2 / N}, \end{cases} & \begin{array}{l} q = \\ 01 \leq q \leq N - 1 \end{array} \end{matrix} \end{array}$

Значения _Bpq называются коэффициентами DCT A. (Обратите внимание на то, что матричные индексы в MATLAB^® всегда запускаются в 1, а не 0; поэтому, элементы матрицы MATLAB A(1,1) и B(1,1) соответствуют математическим количествам _A00 и _B00, соответственно.)

DCT является обратимым преобразованием, и его инверсией дают

$\begin{array}{l} \begin{matrix} A_{m n} = \sum_{p = 0}^{M - 1} \sum_{q = 0}^{N - 1} α_{p} α_{q} B_{p q} потому что \frac{π (2 m + 1) p}{2 M} потому что \frac{π (2 n + 1) q}{2 N}, & \begin{array}{l} 0 \leq m \leq M - \\ 10 \leq n \leq N - 1 \end{array} \end{matrix} \\ \begin{matrix} α_{p} = {\begin{cases} 1 / \sqrt{M}, \\ \sqrt{2 / M}, \end{cases} & \begin{array}{l} p = \\ 01 \leq p \leq M - 1 \end{array} & α_{q} = {\begin{cases} 1 / \sqrt{N}, \\ \sqrt{2 / N}, \end{cases} & \begin{array}{l} q = \\ 01 \leq q \leq N - 1 \end{array} \end{matrix} \end{array}$

Обратное уравнение DCT может быть интерпретировано как то, чтобы подразумевать, что любая матрица M на n A может быть записана как сумма функций MN формы

$α_{p} α_{q} потому что \frac{π (2 m + 1) p}{2 M} потому что \frac{π (2 n + 1) q}{2 N}, \begin{matrix} 0 \leq p \leq M - 1 \\ 0 \leq q \leq N - 1 \end{matrix}$

Эти функции вызваны основные функции DCT. Коэффициенты DCT _Bpq, затем, может рассматриваться как веса, применились к каждой основной функции. Для 8 8 матриц эти 64 основных функции проиллюстрированы этим изображением.

64 основных функции 8 8 матрицы

Горизонтальные частоты увеличиваются слева направо, и увеличение частот кадровой развертки сверху донизу. Основная функция с постоянным знаком в верхнем левом углу часто называется основной функцией DC и соответствующим коэффициентом DCT_{, B00} часто называется коэффициентом DC.

DCT преобразовывает матрицу

Существует два способа вычислить DCT с помощью программного обеспечения Image Processing Toolbox™. Первый метод должен использовать функцию dct2. dct2 использует основанный на БПФ алгоритм для быстрого вычисления с большими входными параметрами. Второй метод должен использовать DCT, преобразовывают матрицу, которая возвращена функциональным dctmtx и может быть более эффективной для входных параметров небольшого квадрата, такой как 8 8 или 16 16. M-by-M преобразовывают матричный T, дают

$\begin{matrix} T_{p q} = {\begin{cases} \frac{1}{\sqrt{M}} \\ \sqrt{\frac{2}{M}} потому что \frac{π (2 q + 1) p}{2 M} \end{cases} & \begin{array}{l} p = 0, \\ 1 \leq p \leq M - 1, \end{array} & \begin{array}{l} 0 \leq q \leq M - 1 \\ 0 \leq q \leq M - 1 \end{array} \end{matrix}$

Для M-by-M матричного A T*A является M-by-M матрицей, столбцы которой содержат одномерный DCT столбцов A. Двумерный DCT A может быть вычислен как B=T*A*T'. Поскольку T является действительной ортонормированной матрицей, ее инверсия совпадает с ее транспонировала. Поэтому обратный двумерный DCT B дан T'*B*T.

Сжатие изображения с дискретным косинусным преобразованием

Скрипт Open Live Script

Этот пример показывает, как сжать изображение с помощью Дискретного косинусного преобразования (DCT). Пример вычисляет двумерный DCT 8 8 блоков во входном изображении, отбрасывания (обнуляет) все кроме 10 из 64 коэффициентов DCT в каждом блоке, и затем восстанавливает изображение с помощью двумерного обратного DCT каждого блока. Пример использует матричный метод вычисления преобразования.

DCT используется в алгоритме сжатия изображения JPEG. Входное изображение разделено на 8 8 или 16 16 блокируется, и двумерный DCT вычисляется для каждого блока. Коэффициенты DCT затем квантованы, закодированы и переданы. Получатель JPEG (или средство чтения файлов JPEG) декодирует квантованные коэффициенты DCT, вычисляет обратный двумерный DCT каждого блока, и затем соединяет блоки назад в одно изображение. Для типичных изображений многие коэффициенты DCT имеют значения близко к нулю. Эти коэффициенты могут быть отброшены, серьезно не влияя на качество восстановленного изображения.

Считайте изображение в рабочую область и преобразуйте ее, чтобы классифицировать double.

I = imread('cameraman.tif');
I = im2double(I);

Вычислите двумерный DCT 8 8 блоков в изображении. Функциональный dctmtx возвращается, N на n DCT преобразовывают матрицу.

T = dctmtx(8);
dct = @(block_struct) T * block_struct.data * T';
B = blockproc(I,[8 8],dct);

Отбросьте все кроме 10 из 64 коэффициентов DCT в каждом блоке.

mask = [1   1   1   1   0   0   0   0
        1   1   1   0   0   0   0   0
        1   1   0   0   0   0   0   0
        1   0   0   0   0   0   0   0
        0   0   0   0   0   0   0   0
        0   0   0   0   0   0   0   0
        0   0   0   0   0   0   0   0
        0   0   0   0   0   0   0   0];
B2 = blockproc(B,[8 8],@(block_struct) mask .* block_struct.data);

Восстановите изображение с помощью двумерного обратного DCT каждого блока.

invdct = @(block_struct) T' * block_struct.data * T;
I2 = blockproc(B2,[8 8],invdct);

Отобразите оригинальное изображение и восстановленное изображение, бок о бок. Несмотря на то, что существует некоторая потеря качества в восстановленном изображении, это является явно распознаваемым, даже при том, что почти 85% коэффициентов DCT были отброшены.

imshow(I)

figure
imshow(I2)

Документация