huffmanenco

Закодируйте последовательность символов кодировкой Хаффмана

Описание

пример

code = huffmanenco(sig,dict) кодирует входной сигнал sig использование кодов Хаффмана, описанных входом кода dict. sig может иметь форму вектора, массива ячеек или алфавитно-цифрового массива ячеек. Если sig - массив ячеек, он должен быть либо строкой, либо столбцом. dict - N-by-2 массив ячеек, где N - количество различных возможных символов для кодирования. Первый столбец dict представляет отдельные символы, а второй столбец представляет соответствующие кодовые слова. Каждое кодовое слово представлено в виде вектора-строки и без кодового слова в dict может быть префиксом любого другого кодового слова в dict. Можно сгенерировать dict использование huffmandict функция.

Примеры

свернуть все

Создайте уникальные символы и присвойте им вероятности вхождения.

symbols = 1:6; 
p = [.5 .125 .125 .125 .0625 .0625];

Создайте словарь Хаффмана на основе символов и их вероятностей.

dict = huffmandict(symbols,p);

Сгенерируйте вектор случайных символов.

inputSig = randsrc(100,1,[symbols;p]);

Закодируйте случайные символы.

code = huffmanenco(inputSig,dict);

Декодируйте данные. Проверьте, что декодированные символы совпадают с исходными символами.

sig = huffmandeco(code,dict);
isequal(inputSig,sig)
ans = logical
   1

Преобразуйте исходный сигнал в двоичный и определите длину двоичных символов.

binarySig = de2bi(inputSig);
seqLen = numel(binarySig)
seqLen = 300

Преобразуйте кодированные Хаффманом символы в двоичные и определите длину кодированных двоичных символов.

binaryComp = de2bi(code);
encodedLen = numel(binaryComp)
encodedLen = 224

Задайте буквенно-цифровые символы в форме массива ячеек.

inputSig = {'a2',44,'a3',55,'a1'}
inputSig=1×5 cell array
    {'a2'}    {[44]}    {'a3'}    {[55]}    {'a1'}

Задайте словарь Хаффмана. Коды для сигнальных букв должны быть числовыми.

dict = {'a1',0; 'a2',[1,0]; 'a3',[1,1,0]; 44,[1,1,1,0]; 55,[1,1,1,1]}
dict=5×2 cell array
    {'a1'}    {[      0]}
    {'a2'}    {[    1 0]}
    {'a3'}    {[  1 1 0]}
    {[44]}    {[1 1 1 0]}
    {[55]}    {[1 1 1 1]}

Закодируйте буквенно-цифровые символы.

enco = huffmanenco(inputSig,dict);

Декодируйте данные. Проверьте, что декодированные символы совпадают с исходными символами.

sig = huffmandeco(enco,dict)
sig=1×5 cell array
    {'a2'}    {[44]}    {'a3'}    {[55]}    {'a1'}

isequal(inputSig,sig)
ans = logical
   1

Входные параметры

свернуть все

Входной сигнал для сжатия, заданный как вектор, массив ячеек или алфавитно-цифровой массив ячеек. sig может иметь форму вектора, массива ячеек или алфавитно-цифрового массива ячеек. Если sig - массив ячеек, он должен быть массивом ячеек 1-by- S или S-by-1, где S - количество символов.

Типы данных: double | cell

Словарь кода Хаффмана, заданный как массив ячеек N -by-2. N - количество различных возможных символов для кодирования функцией. Первый столбец dict представляет отдельные символы, а второй - соответствующие кодовые слова. Каждое кодовое слово представлено как вектор-строка, и никакое кодовое слово в dict не может быть префиксом любого другого кодового слова в dict. Вы можете сгенерировать dict при помощи huffmandict функция.

Типы данных: double | cell

Выходные аргументы

свернуть все

Закодированный сигнал для входного словаря кода Хаффмана dict, возвращается как вектор.

Ссылки

[1] Сайуд, Халид. Введение в сжатие данных. 2nd ed. San Francisco: Morgan Kaufmann Publishers, 2000.

См. также

Функции

Представлено до R2006a