Типы изображений в тулбоксе

Программное обеспечение Image Processing Toolbox™ определяет несколько основных типов изображений, результирующих в таблице. Эти типы изображений определяют способ MATLAB® интерпретирует элементы массива как значения интенсивности пикселей.

Все изображения в Image Processing Toolbox приняты с нерассмотренными значениями. Числовые и логические изображения ожидаются реальными, если не указано иное.

Тип изображения

Интерпретация

Бинарные изображения

Данные изображения хранятся как m на n логическая матрица, в которой значения 0 и 1 интерпретируются как черные и белые, соответственно. Некоторые функции тулбокса могут также интерпретировать m-на-n числовую матрицу как бинарное изображение, где значения 0 являются черными, а все ненулевые значения - белыми.

Индексированные изображения

Данные изображения хранятся как m-на-n числовая матрица, элементы которой являются прямыми индексами в цветовой карте. Каждая строка цветовой карты задает красный, зеленый и синий компоненты одного цвета.

  • Для single или double массивы, целочисленные значения варьируются от [1, p].

  • Для logical, uint8, или uint16 массивы, значения варьируются от [0, p-1].

Карта цветов является массивом классов c-на-3 double.

Полутоновые изображения

(Также известны как изображения интенсивности)

Данные изображения хранятся как m-на-n числовая матрица, элементы которой определяют значения интенсивности. Наименьшее значение указывает на черный, а самое большое - на белый.

  • Для single или double массивы, значения варьируются от [0, 1].

  • Для uint8 массивы, значения варьируются от [0, 255].

  • Для uint16, значения варьируются от [0, 65535].

  • Для int16, значения варьируются от [-32768, 32767].

Изображения Truecolor

(Обычно называемые изображениями RGB)

Данные изображения хранятся как числовой массив m на n на 3, элементы которого определяют значения интенсивности одного из трех цветовых каналов. Для изображений RGB три канала представляют красный, зеленый и синий сигналы изображения.

  • Для single или double массивы, значения RGB варьируются от [0, 1].

  • Для uint8 массивы, значения RGB варьируются от [0, 255].

  • Для uint16, значения RGB варьируются от [0, 65535].

Существуют и другие модели, называемые цветовыми пространствами, которые описывают цвета с помощью трех цветовых каналов. Для этих цветовых пространств области значений каждого типа данных могут отличаться от областей значений, разрешенных изображениями в цветовом пространстве RGB. Например, пиксельные значения в цветовом пространстве L * a * b * типа данных double может быть отрицательным или больше 1. Для получения дополнительной информации см. Раздел «Общие сведения о цветовых пространствах» и «Преобразование цветового пространства».

Изображения с высокой динамической областью значений (HDR)Изображения HDR хранятся в виде числовой матрицы m на n или числового массива m на n на 3, подобной изображениям в полутоновом или RGB, соответственно. Изображения HDR имеют данные тип single или double но значения данных не ограничены областью значений [0, 1] и могут содержать Inf значения. Для получения дополнительной информации смотрите Работа с изображениями высокой динамической области значений.
Мультиспектральные и гиперспектральные изображения

Данные изображения хранятся как m-на-n-by c числовой массив, где c количество цветовых каналов.

Маркируйте изображения

Данные изображения хранятся в виде категориальной матрицы m на n или числовой матрицы неотрицательных целых чисел.

Бинарные изображения

В бинарное изображение каждый пиксель имеет одно из двух дискретных значений: 1 или 0. Большинство функций тулбокса интерпретируют пиксели со значением 1 как принадлежащие необходимые области и пиксели со значением 0 как фон. Бинарные изображения часто используются в сочетании с другими типами изображений, чтобы указать, какие фрагменты изображения обрабатывать.

Рисунок показывает бинарное изображение с видом крупным планом некоторых значений пикселей.

Индексированные изображения

Индексированное изображение состоит из матрицы изображений и цветовой карты.

Карта цветов является матрицей m на 3 класса double содержащие значения в области значений [0, 1]. Каждая строка цветовой карты задает красный, зеленый и синий компоненты одного цвета.

Пиксельные значения в матрице изображений являются прямыми индексами в карту цветов. Поэтому цвет каждого пикселя в индексированном изображении определяется путем преобразования значения пикселя в матрице изображения в соответствующий цвет в цветовой карте. Отображение зависит от класса матрицы изображений:

  • Если матрица изображений имеет класс single или double, карта цветов обычно содержит целочисленные значения в области значений [1, p], где p - длина карты цветов. Значение 1 указывает на первую строку в цветовой карте, значение 2 указывает на вторую строку и так далее.

  • Если матрица изображений имеет класс logical, uint8 или uint16, карта цветов обычно содержит целочисленные значения в области значений [0, p-1]. Значение 0 указывает на первую строку в цветовой карте, значение 1 указывает на вторую строку и так далее.

Карта цветов часто хранится с индексированным изображением и автоматически загружается с изображением, когда вы используете imread функция. После чтения изображения и цветовой карты в рабочую область как отдельных переменных необходимо отслеживать связь между изображением и цветовой картой. Тем не менее, вы не ограничиваетесь использованием карты цветов по умолчанию - вы можете использовать любую карту цветов, которую вы выбираете.

Рисунок иллюстрирует индексированное изображение, матрицу изображений и цветовую карту, соответственно. Матрица изображений имеет класс double, так что значение 7 указывает на седьмую строку цветовой карты.

Полутоновые изображения

Полутоновое изображение является матрицей данных, значения которой представляют интенсивность одного пикселя изображения. В то время как полутоновые изображения редко сохраняются с помощью цветовой карты, MATLAB использует цветовую карту, чтобы отобразить их.

Вы можете получить полутоновое изображение непосредственно от камеры, которая получает один сигнал для каждого пикселя. Можно также преобразовать truecolor или мультиспектральные изображения в полутоновые, чтобы подчеркнуть один конкретный аспект изображений. Например, можно взять линейную комбинацию красных, зеленых и синих каналов изображения RGB таким образом, чтобы полученное полутоновое изображение указывало яркость, насыщение или оттенок каждого пикселя. Можно обработать каждый канал truecolor или мультиспектрального изображения независимо путем разделения каналов на отдельные полутоновые изображения.

Рисунок изображает полутоновое изображение double классов пиксельные значения которых находятся в области значений [0, 1].

Изображения Truecolor

Изображение truecolor является изображением, в котором каждый пиксель имеет цвет, заданный тремя значениями. Форматы графических файлов хранят изображения truecolor как 24-битные изображения, где три цветовых канала составляют 8 биты каждый. Это дает потенциал 16 миллионов цветов. Точность, с которой может быть реплицировано реальное изображение, привела к обычно используемому термину truecolor image.

Изображения RGB являются наиболее распространенным типом изображений truecolor. На изображениях RGB три цветовых канала - красный, зеленый и синий. Дополнительные сведения о цветовых каналах RGB см. в разделе «Отображение разделенных цветовых каналов изображения RGB».

Существуют и другие модели, называемые цветовыми пространствами, которые описывают цвета, использующие три разных цветовых канала. Для этих цветовых пространств области значений каждого типа данных могут отличаться от областей значений, разрешенных изображениями в цветовом пространстве RGB. Например, пиксельные значения в цветовом пространстве L * a * b * типа данных double может быть отрицательным или больше 1. Для получения дополнительной информации см. Раздел «Общие сведения о цветовых пространствах» и «Преобразование цветового пространства».

Изображения Truecolor не используют карту цвета. Цвет каждого пикселя определяется комбинацией интенсивностей, сохраненных в каждом цветовом канале в местоположении пикселя.

Рисунок изображает красный, зеленый и синий каналы изображения RGB с плавающей точкой. Заметьте, что значения пикселей находятся в области значений [0, 1].

Чтобы определить цвет пикселя при (строка, столбец) координате (2,3), вы бы посмотрели на триплет RGB, сохраненный в векторе (2,3,:). Предположим (2,3,1) содержит значение 0.5176, (2,3,2) содержит 0.1608, и (2,3,3) содержит 0.0627. Цвет для пикселя при (2,3)

0.5176 0.1608 0.0627

Изображения HDR

Динамическая область значений относится к области значений уровней яркости. Динамическая область значений реальных сцен может быть довольно высоким. Изображения с высокой динамической областью значений (HDR) пытаются захватить всюсь тональную область значений реальных сцен (называемых ссылками на сцену), используя 32-битные значения с плавающей точкой для хранения каждого цветового канала.

Рисунок изображает красный, зеленый и синий каналы HDR- изображения с тоновым отображением с исходными значениями пикселей в область значений [0, 3.2813]. Отображение тональных сигналов - это процесс, который уменьшает динамическую область значений HDR- изображения до области значений, ожидаемой монитором или экраном компьютера.

Мультиспектральные и гиперспектральные изображения

Мультиспектральное изображение является типом цветного изображения, которое хранит более трех каналов. Для примера мультиспектральное изображение может хранить три цветовых канала RGB и три инфракрасных канала, в общей сложности шесть каналов. Количество каналов в мультиспектральном изображении обычно невелико. В отличие от этого, гиперспектральное изображение может хранить десятки, а то и сотни каналов.

Рисунок изображает мультиспектральное изображение с шестью каналами, состоящими из красных, зеленых, синих цветовых каналов (изображенных как одно изображение RGB) и трех инфракрасных каналов.

Маркируйте изображения

Изображение с меткой является изображением, в котором каждый пиксель задает класс, объект или видимую область (ROI). Можно вывести изображение метки из изображения сцены с помощью методов сегментации.

  • Числовое изображение с меткой перечисляет объекты или ROI в сцене. Метки являются неотрицательными целыми числами. Фон обычно имеет значение 0. Пиксели, обозначенные 1, составляют один объект; пиксели, помеченные как 2, составляют второй объект; и так далее.

  • A categorical Метка изображение задает класс каждого пикселя в изображении. Фону обычно присваивается значение <undefined>.

Рисунок изображает изображение метки с тремя категориями: лепесток, лист и грязь.

Похожие темы