Типы изображения в тулбоксе

Программное обеспечение Image Processing Toolbox™ задает несколько фундаментальных типов изображений, полученных в итоге в таблице. Эти типы изображения определяют путь MATLAB® интерпретирует элементы массива как значения интенсивности пикселей.

Все изображения в Image Processing Toolbox приняты, чтобы иметь неразреженные значения. Числовые и логические изображения, как ожидают, будут с действительным знаком, если в противном случае не задано.

Тип изображения

Интерпретация

Бинарные изображения

Данные изображения хранятся как m на n логическая матрица, в которой значения 0 и 1 интерпретированы как черные и белые, соответственно. Некоторые функции тулбокса могут также интерпретировать m на n числовая матрица как бинарное изображение, где значения 0 являются черными, и все ненулевые значения являются белыми.

Индексируемые изображения

Данные изображения хранятся как m на n числовая матрица, элементами которой являются прямые индексы в палитру. Каждая строка палитры задает красные, зеленые, и синие компоненты одного цвета.

  • Для single или double массивы, целочисленные значения располагаются от [1, p].

  • Для logicaluint8, или uint16 массивы, значения располагаются от [0, p-1].

Палитра является c-3 массивом типа данных double со значениями в области значений [0, 1].

Полутоновые изображения

(Также известный как изображения интенсивности)

Данные изображения хранятся как m на n числовая матрица, элементы которой задают значения интенсивности. Наименьшее значение указывает черный, и самое большое значение указывает белый.

  • Для single или double массивы, значения располагаются от [0, 1].

  • Для uint8 массивы, значения располагаются от [0, 255].

  • Для uint16, значения располагаются от [0, 65535].

  • Для int16, значения располагаются от [-32768, 32767].

Изображения истинного цвета

(Обычно называемый изображениями RGB)

Данные изображения хранятся как m n 3 числовыми массивами, элементы которых задают значения интенсивности одного из этих трех цветовых каналов. Для изображений RGB три канала представляют красные, зеленые, и синие сигналы изображения.

  • Для single или double массивы, значения RGB располагаются от [0, 1].

  • Для uint8 массивы, значения RGB располагаются от [0, 255].

  • Для uint16, Значения RGB располагаются от [0, 65535].

Существуют другие модели, названные цветовыми пространствами, которые описывают цвета с помощью трех цветовых каналов. Для этих цветовых пространств область значений каждого типа данных может отличаться от области значений, позволенной изображениями в цветовом пространстве RGB. Например, пиксельные значения в L*a*b* цветовое пространство типа данных double может быть отрицательным или больше, чем 1. Для получения дополнительной информации смотрите Цветовые пространства Понимания и Преобразование Цветового пространства.

Изображения расширенного динамического диапазона (HDR)Изображения HDR хранятся как m на n числовая матрица или m n 3 числовыми массивами, похожими на шкалу полутонов или изображения RGB, соответственно. Изображения HDR имеют тип данных single или double но значения данных не ограничиваются областью значений [0, 1] и могут содержать Inf значения. Для получения дополнительной информации смотрите работу с Изображениями Расширенного динамического диапазона.
Многоспектральные и гиперспектральные изображения

Данные изображения хранятся как m n c числовым массивом, где c является количеством цветовых каналов.

Маркируйте Images

Данные изображения хранятся как m на n категориальная матричная или числовая матрица неотрицательных целых чисел.

Бинарные изображения

В бинарном изображении каждый пиксель имеет одно только из двух дискретных значений: 1 или 0. Большинство функций в тулбоксе интерпретирует пиксели со значением 1 как принадлежащий необходимой области и пикселям со значением 0 как фон. Бинарные изображения часто используются в сочетании с другими типами изображения, чтобы указать который фрагменты изображения к процессу.

Рисунок показывает бинарное изображение с представлением крупным планом некоторых пиксельных значений.

Индексируемые изображения

Индексируемое изображение состоит из матрицы изображений и палитры.

Палитра является c-3 матрицей типа данных double со значениями в области значений [0, 1]. Каждая строка палитры задает красные, зеленые, и синие компоненты одного цвета.

Пиксельные значения в матрице изображений являются прямыми индексами в палитру. Поэтому цвет каждого пикселя в индексируемом изображении определяется путем отображения пиксельного значения в матрице изображений к соответствующему цвету в палитре. Отображение зависит от типа данных матрицы изображений:

  • Если матрица изображений имеет тип данных single или double, палитра обычно содержит целочисленные значения в области значений [1, p], где p является длиной палитры. Значение 1 точка к первой строке в палитре, значение 2 точки к второй строке, и так далее.

  • Если матрица изображений имеет тип данных logicaluint8 или uint16, палитра обычно содержит целочисленные значения в области значений [0, p–1]. Значение 0 точек к первой строке в палитре, значение 1 точка к второй строке, и так далее.

Палитра часто хранится индексируемым изображением и автоматически загружается с изображением, когда вы используете imread функция. После того, как вы считаете изображение и палитру в рабочую область как отдельные переменные, необходимо отслеживать ассоциацию между изображением и палитрой. Однако вы не ограничиваетесь использованием палитры по умолчанию — можно использовать любую палитру, которую вы выбираете.

Фигура иллюстрирует индексируемое изображение, матрицу изображений и палитру, соответственно. Матрица изображений имеет тип данных double, так значение 7 точки к седьмой строке палитры.

Полутоновые изображения

Полутоновое изображение является матрицей данных, значения которой представляют интенсивность одного пикселя изображения. В то время как полутоновые изображения редко сохранены с палитрой, MATLAB использует палитру, чтобы отобразить их.

Можно получить полутоновое изображение непосредственно из камеры, которая получает один сигнал для каждого пикселя. Можно также преобразовать истинный цвет или многоспектральные изображения к шкале полутонов, чтобы подчеркнуть один конкретный аспект изображений. Например, можно взять линейную комбинацию красных, зеленых, и синих каналов изображения RGB, таким образом, что получившееся полутоновое изображение указывает на яркость, насыщение или оттенок каждого пикселя. Можно обработать каждый канал истинного цвета или многоспектрального изображения независимо путем разделения каналов в отдельные полутоновые изображения.

Фигура изображает полутоновое изображение типа данных double чьи пиксельные значения находятся в области значений [0, 1].

Изображения истинного цвета

Изображение истинного цвета является изображением, в котором каждый пиксель имеет цвет, заданный тремя значениями. Форматы графических файлов хранят изображения истинного цвета как 24-битные изображения, где три цветовых канала составляют 8 битов каждый. Это дает к потенциалу 16 миллионов цветов. Точность, с которой может быть реплицировано реальное изображение, привела к обычно используемому изображению истинного цвета термина.

Изображения RGB являются наиболее распространенным типом изображений истинного цвета. В изображениях RGB эти три цветовых канала являются красными, зелеными, и синими. Для получения дополнительной информации о цветовых каналах RGB, смотрите Отображение Разделенные Цветовые каналы Изображения RGB.

Существуют другие модели, названные цветовыми пространствами, которые описывают цвета с помощью трех различных цветовых каналов. Для этих цветовых пространств область значений каждого типа данных может отличаться от области значений, позволенной изображениями в цветовом пространстве RGB. Например, пиксельные значения в L*a*b* цветовое пространство типа данных double может быть отрицательным или больше, чем 1. Для получения дополнительной информации смотрите Цветовые пространства Понимания и Преобразование Цветового пространства.

Изображения истинного цвета не используют палитру. Цвет каждого пикселя определяется комбинацией интенсивности, сохраненной в каждом цветовом канале в местоположении пикселя.

Фигура изображает красные, зеленые, и синие каналы изображения RGB с плавающей точкой. Заметьте, что пиксельные значения находятся в области значений [0, 1].

Чтобы определить цвет пикселя в (строка, столбец) координата (2,3), вы посмотрели бы на триплет RGB, сохраненный в векторе (2,3, :). Предположим (2,3,1), содержит значение 0.5176, (2,3,2) содержит 0.1608, и (2,3,3) содержит 0.0627. Цвет для пикселя в (2,3)

0.5176 0.1608 0.0627

Изображения HDR

Динамический диапазон относится к области значений уровней яркости. Динамический диапазон реальных сцен может быть довольно высоким. Изображения расширенного динамического диапазона (HDR) пытаются получить целую тональную область значений реальных сцен (названный отнесенный к сцене), с помощью 32-битных значений с плавающей точкой, чтобы сохранить каждый цветовой канал.

Фигура изображает красные, зеленые, и синие каналы сопоставленного с тоном изображения HDR с исходными пиксельными значениями в области значений [0, 3.2813]. Тональное отображение является процессом, который уменьшает динамический диапазон изображения HDR к области значений, ожидаемой компьютерным монитором или экраном.

Многоспектральные и гиперспектральные изображения

Многоспектральное изображение является типом цветного изображения, которое хранит больше чем три канала. Например, многоспектральное изображение может сохранить три цветовых канала RGB и три инфракрасных канала для в общей сложности шести каналов. Количество каналов в многоспектральном изображении обычно мало. В отличие от этого гиперспектральное изображение может сохранить десятки или даже сотни каналов.

Фигура изображает многоспектральное изображение с шестью каналами, состоящими из красных, зеленых, синих цветовых каналов (изображенный как одно изображение RGB) и тремя инфракрасными каналами.

Маркируйте Images

Изображение метки является изображением, в котором каждый пиксель задает класс, объект или видимую область (ROI). Можно вывести изображение метки из изображения сцены с помощью методов сегментации.

  • Числовое изображение метки перечисляет объекты или ROI в сцене. Метки являются неотрицательными целыми числами. Фон обычно имеет значение 0. Пиксели пометили 1, составляют один объект; пиксели пометили 2, составляют второй объект; и так далее.

  • A categorical изображение метки задает класс каждого пикселя в изображении. Фон обычно присваивается значение <undefined>.

Фигура изображает изображение метки с тремя категориями: лепесток, лист и грязь.

Похожие темы