exponenta event banner

Типы изображений на панели инструментов

Программное обеспечение Toolbox™ обработки изображений определяет несколько фундаментальных типов изображений, обобщенных в таблице. Эти типы изображений определяют способ, которым MATLAB ® интерпретирует элементы массива как значения интенсивности пикселей.

Предполагается, что все изображения в панели инструментов обработки изображений не имеют синтаксических значений. Числовые и логические изображения должны быть действительными, если не указано иное.

Тип изображения

Интерпретация

Двоичные изображения

Данные изображения сохраняются как логическая матрица m-на-n, в которой значения 0 и 1 интерпретируются как черный и белый соответственно. Некоторые функции панели инструментов также могут интерпретировать числовую матрицу m-на-n как двоичное изображение, где значения 0 являются черными, а все ненулевые значения - белыми.

Индексированные изображения

Данные изображения хранятся в виде m-на-n числовой матрицы, элементы которой являются прямыми индексами в цветовой карте. Каждая строка карты цветов определяет красный, зеленый и синий компоненты одного цвета.

  • Для single или double массивы, целочисленные значения находятся в диапазоне от [1, p].

  • Для logical, uint8, или uint16 массивы, значения варьируются от [0, p-1].

Цветовая карта является массивом класса c-by-3 double.

Изображения в градациях серого

(Также известны как изображения интенсивности)

Данные изображения хранятся в виде m-на-n числовой матрицы, элементы которой задают значения интенсивности. Наименьшее значение указывает на черный цвет, а наибольшее - на белый.

  • Для single или double массивы, значения находятся в диапазоне от [0, 1].

  • Для uint8 массивы, значения находятся в диапазоне от [0, 255].

  • Для uint16, значения находятся в диапазоне от [0, 65535].

  • Для int16, значения варьируются от [-32768, 32767].

Изображения Truecolor

(Обычно называются образами RGB)

Данные изображения хранятся в виде числового массива m-на-n-на-3, элементы которого задают значения интенсивности одного из трех цветовых каналов. Для изображений RGB три канала представляют красный, зеленый и синий сигналы изображения.

  • Для single или double массивы, значения RGB варьируются от [0, 1].

  • Для uint8 массивы, значения RGB находятся в диапазоне от [0, 255].

  • Для uint16, значения RGB находятся в диапазоне от [0, 65535].

Существуют другие модели, называемые цветовыми пространствами, которые описывают цвета с использованием трех цветовых каналов. Для этих цветовых пространств диапазон каждого типа данных может отличаться от диапазона, разрешенного изображениями в цветовом пространстве RGB. Например, значения пикселей в цветовом пространстве L * a * b * типа данныхdouble может быть отрицательным или больше 1. Дополнительные сведения см. в разделе Общие сведения о цветовых пространствах и преобразовании цветовых пространств.

Изображения с высоким динамическим диапазоном (HDR)HDR-изображения хранятся в виде цифровой матрицы m-на-n или цифровой матрицы m-на-n-на-3, аналогично изображениям в градациях серого или RGB, соответственно. HDR-образы имеют тип данных single или double но значения данных не ограничиваются диапазоном [0, 1] и могут содержать Inf значения. Дополнительные сведения см. в разделе Работа с изображениями с высоким динамическим диапазоном.
Мультиспектральные и гиперспектральные изображения

Данные изображения хранятся в виде числового массива m-by-n-by-c, где c - количество цветовых каналов.

Изображения меток

Данные изображения хранятся в виде m-на-n категориальной матрицы или цифровой матрицы неотрицательных целых чисел.

Двоичные изображения

В двоичном изображении каждый пиксель имеет одно из только двух дискретных значений: 1 или 0. Большинство функций на панели инструментов интерпретируют пикселы со значением 1 как принадлежащие интересующей области, а пикселы со значением 0 как фон. Двоичные изображения часто используются в сочетании с другими типами изображений для указания того, какие части изображения подлежат обработке.

На рисунке показано двоичное изображение с крупным планом некоторых значений пикселей.

Индексированные изображения

Индексированное изображение состоит из матрицы изображения и цветовой карты.

Цветовая карта - это матрица класса m-на-3 double содержит значения в диапазоне [0, 1]. Каждая строка карты цветов определяет красный, зеленый и синий компоненты одного цвета.

Значения пикселей в матрице изображения являются прямыми индексами в цветовой карте. Поэтому цвет каждого пикселя в индексированном изображении определяется отображением значения пикселя в матрице изображения на соответствующий цвет в цветовой карте. Отображение зависит от класса матрицы изображения:

  • Если матрица изображения имеет класс single или double, цветовая карта обычно содержит целочисленные значения в диапазоне [1, p], где p - длина цветовой карты. Значение 1 указывает на первую строку на карте цветов, значение 2 указывает на вторую строку и т.д.

  • Если матрица изображения имеет класс logical, uint8 или uint16, цветовая карта обычно содержит целочисленные значения в диапазоне [0, p-1]. Значение 0 указывает на первую строку карты цветов, значение 1 указывает на вторую строку и т.д.

Цветовая карта часто хранится с индексированным изображением и автоматически загружается с изображением при использовании imread функция. После считывания изображения и цветовой карты в рабочее пространство в виде отдельных переменных необходимо отслеживать связь между изображением и цветовой картой. Однако вы не ограничиваетесь использованием карты цветов по умолчанию - вы можете использовать любую выбранную карту цветов.

Рисунок иллюстрирует индексированное изображение, матрицу изображения и цветовую карту соответственно. Матрица изображения имеет класс double, то есть значение 7 указывает на седьмую строку карты цветов.

Изображения в градациях серого

Изображение в градациях серого - это матрица данных, значения которой представляют интенсивности одного пикселя изображения. В то время как изображения в оттенках серого редко сохраняются с помощью карты цветов, MATLAB использует карту цветов для их отображения.

Изображение в градациях серого можно получить непосредственно с камеры, которая получает один сигнал для каждого пикселя. Можно также преобразовать трюэколор или многоспектральные изображения в градации серого, чтобы подчеркнуть один конкретный аспект изображений. Например, можно использовать линейную комбинацию красного, зеленого и синего каналов RGB-изображения, чтобы полученное изображение в градациях серого указывало яркость, насыщенность или оттенок каждого пикселя. Можно обрабатывать каждый канал цветного или многоспектрального изображения независимо, разбивая каналы на отдельные изображения в градациях серого.

На рисунке изображено изображение класса в градациях серого double чьи значения пикселей находятся в диапазоне [0, 1].

Изображения Truecolor

Триколорное изображение - это изображение, в котором каждый пиксель имеет цвет, заданный тремя значениями. Форматы графических файлов хранят изображения в виде 24-битных изображений, где три цветовых канала по 8 бит каждый. Это дает потенциал в 16 миллионов цветов. Точность, с которой может быть воспроизведено реальное изображение, привела к широко используемому термину truecolor image.

Образы RGB - наиболее распространенный тип трюкколорных изображений. На RGB-изображениях три цветовых канала - красный, зеленый и синий. Дополнительные сведения о цветовых каналах RGB см. в разделе Отображение отдельных цветовых каналов изображения RGB.

Существуют другие модели, называемые цветовыми пространствами, которые описывают цвета с использованием трех различных цветовых каналов. Для этих цветовых пространств диапазон каждого типа данных может отличаться от диапазона, разрешенного изображениями в цветовом пространстве RGB. Например, значения пикселей в цветовом пространстве L * a * b * типа данныхdouble может быть отрицательным или больше 1. Дополнительные сведения см. в разделе Общие сведения о цветовых пространствах и преобразовании цветовых пространств.

Изображения Truecolor не используют цветную карту. Цвет каждого пикселя определяется комбинацией интенсивностей, хранящихся в каждом цветовом канале в местоположении пикселя.

На рисунке изображены красный, зеленый и синий каналы изображения RGB с плавающей запятой. Обратите внимание, что значения пикселей находятся в диапазоне [0, 1].

Чтобы определить цвет пикселя в координате (строка, столбец) (2,3), необходимо просмотреть триплет RGB, сохраненный в векторе (2,3,:). Предположим (2,3,1) содержит значение 0.5176, (2,3,2) содержит 0.1608, и (2,3,3) содержит 0.0627. Цвет пикселя в (2,3) равен

0.5176 0.1608 0.0627

Изображения HDR

Динамический диапазон относится к диапазону уровней яркости. Динамический диапазон реальных сцен может быть довольно высоким. Изображения с высоким динамическим диапазоном (HDR) пытаются захватить весь тональный диапазон реальных сцен (называемых сценами), используя 32-битные значения с плавающей запятой для хранения каждого цветового канала.

На рисунке изображены красный, зеленый и синий каналы изображения HDR с отображенным тоном с исходными значениями пикселей в диапазоне [0, 3.2813]. Отображение тонов - это процесс, который уменьшает динамический диапазон HDR-изображения до диапазона, ожидаемого монитором или экраном компьютера.

Мультиспектральные и гиперспектральные изображения

Многоспектральное изображение - это тип цветного изображения, в котором хранится более трех каналов. Например, многоспектральное изображение может хранить три цветных канала RGB и три инфракрасных канала, в общей сложности шесть каналов. Количество каналов в многоспектральном изображении обычно невелико. Напротив, гиперспектральное изображение может хранить десятки или даже сотни каналов.

На рисунке изображено многоспектральное изображение с шестью каналами, состоящими из красного, зелёного, синего цветовых каналов (изображённых как единое изображение RGB) и трёх инфракрасных каналов.

Изображения меток

Изображение метки - это изображение, в котором каждый пиксель определяет класс, объект или область, представляющую интерес (ROI). Изображение метки можно получить из изображения сцены с помощью методов сегментации.

  • Числовое изображение метки перечисляет объекты или ROI в сцене. Метки являются неотрицательными целыми числами. Фоновый фон обычно имеет значение 0. Пиксели с меткой 1 составляют один объект; пиксели 2 составляют второй объект; и так далее.

  • A categorical изображение метки определяет класс каждого пикселя в изображении. Фону обычно присваивается значение <undefined>.

На рисунке изображено изображение этикетки с тремя категориями: лепесток, лист и грязь.

Связанные темы