detect

Обнаружьте объекты с помощью детектора объектов SSD, сконфигурированного для монокулярной камеры

Синтаксис

bboxes = detect(detector,I)

[bboxes,scores]
= detect(detector,I)

[___,labels] = detect(detector,I)

[___] = detect(___,roi)

detectionResults = detect(detector,ds)

[___] = detect(___,Name,Value)

Описание

bboxes = detect(detector,I) обнаруживает объекты в изображении I использование SSD (палят сверточные нейронные сети обнаружения выстрела), детектор мультиобъекта поля, сконфигурированный для монокулярной камеры. Местоположения обнаруженных объектов возвращены в виде набора ограничительных рамок.

При использовании этой функции, использования графического процессора CUDA^®-enabled NVIDIA^®. Графический процессор значительно уменьшает время вычисления. Использование графического процессора требует Parallel Computing Toolbox™. Для получения информации о поддерживаемом вычислите возможности, смотрите Поддержку графического процессора Релизом (Parallel Computing Toolbox).

пример

[bboxes,scores] = detect(detector,I) также возвращает оценки достоверности обнаружения для каждой ограничительной рамки.

[___,labels] = detect(detector,I) также возвращает категориальный массив меток, присвоенных ограничительным рамкам, с помощью любого из предыдущих синтаксисов. Метки, используемые для классов объектов, заданы во время обучения с помощью trainSSDObjectDetector функция.

[___] = detect(___,roi) обнаруживает объекты в прямоугольной поисковой области, заданной roi. Используйте выходные аргументы от любого из предыдущих синтаксисов. Задайте входные параметры от любого из предыдущих синтаксисов.

detectionResults = detect(detector,ds) обнаруживает объекты в серии изображений, возвращенных read функция входного datastore.

[___] = detect(___,Name,Value) задает опции с помощью одного или нескольких Name,Value парные аргументы. Например, detect(detector,I,'Threshold',0.75) устанавливает порог счета обнаружения к 0.75. Любые обнаружения с более низким счетом удалены.

Примеры

свернуть все

Обнаружьте транспортные средства Используя монокулярную камеру и SSD

Этот пример использует:

Скрипт Open Live Script

Сконфигурируйте детектор объектов SSD для использования с монокулярной камерой, смонтированной на автомобиле, оборудованном датчиком. Используйте этот детектор, чтобы обнаружить транспортные средства в изображении, полученном камерой.

Загрузите ssdObjectDetector объект, предварительно обученный обнаружить транспортные средства.

vehicleDetector = load('ssdVehicleDetector.mat','detector');
detector = vehicleDetector.detector;

Смоделируйте монокулярный датчик камеры путем создания monoCamera объект. Этот объект содержит внутренние параметры камеры и местоположение камеры на автомобиле, оборудованном датчиком.

focalLength = [309.4362 344.2161];    % [fx fy]
principalPoint = [318.9034 257.5352]; % [cx cy]
imageSize = [480 640];                % [mrows ncols]
height = 2.1798;                      % height of camera above ground, in meters
pitch = 14;                           % pitch of camera, in degrees
intrinsics = cameraIntrinsics(focalLength,principalPoint,imageSize);

sensor = monoCamera(intrinsics,height,'Pitch',pitch);

Сконфигурируйте детектор для использования с камерой. Ограничьте ширину обнаруженных объектов к 1.5 - 2.5 метрам. Сконфигурированный детектор является ssdObjectDetectorMonoCamera объект.

vehicleWidth = [1.5 2.5];
detectorMonoCam = configureDetectorMonoCamera(detector,sensor,vehicleWidth);

Считайте изображение, полученное камерой.

I = imread('highwayCars.png');

Обнаружьте транспортные средства в изображении при помощи детектора. Аннотируйте изображение ограничительными рамками для обнаружений и оценок достоверности обнаружения.

[bboxes,scores,labels] = detect(detectorMonoCam,I,'Threshold',0.6);
I = insertObjectAnnotation(I,'rectangle',bboxes,scores,'Color','g');
imshow(I)

Figure contains an axes. The axes contains an object of type image.

Отобразите метки для обнаруженных ограничительных рамок. Метки задают имена классов обнаруженных объектов.

disp(labels)

     vehicle 
     vehicle

Входные параметры

свернуть все

`detector` — Детектор мультиобъекта поля SSD
`SSDObjectDetector` объект

Детектор мультиобъекта поля SSD в виде ssdObjectDetector объект. Чтобы создать этот объект, вызовите trainSSDObjectDetector функция с обучающими данными, как введено.

`I` — Введите изображение
H-by-W-by-C-by-B числовой массив изображений

Введите изображение в виде H-by-W-by-C-by-B, числовой массив Изображений изображений должен быть действительным, неразреженным, полутоновым или изображение RGB.

H: Высота
W: Width
C: размер канала в каждом изображении должен быть равен входному размеру канала сети. Например, для полутоновых изображений, C должен быть равен 1. Для цветных изображений RGB это должно быть равно 3.
B: количество изображений в массиве.

Детектор чувствителен к области значений входного изображения. Поэтому гарантируйте, что входной диапазон образов похож на область значений изображений, используемых, чтобы обучить детектор. Например, если детектор был обучен на uint8 изображения, перемасштабируйте это входное изображение к области значений [0, 255] при помощи im2uint8 или rescale функция. Размер этого входного изображения должен быть сопоставим с размерами изображений, используемых в обучении. Если эти размеры очень отличаются, детектор испытывает затруднения при обнаружении объектов, потому что шкала объектов во входном изображении отличается от шкалы объектов, которые детектор был обучен идентифицировать. Рассмотрите, использовали ли вы SmallestImageDimension свойство во время обучения изменить размер учебных изображений.

`ds` datastore
`datastore` объект

Datastore в виде объекта datastore, содержащего набор изображений. Каждое изображение должно быть шкалой полутонов, RGB или многоканальным изображением. Функциональные процессы только первый столбец datastore, который должен содержать изображения и должен быть массивами ячеек или таблицами с несколькими столбцами.

`roi` — Поисковая необходимая область
[x y width height] вектор

Поисковая необходимая область в виде [x y width height] вектор. Вектор задает левый верхний угол и размер области в пикселях.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'SelectStrongest',true

`'Threshold'` — Порог обнаружения
0.5 (значение по умолчанию) | скаляр

Порог обнаружения в виде скаляра в области значений [0, 1]. Удалены обнаружения, которые имеют баллы меньше, чем это пороговое значение. Чтобы уменьшать ложные положительные стороны, увеличьте это значение.

`'SelectStrongest'` — Выберите самую сильную ограничительную рамку
`true` (значение по умолчанию) | `false`

Выберите самую сильную ограничительную рамку для каждого обнаруженного объекта в виде разделенной запятой пары, состоящей из 'SelectStrongest' и любой true или false.

true — Возвратите самую сильную ограничительную рамку на объект. Выбрать эти поля, detect вызывает selectStrongestBboxMulticlass функция, которая использует немаксимальное подавление, чтобы устранить перекрывающиеся ограничительные рамки на основе их оценок достоверности.
Например:
```
 selectStrongestBboxMulticlass(bbox,scores, ...
            'RatioType','Min', ...
            'OverlapThreshold',0.5);
```
false — Возвратите все обнаруженные ограничительные рамки. Можно затем создать собственную операцию, чтобы устранить перекрывающиеся ограничительные рамки.

`'MaxSize'` — Максимальный размер области
`sizei`) (значение по умолчанию) | [height width] вектор

Максимальный размер области, который содержит обнаруженный объект в виде разделенной запятой пары, состоящей из 'MaxSize' и [height width] вектор. Модули находятся в пикселях.

Чтобы уменьшать время вычисления, установите это значение к известному максимальному размеру области для объектов, обнаруживаемых в изображении. По умолчанию, 'MaxSize' установлен в высоту и ширину входного изображения, I.

`'MiniBatchSize'` — Минимальный пакетный размер
128 (значение по умолчанию) | скаляр

Минимальный пакетный размер в виде разделенной запятой пары, состоящей из 'MiniBatchSize' и скалярное значение. Используйте MiniBatchSize обработать большое количество изображений. Изображения сгруппированы в мини-пакеты и обработаны как пакет, чтобы повысить эффективность расчета. Увеличьте мини-пакетный размер, чтобы уменьшить время вычислений. Уменьшите размер, чтобы использовать меньше памяти.

`'ExecutionEnvironment'` — Аппаратный ресурс
`'auto'` (значение по умолчанию) | `'gpu'` | `'cpu'`

Аппаратный ресурс, на котором можно запустить детектор в виде разделенной запятой пары, состоящей из 'ExecutionEnvironment' и 'auto', 'gpu', или 'cpu'.

'auto' — Используйте графический процессор, если это доступно. В противном случае используйте центральный процессор.
'gpu' — Используйте графический процессор. Чтобы использовать графический процессор, у вас должен быть Parallel Computing Toolbox, и CUDA включил NVIDIA графический процессор. Если подходящий графический процессор не доступен, функция возвращает ошибку. Для получения информации о поддерживаемом вычислите возможности, смотрите Поддержку графического процессора Релизом (Parallel Computing Toolbox).
'cpu' — Используйте центральный процессор.

Выходные аргументы

свернуть все

`bboxes` — Местоположение объектов обнаруживается
M-by-4 матрица | B-by-1 массив ячеек

Местоположение объектов обнаруживается во входном изображении или изображениях, возвращенных как M-by-4 матрица или B-by-1 массив ячеек. M является количеством ограничительных рамок в изображении, и B является количеством M-by-4 матрицы, когда вход содержит массив изображений.

Каждая строка bboxes содержит четырехэлементный вектор из формы [x y width height]. Этот вектор задает левый верхний угол и размер той соответствующей ограничительной рамки в пикселях.

`scores` — Баллы обнаружения
M-by-1 вектор | B-by-1 массив ячеек

Оценки достоверности обнаружения, возвращенные как M-by-1 вектор или B-by-1 массив ячеек. M является количеством ограничительных рамок в изображении, и B является количеством M-by-1 векторы, когда вход содержит массив изображений. Более высокий счет указывает на более высокое доверие к обнаружению.

`labels` — Метки для ограничительных рамок
M-by-1 категориальный массив | B-by-1 массив ячеек

Метки для ограничительных рамок, возвращенных как M-by-1 категориальный массив или B-by-1 массив ячеек. M является количеством меток в изображении, и B является количеством M-by-1 категориальные массивы, когда вход содержит массив изображений. Вы задаете имена классов, используемые, чтобы пометить объекты, когда вы обучаете вход detector.

`detectionResults` — Результаты обнаружения
Таблица с 3 столбцами

Результаты обнаружения, возвращенные как таблица с 3 столбцами с именами переменных, Boxes, Scores и Labels. Столбец Boxes содержит M-by-4 матрицы ограничительных рамок M для объектов, найденных в изображении. Каждая строка содержит ограничительную рамку как вектор с 4 элементами в формате [x, y, width, height]. Формат задает местоположение верхнего левого угла и размер в пикселях ограничительной рамки в соответствующем изображении.

Смотрите также

Приложения

Ground Truth Labeler

Функции

configureDetectorMonoCamera | evaluateDetectionMissRate | evaluateDetectionPrecision | selectStrongestBboxMulticlass

Документация

detect

Синтаксис

Описание

Примеры

Обнаружьте транспортные средства Используя монокулярную камеру и SSD

Входные параметры

`detector` — Детектор мультиобъекта поля SSD
`SSDObjectDetector` объект

`I` — Введите изображение
H-by-W-by-C-by-B числовой массив изображений

`ds` datastore
`datastore` объект

`roi` — Поисковая необходимая область
[x y width height] вектор

Аргументы в виде пар имя-значение

`'Threshold'` — Порог обнаружения
0.5 (значение по умолчанию) | скаляр

`'SelectStrongest'` — Выберите самую сильную ограничительную рамку
`true` (значение по умолчанию) | `false`

`'MaxSize'` — Максимальный размер области
`sizei`) (значение по умолчанию) | [height width] вектор

`'MiniBatchSize'` — Минимальный пакетный размер
128 (значение по умолчанию) | скаляр

`'ExecutionEnvironment'` — Аппаратный ресурс
`'auto'` (значение по умолчанию) | `'gpu'` | `'cpu'`

Выходные аргументы

`bboxes` — Местоположение объектов обнаруживается
M-by-4 матрица | B-by-1 массив ячеек

`scores` — Баллы обнаружения
M-by-1 вектор | B-by-1 массив ячеек

`labels` — Метки для ограничительных рамок
M-by-1 категориальный массив | B-by-1 массив ячеек

`detectionResults` — Результаты обнаружения
Таблица с 3 столбцами

Смотрите также

Приложения

Функции

Объекты

Темы

Документация Automated Driving Toolbox

Поддержка

Документация

detect

Синтаксис

Описание

Примеры

Обнаружьте транспортные средства Используя монокулярную камеру и SSD

Входные параметры

detector — Детектор мультиобъекта поля SSD SSDObjectDetector объект

I — Введите изображение H-by-W-by-C-by-B числовой массив изображений

ds datastore datastore объект

roi — Поисковая необходимая область [x y width height] вектор

Аргументы в виде пар имя-значение

'Threshold' — Порог обнаружения0.5 (значение по умолчанию) | скаляр

'SelectStrongest' — Выберите самую сильную ограничительную рамку true (значение по умолчанию) | false

'MaxSize' — Максимальный размер области sizei) (значение по умолчанию) | [height width] вектор

'MiniBatchSize' — Минимальный пакетный размер128 (значение по умолчанию) | скаляр

'ExecutionEnvironment' — Аппаратный ресурс 'auto' (значение по умолчанию) | 'gpu' | 'cpu'

Выходные аргументы

bboxes — Местоположение объектов обнаруживается M-by-4 матрица | B-by-1 массив ячеек

scores — Баллы обнаружения M-by-1 вектор | B-by-1 массив ячеек

labels — Метки для ограничительных рамок M-by-1 категориальный массив | B-by-1 массив ячеек

detectionResults — Результаты обнаружения Таблица с 3 столбцами

Смотрите также

Приложения

Функции

Объекты

Темы

Документация Automated Driving Toolbox

Поддержка

`detector` — Детектор мультиобъекта поля SSD
`SSDObjectDetector` объект

`I` — Введите изображение
H-by-W-by-C-by-B числовой массив изображений

`ds` datastore
`datastore` объект

`roi` — Поисковая необходимая область
[x y width height] вектор

`'Threshold'` — Порог обнаружения
0.5 (значение по умолчанию) | скаляр

`'SelectStrongest'` — Выберите самую сильную ограничительную рамку
`true` (значение по умолчанию) | `false`

`'MaxSize'` — Максимальный размер области
`sizei`) (значение по умолчанию) | [height width] вектор

`'MiniBatchSize'` — Минимальный пакетный размер
128 (значение по умолчанию) | скаляр

`'ExecutionEnvironment'` — Аппаратный ресурс
`'auto'` (значение по умолчанию) | `'gpu'` | `'cpu'`

`bboxes` — Местоположение объектов обнаруживается
M-by-4 матрица | B-by-1 массив ячеек

`scores` — Баллы обнаружения
M-by-1 вектор | B-by-1 массив ячеек

`labels` — Метки для ограничительных рамок
M-by-1 категориальный массив | B-by-1 массив ячеек

`detectionResults` — Результаты обнаружения
Таблица с 3 столбцами