detect

Обнаружьте объекты с помощью детектора глубокого обучения R-CNN

Синтаксис

bboxes = detect(detector,I)

[bboxes,scores]
= detect(detector,I)

[___,labels] = detect(detector,I)

[___] = detect(___,roi)

[___] = detect(___,Name,Value)

Описание

bboxes = detect(detector,I) обнаруживает объекты в изображении I использование R-CNN (области со сверточными нейронными сетями) детектор объектов. Местоположения обнаруженных объектов возвращены как набор ограничительных рамок.

При использовании этой функции использование CUDA^® включило NVIDIA^® графический процессор с вычислить возможностью 3,0 или выше настоятельно рекомендовано. Графический процессор значительно уменьшает время вычисления. Использование графического процессора требует Parallel Computing Toolbox™.

[bboxes,scores] = detect(detector,I) также возвращает музыку обнаружения к каждой ограничительной рамке.

пример

[___,labels] = detect(detector,I) также возвращает категориальный массив меток, присвоенных ограничительным рамкам, с помощью любого из предыдущих синтаксисов. Метки, используемые в классах объектов, заданы во время обучения с помощью trainRCNNObjectDetector функция.

[___] = detect(___,roi) обнаруживает объекты в прямоугольной поисковой области, заданной roi.

[___] = detect(___,Name,Value) задает опции с помощью одного или нескольких Name,Value парные аргументы. Например, detect(detector,I,'NumStongestRegions',1000) ограничивает количество самых сильных предложений по области к 1 000.

Примеры

свернуть все

Обучите детектор знака Стоп R-CNN

Этот пример использует:

Открыть скрипт

Загрузите обучающие данные и сетевые слои.

load('rcnnStopSigns.mat', 'stopSigns', 'layers')

Добавьте каталог образов в путь MATLAB.

imDir = fullfile(matlabroot, 'toolbox', 'vision', 'visiondata',...
  'stopSignImages');
addpath(imDir);

Установите сетевые опции обучения использовать мини-пакетный размер 32, чтобы уменьшать использование памяти графического процессора. Понизьте InitialLearningRate, чтобы уменьшать уровень, на котором изменяются сетевые параметры. Это выгодно при подстройке предварительно обученной сети и препятствует тому, чтобы сеть изменилась слишком быстро.

options = trainingOptions('sgdm', ...
  'MiniBatchSize', 32, ...
  'InitialLearnRate', 1e-6, ...
  'MaxEpochs', 10);

Обучите детектор R-CNN. Обучение может занять несколько минут, чтобы завершиться.

rcnn = trainRCNNObjectDetector(stopSigns, layers, options, 'NegativeOverlapRange', [0 0.3]);

*******************************************************************
Training an R-CNN Object Detector for the following object classes:

* stopSign

Step 1 of 3: Extracting region proposals from 27 training images...done.

Step 2 of 3: Training a neural network to classify objects in training data...

|=========================================================================================|
|     Epoch    |   Iteration  | Time Elapsed |  Mini-batch  |  Mini-batch  | Base Learning|
|              |              |  (seconds)   |     Loss     |   Accuracy   |     Rate     |
|=========================================================================================|
|            3 |           50 |         9.27 |       0.2895 |       96.88% |     0.000001 |
|            5 |          100 |        14.77 |       0.2443 |       93.75% |     0.000001 |
|            8 |          150 |        20.29 |       0.0013 |      100.00% |     0.000001 |
|           10 |          200 |        25.94 |       0.1524 |       96.88% |     0.000001 |
|=========================================================================================|

Network training complete.

Step 3 of 3: Training bounding box regression models for each object class...100.00%...done.

R-CNN training complete.
*******************************************************************

Протестируйте детектор R-CNN на тестовом изображении.

img = imread('stopSignTest.jpg');

[bbox, score, label] = detect(rcnn, img, 'MiniBatchSize', 32);

Отобразите самый сильный результат обнаружения.

[score, idx] = max(score);

bbox = bbox(idx, :);
annotation = sprintf('%s: (Confidence = %f)', label(idx), score);

detectedImg = insertObjectAnnotation(img, 'rectangle', bbox, annotation);

figure
imshow(detectedImg)

Удалите каталог образов из пути.

rmpath(imDir);

Входные параметры

свернуть все

`detector` — Детектор объектов R-CNN
`rcnnObjectDetector` объект

Детектор объектов R-CNN, заданный как rcnnObjectDetector объект. Чтобы создать этот объект, вызовите trainRCNNObjectDetector функция с обучающими данными, как введено.

`I` — Введите изображение
полутоновое изображение | изображение истинного цвета

Введите изображение, заданное как изображение действительного, неразреженного, полутонового или истинного цвета.

Детектор чувствителен к области значений входного изображения. Поэтому гарантируйте, что входной диапазон образов похож на область значений изображений, используемых, чтобы обучить детектор. Например, если детектор был обучен на uint8 изображения, повторно масштабируйте входное изображение к области значений [0, 255] при помощи im2uint8 или rescale.

`roi` — Поисковая необходимая область
четырехэлементный вектор формы [x y width height]

Поисковая необходимая область, заданная как [x y width height] вектор. Вектор задает левый верхний угол и размер области в пикселях.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'NumStongestRegions',1000

`'NumStrongestRegions'` — Максимальное количество самых сильных предложений по области
2000 (значение по умолчанию) | целое число

Максимальное количество самых сильных предложений по области, заданных как разделенная запятой пара, состоящая из 'NumStrongestRegions' и целое число. Уменьшайте это значение, чтобы ускорить время вычислений за счет точности обнаружения. Чтобы использовать все предложения по области, задайте это значение как Inf.

`'SelectStrongest'` — Выберите самую сильную ограничительную рамку
`true` (значение по умолчанию) | `false`

Выберите самую сильную ограничительную рамку для каждого обнаруженного объекта, заданного как разделенная запятой пара, состоящая из 'SelectStrongest' и любой true или false.

true — Возвратите самую сильную ограничительную рамку на объект. Выбрать эти поля, detect вызывает selectStrongestBboxMulticlass функция, которая использует немаксимальное подавление, чтобы устранить перекрывающиеся ограничительные рамки на основе их баллов.
Например:
```
 selectStrongestBboxMulticlass(bbox,scores, ...
            'RatioType','Min', ...
            'OverlapThreshold',0.5);
```
false — Возвратите все обнаруженные ограничительные рамки. Можно затем использовать пользовательскую операцию, чтобы устранить перекрывающиеся ограничительные рамки.

`'MiniBatchSize'` — Размер меньших пакетов для обработки данных R-CNN
128 (значение по умолчанию) | целое число

Размер меньших пакетов для обработки данных R-CNN, заданной как разделенная запятой пара, состоящая из 'MiniBatchSize' и целое число. Большие пакетные размеры приводят к более быстрой обработке, но поднимают больше памяти.

`'ExecutionEnvironment'` — Аппаратный ресурс
`'auto'` (значение по умолчанию) | `'gpu'` | `'cpu'`

Аппаратный ресурс, на котором можно запустить детектор, заданный как разделенная запятой пара, состоящая из 'ExecutionEnvironment' и 'auto', 'gpu', или 'cpu'. Таблица показывает допустимые значения аппаратного ресурса.

Ресурс	Действие
`'auto'`	Используйте графический процессор, если это доступно. В противном случае используйте центральный процессор.
`'gpu'`	Используйте графический процессор. Чтобы использовать графический процессор, у вас должен быть Parallel Computing Toolbox, и CUDA включил NVIDIA графический процессор с вычислить возможностью 3,0 или выше. Если подходящий графический процессор не доступен, функция возвращает ошибку.
`'cpu'`	Используйте центральный процессор.

Выходные аргументы

свернуть все

`bboxes` — Местоположение объектов обнаруживается в изображении
M-by-4 матрица

Местоположение объектов обнаруживается в изображении, возвращенном как M-by-4 матрица, задающая ограничительные рамки M. Каждая строка bboxes содержит четырехэлементный вектор формы [x y width height]. Этот вектор задает левый верхний угол и размер ограничительной рамки в пикселях.

`scores` — Баллы обнаружения
M-by-1 вектор

Баллы обнаружения, возвращенные как M-by-1 вектор. Более высокий счет указывает на более высокую уверенность в обнаружении.

`labels` — Метки для ограничительных рамок
M-by-1 категориальный массив

Метки для ограничительных рамок, возвращенных как M-by-1 категориальный массив меток M. Вы задаете имена классов, используемые, чтобы пометить объекты, когда вы обучаете вход detector.

Документация

detect

Синтаксис

Описание

Примеры

Обучите детектор знака Стоп R-CNN

Входные параметры

`detector` — Детектор объектов R-CNN
`rcnnObjectDetector` объект

`I` — Введите изображение
полутоновое изображение | изображение истинного цвета

`roi` — Поисковая необходимая область
четырехэлементный вектор формы [x y width height]

Аргументы в виде пар имя-значение

`'NumStrongestRegions'` — Максимальное количество самых сильных предложений по области
2000 (значение по умолчанию) | целое число

`'SelectStrongest'` — Выберите самую сильную ограничительную рамку
`true` (значение по умолчанию) | `false`

`'MiniBatchSize'` — Размер меньших пакетов для обработки данных R-CNN
128 (значение по умолчанию) | целое число

`'ExecutionEnvironment'` — Аппаратный ресурс
`'auto'` (значение по умолчанию) | `'gpu'` | `'cpu'`

Выходные аргументы

`bboxes` — Местоположение объектов обнаруживается в изображении
M-by-4 матрица

`scores` — Баллы обнаружения
M-by-1 вектор

`labels` — Метки для ограничительных рамок
M-by-1 категориальный массив

Смотрите также

Приложения

Функции

Объекты

Введенный в R2017b

Документация Computer Vision Toolbox

Поддержка

Документация

detect

Синтаксис

Описание

Примеры

Обучите детектор знака Стоп R-CNN

Входные параметры

detector — Детектор объектов R-CNN rcnnObjectDetector объект

I — Введите изображение полутоновое изображение | изображение истинного цвета

roi — Поисковая необходимая область четырехэлементный вектор формы [x y width height]

Аргументы в виде пар имя-значение

'NumStrongestRegions' — Максимальное количество самых сильных предложений по области2000 (значение по умолчанию) | целое число

'SelectStrongest' — Выберите самую сильную ограничительную рамку true (значение по умолчанию) | false

'MiniBatchSize' — Размер меньших пакетов для обработки данных R-CNN128 (значение по умолчанию) | целое число

'ExecutionEnvironment' — Аппаратный ресурс 'auto' (значение по умолчанию) | 'gpu' | 'cpu'

Выходные аргументы

bboxes — Местоположение объектов обнаруживается в изображении M-by-4 матрица

scores — Баллы обнаружения M-by-1 вектор

labels — Метки для ограничительных рамок M-by-1 категориальный массив

Смотрите также

Приложения

Функции

Объекты

Введенный в R2017b

Документация Computer Vision Toolbox

Поддержка

`detector` — Детектор объектов R-CNN
`rcnnObjectDetector` объект

`I` — Введите изображение
полутоновое изображение | изображение истинного цвета

`roi` — Поисковая необходимая область
четырехэлементный вектор формы [x y width height]

`'NumStrongestRegions'` — Максимальное количество самых сильных предложений по области
2000 (значение по умолчанию) | целое число

`'SelectStrongest'` — Выберите самую сильную ограничительную рамку
`true` (значение по умолчанию) | `false`

`'MiniBatchSize'` — Размер меньших пакетов для обработки данных R-CNN
128 (значение по умолчанию) | целое число

`'ExecutionEnvironment'` — Аппаратный ресурс
`'auto'` (значение по умолчанию) | `'gpu'` | `'cpu'`

`bboxes` — Местоположение объектов обнаруживается в изображении
M-by-4 матрица

`scores` — Баллы обнаружения
M-by-1 вектор

`labels` — Метки для ограничительных рамок
M-by-1 категориальный массив