detect

Обнаружение объектов с помощью детектора объектов Faster R-CNN

Синтаксис

bboxes = detect(detector,I)

[bboxes,scores]
= detect(detector,I)

[___,labels] = detect(detector,I)

detectionResults = detect(detector,ds)

[___] = detect(___,roi)

[___] = detect(___,Name,Value)

Описание

bboxes = detect(detector,I) обнаруживает объекты в одном изображении или массиве изображений, I, с использованием детектора объектов Faster R-CNN (области со сверточными нейронными сетями). Местоположения обнаруженных объектов возвращаются как набор ограничивающих рамок.

При использовании этой функции используйте CUDA^® enabled NVIDIA^® Настоятельно рекомендуется использовать графический процессор. Графический процессор значительно сокращает время расчетов. Для использования графический процессор требуется Parallel Computing Toolbox™. Для получения информации о поддерживаемых вычислительных возможностях смотрите Поддержку GPU by Release (Parallel Computing Toolbox).

[bboxes,scores] = detect(detector,I) также возвращает счета обнаружения для каждого ограничивающего прямоугольника.

пример

[___,labels] = detect(detector,I) также возвращает категориальный массив меток, назначенных ограничивающим рамкам, используя любой из предыдущих синтаксисов. Метки, используемые для классов объектов, определяются во время обучения с помощью trainFasterRCNNObjectDetector функция.

detectionResults = detect(detector,ds) обнаруживает объекты в пределах ряда изображений, возвращаемых read функция входного datastore.

[___] = detect(___,roi) обнаруживает объекты в прямоугольной области поиска, заданной roi.

[___] = detect(___,Name,Value) задает опции с использованием одного или нескольких Name,Value аргументы в виде пар. Для примера, detect(detector,I,'NumStrongestRegions',1000) ограничивает количество наиболее сильных региональных предложений 1000.

Примеры

свернуть все

Обнаружение транспортных средств, использующих Faster R-CNN

Открыть Live Script

Обнаружение транспортных средств в изображении с помощью детектора объектов Faster R-CNN.

Загрузите детектор объектов Faster R-CNN, предварительно обученный для обнаружения транспортных средств.

data = load('fasterRCNNVehicleTrainingData.mat', 'detector');
detector = data.detector;

Чтение в тестовом изображении.

I = imread('highway.png');
imshow(I)

Figure contains an axes. The axes contains an object of type image.

Запустите детектор на изображении и проверьте результаты. Метки поступают из ClassNames свойство детектора.

[bboxes,scores,labels] = detect(detector,I)

bboxes = 2×4

   150    86    80    72
    91    89    67    48

scores = 2x1 single column vector

    1.0000
    0.9001

labels = 2x1 categorical
     vehicle 
     vehicle

Детектор обладает высоким доверием в обнаружениях. Аннотируйте изображение с ограничивающими рамками для обнаружений и соответствующими счетами обнаружения.

  detectedI = insertObjectAnnotation(I,'Rectangle',bboxes,cellstr(labels));
  figure
  imshow(detectedI)

Figure contains an axes. The axes contains an object of type image.

Входные параметры

свернуть все

`detector` - Более быстрый детектор объектов R-CNN
`fasterRCNNObjectDetector` объект

Faster R-CNN, заданный как fasterRCNNObjectDetector объект. Чтобы создать этот объект, вызовите trainFasterRCNNObjectDetector функция с обучающими данными в качестве входных данных.

`I` - Входное изображение
H -by- W -by- C -by- B числовой массив

изображений

Входное изображение, заданное как H -by- W -by- C -by- B числовой массив изображений Изображения должны быть реальными, непараметрическими, полутоновыми или RGB изображениями.

H: Высота
W: Ширина
C: Размер канала в каждом изображении должен быть равен размеру входного канала сети. Для примера, для полутоновых изображений C должны быть равны 1. Для цветных изображений RGB он должен быть равен 3.
B: Количество изображений в массиве.

Детектор чувствителен к области значений входного изображения. Поэтому убедитесь, что вход области значений изображения аналогичен области значений изображений, используемых для обучения детектора. Например, если детектор был обучен на uint8 изображения, переключите это входное изображение в область значений [0, 255] с помощью im2uint8 или rescale функция. Размер этого входного изображения должен быть сопоставим с размерами изображений, используемых в обучении. Если эти размеры сильно отличаются, детектор испытывает трудности с обнаружением объектов, потому что шкала объектов в вход изображении отличается от шкалы объектов, для идентификации которых был обучен детектор. Рассмотрим, использовали ли вы SmallestImageDimension свойство во время обучения для изменения размера обучающих изображений.

`ds` - Datastore
`datastore` объект

Datastore, заданный как объект datastore, содержащий набор изображений. Каждое изображение должно быть полутоновым, RGB или многоканальным изображением. Функция обрабатывает только первый столбец datastore, который должен содержать изображения и должен быть массивами ячеек или таблицами с несколькими столбцами.

`roi` - Область поиска интересов
[x y width height] вектор

Необходимая область поиска, определенная как [<reservedrangesplaceholder3> <reservedrangesplaceholder2> <reservedrangesplaceholder1> <reservedrangesplaceholder0>] вектор. Вектор задает верхний левый угол и размер области в пикселях.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'NumStrongestRegions',1000

`'Threshold'` - Порог обнаружения
`0.5` (по умолчанию) | скаляром в области значений [0, 1]

Порог обнаружения, заданный как скаляр в области значений [0, 1]. Обнаружение, которое счета меньше этого порога значения, удаляется. Чтобы уменьшить ложные срабатывания, увеличьте это значение.

`'NumStrongestRegions'` - Максимальное число предложений сильнейших областей
`2000` (по умолчанию) | положительное целое число | `Inf`

Максимальное число предложений сильнейших областей, заданная как разделенная запятой пара, состоящая из 'NumStrongestRegions' и положительное целое число. Уменьшите это значение, чтобы ускорить время вычислений за счет точности обнаружения. Чтобы использовать все предложения по областям, задайте это значение следующим Inf.

`'SelectStrongest'` - Выберите самый сильный ограничивающий прямоугольник
`true` (по умолчанию) | `false`

Выберите самый сильный ограничивающий прямоугольник для каждого обнаруженного объекта, заданный как разделенная разделенными запятой парами, состоящая из 'SelectStrongest' и любой из них true или false.

true - Возвращает самый сильный ограничивающий прямоугольник по объекту. Чтобы выбрать эти рамки, detect вызывает selectStrongestBboxMulticlass функция, которая использует немаксимальное подавление, чтобы исключить перекрывающиеся ограничивающие прямоугольники на основе их оценок достоверности.
Для примера:
```
 selectStrongestBboxMulticlass(bbox,scores, ...
            'RatioType','Min', ...
            'OverlapThreshold',0.5);
```
false - Возвращает все обнаруженные ограничительные рамки. Затем можно создать собственную пользовательскую операцию для устранения перекрывающихся ограничивающих рамок.

`'MinSize'` - Минимальный размер области
вектор [ height width]

Минимальный размер области, которая содержит обнаруженный объект, заданный как разделенная разделенными запятой парами, состоящая из 'MinSize' и вектор [height width]. Модули указаны в пикселях.

По умолчанию MinSize является наименьшим объектом, который обучает detector может обнаружить.

`'MaxSize'` - Максимальный размер области
`size`(`I`) (по умолчанию) | вектор [height width]

Максимальный размер области, которая содержит обнаруженный объект, заданный как разделенная разделенными запятой парами, состоящая из 'MaxSize' и вектор [height width]. Модули указаны в пикселях.

Чтобы уменьшить время расчета, установите это значение на известный максимальный размер области для объектов, обнаруживаемых в изображении. По умолчанию 'MaxSize' задается высота и ширина входного изображения, I.

`'MiniBatchSize'` - Минимальный размер партии
`128` (по умолчанию) | скаляром

Минимальный размер пакета, заданный как разделенная разделенными запятой парами, состоящая из 'MiniBatchSize' и скалярное значение. Используйте MiniBatchSize для обработки большого набора изображений. Изображения сгруппированы в минибатчи и обработаны как пакет для повышения эффективности расчетов. Увеличьте размер мини-бата, чтобы уменьшить время вычислений. Уменьшите размер, чтобы использовать меньше памяти.

`'ExecutionEnvironment'` - Аппаратный ресурс
`'auto'` (по умолчанию) | `'gpu'` | `'cpu'`

Аппаратный ресурс, на котором можно запустить детектор, задается как разделенная разделенными запятой парами, состоящая из 'ExecutionEnvironment' и 'auto', 'gpu', или 'cpu'.

'auto' - Используйте графический процессор, если он доступен. В противном случае используйте центральный процессор.
'gpu' - Использовать графический процессор. Для использования GPU необходимо иметь Parallel Computing Toolbox и графический процессор NVIDIA с поддержкой CUDA. Если подходящий графический процессор недоступен, функция возвращает ошибку. Для получения информации о поддерживаемых вычислительных возможностях смотрите Поддержку GPU by Release (Parallel Computing Toolbox).
'cpu' - Использовать центральный процессор.

Выходные аргументы

свернуть все

`bboxes` - Местоположение обнаруженных объектов
M матрицу -by-4 | B массив ячеек -by-1

Расположение объектов, обнаруженных в входном изображении или изображениях, возвращенных в виде матрицы M -by-4 или массива ячеек B -by-1. M - количество ограничивающих рамок в изображении, а B - количество матриц M -на 4, когда вход содержит массив изображений.

Каждая строка bboxes содержит четырехэлементный вектор вида [x y width height]. Этот вектор задает верхний левый угол и размер соответствующего ограничивающего прямоугольника в пикселях.

`scores` - счета обнаружения
M вектор -by-1 | B массив ячеек -by-1

Достоверные оценки обнаружения, возвращенные как M-на-1 вектор или B-на-1 массив ячеек. M - количество ограничивающих рамок в изображении, а B - количество векторов M -by-1, когда вход содержит массив изображений. Более высокий счет указывает на более высокое доверие в обнаружении.

`labels` - Метки для ограничивающих рамок
M категориальный массив -by-1 | B массив ячеек -by-1

Метки для ограничивающих рамок, возвращенные как M-на-1 категориальный массив или B-на-1 массив ячеек. M - количество меток в изображении, а B - количество M-на-1 категориальных массивов, когда вход содержит массив изображений. Вы определяете имена классов, используемые для маркировки объектов, когда вы обучаете вход detector.

`detectionResults` - Результаты обнаружения
3-столбная таблица

Результаты обнаружения, возвращенные как 3-столбцевая таблица с именами переменных, Boxes, Scores и Labels. Столбец Boxes содержит M на 4 матрицы M ограничивающих прямоугольников для объектов, найденных на изображении. Каждая строка содержит ограничивающий прямоугольник как вектор с 4 элементами в формате [x, y, width, height]. Формат задает положение и размер верхнего левого угла в пикселях ограничивающего прямоугольника на соответствующем изображении.

См. также

Введенный в R2017a

Документация

detect

Синтаксис

Описание

Примеры

Обнаружение транспортных средств, использующих Faster R-CNN

Входные параметры

`detector` - Более быстрый детектор объектов R-CNN
`fasterRCNNObjectDetector` объект

`I` - Входное изображение
H -by- W -by- C -by- B числовой массив

`ds` - Datastore
`datastore` объект

`roi` - Область поиска интересов
[x y width height] вектор

Аргументы в виде пар имя-значение

`'Threshold'` - Порог обнаружения
`0.5` (по умолчанию) | скаляром в области значений [0, 1]

`'NumStrongestRegions'` - Максимальное число предложений сильнейших областей
`2000` (по умолчанию) | положительное целое число | `Inf`

`'SelectStrongest'` - Выберите самый сильный ограничивающий прямоугольник
`true` (по умолчанию) | `false`

`'MinSize'` - Минимальный размер области
вектор [ height width]

`'MaxSize'` - Максимальный размер области
`size`(`I`) (по умолчанию) | вектор [height width]

`'MiniBatchSize'` - Минимальный размер партии
`128` (по умолчанию) | скаляром

`'ExecutionEnvironment'` - Аппаратный ресурс
`'auto'` (по умолчанию) | `'gpu'` | `'cpu'`

Выходные аргументы

`bboxes` - Местоположение обнаруженных объектов
M матрицу -by-4 | B массив ячеек -by-1

`scores` - счета обнаружения
M вектор -by-1 | B массив ячеек -by-1

`labels` - Метки для ограничивающих рамок
M категориальный массив -by-1 | B массив ячеек -by-1

`detectionResults` - Результаты обнаружения
3-столбная таблица

См. также

Приложения

Функции

Объекты

Темы

Документация по Computer Vision Toolbox

Поддержка

Документация

detect

Синтаксис

Описание

Примеры

Обнаружение транспортных средств, использующих Faster R-CNN

Входные параметры

detector - Более быстрый детектор объектов R-CNN fasterRCNNObjectDetector объект

I - Входное изображение H -by- W -by- C -by- B числовой массив

ds - Datastore datastore объект

roi - Область поиска интересов [x y width height] вектор

Аргументы в виде пар имя-значение

'Threshold' - Порог обнаружения 0.5 (по умолчанию) | скаляром в области значений [0, 1]

'NumStrongestRegions' - Максимальное число предложений сильнейших областей 2000 (по умолчанию) | положительное целое число | Inf

'SelectStrongest' - Выберите самый сильный ограничивающий прямоугольник true (по умолчанию) | false

'MinSize' - Минимальный размер областивектор [ height width]

'MaxSize' - Максимальный размер области size(I) (по умолчанию) | вектор [height width]

'MiniBatchSize' - Минимальный размер партии 128 (по умолчанию) | скаляром

'ExecutionEnvironment' - Аппаратный ресурс 'auto' (по умолчанию) | 'gpu' | 'cpu'

Выходные аргументы

bboxes - Местоположение обнаруженных объектов M матрицу -by-4 | B массив ячеек -by-1

scores - счета обнаружения M вектор -by-1 | B массив ячеек -by-1

labels - Метки для ограничивающих рамок M категориальный массив -by-1 | B массив ячеек -by-1

detectionResults - Результаты обнаружения 3-столбная таблица

См. также

Приложения

Функции

Объекты

Темы

Документация по Computer Vision Toolbox

Поддержка

`detector` - Более быстрый детектор объектов R-CNN
`fasterRCNNObjectDetector` объект

`I` - Входное изображение
H -by- W -by- C -by- B числовой массив

`ds` - Datastore
`datastore` объект

`roi` - Область поиска интересов
[x y width height] вектор

`'Threshold'` - Порог обнаружения
`0.5` (по умолчанию) | скаляром в области значений [0, 1]

`'NumStrongestRegions'` - Максимальное число предложений сильнейших областей
`2000` (по умолчанию) | положительное целое число | `Inf`

`'SelectStrongest'` - Выберите самый сильный ограничивающий прямоугольник
`true` (по умолчанию) | `false`

`'MinSize'` - Минимальный размер области
вектор [ height width]

`'MaxSize'` - Максимальный размер области
`size`(`I`) (по умолчанию) | вектор [height width]

`'MiniBatchSize'` - Минимальный размер партии
`128` (по умолчанию) | скаляром

`'ExecutionEnvironment'` - Аппаратный ресурс
`'auto'` (по умолчанию) | `'gpu'` | `'cpu'`

`bboxes` - Местоположение обнаруженных объектов
M матрицу -by-4 | B массив ячеек -by-1

`scores` - счета обнаружения
M вектор -by-1 | B массив ячеек -by-1

`labels` - Метки для ограничивающих рамок
M категориальный массив -by-1 | B массив ячеек -by-1

`detectionResults` - Результаты обнаружения
3-столбная таблица