exponenta event banner

classifyRegions

Классификация объектов в областях изображения с помощью детектора объектов Fast R-CNN, настроенного для монокулярной камеры

Описание

[labels,scores] = classifyRegions(detector,I,rois) классифицирует объекты в пределах областей, представляющих интерес для изображения I, используя детектор объектов Fast R-CNN (области со сверточными нейронными сетями), сконфигурированный для монокулярной камеры. Для каждого региона, classifyRegions возвращает метку класса с соответствующим наивысшим показателем классификации.

При использовании этой функции настоятельно рекомендуется использовать графический процессор NVIDIA ® с поддержкой CUDA ®. Графический процессор значительно сокращает время вычислений. Для использования графического процессора требуется Toolbox™ параллельных вычислений. Сведения о поддерживаемых вычислительных возможностях см. в разделе Поддержка графического процессора по выпуску (Parallel Computing Toolbox).

[labels,scores,allScores] = classifyRegions(detector,I,rois) также возвращает все оценки классификации для каждого региона. Баллы возвращаются в матрице M-на-N из M областей и N меток класса.

[___] = classifyRegions(___,'ExecutionEnvironment',resource) указывает аппаратный ресурс, используемый для классификации объектов в областях изображения. Эту пару имя-значение можно использовать с любым из предшествующих синтаксисов.

Входные аргументы

свернуть все

Быстрый детектор объектов R-CNN, сконфигурированный для монокулярной камеры, указанный как fastRCNNObjectDetectorMonoCamera объект. Чтобы создать этот объект, используйте configureDetectorMonoCamera функция с monoCamera объект и обученный fastRCNNObjectDetector объект в качестве входных данных.

Входное изображение, указанное как вещественное изображение, изображение без синтаксического анализа, изображение в градациях серого или RGB.

Типы данных: uint8 | uint16 | int16 | double | single | logical

Области, представляющие интерес в изображении, определенные как M-by-4 матрица, определяющая M прямоугольных областей. Каждая строка содержит четырехэлементный вектор вида [x y width height]. Этот вектор задает левый верхний угол и размер области в пикселях.

Аппаратный ресурс, используемый для классификации областей изображения, указанный как 'ExecutionEnvironment' и 'auto', 'gpu', или 'cpu'.

  • 'auto' - Используйте графический процессор, если он доступен. В противном случае используйте ЦП.

  • 'gpu' - Использовать графический процессор. Для использования графического процессора необходимо иметь панель инструментов параллельных вычислений и графический процессор NVIDIA с поддержкой CUDA. Если подходящий графический процессор недоступен, функция возвращает ошибку. Сведения о поддерживаемых вычислительных возможностях см. в разделе Поддержка графического процессора по выпуску (Parallel Computing Toolbox).

  • 'cpu' - Использовать ЦП.

Пример: 'ExecutionEnvironment','cpu'

Выходные аргументы

свернуть все

Метки классификации регионов, возвращаемые как M-by-1 категориальный массив. M - количество регионов, представляющих интерес rois. Каждое имя класса в labels соответствует классификационному баллу в scores и регион, представляющий интерес rois. classifyRegions получает имена классов из входных данных detector.

Наивысший показатель классификации по регионам, возвращаемый в виде M-by-1 вектора значений в диапазоне [0, 1]. M - количество регионов, представляющих интерес rois. Каждый показатель классификации в scores соответствует имени класса в labels и регион, представляющий интерес rois. Более высокий балл указывает на более высокую уверенность в классификации.

Все оценки классификации по регионам, возвращаемые в виде матрицы M-by-N значений в диапазоне [0, 1]. M - количество регионов в rois. N - количество имен классов, хранящихся на входе detector. Каждая строка классификационных баллов в allscores соответствует региону, представляющему интерес rois. Более высокий балл указывает на более высокую уверенность в классификации.

Представлен в R2017a