Обнаружение объектов

Выполните классификацию, обнаружение объектов, сверточные нейронные сети использования передачи обучения (CNNs или ConvNets), создайте настроенные детекторы

Обнаружение объектов является методом компьютерного зрения для определения местоположения экземпляров объектов в изображениях или видео. Алгоритмы обнаружения объектов обычно усиливают машинное обучение или глубокое обучение, чтобы привести к значимым результатам. При рассмотрении изображений или видео, люди могут распознать и определить местоположение предметов интереса в течение моментов. Цель обнаружения объектов состоит в том, чтобы реплицировать этот интеллект с помощью компьютера. Лучший подход для обнаружения объектов зависит от вашего приложения и задачи, которую вы пытаетесь решить.

Методы глубокого обучения требуют большого количества помеченных учебных изображений, таким образом, использованию графического процессора рекомендуют уменьшиться, время должно было обучить модель. Основанные на глубоком обучении подходы к обнаружению объектов используют сверточные нейронные сети (CNNs или ConvNets), такие как R-CNN и YOLO v2 или однократное обнаружение (SSD) использования. Можно обучить детектор пользовательского объекта или использовать предварительно обученный детектор объектов путем усиления передачи обучения, подход, который позволяет вам запуститься с предварительно обученной сети и затем подстроить ее для своего приложения. Сверточные нейронные сети требуют Deep Learning Toolbox™. Обучение и предсказание поддерживаются на графическом процессоре CUDA®-capable. Использование графического процессора рекомендуется и требует Parallel Computing Toolbox™. Для получения дополнительной информации смотрите Настройки Computer Vision Toolbox и Поддержку Параллельных вычислений в Продуктах Mathworks (Parallel Computing Toolbox).

Методы машинного обучения для обнаружения объектов включают совокупные функции канала (ACF), классификация машин опорных векторов (SVM) с помощью гистограмм ориентированного градиента (ПОЖИРАТЕЛЬ РЕСУРСОВ) функции и алгоритм Виолы - Джонса для человеческой поверхности или обнаружения верхней части тела. Можно принять решение запуститься с предварительно обученного детектора объектов или создать детектор пользовательского объекта, чтобы удовлетворить приложению.

Object detection, neural network

Приложения

Image LabelerПометьте изображения для приложений компьютерного зрения
Video LabelerПометьте видео для приложений компьютерного зрения

Функции

развернуть все

Детекторы глубокого обучения

rcnnObjectDetectorОбнаружьте объекты с помощью детектора глубокого обучения R-CNN
fastRCNNObjectDetectorОбнаружьте объекты с помощью Быстрого детектора глубокого обучения R-CNN
fasterRCNNObjectDetectorОбнаружьте объекты с помощью детектора глубокого обучения Faster R-CNN
ssdObjectDetectorОбнаружьте объекты с помощью детектора глубокого обучения SSD
yolov2ObjectDetectorОбнаружьте объекты с помощью детектора объектов YOLO v2
yolov3ObjectDetectorСоздайте детектор объектов YOLO v3

Основанные на функции детекторы

ocrРаспознайте текст с помощью оптического распознавания символов
readAprilTagОбнаружьте и оцените положение для AprilTag в изображении
readBarcodeОбнаружьте и декодируйте 1D или 2D штрихкод в изображении
acfObjectDetectorОбнаружьте объекты, использующие совокупные функции канала
peopleDetectorACFОбнаружьте людей, использующих совокупные функции канала
vision.CascadeObjectDetectorОбнаружьте объекты с помощью алгоритма Виолы - Джонса
vision.ForegroundDetectorПриоритетное обнаружение с помощью смешанных гауссовских моделей
vision.PeopleDetectorОбнаружение людей в вертикальной позиции , с использованием функции направленного градиента (HOG)
vision.BlobAnalysisСвойства связанных областей

Обнаружьте объекты, использующие функции точки

detectBRISKFeaturesОбнаружьте функции BRISK и возвратите BRISKPoints объект
detectFASTFeaturesОбнаружьте углы с помощью Алгоритма FAST и возвратите cornerPoints объект
detectHarrisFeaturesОбнаружьте углы с помощью алгоритма Харриса-Стивенса и возвратите cornerPoints объект
detectKAZEFeaturesОбнаружьте функции KAZE и возвратите KAZEPoints объект
detectMinEigenFeaturesОбнаружьте углы с помощью минимального алгоритма собственного значения и возвратите cornerPoints объект
detectMSERFeaturesОбнаружьте функции MSER и возвратите MSERRegions объект
detectORBFeaturesОбнаружьте ORB keypoints и возвратите ORBPoints объект
detectSURFFeaturesОбнаружьте функции SURF и возвратите SURFPoints объект
extractFeaturesИзвлеките дескрипторы точки интереса
matchFeaturesНайдите соответствующие признаки

Выберите Detected Objects

selectStrongestBboxВыберите самые сильные ограничительные рамки из перекрывающихся кластеров
selectStrongestBboxMulticlassВыберите самые сильные ограничительные рамки мультикласса из перекрывающихся кластеров

Загрузите обучающие данные

boxLabelDatastoreDatastore для ограничительной рамки помечает данные
groundTruthДанные о метке основной истины
imageDatastoreDatastore для данных изображения
objectDetectorTrainingDataСоздание обучающих данных для детектора объектов
combineОбъедините данные от нескольких datastores

Обучите основанные на функции детекторы объектов

trainACFObjectDetectorОбучите детектор объектов ACF
trainCascadeObjectDetectorОбучите каскадную модель детектора объектов
trainImageCategoryClassifierОбучите классификатор категории изображений

Обучите основанные на глубоком обучении детекторы объектов

trainRCNNObjectDetectorОбучите детектор объектов глубокого обучения R-CNN
trainFastRCNNObjectDetectorОбучите Быстрый детектор объектов глубокого обучения R-CNN
trainFasterRCNNObjectDetectorОбучите детектор объектов глубокого обучения Faster R-CNN
trainSSDObjectDetectorОбучите детектор объектов глубокого обучения SSD
trainYOLOv2ObjectDetectorОбучите детектор объектов YOLO v2

Увеличьте и предварительно обработайте обучающие данные для глубокого обучения

balanceBoxLabelsСбалансируйте метки ограничительной рамки для обнаружения объектов
bboxcropОбрежьте ограничительные рамки
bboxeraseУдалите ограничительные рамки
bboxresizeИзмените размер ограничительных рамок
bboxwarpПримените геометрическое преобразование к ограничительным рамкам
bbox2pointsПреобразуйте прямоугольник в список угловых точек
imwarpПримените геометрическое преобразование изображения
imcropОбрежьте изображение
imresizeИзмените размер изображения
randomAffine2dСоздайте рандомизированное 2D аффинное преобразование
centerCropWindow2dСоздайте прямоугольное окно обрезки центра
randomWindow2dСлучайным образом выберите прямоугольную область в изображении
integralImageВычислите 2D интегральное изображение

R-CNN (области со сверточными нейронными сетями)

rcnnBoxRegressionLayerСлой регрессии поля для Быстрого и Faster R-CNN
fasterRCNNLayersСоздайте более быструю сеть обнаружения объектов R-CNN
rpnSoftmaxLayerСлой Softmax для сети предложения по области (RPN)
rpnClassificationLayerСлой Classification для сетей предложения по области (RPNs)
regionProposalLayerСлой предложения по области для Faster R-CNN
roiAlignLayerНеквантованный слой объединения ROI для CNN маски
roiInputLayerСлой входа ROI для Быстрого R-CNN
roiMaxPooling2dLayerСлой нейронной сети для вывода карты признаков фиксированного размера для прямоугольных областей интереса (ROI)

YOLO (вы только смотрите однажды),

yolov2LayersСоздайте сеть обнаружения объектов YOLO v2
yolov2TransformLayerСоздайте преобразовывают слой для сети обнаружения объектов YOLO v2
yolov2OutputLayerСоздайте выходной слой для сети обнаружения объектов YOLO v2
yolov2ReorgLayer(Не рекомендуемый), Создают слой перестройки для сети обнаружения объектов YOLO v2
spaceToDepthLayerПробел к слою глубины

Фокальные слои потерь

focalLossLayerСоздайте фокальный слой потерь с помощью фокальной функции потерь
focalCrossEntropyВычислите фокальную потерю перекрестной энтропии

SSD (один детектор выстрела)

ssdMergeLayerСоздайте слой слияния SSD для обнаружения объектов
ssdLayersСеть обнаружения мультиобъекта поля SSD

Поля привязки

anchorBoxLayerСоздайте слой поля привязки для обнаружения объектов
estimateAnchorBoxesОцените поля привязки для детекторов объектов глубокого обучения
insertObjectAnnotationАннотируйте истинный цвет или полутоновое изображение или видеопоток
insertObjectMask Вставьте маски в изображение или видеопоток
insertShapeВставьте фигуры в изображение или видео
showShapeОтобразите формы на изображении, видео или облаке точек
evaluateDetectionAOSОцените среднюю метрику подобия ориентации для обнаружения объектов
evaluateDetectionMissRateОцените метрику коэффициента непопаданий для обнаружения объектов
evaluateDetectionPrecisionОцените метрику точности для обнаружения объектов
bboxOverlapRatioВычислите отношение перекрытия ограничительной рамки
bboxPrecisionRecallВычислите точность ограничительной рамки и отзыв против основной истины

Темы

Запуск

Начало работы с обнаружением объектов Используя глубокое обучение

Обнаружение объектов с помощью глубоких нейронных сетей.

Укажите типы функции

Выберите функции, которые возвращают и принимают объекты точек для нескольких типов функций

Системы координат

Укажите индексы пикселей, пространственные координаты и трехмерные системы координат

Обнаружение локального признака и экстракция

Узнайте о преимуществах и приложениях локального обнаружения и извлечения объектов

Отобразите классификацию с мешком визуальных слов

Используйте функции Computer Vision Toolbox™ для классификации категорий изображений путем создания мешка визуальных слов.

Начало работы с каскадным детектором объектов

Обучите пользовательский классификатор

Выберите Function to Visualize Detected Objects

Сравните функции визуализации.

Обучающие данные для обнаружения объектов и Семантической Сегментации

Начало работы с Image Labeler

Интерактивно помечайте прямоугольные ROI для обнаружения объектов, пиксели для семантической сегментации, многоугольники, например, сегментация и сцены для классификации изображений.

Начало работы с Video Labeler

Интерактивно помечайте прямоугольные ROI для обнаружения объектов, пиксели для семантической сегментации, многоугольники, например, сегментация и сцены для классификации изображений в видео или последовательности изображений.

Хранилища данных для глубокого обучения (Deep Learning Toolbox)

Узнать, как использовать хранилища данных в применении глубокого обучения.

Начало работы с маской R-CNN, например, сегментация

Выполните сегментацию мультиэкземпляра класса с помощью Маски R-CNN и глубокое обучение.

Обучающие данные для обнаружения объектов и Семантической Сегментации

Создайте обучающие данные для обнаружения объектов или семантической сегментации с помощью Image Labeler или Video Labeler.

Начало работы с глубоким обучением

Deep Network Designer (Deep Learning Toolbox)

Список слоев глубокого обучения (Deep Learning Toolbox)

Узнайте все слои глубокого обучения в MATLAB®.

Глубокое обучение в MATLAB (Deep Learning Toolbox)

Узнайте возможности глубокого обучения в сверточных нейронных сетях использования MATLAB для классификации и регрессии, включая предварительно обученные сети и передачу обучения и обучение на графических процессорах, центральных процессорах, кластерах и облаках.

Предварительно обученные глубокие нейронные сети (Deep Learning Toolbox)

Узнать, как загружать и использовать предварительно обученные сверточные нейронные сети для классификации, передачи обучения и извлечения признаков.

Рекомендуемые примеры

Для просмотра документации необходимо авторизоваться на сайте