exponenta event banner

Обнаружение объектов

Выполнение классификации, обнаружения объектов, передачи обучения с использованием сверточных нейронных сетей (CNN или ConvNets), создание настраиваемых детекторов

Обнаружение объектов - это техника компьютерного зрения для обнаружения экземпляров объектов в изображениях или видео. Алгоритмы обнаружения объектов обычно используют машинное обучение или глубокое обучение для получения значимых результатов. Глядя на изображения или видео, люди могут распознавать и находить интересующие их объекты в считанные моменты. Цель обнаружения объектов - реплицировать этот интеллект с помощью компьютера. Наилучший подход к обнаружению объектов зависит от приложения и проблемы, которую вы пытаетесь решить.

Методы глубокого обучения требуют большого количества помеченных обучающих изображений, поэтому использование графического процессора рекомендуется для уменьшения времени, необходимого для обучения модели. Основанные на глубоком обучении подходы к обнаружению объектов используют сверточные нейронные сети (CNN или ConvNets), такие как R-CNN и YOLO v2, или используют обнаружение с одним выстрелом (SSD). Вы можете обучить настраиваемый детектор объектов или использовать предварительно обученный детектор объектов, используя обучение передачи, подход, который позволяет начать с предварительно обученной сети, а затем точно настроить ее для вашего приложения. Сверточные нейронные сети требуют Deep Learning Toolbox™. Обучение и прогнозирование поддерживаются графическим процессором с поддержкой CUDA ®. Использование графического процессора рекомендуется и требует Toolbox™ параллельных вычислений. Дополнительные сведения см. в разделе Настройки панели инструментов Computer Vision и поддержка параллельных вычислений в продуктах MathWorks (Панель инструментов параллельных вычислений).

Методы машинного обучения для обнаружения объектов включают в себя агрегированные канальные особенности (ACF), классификацию вспомогательных векторных машин (SVM) с использованием гистограмм признаков ориентированного градиента (HOG) и алгоритм Виолы-Джонса для обнаружения лица человека или верхней части тела. Можно выбрать запуск с предварительно обученного детектора объектов или создание пользовательского детектора объектов в соответствии с приложением.

Object detection, neural network

Приложения

Маркировщик изображенийИзображения наклеек для приложений компьютерного зрения
Этикетировщик видеоНаклейка видео для приложений компьютерного зрения

Функции

развернуть все

Детекторы глубокого обучения

rcnnObjectDetectorОбнаружение объектов с помощью детектора глубокого обучения R-CNN
fastRCNNObjectDetectorОбнаружение объектов с помощью детектора глубокого обучения Fast R-CNN
fasterRCNNObjectDetectorОбнаружение объектов с помощью более быстрого детектора глубокого обучения R-CNN
ssdObjectDetectorОбнаружение объектов с помощью детектора глубокого обучения SSD
yolov2ObjectDetectorОбнаружение объектов с помощью детектора объектов YOLO v2
yolov3ObjectDetectorСоздать детектор объектов YOLO v3

Детекторы на основе функций

ocrРаспознавание текста с помощью оптического распознавания символов
readAprilTagОбнаружение и оценка позы для тега на изображении
readBarcodeОбнаружение и декодирование 1-D или 2-D штрихкода в изображении
acfObjectDetectorОбнаружение объектов с помощью агрегированных функций канала
peopleDetectorACFОбнаружение людей с помощью агрегированных функций каналов
vision.CascadeObjectDetectorОбнаружение объектов с помощью алгоритма Виолы-Джонса
vision.ForegroundDetectorОбнаружение на переднем плане с использованием гауссовых моделей смесей
vision.PeopleDetectorОбнаружение людей в вертикальном положении с помощью функций HOG
vision.BlobAnalysisСвойства связанных областей

Обнаружение объектов с помощью точечных элементов

detectBRISKFeaturesОбнаружение функций BRISK и возврат BRISKPoints объект
detectFASTFeaturesОбнаружение углов с помощью алгоритма FAST и возврата cornerPoints объект
detectHarrisFeaturesОбнаружение углов с помощью алгоритма Харриса-Стивенса и возврат cornerPoints объект
detectKAZEFeaturesОбнаружение функций KAZE и возврат KAZEPoints объект
detectMinEigenFeaturesОбнаружение углов с помощью алгоритма минимального собственного значения и возврата cornerPoints объект
detectMSERFeaturesОбнаружение функций MSER и возврат MSERRegions объект
detectORBFeaturesОбнаружение ключевых точек ORB и возврат ORBPoints объект
detectSURFFeaturesОбнаружение элементов SURF и возврат SURFPoints объект
extractFeaturesИзвлечение дескрипторов процентных пунктов
matchFeaturesПоиск соответствующих функций

Выбор обнаруженных объектов

selectStrongestBboxВыбрать наиболее сильные ограничивающие рамки из перекрывающихся кластеров
selectStrongestBboxMulticlassВыберите наиболее прочные многоклассовые ограничивающие рамки из перекрывающихся кластеров

Загрузка данных обучения

boxLabelDatastoreХранилище данных для данных метки ограничивающей рамки
groundTruthДанные метки истинности земли
imageDatastoreХранилище данных для данных изображения
objectDetectorTrainingDataСоздание учебных данных для детектора объектов
combineОбъединение данных из нескольких хранилищ данных

Детекторы объектов на основе элементов поезда

trainACFObjectDetectorДетектор объекта ACF канала
trainCascadeObjectDetectorМодель каскадного детектора объектов поезда
trainImageCategoryClassifierПодготовка классификатора категорий изображений

Обучение детекторам объектов на основе глубокого обучения

trainRCNNObjectDetectorОбучение детектору объекта глубокого обучения R-CNN
trainFastRCNNObjectDetectorОбучение детектору объекта глубокого обучения Fast R-CNN
trainFasterRCNNObjectDetectorОбучение более быстрому детектору объекта глубокого обучения R-CNN
trainSSDObjectDetectorОбучение детектору объектов глубокого обучения твердотельных накопителей
trainYOLOv2ObjectDetectorДетектор объекта канала YOLO v2

Увеличение и предварительная обработка данных обучения для глубокого обучения

balanceBoxLabelsМетки ограничивающих рамок баланса для обнаружения объектов
bboxcropОбрезать ограничивающие рамки
bboxeraseУдалить ограничивающие рамки
bboxresizeИзменение размеров ограничивающих рамок
bboxwarpПрименение геометрического преобразования к ограничивающим рамкам
bbox2pointsПреобразовать прямоугольник в список угловых точек
imwarpПрименение геометрического преобразования к изображению
imcropИзображение обрезки
imresizeИзменить размер изображения
randomAffine2dСоздайте рандомизированное 2-е аффинное преобразование
centerCropWindow2dСоздание прямоугольного центрального окна обрезки
randomWindow2dСлучайный выбор прямоугольной области на изображении
integralImageРасчет 2-D интегрального изображения

R-CNN (области со сверточными нейронными сетями)

rcnnBoxRegressionLayerУровень регрессии коробки для быстрого и более быстрого R-CNN
fasterRCNNLayersСоздание более быстрой сети обнаружения объектов R-CNN
rpnSoftmaxLayerУровень Softmax для сети предложений по регионам (RPN)
rpnClassificationLayerКлассификационный уровень для региональных предлагаемых сетей (РПС)
regionProposalLayerУровень предложения по региону для более быстрого R-CNN
roiAlignLayerНеквантованный уровень объединения ROI для Mask-CNN
roiInputLayerВходной уровень ROI для Fast R-CNN
roiMaxPooling2dLayerУровень нейронной сети, используемый для вывода карт характеристик фиксированного размера для прямоугольных ROI

YOLO (вы смотрите только один раз)

yolov2LayersСоздать сеть обнаружения объектов YOLO v2
yolov2TransformLayerСоздать слой преобразования для сети обнаружения объектов YOLO v2
yolov2OutputLayerСоздание выходного уровня для сети обнаружения объектов YOLO v2
yolov2ReorgLayer(Не рекомендуется) Создание уровня реорганизации для сети обнаружения объектов YOLO v2
spaceToDepthLayerСлой от пространства до глубины

Слои фокальных потерь

focalLossLayerСоздание слоя фокусных потерь с использованием функции фокусных потерь
focalCrossEntropyВычислить фокальные потери перекрестной энтропии

Твердотельный накопитель (однокадровый детектор)

ssdMergeLayerСоздание слоя слияния SSD для обнаружения объектов
ssdLayersСеть обнаружения объектов SSD multibox

Ящики привязки

anchorBoxLayerСоздать слой поля привязки для обнаружения объектов
estimateAnchorBoxesОценить якорные ящики для детекторов объектов глубокого обучения
insertObjectAnnotationАннотирование цветного или серого изображения или видеопотока
insertObjectMask Вставка масок в изображение или видеопоток
insertShapeВставка фигур в изображение или видео
showShapeОтображение фигур на изображении, видео или облаке точек
evaluateDetectionAOSОценить среднюю метрику подобия ориентации для обнаружения объектов
evaluateDetectionMissRateОценка метрики частоты промахов для обнаружения объектов
evaluateDetectionPrecisionВычислить метрику точности для обнаружения объектов
bboxOverlapRatioВычислить коэффициент перекрытия ограничивающей рамки
bboxPrecisionRecallВычислить точность ограничивающей рамки и вспомнить об истинном основании

Темы

Начало работы

Начало работы с функцией обнаружения объектов с помощью глубокого обучения

Обнаружение объектов с помощью нейронных сетей глубокого обучения.

Типы элементов точек

Выберите функции, возвращающие и принимающие объекты точек для нескольких типов элементов

Системы координат

Указание индексов пикселей, пространственных координат и 3-D систем координат

Обнаружение и извлечение локальных элементов

Узнайте о преимуществах и приложениях локального обнаружения и извлечения функций

Классификация изображений с сумкой визуальных слов

Используйте функции Computer Vision Toolbox™ для классификации категорий изображений путем создания пакета визуальных слов.

Начало работы с каскадным детектором объектов

Подготовка пользовательского классификатора

Выберите функцию для визуализации обнаруженных объектов

Сравнение функций визуализации.

Учебные данные для обнаружения объектов и семантической сегментации

Начало работы с маркировщиком изображений

Интерактивно маркировать прямоугольные ROI для обнаружения объектов, пикселы для семантической сегментации, многоугольники, например сегментация, и сцены для классификации изображений.

Начало работы с приложением Video Labeler

Интерактивно маркировать прямоугольные ROI для обнаружения объектов, пикселы для семантической сегментации, многоугольники, например сегментация, и сцены для классификации изображения в видео или последовательности изображений.

Хранилища данных для глубокого обучения (набор инструментов для глубокого обучения)

Узнайте, как использовать хранилища данных в приложениях для глубокого обучения.

Начало работы с маской R-CNN для сегментации экземпляров

Выполнение сегментации многоклассовых экземпляров с помощью Mask R-CNN и глубокого обучения.

Учебные данные для обнаружения объектов и семантической сегментации

Создайте обучающие данные для обнаружения объектов или семантической сегментации с помощью средства маркировки изображений или средства маркировки видео.

Начните с глубокого обучения

Deep Network Designer (инструментарий для глубокого обучения)

Список слоев глубокого обучения (панель инструментов глубокого обучения)

Откройте для себя все уровни глубокого обучения в MATLAB ®.

Глубокое обучение в MATLAB (инструментарий глубокого обучения)

Откройте для себя возможности глубокого обучения в MATLAB с использованием сверточных нейронных сетей для классификации и регрессии, включая предварительно обученные сети и обучение передаче, а также обучение по GPU, CPU, кластерам и облакам.

Предварительно обученные нейронные сети (набор инструментов для глубокого обучения)

Узнайте, как загрузить и использовать предварительно обученные сверточные нейронные сети для классификации, передачи обучения и извлечения функций.

Характерные примеры