Обучите детектор объекта глубокого обучения R-CNN
detector = trainRCNNObjectDetector(trainingData,network,options)detector = trainRCNNObjectDetector(___,Name,Value)detector = trainRCNNObjectDetector(___,'RegionProposalFcn',proposalFcn)[detector,info] = trainRCNNObjectDetector(___) обучает R-CNN (области со сверточными нейронными сетями) базирующийся объектный детектор. Функция использует глубокое обучение, чтобы обучить детектор обнаруживать несколько классов объектов. detector = trainRCNNObjectDetector(trainingData,network,options)
Эта реализация R-CNN не обучает классификатор SVM каждому классу объекта.
Эта функция требует, чтобы у вас были Deep Learning Toolbox™ и Statistics and Machine Learning Toolbox™. Рекомендуется, чтобы у вас также был Parallel Computing Toolbox™, чтобы использовать с графическим процессором CUDA®-enabled NVIDIA® с, вычисляют возможность 3.0 или выше.
возвращает объект detector = trainRCNNObjectDetector(___,Name,Value)detector с дополнительными входными свойствами, заданными одним или несколькими аргументами пары Name,Value.
опционально обучает детектор R-CNN с помощью пользовательской функции предложения по области.detector = trainRCNNObjectDetector(___,'RegionProposalFcn',proposalFcn)
Эта реализация R-CNN не обучает классификатор SVM каждому классу объекта.
Чтобы ускорить предварительную обработку данных для обучения, trainRCNNObjectDetector автоматически создает и использует параллельный пул на основе ваших параллельных настроек настройки. Это требует Parallel Computing Toolbox.
VGG-16, VGG-19, ResNet-101 и Inception-ResNet-v2 являются большими моделями. Обучение с большими изображениями может произвести "Из Памяти" ошибки. Чтобы смягчить эти ошибки, вручную измените размер изображений наряду с наземными данными об истине ограничительной рамки прежде, чем вызвать trainRCNNObjectDetector.
Эта функция поддерживает изучение передачи. Когда сеть вводится по наименованию, такие как 'resnet50', затем программное обеспечение автоматически преобразовывает сеть в допустимую сетевую модель R-CNN на основе предварительно обученной модели resnet50. Также вручную задайте пользовательскую сеть R-CNN с помощью LayerGraph, извлеченного от предварительно обученной сети DAG. Смотрите Создают Сеть Обнаружения объектов R-CNN.
Используйте функцию trainingOptions, чтобы включить или отключить многословную печать.
[1] Girshick, R., Дж. Донахью, Т. Даррелл и Дж. Малик. “Богатые Иерархии Функции для Точного Обнаружения объектов и Семантической Сегментации”. Продолжения Конференции по IEEE по Компьютерному зрению и Распознаванию образов. 2014, стр 580–587.
[2] Girshick, R. “Быстрый R-CNN”. Продолжения Международной конференции IEEE по вопросам Компьютерного зрения. 2015, стр 1440–1448.
[3] Zitnick, К. Лоуренс и П. Доллэр. “Поля ребра: Определение местоположения Объектных Предложений от Ребер”. Компьютерное-зрение-ECCV, Springer International Publishing. 2014, стр 391–405.