exponenta event banner

Извлечение изображения с помощью пакета визуальных слов

Функции Computer Vision Toolbox™ можно использовать для поиска по изображениям, также известной как система поиска изображений на основе содержимого (CBIR). CBIR-системы используются для извлечения изображений из коллекции изображений, похожих на изображение запроса. Применение этих типов систем можно найти во многих областях, таких как веб-поиск продукта, наблюдение и визуальная идентификация места. Сначала система выполняет поиск набора изображений для поиска изображений, визуально похожих на изображение запроса.

Система поиска использует пакет визуальных слов, набор дескрипторов изображений, чтобы представить ваш набор данных изображений. Изображения индексируются для создания сопоставления визуальных слов. Индекс сопоставляет каждое визуальное слово с их вхождениями в наборе изображений. Сравнение изображения запроса с индексом обеспечивает изображения, наиболее похожие на изображение запроса. Используя рабочий процесс системы CBIR, можно оценить точность для известного набора результатов поиска изображений.

Рабочий процесс системы извлечения

  1. Создать набор изображений, представляющий элементы изображения для извлечения. Использовать imageDatastore для хранения данных изображения. Используйте большое количество изображений, представляющих различные точки обзора объекта. Большое и разнообразное количество изображений помогает обучить мешок визуальных слов и повышает точность поиска изображения.

  2. Тип элемента. indexImages функция создает пакет визуальных слов, используя ускоренные надежные функции (SURF). Для других типов элементов можно использовать пользовательский экстрактор, а затем использовать bagOfFeatures для создания пакета визуальных слов. См. пример «Создание индекса поиска с использованием пользовательского пакета элементов».

    Можно использовать оригинал imgSet или другой набор изображений для обучающего набора. Чтобы использовать другую коллекцию, создайте пакет визуальных слов перед созданием индекса изображения, используя bagOfFeatures функция. Преимущество использования одного и того же набора изображений заключается в том, что визуальный словарь адаптирован к набору поиска. Недостатком этого подхода является то, что система поиска должна заново изучить визуальный словарь для использования на резко отличающемся наборе изображений. С независимым набором визуальный словарь лучше способен обрабатывать добавления новых изображений в поисковый индекс.

  3. Проиндексировать изображения. indexImages создает индекс поиска, который сопоставляет визуальные слова с их вхождениями в коллекции изображений. При создании пакета визуальных слов с помощью независимой коллекции или коллекции подмножеств включите bag в качестве входного аргумента для indexImages. Если не создать независимый пакет визуальных слов, то функция создаст пакет на основе всего imgSet сбор входных данных. Можно добавлять и удалять изображения непосредственно в индекс изображения и из него с помощью addImages и removeImages методы.

  4. Поиск набора данных для аналогичных изображений. Используйте retrieveImages функция для поиска в наборе изображений изображений, аналогичных изображению запроса. Используйте NumResults для управления количеством результатов. Например, чтобы вернуть 10 наиболее похожих изображений, установите ROI для использования меньшей области изображения запроса. Область меньшего размера полезна для выделения определенного объекта в изображении, которое требуется найти.

Вычисление извлечения изображения

Используйте evaluateImageRetrieval функцию для оценки извлечения изображения с использованием изображения запроса с известным набором результатов. Если результаты не соответствуют ожидаемым, можно изменить или дополнить элементы изображения с помощью пакета визуальных слов. Проверьте тип полученных элементов. Тип элемента, используемого для извлечения, зависит от типа изображений в коллекции. Например, при поиске коллекции изображений, состоящей из сцен, таких как пляжи, города или магистрали, используйте функцию глобального изображения. Функция глобального изображения, такая как цветная гистограмма, захватывает ключевые элементы всей сцены. Чтобы найти определенные объекты в коллекциях изображений, используйте локальные элементы изображения, извлеченные вокруг ключевых точек объектов.

Связанные темы