exponenta event banner

закодировать

Создание гистограммы вхождений визуальных слов

Описание

пример

featureVector = encode(bag,I) возвращает вектор признаков, который представляет гистограмму вхождений визуальных слов, содержащихся во входном изображении, I. Входной мешок содержит bagOfFeatures объект.

[featureVector,words] = encode(bag,I) дополнительно возвращает визуальные слова в виде visualWords объект. visualWords объект хранит визуальные слова, которые встречаются в I и сохраняет местоположение этих слов.

featureVector= encode(bag,imds) возвращает вектор признаков, который представляет гистограмму вхождений визуальных слов, содержащихся в imds. Вход bag содержит bagOfFeatures объект.

[featureVector,words] = encode(bag,imds) дополнительно возвращает массив visualWords вхождения в imds. visualWords объект хранит визуальные слова, которые встречаются в I и сохраняет местоположение этих слов.

[___] = encode(___,Name,Value) задает свойства, используя одну или несколько пар имя-значение. Заключите каждое имя свойства в кавычки. Например, encode('SparseOutput',false)

Этот метод поддерживает параллельные вычисления с использованием нескольких работников MATLAB ®. Включите параллельные вычисления в диалоговом окне «Настройки панели инструментов Computer Vision». Чтобы открыть настройки Toolbox™ компьютерного зрения, на вкладке Главная в разделе Среда щелкните Настройки. Затем выберите Инструмент компьютерного зрения (Computer Vision Toolbox).

Примеры

свернуть все

Загрузите набор изображений.

setDir  = fullfile(toolboxdir('vision'),'visiondata','imageSets');
imds = imageDatastore(setDir,'IncludeSubfolders',true,'LabelSource',...
    'foldernames');

Выберите первые два изображения из каждой метки.

trainingSet = splitEachLabel(imds,2);

Создание пакета элементов.

bag = bagOfFeatures(trainingSet);
Creating Bag-Of-Features.
-------------------------
* Image category 1: books
* Image category 2: cups
* Selecting feature point locations using the Grid method.
* Extracting SURF features from the selected feature point locations.
** The GridStep is [8 8] and the BlockWidth is [32 64 96 128].

* Extracting features from 4 images...done. Extracted 76800 features.

* Keeping 80 percent of the strongest features from each category.

* Using K-Means clustering to create a 500 word visual vocabulary.
* Number of features          : 61440
* Number of clusters (K)      : 500

* Initializing cluster centers...100.00%.
* Clustering...completed 21/100 iterations (~0.21 seconds/iteration)...converged in 21 iterations.

* Finished creating Bag-Of-Features

Закодируйте одно из изображений в вектор элементов.

img = readimage(trainingSet,1);
featureVector = encode(bag,img);

Входные аргументы

свернуть все

Пакет элементов, указанный как bagOfFeatures объект.

Входное изображение, I, указывается в градациях серого или в цветном цвете.

Изображения, указанные как ImageDatastore объект.

Аргументы пары «имя-значение»

Пример: «SparseOutput»,false

Тип нормализации, примененный к вектору элемента, указанный как разделенная запятыми пара, состоящая из "Normalization«и либо» 'L2' или 'none'.

Выходная разреженность, заданная как разделенная запятыми пара, состоящая из 'SparseOutput'и как true или false. Установить для этого свойства значение true для возврата визуальных гистограмм слов в разреженной матрице. Установка для этого свойства значения true уменьшение потребления памяти для больших визуальных словарей, где гистограммы визуальных слов содержат много нулевых элементов.

Включить отображение хода выполнения на экране, указанное как разделенная запятыми пара, состоящая из 'Verbose«и логическое» true или false.

Выходные аргументы

свернуть все

Гистограмма вхождений визуальных слов, указанных как M-by-bag.VocabularySize вектор, где M - общее количество изображений в imds, numel(imds.Files).

Объект визуальных слов, возвращаемый как объект визуальных слов или массив объектов визуальных слов. visualWords объект сохраняет визуальные слова, встречающиеся в изображениях, и местоположение этих слов.

Расширенные возможности

См. также

Представлен в R2014b