roialign

Неквантованное объединение ROI dlarray данные

Описание

ROI выравнивает пулы операции прямоугольный ROI в фиксированные размерные интервалы, не квантуя узлы решетки к самому близкому пикселю. Функция использует билинейную интерполяцию, чтобы вывести значение в каждом узле решетки.

Учитывая входные данные размера [H W C N], где C является количеством каналов и N, количество наблюдений, объединенные данные о глубоком обучении имеют размер [h w C sum(M)], где h и w являются заданным выходным размером. M является вектором из длины, N и M (i) являются количеством ROI, сопоставленных с i-th наблюдение.

Примечание

Выполнять объединение ROI в layerGraph Объект (Deep Learning Toolbox) или Layer (Deep Learning Toolbox) массив, использовать roiAlignLayer.

Эта функция требует Deep Learning Toolbox™.

пример

dlY = roialign(dlX,boxes,outputSize) выполняет операцию объединения по пространственным измерениям входа X для каждой ограничительной рамки в boxes. Выходные параметры, Y, имеют размер outputSize.

dlY = roialign(dlX,boxes,outputSize,Name=Value) задает дополнительные аргументы name-value.

Примеры

свернуть все

Создайте 4-D, отформатированный dlarray объект, который симулирует пакет двух изображений RGB.

X = dlarray(rand(10,10,3,2),"SSCB");

Задайте положение и обработайте индекс в пакетном режиме одной ограничительной рамки.

startXY = [2 2];
endXY = [4 4];
batchIdx = 1;
rois = [startXY endXY batchIdx]';

Выполните объединение ROI с выходным размером 3х3.

Y = roialign(X,rois,[3 3])
Y = 
  3(S) x 3(S) x 3(C) x 1(B) single dlarray


(:,:,1) =

    0.7464    0.3069    0.1780
    0.9212    0.8491    0.4677
    0.7303    0.9057    0.3840


(:,:,2) =

    0.3024    0.6428    0.6594
    0.1542    0.0046    0.1228
    0.6295    0.5182    0.3304


(:,:,3) =

    0.4915    0.7590    0.5035
    0.4574    0.4302    0.5453
    0.2960    0.2666    0.5389

Входные параметры

свернуть все

Данные о глубоком обучении, чтобы объединить в виде 4-D отформатировали dlarray Объект (Deep Learning Toolbox) с форматом данных "SSCB".

Ограничительные рамки в виде 5 N числовой матрицей, где N является количеством ограничительных рамок. Каждая ограничительная рамка отформатирована как вектор-столбец формы [x_start; 'YStart' ; x_end; y_end; batchIdx], где:

  • x_start и y_start задают (x, y) координаты верхнего левого угла прямоугольника.

  • x_end и y_end задают (x, y) координаты нижнего правого угла прямоугольника.

  • batchIdx задает индекс наблюдения, соответствующего прямоугольнику.

По умолчанию, boxes находятся в том же координатном пространстве и шкале как входные данные о глубоком обучении dlX.

Объединенный выходной размер в виде вектора из двух положительных целых чисел [h w], где h высота и w ширина.

Аргументы name-value

Задайте дополнительные пары аргументов как Name1=Value1,...,NameN=ValueN, где Name имя аргумента и Value соответствующее значение. Аргументы name-value должны появиться после других аргументов, но порядок пар не имеет значения.

Пример: dlY = roialign(dlX,boxes,outputSize,ROIScale=2) масштабирует вход ROI на коэффициент 2

Отношение шкалы входной функции сопоставляет с той из координат ROI. Это отношение указывает, что фактор раньше масштабировал вход ROI к входному размеру карты функции.

Количество отсчетов в каждом объединенном интервале в виде "auto" или вектор-строка из двух положительных целых чисел. Этими двумя элементами является количество вертикальных и горизонтальных выборок, соответственно.

Если вы не задаете отношение выборки, то количество вертикальных выборок имеет значение по умолчанию ceil(roiHeight/outputHeight). Аналогично, количество горизонтальных выборок имеет значение по умолчанию ceil(roiWidth/outputWidth).

Типы данных: double | char

Выходные аргументы

свернуть все

Объединенные данные о глубоком обучении, возвращенные как 4-D, отформатировали dlarray Объект (Deep Learning Toolbox) с форматом данных "SSCB".

Больше о

свернуть все

ROI выравнивается

ROI выравнивается, операция возвращает карты функции фиксированного размера для каждого прямоугольного ROI во входе dlarray. Функциональные первые разделы ROI в фиксированные размерные интервалы размера OutputSize не квантуя узлы решетки. Каждый интервал далее производится в SamplingRatio местоположения. Значение в каждой произведенной точке выведено с помощью билинейной интерполяции. Среднее значение произведенных значений возвращено как выходное значение каждого объединенного интервала.

Расширенные возможности

Введенный в R2021b