Этот пример показывает, как сгенерировать MEX-функцию от функции MATLAB®, которая вычисляет несоизмеримость стерео двух изображений.
CUDA включил NVIDIA®, графический процессор с вычисляет возможность 3.2 или выше.
NVIDIA инструментарий CUDA.
Переменные окружения для компиляторов и библиотек. Для получения дополнительной информации смотрите Переменные окружения.
Следующая строка кода создает папку в вашей текущей рабочей папке (pwd) и копирует все соответствующие файлы в эту папку. Если вы не хотите выполнять эту операцию или если вы не можете сгенерировать файлы в этой папке, изменить вашу текущую рабочую папку.
gpucoderdemo_setup('gpucoderdemo_stereo_disparity');
Используйте coder.checkGpuInstall, функционируют и проверяют, что компиляторы и библиотеки, необходимые для выполнения этого примера, настраиваются правильно.
envCfg = coder.gpuEnvConfig('host');
envCfg.BasicCodegen = 1;
envCfg.Quiet = 1;
coder.checkGpuInstall(envCfg);
Функция stereoDisparity.m берет два изображения и возвращает карту несоизмеримости стерео, вычисленную из двух изображений.
type stereoDisparity
%% modified algorithm for stereo disparity block matching % In this implementation instead of finding shifted image ,indices are mapped accordingly % to save memory and some processing RGBA column major packed data is used as input for % Compatibility with CUDA intrinsics Convolution is performed using separable filters (Horizontal and then Vertical) function [out_disp] = stereoDisparity(img0,img1) %#codegen % gpu code generation pragma coder.gpu.kernelfun; %% Stereo disparity Parameters % WIN_RAD is the radius of the window to be operated,min_disparity is the minimum disparity level % the search continues max_disparity is the maximun disparity level the search continues WIN_RAD = 8; min_disparity = -16; max_disparity = 0; %% Image dimensions for loop control % The number of channels packed are 4 (RGBA) so as nChannels are 4 [imgHeight,imgWidth]=size(img0); nChannels = 4; imgHeight = imgHeight/nChannels; %% To store the raw differences diff_img = zeros([imgHeight+2*WIN_RAD,imgWidth+2*WIN_RAD],'int32'); %To store the minimum cost min_cost = zeros([imgHeight,imgWidth],'int32'); min_cost(:,:) = 99999999; % Store the final disparity out_disp = zeros([imgHeight,imgWidth],'int16'); %% Filters for aggregating the differences % filter_h is the horizontal filter used in separable convolution % filter_v is the vertical filter used in separable convolution which % operates on the output of the row convolution filt_h = ones([1 17],'int32'); filt_v = ones([17 1],'int32'); %% Main Loop that runs for all the disparity levels. This loop is % expected to run on CPU. for d=min_disparity:max_disparity % Find the difference matrix for the current disparity level. Expect % this to generate a Kernel function. coder.gpu.kernel; for colIdx=1:imgWidth+2*WIN_RAD coder.gpu.kernel; for rowIdx=1:imgHeight+2*WIN_RAD % Row index calculation ind_h = rowIdx - WIN_RAD; % Column indices calculation for left image ind_w1 = colIdx - WIN_RAD; % Row indices calculation for right image ind_w2 = colIdx + d - WIN_RAD; % Border clamping for row Indices if ind_h <= 0 ind_h = 1; end if ind_h > imgHeight ind_h = imgHeight; end % Border clamping for column indices for left image if ind_w1 <= 0 ind_w1 = 1; end if ind_w1 > imgWidth ind_w1 = imgWidth; end % Border clamping for column indices for right image if ind_w2 <= 0 ind_w2 = 1; end if ind_w2 > imgWidth ind_w2 = imgWidth; end % In this step, Sum of absolute Differences is performed % across tour channels. tDiff = int32(0); for chIdx = 1:nChannels tDiff = tDiff + abs(int32(img0((ind_h-1)*(nChannels)+chIdx,ind_w1))-int32(img1((ind_h-1)*(nChannels)+chIdx,ind_w2))); end %Store the SAD cost into a matrix diff_img(rowIdx,colIdx) = tDiff; end end % Aggregating the differences using separable convolution. Expect this to generate two Kernel % using shared memory.The first kernel is the convolution with the horizontal kernel and second % kernel operates on its output the column wise convolution. cost_v = conv2(diff_img,filt_h,'valid'); cost = conv2(cost_v,filt_v,'valid'); % This part updates the min_cost matrix with by comparing the values % with current disparity level. for ll=1:imgWidth for kk=1:imgHeight % load the cost temp_cost = int32(cost(kk,ll)); % compare against the minimum cost available and store the % disparity value if min_cost(kk,ll) > temp_cost min_cost(kk,ll) = temp_cost; out_disp(kk,ll) = abs(d) + 8; end end end end end
img0 = imread('scene_left.png'); img1 = imread('scene_right.png'); [imgRGB0] = pack_rgbData(img0); [imgRGB1] = pack_rgbData(img1);
cfg = coder.gpuConfig('mex'); codegen -config cfg -args {imgRGB0, imgRGB1} stereoDisparity;
out_disp = stereoDisparity_mex(imgRGB0,imgRGB1); imagesc(out_disp);
Удалите файлы и возвратитесь к исходной папке
cleanup