При использовании сверточных нейронных сетей с данными облака точек определенные операции ядра, такие как свертка, требуют входных данных, которые регулярно дискретизируются пространственно. Нерегулярная пространственная выборка данных облака точек и лидара должна быть преобразована в некую регулярно отбираемую структуру в какой-то момент в трубопроводе предварительной обработки. Существует множество различных подходов к преобразованию данных облака точек в плотную сетчатую структуру [1] 2[] 3[]. Этот пример демонстрирует простой подход, известный как вокселизация.
Начните с определения хранилища данных для работы с набором данных городских объектов Сиднея.
dataPath = downloadSydneyUrbanObjects(tempdir); ds = loadSydneyUrbanObjectsData(dataPath);
Получение образцов выходных данных из хранилища данных.
data = preview(ds); disp(data)
{1×1 pointCloud} {[4wd]}
Просмотр образцов выходных данных из хранилища данных
figure
ptCloud = data{1};
pcshow(ptCloud);
label = string(data{2});
title(label);
Используйте pcbin для определения желаемой регулярной 3-D сетки системы координат ввода pointCloud объект. Использовать pcbin чтобы также вернуть массив выходных ячеек, который содержит пространственные ячейки для каждой точки на входе pointCloud. В этом случае вход pointCloud привязывается к выходной сетке [32,32,32] размера, которая охватывает XLimits, YLimits и ZLimits входного значенияpointCloud.
outputGridSize = [32,32,32];
bins = pcbin(data{1},outputGridSize);Каждая ячейка в bins содержит индексы точек в ptCloud.Location которые находятся в определенной точке. Функция MATLAB cellfun может использоваться для определения общих кодировок данных облака точек с помощью bins в качестве входных данных.
occupancyGrid = cellfun(@(c) ~isempty(c),bins);
Определите 3-D сетку занятости, которая является истинной для расположений сетки, которые заняты хотя бы одной точкой, а в противном случае - ложью.
figure; p = patch(isosurface(occupancyGrid,0.5)); view(45,45); p.FaceColor = 'red'; p.EdgeColor = 'none'; camlight; lighting phong

Используйте transform функция хранилища данных для применения простого кодирования сетки занятости к каждому наблюдению во входном хранилище данных. formOccupancyGrid функция, которая включена в раздел вспомогательных функций, использует точно такой же подход, показанный выше с pcbin.
dsTransformed = transform(ds,@formOccupancyGrid); exampleOutputData = preview(dsTransformed); disp(exampleOutputData);
{32×32×32 logical} {[4wd]}
Полученное хранилище данных, dsTransformed, может передаваться в интерфейсы глубокого обучения, в том числе trainNetwork и DataLoader для использования в обучении глубоких нейронных сетей.
[1] Maturana, D. и Scherer, S., VoxNet: 3D сверточная нейронная сеть для распознавания объектов в реальном времени, IROS 2015.
[2] AH Lang, S Vora, H Caesar, L Zhou, J Yang, O Beijbom,
[3] Чарльз Р. Ци, Хао Су, Кэйчун Мо, Леонидас Дж. Гуибас, PointNet: глубоко учась на наборах пункта для 3D классификации и сегментации, CVPR 2017
function datasetPath = downloadSydneyUrbanObjects(dataLoc) if nargin == 0 dataLoc = pwd(); end dataLoc = string(dataLoc); url = "http://www.acfr.usyd.edu.au/papers/data/"; name = "sydney-urban-objects-dataset.tar.gz"; if ~exist(fullfile(dataLoc,'sydney-urban-objects-dataset'),'dir') disp('Downloading Sydney Urban Objects Dataset...'); untar(url + name,dataLoc); end datasetPath = dataLoc.append('sydney-urban-objects-dataset'); end function ds = loadSydneyUrbanObjectsData(datapath,folds) % loadSydneyUrbanObjectsData Datastore with point clouds and % associated categorical labels for Sydney Urban Objects dataset. % % ds = loadSydneyUrbanObjectsData(datapath) constructs a datastore that % represents point clouds and associated categories for the Sydney Urban % Objects dataset. The input, datapath, is a string or char array which % represents the path to the root directory of the Sydney Urban Objects % Dataset. % % ds = loadSydneyUrbanObjectsData(___,folds) optionally allows % specification of desired folds that you wish to be included in the % output ds. For example, [1 2 4] specifies that you want the first, % second, and fourth folds of the Dataset. Default: [1 2 3 4]. if nargin < 2 folds = 1:4; end datapath = string(datapath); path = fullfile(datapath,'objects',filesep); % For now, include all folds in Datastore foldNames{1} = importdata(fullfile(datapath,'folds','fold0.txt')); foldNames{2} = importdata(fullfile(datapath,'folds','fold1.txt')); foldNames{3} = importdata(fullfile(datapath,'folds','fold2.txt')); foldNames{4} = importdata(fullfile(datapath,'folds','fold3.txt')); names = foldNames(folds); names = vertcat(names{:}); fullFilenames = append(path,names); ds = fileDatastore(fullFilenames,'ReadFcn',@extractTrainingData,'FileExtensions','.bin'); end function dataOut = extractTrainingData(fname) [pointData,intensity] = readbin(fname); [~,name] = fileparts(fname); name = string(name); name = extractBefore(name,'.'); labelNames = ["4wd","bench","bicycle","biker",... "building","bus","car","cyclist","excavator","pedestrian","pillar",... "pole","post","scooter","ticket_machine","traffic_lights","traffic_sign",... "trailer","trash","tree","truck","trunk","umbrella","ute","van","vegetation"]; label = categorical(name,labelNames); dataOut = {pointCloud(pointData,'Intensity',intensity),label}; end function [pointData,intensity] = readbin(fname) % readbin Read point and intensity data from Sydney Urban Object binary % files. % names = ['t','intensity','id',... % 'x','y','z',... % 'azimuth','range','pid'] % % formats = ['int64', 'uint8', 'uint8',... % 'float32', 'float32', 'float32',... % 'float32', 'float32', 'int32'] fid = fopen(fname, 'r'); c = onCleanup(@() fclose(fid)); fseek(fid,10,-1); % Move to the first X point location 10 bytes from beginning X = fread(fid,inf,'single',30); fseek(fid,14,-1); Y = fread(fid,inf,'single',30); fseek(fid,18,-1); Z = fread(fid,inf,'single',30); fseek(fid,8,-1); intensity = fread(fid,inf,'uint8',33); pointData = [X,Y,Z]; end function dataOut = formOccupancyGrid(data) grid = pcbin(data{1},[32 32 32]); occupancyGrid = cellfun(@(c) ~isempty(c),grid); label = data{2}; dataOut = {occupancyGrid,label}; end