Закодируйте данные об облаке точек для глубокого обучения

При использовании сверточных нейронных сетей с данными об облаке точек определенные базовые операции как свертка требуют входных данных, который регулярно производится пространственно. Неправильная пространственная выборка облака точек и данных о лидаре должна быть преобразована в некоторую регулярно производимую структуру в какой-то момент в конвейере предварительной обработки. Существует много разных подходов к тому, как данные об облаке точек преобразовываются в плотную, структуру с координатной сеткой 1[] 2[] 3[]. Этот пример демонстрирует простой подход, известный voxelization.

Voxelization данных об облаке точек

Запустите путем определения datastore для работы с Сиднеем Городской Набор данных Объектов.

dataPath = downloadSydneyUrbanObjects(tempdir);
ds = loadSydneyUrbanObjectsData(dataPath);

Получите демонстрационные выходные данные из datastore.

data = preview(ds);
disp(data)
    {1×1 pointCloud}    {[4wd]}

Просмотрите демонстрационные выходные данные от datastore

figure
ptCloud = data{1};
pcshow(ptCloud);
label = string(data{2});
title(label);

Используйте pcbin функция, чтобы задать желаемый регулярный 3-D gridding системы координат входа pointCloud объект. Используйте pcbin также возвратить выходной массив ячеек, который содержит пространственные местоположения интервала для каждой точки во входе pointCloud. В этом случае, вход pointCloud сгруппировано в [32,32,32] размер выходная сетка, которая охватывает XLimits, YLimits и ZLimits входа pointCloud.

outputGridSize = [32,32,32];
bins = pcbin(data{1},outputGridSize);

Каждая ячейка в bins содержит индексы точек в ptCloudместоположение то падение конкретного местоположения точки. Функция MATLAB cellfun может использоваться, чтобы задать общую кодировку данных об облаке точек с помощью bins как введено.

occupancyGrid = cellfun(@(c) ~isempty(c),bins);

Задайте 3-D сетку заполнения, которая верна для местоположений сетки, которые заняты по крайней мере одной точкой и ложью в противном случае.

figure;
p = patch(isosurface(occupancyGrid,0.5));
view(45,45);
p.FaceColor = 'red';
p.EdgeColor = 'none';
camlight;
lighting phong

Преобразуйте Datastore, чтобы применить кодирование облака точек к набору данных в целом

Используйте transform функция datastore, чтобы применить простое кодирование сетки заполнения к каждому наблюдению во входном datastore. formOccupancyGrid функция, которая включена в раздел функций поддержки, использует тот же самый подход, показанный выше с pcbin.

dsTransformed = transform(ds,@formOccupancyGrid);
exampleOutputData = preview(dsTransformed);
disp(exampleOutputData);
    {32×32×32 logical}    {[4wd]}

Получившийся datastore, dsTransformed, может быть передан интерфейсам глубокого обучения включая trainNetwork и DataLoader для использования в учебных глубоких нейронных сетях.

Ссылки

[1] Maturana, D. и Scherer, S., VoxNet: 3D сверточная нейронная сеть для алгоритма распознавания в реальном времени, IROS 2015.

[2] AH Ленг, S Vora, Х Цезарь, Л Чжоу, Дж Янг, O Beijbom, PointPillars: быстрые энкодеры для обнаружения объектов от облаков точек, CVPR 2019

[3] Чарльз Р. Ци, Хао Су, Кэйчун Мо, Леонидас Дж. Гуибас, PointNet: глубокое обучение на наборах точки для 3D классификации и сегментации, CVPR 2017

Вспомогательные Функции

function datasetPath = downloadSydneyUrbanObjects(dataLoc)

if nargin == 0
    dataLoc = pwd();
end

dataLoc = string(dataLoc);

url = "http://www.acfr.usyd.edu.au/papers/data/";
name = "sydney-urban-objects-dataset.tar.gz";

if ~exist(fullfile(dataLoc,'sydney-urban-objects-dataset'),'dir')
    disp('Downloading Sydney Urban Objects Dataset...');
    untar(url + name,dataLoc);
end

datasetPath = dataLoc.append('sydney-urban-objects-dataset');

end

function ds = loadSydneyUrbanObjectsData(datapath,folds)
% loadSydneyUrbanObjectsData Datastore with point clouds and
% associated categorical labels for Sydney Urban Objects dataset.
%
% ds = loadSydneyUrbanObjectsData(datapath) constructs a datastore that
% represents point clouds and associated categories for the Sydney Urban
% Objects dataset. The input, datapath, is a string or char array which
% represents the path to the root directory of the Sydney Urban Objects
% Dataset.
%
% ds = loadSydneyUrbanObjectsData(___,folds) optionally allows
% specification of desired folds that you wish to be included in the
% output ds. For example, [1 2 4] specifies that you want the first,
% second, and fourth folds of the Dataset. Default: [1 2 3 4].

if nargin < 2
    folds = 1:4;
end

datapath = string(datapath);
path = fullfile(datapath,'objects',filesep);

% For now, include all folds in Datastore
foldNames{1} = importdata(fullfile(datapath,'folds','fold0.txt'));
foldNames{2} = importdata(fullfile(datapath,'folds','fold1.txt'));
foldNames{3} = importdata(fullfile(datapath,'folds','fold2.txt'));
foldNames{4} = importdata(fullfile(datapath,'folds','fold3.txt'));
names = foldNames(folds);
names = vertcat(names{:});

fullFilenames = append(path,names);
ds = fileDatastore(fullFilenames,'ReadFcn',@extractTrainingData,'FileExtensions','.bin');

end

function dataOut = extractTrainingData(fname)

[pointData,intensity] = readbin(fname);

[~,name] = fileparts(fname);
name = string(name);
name = extractBefore(name,'.');

labelNames = ["4wd","bench","bicycle","biker",...
    "building","bus","car","cyclist","excavator","pedestrian","pillar",...
    "pole","post","scooter","ticket_machine","traffic_lights","traffic_sign",...
    "trailer","trash","tree","truck","trunk","umbrella","ute","van","vegetation"];

label = categorical(name,labelNames);

dataOut = {pointCloud(pointData,'Intensity',intensity),label};

end

function [pointData,intensity] = readbin(fname)
% readbin Read point and intensity data from Sydney Urban Object binary
% files.

% names = ['t','intensity','id',...
%          'x','y','z',...
%          'azimuth','range','pid']
% 
% formats = ['int64', 'uint8', 'uint8',...
%            'float32', 'float32', 'float32',...
%            'float32', 'float32', 'int32']

fid = fopen(fname, 'r');
c = onCleanup(@() fclose(fid));
    
fseek(fid,10,-1); % Move to the first X point location 10 bytes from beginning
X = fread(fid,inf,'single',30);
fseek(fid,14,-1);
Y = fread(fid,inf,'single',30);
fseek(fid,18,-1);
Z = fread(fid,inf,'single',30);

fseek(fid,8,-1);
intensity = fread(fid,inf,'uint8',33);

pointData = [X,Y,Z];

end

function dataOut = formOccupancyGrid(data)

grid = pcbin(data{1},[32 32 32]);
occupancyGrid = cellfun(@(c) ~isempty(c),grid);
label = data{2};
dataOut = {occupancyGrid,label};

end