При использовании сверточных нейронных сетей с данными облака точек некоторые основные операции, такие как свертка, требуют входных данных, которые регулярно дискретизируются пространственно. Нерегулярная пространственная выборка облака точек и лидарных данных должна быть преобразована в некоторую регулярно отбираемую структуру в некоторой точке трубопровода предварительной обработки. Существует множество различных подходов к преобразованию данных облака точек в плотную сетчатую структуру [1] 2[] 3[]. Этот пример демонстрирует простой подход, известный как вокселизация.
Начните, определив datastore для работы с Sydney Urban Objects Dataset.
dataPath = downloadSydneyUrbanObjects(tempdir); ds = loadSydneyUrbanObjectsData(dataPath);
Получите выборку выходных данных из datastore.
data = preview(ds); disp(data)
{1×1 pointCloud} {[4wd]}
Просмотрите выборку выходных данных из datastore
figure ptCloud = data{1}; pcshow(ptCloud); label = string(data{2}); title(label);
Используйте pcbin
функция для определения требуемой регулярной 3-D сетки системы координат входного pointCloud
объект. Использование pcbin
чтобы также вернуть массив ячеек выхода, который содержит пространственные положения интервала для каждой точки во входе pointCloud
. В этом случае вход pointCloud
привязан в выходной сетке [32,32,32] размера, которая охватывает XLimits, YLimits и ZLimits входного pointCloud
.
outputGridSize = [32,32,32]; bins = pcbin(data{1},outputGridSize);
Каждая камера в bins
содержит индексы точек в ptCloud
. Location
которые попадают в конкретное местоположение точки. Функция MATLAB cellfun
может использоваться для определения общих кодировок данных облака точек с помощью bins
как вход.
occupancyGrid = cellfun(@(c) ~isempty(c),bins);
Задайте сетку заполнения 3-D, которая является true для расположений сетки, которые заняты, по крайней мере, одной точкой и false в противном случае.
figure; p = patch(isosurface(occupancyGrid,0.5)); view(45,45); p.FaceColor = 'red'; p.EdgeColor = 'none'; camlight; lighting phong
Используйте transform
функция datastore для применения простой сетки заполнения к каждому наблюдению в вход datastore. The formOccupancyGrid
функция, которая включена в раздел вспомогательных функций, использует точно такой же подход, показанный выше с pcbin
.
dsTransformed = transform(ds,@formOccupancyGrid); exampleOutputData = preview(dsTransformed); disp(exampleOutputData);
{32×32×32 logical} {[4wd]}
Получившийся datastore, dsTransformed
, может быть передан в интерфейсы глубокого обучения, включая trainNetwork
и DataLoader
для использования в обучении глубоких нейронных сетей.
[1] Maturana, D. and Scherer, S., VoxNet: A 3D сверточная нейронная сеть для алгоритма распознавания в реальном времени, IROS 2015.
[2] AH Lang, S Vora, H Caesar, L Zhou, J Yang, O Beijbom, PointPillars: быстрые энкодеры для обнаружения объектов из облаков точек, CVPR 2019
[3] Charles R. Qi, Hao Su, Kaichun Mo, Leonidas J. Guibas, PointNet: Глубокое обучение on Point Sets for 3D Classification and Segmentation, CVPR 2017
function datasetPath = downloadSydneyUrbanObjects(dataLoc) if nargin == 0 dataLoc = pwd(); end dataLoc = string(dataLoc); url = "http://www.acfr.usyd.edu.au/papers/data/"; name = "sydney-urban-objects-dataset.tar.gz"; if ~exist(fullfile(dataLoc,'sydney-urban-objects-dataset'),'dir') disp('Downloading Sydney Urban Objects Dataset...'); untar(url + name,dataLoc); end datasetPath = dataLoc.append('sydney-urban-objects-dataset'); end function ds = loadSydneyUrbanObjectsData(datapath,folds) % loadSydneyUrbanObjectsData Datastore with point clouds and % associated categorical labels for Sydney Urban Objects dataset. % % ds = loadSydneyUrbanObjectsData(datapath) constructs a datastore that % represents point clouds and associated categories for the Sydney Urban % Objects dataset. The input, datapath, is a string or char array which % represents the path to the root directory of the Sydney Urban Objects % Dataset. % % ds = loadSydneyUrbanObjectsData(___,folds) optionally allows % specification of desired folds that you wish to be included in the % output ds. For example, [1 2 4] specifies that you want the first, % second, and fourth folds of the Dataset. Default: [1 2 3 4]. if nargin < 2 folds = 1:4; end datapath = string(datapath); path = fullfile(datapath,'objects',filesep); % For now, include all folds in Datastore foldNames{1} = importdata(fullfile(datapath,'folds','fold0.txt')); foldNames{2} = importdata(fullfile(datapath,'folds','fold1.txt')); foldNames{3} = importdata(fullfile(datapath,'folds','fold2.txt')); foldNames{4} = importdata(fullfile(datapath,'folds','fold3.txt')); names = foldNames(folds); names = vertcat(names{:}); fullFilenames = append(path,names); ds = fileDatastore(fullFilenames,'ReadFcn',@extractTrainingData,'FileExtensions','.bin'); end function dataOut = extractTrainingData(fname) [pointData,intensity] = readbin(fname); [~,name] = fileparts(fname); name = string(name); name = extractBefore(name,'.'); labelNames = ["4wd","bench","bicycle","biker",... "building","bus","car","cyclist","excavator","pedestrian","pillar",... "pole","post","scooter","ticket_machine","traffic_lights","traffic_sign",... "trailer","trash","tree","truck","trunk","umbrella","ute","van","vegetation"]; label = categorical(name,labelNames); dataOut = {pointCloud(pointData,'Intensity',intensity),label}; end function [pointData,intensity] = readbin(fname) % readbin Read point and intensity data from Sydney Urban Object binary % files. % names = ['t','intensity','id',... % 'x','y','z',... % 'azimuth','range','pid'] % % formats = ['int64', 'uint8', 'uint8',... % 'float32', 'float32', 'float32',... % 'float32', 'float32', 'int32'] fid = fopen(fname, 'r'); c = onCleanup(@() fclose(fid)); fseek(fid,10,-1); % Move to the first X point location 10 bytes from beginning X = fread(fid,inf,'single',30); fseek(fid,14,-1); Y = fread(fid,inf,'single',30); fseek(fid,18,-1); Z = fread(fid,inf,'single',30); fseek(fid,8,-1); intensity = fread(fid,inf,'uint8',33); pointData = [X,Y,Z]; end function dataOut = formOccupancyGrid(data) grid = pcbin(data{1},[32 32 32]); occupancyGrid = cellfun(@(c) ~isempty(c),grid); label = data{2}; dataOut = {occupancyGrid,label}; end