partition

Класс: matlab.io.datastore.Partitionable
Пакет: matlab.io.datastore

Разделите datastore

Синтаксис

subds = partition(ds,n,index)

Описание

subds = partition(ds,n,index) datastore разделов ds в количество частей, заданных n и возвращает раздел, соответствующий индексу index. Разделенный datastore subds имеет тот же тип как входной datastore ds.

Входные параметры

развернуть все

`ds` — Введите datastore
`matlab.io.Datastore` объект

Введите datastore, заданный как matlab.io.Datastore объект. Создать Datastore возразите, смотрите matlab.io.Datastore.

`n` Количество разделов
положительное целое число

Количество разделов, заданных как положительное целое число. Получить рыночную стоимость для n, используйте numpartitions функция.

Когда вы задаете значение n это не находится в области значений разделов, доступных для datastore, partition метод возвращает пустой datastore. Для получения дополнительной информации смотрите Пустые Хранилища данных. Например, если datastore может содержать до 10 разделы, затем выход partition метод зависит от значения n.

Если заданное значение n меньше чем или равно 10, затем partition метод возвращает раздел, заданный index. Например, partition(ds,10,1) возвращает копию первого раздела исходного datastore ds.
Если заданное значение n больше 10, затем partition метод возвращает пустой datastore. Например, partition(ds,100,11) возвращает пустой datastore.

Пример 3

Типы данных: double

`index` — Индекс
положительное целое число

Индексируйте, заданный как положительное целое число.

Пример 1

Типы данных: double

Атрибуты

Abstract true

Чтобы узнать об атрибутах методов, см. "Атрибуты метода".

Примеры

развернуть все

Создание Datastore с поддержкой параллельной обработки

Открыть скрипт

Создайте datastore с поддержкой параллельной обработки и используйте ее, чтобы принести ваши пользовательские или собственные данные в MATLAB®. Затем обработайте данные в параллельном пуле.

Создайте .m файл определения класса, который содержит код, реализующий ваш пользовательский datastore. Необходимо сохранить этот файл в рабочей папке или в папке, которая находится на пути MATLAB®. Имя .m файл должен совпасть с именем вашей функции конструктора Object. Например, если вы хотите, чтобы ваша функция конструктора имела имя MyDatastorePar, затем имя .m файлом должен быть MyDatastorePar.m. .m файл определения класса должен содержать следующие шаги:

Шаг 1: Наследуйтесь классам datastore.
Шаг 2: Задайте конструктора и требуемые методы.
Шаг 3: Задайте свою пользовательскую функцию чтения файла.

В дополнение к этим шагам задайте любые другие свойства или методы, что необходимо обработать и анализировать данные.

%% STEP 1: INHERIT FROM DATASTORE CLASSES
classdef MyDatastorePar < matlab.io.Datastore & ...
        matlab.io.datastore.Partitionable
   
    properties(Access = private)
        CurrentFileIndex double
        FileSet matlab.io.datastore.DsFileSet
    end
    
    % Property to support saving, loading, and processing of
    % datastore on different file system machines or clusters.
    % In addition, define the methods get.AlternateFileSystemRoots()
    % and set.AlternateFileSystemRoots() in the methods section. 
    properties(Dependent)
        AlternateFileSystemRoots
    end
    
%% STEP 2: DEFINE THE CONSTRUCTOR AND THE REQUIRED METHODS
    methods
        % Define your datastore constructor
        function myds = MyDatastorePar(location,altRoots)
            myds.FileSet = matlab.io.datastore.DsFileSet(location,...
                'FileExtensions','.bin', ...
                'FileSplitSize',8*1024);
            myds.CurrentFileIndex = 1;
             
            if nargin == 2
                 myds.AlternateFileSystemRoots = altRoots;
            end
            
            reset(myds);
        end
        
        % Define the hasdata method
        function tf = hasdata(myds)
            % Return true if more data is available
            tf = hasfile(myds.FileSet);
        end
        
        % Define the read method
        function [data,info] = read(myds)
            % Read data and information about the extracted data
            % See also: MyFileReader()
            if ~hasdata(myds)
                msgII = ['Use the reset method to reset the datastore ',... 
                         'to the start of the data.']; 
                msgIII = ['Before calling the read method, ',...
                          'check if data is available to read ',...
                          'by using the hasdata method.'];
                error('No more data to read.\n%s\n%s',msgII,msgIII);
            end
            
            fileInfoTbl = nextfile(myds.FileSet);
            data = MyFileReader(fileInfoTbl);
            info.Size = size(data);
            info.FileName = fileInfoTbl.FileName;
            info.Offset = fileInfoTbl.Offset;
            
            % Update CurrentFileIndex for tracking progress
            if fileInfoTbl.Offset + fileInfoTbl.SplitSize >= ...
                    fileInfoTbl.FileSize
                myds.CurrentFileIndex = myds.CurrentFileIndex + 1 ;
            end
        end
        
        % Define the reset method
        function reset(myds)
            % Reset to the start of the data
            reset(myds.FileSet);
            myds.CurrentFileIndex = 1;
        end

        % Define the partition method
        function subds = partition(myds,n,ii)
            subds = copy(myds);
            subds.FileSet = partition(myds.FileSet,n,ii);
            reset(subds);
        end
        
        % Getter for AlternateFileSystemRoots property
        function altRoots = get.AlternateFileSystemRoots(myds)
            altRoots = myds.FileSet.AlternateFileSystemRoots;
        end

        % Setter for AlternateFileSystemRoots property
        function set.AlternateFileSystemRoots(myds,altRoots)
            try
              % The DsFileSet object manages AlternateFileSystemRoots
              % for your datastore
              myds.FileSet.AlternateFileSystemRoots = altRoots;

              % Reset the datastore
              reset(myds);  
            catch ME
              throw(ME);
            end
        end
      
    end
    
    methods (Hidden = true)          
        % Define the progress method
        function frac = progress(myds)
            % Determine percentage of data read from datastore
            if hasdata(myds) 
               frac = (myds.CurrentFileIndex-1)/...
                             myds.FileSet.NumFiles; 
            else 
               frac = 1;  
            end 
        end
    end
    
    methods(Access = protected)
        % If you use the  FileSet property in the datastore,
        % then you must define the copyElement method. The
        % copyElement method allows methods such as readall
        % and preview to remain stateless 
        function dscopy = copyElement(ds)
            dscopy = copyElement@matlab.mixin.Copyable(ds);
            dscopy.FileSet = copy(ds.FileSet);
        end
        
        % Define the maxpartitions method
        function n = maxpartitions(myds)
            n = maxpartitions(myds.FileSet);
        end
    end
end

%% STEP 3: IMPLEMENT YOUR CUSTOM FILE READING FUNCTION
function data = MyFileReader(fileInfoTbl)
% create a reader object using FileName
reader = matlab.io.datastore.DsFileReader(fileInfoTbl.FileName);

% seek to the offset
seek(reader,fileInfoTbl.Offset,'Origin','start-of-file');

% read fileInfoTbl.SplitSize amount of data
data = read(reader,fileInfoTbl.SplitSize);

end

Ваш пользовательский datastore теперь готов. Используйте свой пользовательский datastore, чтобы считать и обработать данные в параллельном пуле.

Больше о

развернуть все

Пустые хранилища данных

Пустой datastore является объектом datastore, который не содержит записей. Для пустого datastore ваши пользовательские методы datastore должны удовлетворить этим условиям:

hasdata должен возвратить false.
read должен возвратить ошибку.
numpartitions и maxpartitions должен возвратить 0.
partition должен возвратить пустой datastore.
preview и readall должен возвратить пустые данные, которые сохраняют невысокие размерности. Например, если read метод на непустом datastore возвращает данные, которые имеют размер 5- 15- 25, затем preview и readall методы должны возвратить пустые данные размера 0- 15- 25.

Невысокие размерности

Размерности кроме первой размерности массива. Для массива размера 5- 15- 25, высокой размерностью является 5 и невысокими размерностями является 15 и 25.

Советы

В вашей реализации partition метод, необходимо включать эти шаги.
- Прежде, чем создать разделенный datastore subds, создайте глубокую копию исходного datastore ds.
- В конце partition метод, сброс разделенный datastore subds.
Для демонстрационной реализации partition метод, смотрите, Добавляет Поддержка Параллельной обработки.
Когда раздел datastore не содержит читаемой записи, read метод должен возвратить пустые данные. Невысокие размерности этих пустых данных должны совпадать с невысокими размерностями read метод выводится на разделе с читаемыми записями. Это требование гарантирует что поведение readall метод совпадает с поведением gather функция.

Документация

partition

Синтаксис

Описание

Входные параметры

`ds` — Введите datastore
`matlab.io.Datastore` объект

`n` Количество разделов
положительное целое число

`index` — Индекс
положительное целое число

Атрибуты

Примеры

Создание Datastore с поддержкой параллельной обработки

Больше о

Пустые хранилища данных

Невысокие размерности

Советы

Смотрите также

Введенный в R2017b

Документация MATLAB

Поддержка

Документация

partition

Синтаксис

Описание

Входные параметры

ds — Введите datastore matlab.io.Datastore объект

n Количество разделов положительное целое число

index — Индекс положительное целое число

Атрибуты

Примеры

Создание Datastore с поддержкой параллельной обработки

Больше о

Пустые хранилища данных

Невысокие размерности

Советы

Смотрите также

Введенный в R2017b

Документация MATLAB

Поддержка

`ds` — Введите datastore
`matlab.io.Datastore` объект

`n` Количество разделов
положительное целое число

`index` — Индекс
положительное целое число