exponenta event banner

saveAsTallDatastore

Класс: matlab.compiler.mlspark.RDD
Пакет: matlab.compiler.mlspark

Сохраните RDD как массив уровня MATLAB в двоичном файле, который можно прочитать с помощью datastore функция

Синтаксис

saveAsMatlabBinaryFile(obj,path)

Описание

saveAsMatlabBinaryFile(obj,path) экономит obj в качестве высокого массива MATLAB ® в двоичном файле, который может быть прочитан с помощью datastore функция. path указывает местоположение каталога для сохранения двоичного файла.

Входные аргументы

развернуть все

Входной RDD, указанный как RDD объект.

Расположение каталога для сохранения двоичного файла, указанного как вектор символов, заключенный в ''.

Типы данных: char

Примеры

развернуть все

Сохраните RDD как массив уровня MATLAB в двоичном файле, который можно прочитать с помощью datastore функция.

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% saveAsTallDatastore 

% May require setting HADOOP_PREFIX or HADOOP_HOME environment variables to a
% valid Hadoop installation folder even if running locally.
% For example:
% setenv('HADOOP_PREFIX','/share/hadoop/hadoop-2.5.2')

inRDD = sc.parallelize({1,2,3,4,5});
% Store RDD in a file as a tall array that can be read back into MATLAB using datastore
inRDD.saveAsTallDatastore('myDir'); 
ds = datastore(['myDir' '/part*'], 'Type', 'tall');
ds.readall()
Представлен в R2016b