parallelize

Класс: matlab.compiler.mlspark.SparkContext
Пакет: matlab.compiler.mlspark

Создайте RDD из набора локальных значений MATLAB

Синтаксис

rdd = parallelize(sc,cellArray)
rdd = parallelize(sc,cellArray,numSlices)

Описание

rdd = parallelize(sc,cellArray) создает RDD из набора локальных значений MATLAB®, сгруппированных как массив ячеек.

rdd = parallelize(sc,cellArray,numSlices) создает RDD с количеством разделов, заданных numSlices.

Входные параметры

развернуть все

SparkContext, чтобы использовать, заданный как SparkContext объект.

Набор значений, заданных как массив ячеек MATLAB.

Типы данных: cell

Количество разделов, чтобы создать, заданный как скаляр.

Типы данных: double

Выходные аргументы

развернуть все

Выход RDD, созданный из набора значений, и, возвратился как RDD объект.

Примеры

развернуть все

Создайте RDD из локальных значений MATLAB.

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% parallelize
x = sc.parallelize({1, 2, 3, 4, 5});
y = x.count()

Введенный в R2017b