distinct

Класс: matlab.compiler.mlspark.RDD
Пакет: matlab.compiler.mlspark

Возвращает новый RDD, содержащий отдельные элементы существующего RDD

Синтаксис

result = distinct(obj,numPartitions)

Описание

result = distinct(obj,numPartitions) возвращает новый RDD result содержащие отдельные элементы obj путем исключения повторяющихся значений.

Входные параметры

расширить все

RDD входа, заданный как RDD объект.

Количество создаваемых разделов, заданное как скалярное значение.

Типы данных: double

Выходные аргументы

расширить все

Конвейерный RDD, содержащий отдельные элементы входного RDD, возвращенный как RDD объект.

Примеры

расширить все

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% distinct
inputRDD = sc.parallelize({1,2,1,2});
dRDD = inputRDD.distinct();
viewRes = dRDD.glom().collect()  %{1,2}

См. также

| |

Введенный в R2016b