distinct

Класс: matlab.compiler.mlspark.RDD
Пакет: matlab.compiler.mlspark

Возвратите новый RDD, содержащий отличные элементы существующего RDD

Синтаксис

result = distinct(obj,numPartitions)

Описание

result = distinct(obj,numPartitions) возвращает новый result RDD содержа отличные элементы obj путем устранения дублирующихся значений.

Входные параметры

развернуть все

Вход RDD в виде RDD объект.

Количество разделов, чтобы создать в виде скалярного значения.

Типы данных: double

Выходные аргументы

развернуть все

Конвейерный RDD, содержащий отличные элементы входа RDD, возвращенного как RDD объект.

Примеры

развернуть все

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% distinct
inputRDD = sc.parallelize({1,2,1,2});
dRDD = inputRDD.distinct();
viewRes = dRDD.glom().collect()  %{1,2}

Смотрите также

| |

Введенный в R2017b