exponenta event banner

отличный

Класс: matlab.compiler.mlspark.RDD
Пакет: matlab.compiler.mlspark

Возврат нового RDD, содержащего отдельные элементы существующего RDD

Синтаксис

result = distinct(obj,numPartitions)

Описание

result = distinct(obj,numPartitions) возвращает новый RDD result содержащие различные элементы obj путем исключения повторяющихся значений.

Входные аргументы

развернуть все

Входной RDD, указанный как RDD объект.

Число создаваемых секций, указанное как скалярное значение.

Типы данных: double

Выходные аргументы

развернуть все

Конвейерный RDD, содержащий отдельные элементы входного RDD, возвращаемый как RDD объект.

Примеры

развернуть все

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% distinct
inputRDD = sc.parallelize({1,2,1,2});
dRDD = inputRDD.distinct();
viewRes = dRDD.glom().collect()  %{1,2}

См. также

| |

Представлен в R2016b