union

Класс: набор данных

(Не Рекомендуемый) объединение Набора для наблюдений набора данных массивов

dataset тип данных не рекомендуется. Чтобы работать с гетерогенными данными, используйте MATLAB® table тип данных вместо этого. Смотрите MATLAB table документация для получения дополнительной информации.

Синтаксис

C = union(A,B)
C = union(A,B,vars)
C = union(A,B,vars,setOrder)
[C,iA,iB] = union(___)

Описание

C = union(A,B) для dataset массивы A и B возвращает объединенный набор наблюдений от этих двух массивов, с удаленными повторениями. Наблюдения в массиве набора данных C сортируются.

C = union(A,B,vars) возвращает объединенный набор наблюдений от этих двух массивов, с повторениями уникальных комбинаций переменных, заданных в vars удаленный. Наблюдения в массиве набора данных C сортируются по тем переменным.

Значения для переменных, не заданных в vars для каждого наблюдения в C взяты из соответствующего наблюдения в A или B, или от A если существуют общие наблюдения в обоих A и B. Если существует несколько наблюдений в A или B это соответствует наблюдению в C, те значения приняты от первого вхождения.

C = union(A,B,vars,setOrder) возвращает наблюдения в C в порядке, заданном setOrder.

[C,iA,iB] = union(___) также возвращает векторы индекса iA и iB таким образом, что C отсортированная комбинация значений A(iA,:) и B(iB,:). Если существуют общие наблюдения в A и B, затем union возвращает только индекс в A, в iA. Если существуют повторенные наблюдения в A или B, затем индекс первого вхождения возвращен. Можно использовать любой из предыдущих входных параметров.

Входные параметры

A,B

Введите массивы набора данных.

vars

Массив строк или массив ячеек из символьных векторов, содержащий имена переменных или вектор целых чисел, содержащих числа переменного столбца. vars указывает на переменные для который union удаляет повторения уникальных комбинаций переменных.

Задайте vars как [] использовать его значение по умолчанию всех переменных.

setOrder

Флаг, указывающий на порядок сортировки для наблюдений в C. Возможные значения setOrder :

'sorted'Наблюдения в C находятся в отсортированном порядке (значение по умолчанию).
'stable'Наблюдения в C находятся в том же порядке, что они появляются в A, затем B.

Выходные аргументы

C

Массив набора данных с объединенными наблюдениями за A и B, с удаленными повторениями. C находится в отсортированном порядке (по умолчанию) или порядке, заданном setOrder.

iA

Вектор индекса, указывая на наблюдения в A это способствует объединению. iA содержит индекс к первому вхождению любых повторных наблюдений в A.

iB

Вектор индекса, указывая на наблюдения в B это способствует объединению. Если существуют общие наблюдения в A и B, затем union возвращает только индекс в A, в iAib содержит индекс к первому вхождению любых повторных наблюдений в B.

Примеры

развернуть все

Загрузка демонстрационных данных.

A = dataset('XLSFile',fullfile(matlabroot,'help/toolbox/stats/examples','hospitalSmall.xlsx'));
B = dataset('XLSFile',fullfile(matlabroot,'help/toolbox/stats/examples','hospitalSmall.xlsx'),'Sheet',2);
[length(A) length(B)]
ans =

    14     8

Первый массив набора данных, A, имеет 14 наблюдений. Второй массив набора данных, B, имеет 8 наблюдений.

Возвратите объединение.

C = union(A,B);
length(C)
ans =

    21

У объединения двух массивов набора данных есть 21 наблюдение, указывая, что было одно наблюдение, реплицированное в A и B.