Документация

Y = prctile(X,p) возвращает процентили элементов в векторе данных или массиве X для процентов p в интервале [0,100].

Если X является вектором, то Y - скаляр или вектор с той же длиной, что и запрашиваемое число процентилей (length(p)). Y(i) содержит p(i) процентиль.
Если X является матрицей, то Y - вектор строки или матрица, где число строк Y равно количеству запрошенных процентилей (length(p)). iтретий ряд Y содержит p(i) процентили каждого столбца X.
Для многомерных массивов: prctile работает по первому несинглтонному размеру X.

Y = prctile(X,p,'all') возвращает процентили всех элементов X.

Y = prctile(X,p,dim) возвращает процентили вдоль рабочего измерения dim.

Y = prctile(X,p,vecdim) возвращает процентили по размерам, указанным в векторе vecdim. Например, если X является матрицей, то prctile(X,50,[1 2]) возвращает 50-й процентиль всех элементов X поскольку каждый элемент матрицы содержится в срезе массива, определяемом размерами 1 и 2.

Y = prctile(___,'Method',method) возвращает либо точные, либо приблизительные процентили на основе значения method, используя любую из комбинаций входных аргументов в предыдущих синтаксисах.

Примеры

Процентили вектора данных

Создайте набор данных размера 10.

rng('default'); % for reproducibility
x = normrnd(5,2,1,10)

x = 1×10

    6.0753    8.6678    0.4823    6.7243    5.6375    2.3846    4.1328    5.6852   12.1568   10.5389

Рассчитайте 42-й процентиль.

Y = prctile(x,42)

Y = 5.6709

Процентили всех ценностей

Найдите процентили всех значений в массиве.

Создание массива 3 на 5 на 2 X.

X = reshape(1:30,[3 5 2])

X = 
X(:,:,1) =

     1     4     7    10    13
     2     5     8    11    14
     3     6     9    12    15


X(:,:,2) =

    16    19    22    25    28
    17    20    23    26    29
    18    21    24    27    30

Найти 40-й и 60-й процентили элементов X.

Y = prctile(X,[40 60],'all')

Y(1) является 40-м процентилем X, и Y(2) является 60-м процентилем X.

Процентили матрицы данных

Вычислите процентили вдоль столбцов и строк матрицы данных для указанных процентов.

Создайте матрицу данных 5 на 5.

X = (1:5)'*(2:6)

X = 5×5

     2     3     4     5     6
     4     6     8    10    12
     6     9    12    15    18
     8    12    16    20    24
    10    15    20    25    30

Рассчитайте 25-й, 50-й и 75-й процентили вдоль столбцов X.

Y = prctile(X,[25 50 75],1)

Y = 3×5

    3.5000    5.2500    7.0000    8.7500   10.5000
    6.0000    9.0000   12.0000   15.0000   18.0000
    8.5000   12.7500   17.0000   21.2500   25.5000

Строки Y соответствуют процентилям столбцов X. Например, 25-й, 50-й и 75-й процентили третьего столбца X с элементами (4, 8, 12, 16, 20) соответственно 7, 12 и 17. Y = prctile(X,[25 50 75]) возвращает ту же матрицу процентиля.

Рассчитайте 25-й, 50-й и 75-й процентили вдоль строк X.

Y = prctile(X,[25 50 75],2)

Y = 5×3

    2.7500    4.0000    5.2500
    5.5000    8.0000   10.5000
    8.2500   12.0000   15.7500
   11.0000   16.0000   21.0000
   13.7500   20.0000   26.2500

Строки Y соответствуют процентилям строк X. Например, 25-й, 50-й и 75-й процентили первого ряда X с элементами (2, 3, 4, 5, 6) соответственно 2,75, 4 и 5,25.

Процентили многомерного массива

Поиск процентилей многомерного массива по нескольким измерениям одновременно.

Создание массива 3 на 5 на 2 X.

X = reshape(1:30,[3 5 2])

X = 
X(:,:,1) =

     1     4     7    10    13
     2     5     8    11    14
     3     6     9    12    15


X(:,:,2) =

    16    19    22    25    28
    17    20    23    26    29
    18    21    24    27    30

Рассчитайте 40-й и 60-й процентили для каждой страницы X путем задания размеров 1 и 2 в качестве рабочих размеров.

Ypage = prctile(X,[40 60],[1 2])

Ypage = 
Ypage(:,:,1) =

    6.5000
    9.5000


Ypage(:,:,2) =

   21.5000
   24.5000

Например, Ypage(1,1,1) является 40-м процентилем первой страницы X, и Ypage(2,1,1) 60-й процентиль первой страницы X.

Вычислите 40-й и 60-й процентили элементов в каждом X(:,i,:) путем задания размеров 1 и 3 в качестве рабочих размеров.

Ycol = prctile(X,[40 60],[1 3])

Ycol = 2×5

    2.9000    5.9000    8.9000   11.9000   14.9000
   16.1000   19.1000   22.1000   25.1000   28.1000

Например, Ycol(1,4) - 40-й процентиль элементов в X(:,4,:), и Ycol(2,4) - 60-й процентиль элементов в X(:,4,:).

Процентили вектора роста для заданного процента

Вычислите точные и приблизительные процентили вектора высокого столбца для заданного процента.

При выполнении вычислений в массивах TALL MATLAB ® использует либо параллельный пул (по умолчанию при наличии Toolbox™ Parallel Computing), либо локальный сеанс MATLAB. Для выполнения примера с использованием локального сеанса MATLAB при наличии панели инструментов Parallel Computing Toolbox измените глобальную среду выполнения с помощью mapreducer функция.

mapreducer(0)

Создание хранилища данных для airlinesmall набор данных. Удовольствие 'NA' значения как отсутствующие данные, так что datastore заменяет их на NaN значения. Укажите для работы с ArrTime переменная.

ds = datastore('airlinesmall.csv','TreatAsMissing','NA',...
    'SelectedVariableNames','ArrTime');

Создайте в верхней части хранилища данных таблицу высокого уровня и извлеките данные из таблицы высокого уровня в вектор высокого уровня.

t = tall(ds) % Tall table

t =

  Mx1 tall table

    ArrTime
    _______

      735  
     1124  
     2218  
     1431  
      746  
     1547  
     1052  
     1134  
       :
       :

x = t{:,:}   % Tall vector

x =

  Mx1 tall double column vector

         735
        1124
        2218
        1431
         746
        1547
        1052
        1134
         :
         :

Вычислите точный 50-й процентиль x. Поскольку x является вектором высокого столбца и p является скаляром, prctile возвращает точное значение процентиля по умолчанию.

p = 50;
yExact = prctile(x,p)

yExact =

  tall double

    ?

Вычислите приблизительно 50-й процентиль x. Укажите 'Method','approximate' использовать алгоритм аппроксимации на основе T-Digest для вычисления процентиля.

yApprox = prctile(x,p,'Method','approximate')

yApprox =

  MxNx... tall double array

    ?    ?    ?    ...
    ?    ?    ?    ...
    ?    ?    ?    ...
    :    :    :
    :    :    :

Оцените массивы tall и внесите результаты в память с помощью gather.

[yExact,yApprox] = gather(yExact,yApprox)

Evaluating tall expression using the Local MATLAB Session:
- Pass 1 of 4: Completed in 1 sec
- Pass 2 of 4: Completed in 0.47 sec
- Pass 3 of 4: Completed in 0.67 sec
- Pass 4 of 4: Completed in 0.55 sec
Evaluation completed in 3.9 sec

yExact = 1522

yApprox = 1.5220e+03

Значения приблизительного процентиля и точного процентиля совпадают с показанными четырьмя цифрами.

Процентили высокой матрицы по разным измерениям

Вычислите точные и приблизительные процентили высокой матрицы для указанных процентов вдоль различных размеров.

mapreducer(0)

Создание высокой матрицы X содержащий подмножество переменных из airlinesmall набор данных. Дополнительные сведения о шагах извлечения данных из массива высокого уровня см. в разделе Процентили вектора высокого уровня для заданного процента.

varnames = {'ArrDelay','ArrTime','DepTime','ActualElapsedTime'}; % Subset of variables in the data set
ds = datastore('airlinesmall.csv','TreatAsMissing','NA',...
    'SelectedVariableNames',varnames); % Datastore
t = tall(ds);     % Tall table
X = t{:,varnames} % Tall matrix

X =

  Mx4 tall double matrix

           8         735         642          53
           8        1124        1021          63
          21        2218        2055          83
          13        1431        1332          59
           4         746         629          77
          59        1547        1446          61
           3        1052         928          84
          11        1134         859         155
          :          :            :           :
          :          :            :           :

При работе вдоль размера, который не равен 1, prctile функция вычисляет только точные процентили, так что она может эффективно выполнять вычисления, используя алгоритм на основе сортировки (см. Алгоритмы) вместо алгоритма аппроксимации, основанного на T-Digest.

Вычислите точные 25-й, 50-й и 75-й процентили X вдоль второго размера.

p = [25 50 75]; % Vector of percentages
Yexact = prctile(X,p,2)

Yexact =

  MxNx... tall double array

    ?    ?    ?    ...
    ?    ?    ?    ...
    ?    ?    ?    ...
    :    :    :
    :    :    :

Когда функция работает вдоль первого измерения и p является вектором процентов, для вычисления процентилей необходимо использовать алгоритм аппроксимации на основе t-дайджеста. Использование алгоритма, основанного на сортировке, для нахождения процентилей вдоль первого измерения высокого массива является вычислительно интенсивным.

Вычислите приблизительно 25-й, 50-й и 75-й процентили X вдоль первого размера. Поскольку размер по умолчанию равен 1, нет необходимости указывать значение для dim.

Yapprox = prctile(X,p,'Method','approximate')

Yapprox =

  MxNx... tall double array

    ?    ?    ?    ...
    ?    ?    ?    ...
    ?    ?    ?    ...
    :    :    :
    :    :    :

Оцените массивы tall и внесите результаты в память с помощью gather.

[Yexact,Yapprox] = gather(Yexact,Yapprox);

Evaluating tall expression using the Local MATLAB Session:
- Pass 1 of 1: Completed in 3.5 sec
Evaluation completed in 4.2 sec

Показать первые пять строк точных 25-го, 50-го и 75-го процентилей вдоль второго измерения X .

Yexact(1:5,:)

ans = 5×3
10³ ×

    0.0305    0.3475    0.6885
    0.0355    0.5420    1.0725
    0.0520    1.0690    2.1365
    0.0360    0.6955    1.3815
    0.0405    0.3530    0.6875

Каждая строка матрицы Yexact содержит три процентиля соответствующей строки в X. Например, 30.5, 347.5, и 688.5 25-й, 50-й и 75-й процентили соответственно первой строки в X.

Показать приблизительные 25-й, 50-й и 75-й процентили X вдоль первого размера.

Yapprox

Yapprox = 3×4
10³ ×

   -0.0070    1.1149    0.9321    0.0700
         0    1.5220    1.3350    0.1020
    0.0110    1.9180    1.7400    0.1510

Каждый столбец матрицы Yapprox соответствует трем процентилям для каждого столбца матрицы X. Например, первый столбец Yapprox с элементами (-7, 0, 11) содержит процентили для первого столбца X.

Входные аргументы

`X` - Входные данные
вектор | массив

Входные данные, указанные как вектор или массив.

Типы данных: double | single

`p` - Проценты
скаляр | вектор

Проценты, для которых вычисляются процентили, указанные как скаляр или вектор скаляров от 0 до 100.

Пример: 25

Пример: [25, 50, 75]

Типы данных: double | single

`dim` - Размерность
положительное целое число

Измерение, вдоль которого процентили X затребованы, указаны как положительное целое число. Например, для матрицы X, когда dim = 1, prctile возвращает процентиль (ы) столбцов X; когда dim = 2, prctile возвращает процентиль (ы) строк X. Для многомерного массива X, длина dim-й размер Y равна длине p.

Типы данных: double | single

`vecdim` - Вектор размеров
положительный целочисленный вектор

Вектор размеров, заданный как положительный целочисленный вектор. Каждый элемент vecdim представляет измерение входного массива X. Продукция Y имеет длину length(p) в наименьшем указанном рабочем измерении (то есть измерении) min(vecdim)) и имеет длину 1 в каждом из оставшихся рабочих размеров. Другие длины размеров одинаковы для X и Y.

Например, рассмотрите множество 2 на 3 на 3 X с p = [20 40 60 80]. В этом случае prctile(X,p,[1 2]) возвращает массив, где каждая страница массива содержит 20-й, 40-й, 60-й и 80-й процентили элементов соответствующей страницы X. Поскольку 1 и 2 являются рабочими размерами, min([1 2]) = 1 и length(p) = 4, выходной сигнал - массив 4 на 1 на 3.

Типы данных: single | double

`method` - Метод расчета процентилей
`'exact'` (по умолчанию) | `'approximate'`

Метод расчета процентилей, указанный как 'exact' или 'approximate'. По умолчанию prctile возвращает точные процентили, реализуя алгоритм, использующий сортировку. Можно указать 'method','approximate' для prctile для возврата приближенных процентилей путем реализации алгоритма, использующего T-Digest.

Типы данных: char | string

Выходные аргументы

`Y` - Процентили
скаляр | массив

Процентили вектора данных или массива, возвращаемые как скаляр или массив для одного или нескольких процентных значений.

Если X является вектором, то Y - скаляр или вектор с той же длиной, что и запрашиваемое число процентилей (length(p)). Y(i) содержит p(i)-й процентиль.
Если X является массивом размерности d, то Y - массив с длиной наименьшего рабочего измерения, равной количеству запрошенных процентилей (length(p)).

Подробнее