Квантили и процентили

Этот раздел объясняет, как функции Statistics and Machine Learning Toolbox™ quantile и prctile вычисляют квантили и процентили.

Функция prctile вычисляет процентили похожим способом, как quantile вычисляет квантили. Следующие шаги в вычислении квантилей также верны для процентилей, учитывая тот факт, что для той же выборки данных квантиль в значении Q совпадает с процентилью в значении P = 100*Q.

  1. quantile первоначально присваивает отсортированные значения в X к (0.5/n), (1.5/n)..., ([n – 0.5]/n) квантили. Например:

    • Для вектора данных шести элементов такой как {6, 3, 2, 10, 8, 1}, отсортированные элементы {1, 2, 3, 6, 8, 10} соответственно соответствуют (0.5/6), (1.5/6), (2.5/6), (3.5/6), (4.5/6), и (5.5/6) квантили.

    • Для вектора данных пяти элементов такой как {2, 10, 5, 9, 13}, отсортированные элементы {2, 5, 9, 10, 13} соответственно соответствуют 0.1, 0.3, 0.5, 0.7, и 0,9 квантиля.

    Следующая фигура иллюстрирует этот подход для вектора данных X = {2, 10, 5, 9, 13}. Первое наблюдение соответствует интегральной вероятности 1/5 = 0.2, второе наблюдение соответствует интегральной вероятности 2/5 = 0.4 и так далее. Ступенчатая функция в этой фигуре показывает эти интегральные вероятности. quantile вместо этого помещает наблюдения в средние точки, такие, что первое соответствует 0.5/5 = 0.1, второе соответствует 1.5/5 = 0.3, и так далее, и затем соединяет эти средние точки. Красные линии в следующей фигуре соединяют средние точки.

    Присвоение наблюдений к квантилям

    Путем переключения осей, как следующая фигура, вы видите значения переменной X, которые соответствуют квантилям p.

    Квантили X

  2. quantile находит любые квантили между значениями данных с помощью линейной интерполяции.

    Линейная интерполяция использует линейные полиномы, чтобы аппроксимировать функцию f (x) и создать новые точки данных в области значений известного набора точек данных. Алгебраически, учитывая точки данных (x 1, y 1) и (x 2, y 2), где y 1 = f (x 1) и y 2 = f (x 2), линейная интерполяция находит y = f (x) для данного x между x 1 и x 2 можно следующим образом:

    y=f(x)=y1+(xx1)(x2x1)(y2y1).

    Точно так же, если 1.5/n квантилем является y 1.5/n, и 2.5/n квантилем является y 2.5/n, то линейная интерполяция находит 2.3/n квантиль y 2.3/n как

    y2.3n=y1.5n+(2.3n1.5n)(2.5n1.5n)(y2.5ny1.5n).

  3. quantile присваивает первые и последние значения X к квантилям для вероятностей меньше, чем (0.5/n) и больше, чем ([n –0.5]/n), соответственно.

Ссылки

[1] Лэнгфорд, E. “Квартили в элементарной статистике”, журнал образования статистики. Издание 14, № 3, 2006.

Смотрите также

| |

Похожие темы