exponenta event banner

zscore

Стандартизированные z-оценки

Описание

пример

Z = zscore(X) возвращает z-оценку для каждого элемента X такие, что столбцы X центрированы, чтобы иметь среднее значение 0, и масштабированы, чтобы иметь стандартное отклонение 1. Z имеет тот же размер, что и X.

  • Если X является вектором, то Z является вектором z-баллов.

  • Если X является матрицей, то Z является матрицей того же размера, что и Xи каждый столбец Z имеет среднее значение 0 и стандартное отклонение 1.

  • Для многомерных массивов z-оценки в Z вычисляются по первому несинглтонному измерению X.

пример

Z = zscore(X,flag) весы X используя стандартное отклонение, указанное flag.

  • Если flag равно 0 (по умолчанию), то zscore весы X используя стандартное отклонение образца, с n - 1 в знаменателе формулы стандартного отклонения. zscore(X,0) является таким же, как zscore(X).

  • Если flag равно 1, то zscore весы X используя стандартное отклонение населения, с n в знаменателе формулы стандартного отклонения.

пример

Z = zscore(X,flag,'all') стандартизирует X используя среднее и стандартное отклонение всех значений в X.

пример

Z = zscore(X,flag,dim) стандартизирует X вдоль рабочего размера dim. Например, для матрицы X, если dim = 1, затем zscore использует средние и стандартные отклонения вдоль колонн X, если dim = 2, затем zscore использует средние и стандартные отклонения вдоль строк X.

пример

Z = zscore(X,flag,vecdim) стандартизирует X над размерами, заданными вектором vecdim. Например, если X является матрицей, то zscore(X,0,[1 2]) эквивалентно zscore(X,0,'all') поскольку каждый элемент матрицы содержится в срезе массива, определяемом размерами 1 и 2.

пример

[Z,mu,sigma] = zscore(___) также возвращает средние и стандартные отклонения, используемые для центрирования и масштабирования, mu и sigmaсоответственно. Можно использовать любой из входных аргументов в предыдущих синтаксисах.

Примеры

свернуть все

Вычислите и постройте график z-показателей двух векторов данных, а затем сравните результаты.

Загрузите образцы данных.

load lawdata

В рабочую область загружаются две переменные: gpa и lsat.

Постройте график обеих переменных на одной оси.

plot([gpa,lsat])
legend('gpa','lsat','Location','East')

Figure contains an axes. The axes contains 2 objects of type line. These objects represent gpa, lsat.

Трудно сопоставить эти два показателя, поскольку они находятся в совершенно разных масштабах.

Постройте график z-баллов gpa и lsat на тех же осях.

Zgpa = zscore(gpa);
Zlsat = zscore(lsat);
plot([Zgpa, Zlsat])
legend('gpa z-scores','lsat z-scores','Location','Northeast')

Figure contains an axes. The axes contains 2 objects of type line. These objects represent gpa z-scores, lsat z-scores.

Теперь вы можете увидеть относительную эффективность людей по отношению к их обоим gpa и lsat результаты. Например, третий индивидуум gpa и lsat оба результата представляют собой одно стандартное отклонение ниже среднего значения выборки. Одиннадцатый индивидуум gpa находится вокруг среднего значения выборки, но имеет lsat оценка почти 1,25 стандартных отклонений от среднего значения выборки.

Проверьте среднее и стандартное отклонение созданных z-баллов.

 mean([Zgpa,Zlsat])
ans = 1×2
10-14 ×

   -0.1088    0.0357

 std([Zgpa,Zlsat])
ans = 1×2

     1     1

По определению, z-оценки gpa и lsat имеют среднее значение 0 и стандартное отклонение 1.

Загрузите образцы данных.

load lawdata

В рабочую область загружаются две переменные: gpa и lsat.

Вычислите z-оценки gpa с использованием формулы заполнения для стандартного отклонения.

Z1 = zscore(gpa,1); % population formula
Z0 = zscore(gpa,0); % sample formula
disp([Z1 Z0])
    1.2554    1.2128
    0.8728    0.8432
   -1.2100   -1.1690
   -0.2749   -0.2656
    1.4679    1.4181
   -0.1049   -0.1013
   -0.4024   -0.3888
    1.4254    1.3771
    1.1279    1.0896
    0.1502    0.1451
    0.1077    0.1040
   -1.5076   -1.4565
   -1.4226   -1.3743
   -0.9125   -0.8815
   -0.5724   -0.5530

Для выборки из популяции формула стандартного отклонения популяции с n в знаменателе соответствует оценке максимального правдоподобия стандартного отклонения популяции и может быть смещена. Формула стандартного отклонения выборки, с другой стороны, является объективной оценкой стандартного отклонения популяции для выборки.

Вычислите z-оценки, используя среднее и стандартное отклонения, вычисленные вдоль столбцов или строк матрицы данных.

Загрузите образцы данных.

load flu

Массив наборов данных flu загружается на рабочее место. flu имеет 52 наблюдения по 11 переменным. Первая переменная содержит даты (в неделях). Другие переменные содержат оценки гриппа для различных регионов в США.

Преобразование массива наборов данных в матрицу данных.

flu2 = double(flu(:,2:end));

Новая матрица данных, flu2, является двойной матрицей данных 52 на 10. Строки соответствуют неделям, а столбцы - регионам США в массиве наборов данных flu.

Стандартизируйте оценку гриппа для каждого региона (столбцы flu2).

Z1 = zscore(flu2,[ ],1);

Для просмотра z-показателей в редакторе переменных дважды щелкните по матрице. Z1 создана в рабочей области.

Стандартизируйте оценку гриппа для каждой недели (строки flu2).

Z2 = zscore(flu2,[ ],2);

Найдите z-оценки многомерного массива, указав стандартизацию данных по различным измерениям. Сравнение результатов при использовании 'all', dim, и vecdim входные аргументы.

Создайте массив 3 на 4 на 2.

X = reshape(1:24,[3 4 2])
X = 
X(:,:,1) =

     1     4     7    10
     2     5     8    11
     3     6     9    12


X(:,:,2) =

    13    16    19    22
    14    17    20    23
    15    18    21    24

Стандартизировать X используя среднее и стандартное отклонение всех значений в X.

Zall = zscore(X,0,'all')
Zall = 
Zall(:,:,1) =

   -1.6263   -1.2021   -0.7778   -0.3536
   -1.4849   -1.0607   -0.6364   -0.2121
   -1.3435   -0.9192   -0.4950   -0.0707


Zall(:,:,2) =

    0.0707    0.4950    0.9192    1.3435
    0.2121    0.6364    1.0607    1.4849
    0.3536    0.7778    1.2021    1.6263

Результирующий многомерный массив z-баллов имеет среднее значение 0 и стандартное отклонение 1. Например, вычислить среднее и стандартное отклонение Zall.

mZall = mean(Zall(:,:,:),'all')
mZall = -9.2519e-18
sZall = std(Zall(:,:,:),0,'all')
sZall = 1.0000

Теперь стандартизируйте X вдоль второго размера.

Zdim = zscore(X,0,2)
Zdim = 
Zdim(:,:,1) =

   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619


Zdim(:,:,2) =

   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619

Элементы в каждой строке каждой страницы Zdim имеют среднее значение 0 и стандартное отклонение 1. Например, вычислить среднее и стандартное отклонение первой строки второй страницы Zdim.

mZdim = mean(Zdim(1,:,2),'all')
mZdim = 0
sZdim = std(Zdim(1,:,2),0,'all')
sZdim = 1

Наконец, стандартизация X на основе второго и третьего измерений.

Zvecdim = zscore(X,0,[2 3])
Zvecdim = 
Zvecdim(:,:,1) =

   -1.4289   -1.0206   -0.6124   -0.2041
   -1.4289   -1.0206   -0.6124   -0.2041
   -1.4289   -1.0206   -0.6124   -0.2041


Zvecdim(:,:,2) =

    0.2041    0.6124    1.0206    1.4289
    0.2041    0.6124    1.0206    1.4289
    0.2041    0.6124    1.0206    1.4289

Элементы в каждом Zvecdim(i,:,:) срез имеет среднее значение 0 и стандартное отклонение 1. Например, вычислите среднее и стандартное отклонение элементов в Zvecdim(1,:,:).

mZvecdim = mean(Zvecdim(1,:,:),'all')
mZvecdim = 2.7756e-17
sZvecdim = std(Zvecdim(1,:,:),0,'all')
sZvecdim = 1

Возвращает среднее и стандартное отклонения, используемые для вычисления z-показателей.

Загрузите образцы данных.

load lawdata

В рабочую область загружаются две переменные: gpa и lsat.

Возвращает z-оценки, среднее и стандартное отклонение gpa.

[Z,gpamean,gpastdev] = zscore(gpa)
Z = 15×1

    1.2128
    0.8432
   -1.1690
   -0.2656
    1.4181
   -0.1013
   -0.3888
    1.3771
    1.0896
    0.1451
      ⋮

gpamean = 3.0947
gpastdev = 0.2435

Входные аргументы

свернуть все

Входные данные, указанные как вектор, матрица или многомерный массив.

Типы данных: double | single

Индикатор стандартного отклонения, используемого для вычисления z-баллов, заданного как 0 или 1.

Измерение, вдоль которого вычисляются z-оценки X, задается как положительный скаляр целого числа. Если значение не указано, то значением по умолчанию является первый размер массива, размер которого не равен 1.

Например, для матрицы X, если dim = 1, затем zscore использует средние и стандартные отклонения вдоль колонн X, и если dim = 2, затем zscore использует средние и стандартные отклонения вдоль строк X.

Вектор размеров, вдоль которого вычисляются z-оценки X, задается как положительный целочисленный вектор. Каждый элемент vecdim представляет измерение входного массива X. Продукция Z имеет те же размеры, что и X, но среднее mu и стандартное отклонение sigma каждый имеет длину 1 в рабочих размерах. Другие длины размеров одинаковы для X, mu, и sigma.

Например, если X множество 2 на 3 на 3, тогда zscore(X,0,[1 2]) использует средства и стандартные отклонения вдоль страниц X для стандартизации значений X.

Типы данных: single | double

Выходные аргументы

свернуть все

z-scares, возвращаемый как вектор, матрица или многомерный массив. Z имеет те же размеры, что и X.

Значения Z зависит от того, укажите ли вы 'all', dim, или vecdim. Если не указать ни один из этих входных аргументов, применяются следующие условия:

  • Если X является вектором, то Z является вектором z-баллов со средним значением 0 и дисперсией 1.

  • Если X является массивом, то zscore стандартизирует вдоль первого nonsingleton размерности X.

Пример, демонстрирующий различия в Z при использовании 'all', dim, и vecdim, см. Z-оценки многомерного массива.

Среднее значение X используется для вычисления z-показателей, возвращаемых в виде скаляра, вектора, матрицы или многомерного массива. mu имеет длину 1 в заданных рабочих размерах. Другие длины размеров одинаковы для X и mu.

Например, если X множество 2 на 3 на 3 и vecdim является [1 2], то mu множество средств 1 на 1 на 3. Каждое значение в mu соответствует среднему значению страницы в X.

Стандартное отклонение X используется для вычисления z-показателей, возвращаемых в виде скаляра, вектора, матрицы или многомерного массива. sigma имеет длину 1 в заданных рабочих размерах. Другие длины размеров одинаковы для X и sigma.

Например, если X множество 2 на 3 на 3 и vecdim является [1 2], то sigma множество стандартных отклонений 1 на 1 на 3. Каждое значение в sigma соответствует стандартному отклонению страницы в X.

Подробнее

свернуть все

Z-оценка

Для случайной величины X со средним λ и стандартным отклонением, z-балл значения x равен

z = (x λ) λ.

Для выборочных данных со средним значением X и стандартным отклонением S z-показатель точки данных x равен

z = (x X) S.

Z-оценки измеряют расстояние точки данных от среднего значения в терминах стандартного отклонения. Это также называется стандартизацией данных. Стандартизированный набор данных имеет среднее значение 0 и стандартное отклонение 1 и сохраняет свойства формы исходного набора данных (тот же самый перекос и куртоз).

Можно использовать z-баллы для размещения данных в одной шкале перед дальнейшим анализом. Это позволяет сравнивать два или более наборов данных с различными единицами измерения.

Многомерный массив

Многомерный массив - это массив с более чем двумя измерениями. Например, если X является массивом 1 на 3 на 4, то X является трехмерным массивом.

Первое измерение Nonsingleton

Первое несинглтоновое измерение - это первое измерение массива, размер которого не равен 1. Например, если X является массивом 1-на-2-на-3-на-4, затем второе измерение является первым несинглтоновым измерением X.

Образец стандартного отклонения

Стандартное отклонение образца S задается

S=∑i=1n (xi X) 2n − 1.

S - квадратный корень непредвзятого оценщика дисперсии населения, из которого X рисуется при условии, что X состоит из независимых, одинаково распределенных образцов. X - среднее значение образца.

Обратите внимание, что знаменатель в этой формуле дисперсии равен n - 1.

Среднеквадратическое отклонение населения

Если данные представляют собой всю совокупность значений, то можно использовать стандартное отклонение совокупности,

σ=∑i=1n (xi λ) 2n.

Если X представляет собой случайную выборку из популяции, затем среднее λ оценивается по среднему значению выборки, а λ является смещенным максимальным оценщиком правдоподобия стандартного отклонения популяции.

Обратите внимание, что знаменателем в этой формуле дисперсии является n.

Алгоритмы

zscore прибыль NaNs для любого образца, содержащего NaNs.

zscore прибыль 0s для любого образца, который является постоянным (все значения одинаковы). Например, если X является вектором того же числового значения, то Z является вектором 0s.

Расширенные возможности

.

См. также

| | |

Представлен до R2006a