zscore

Стандартизированные z -счета

Описание

пример

Z = zscore(X) возвращает z -score для каждого элемента X таким образом, что столбцы X центрированы, чтобы иметь среднее 0 и масштабированы, чтобы иметь стандартное отклонение 1. Z - тот же размер, что и X.

пример

Z = zscore(X,flag) шкалы X использование стандартного отклонения, обозначенного flag.

пример

Z = zscore(X,flag,'all') стандартизирует X при помощи среднего и стандартного отклонения всех значений в X.

пример

Z = zscore(X,flag,dim) стандартизирует X вдоль рабочей размерности dim. Для примера, для матрицы X, если dim = 1, затем zscore использует средства и стандартные отклонения вдоль столбцов X, если dim = 2, затем zscore использует средства и стандартные отклонения по строкам X.

пример

Z = zscore(X,flag,vecdim) стандартизирует X по размерностям, заданным вектором vecdim. Для примера, если X является матрицей, тогда zscore(X,0,[1 2]) эквивалентно zscore(X,0,'all') потому что каждый элемент массива матрицы содержится в срезе массива, заданном размерностями 1 и 2.

пример

[Z,mu,sigma] = zscore(___) также возвращает средства и стандартные отклонения, используемые для центрирования и масштабирования, mu и sigma, соответственно. Можно использовать любой из входных параметров в предыдущих синтаксисах.

Примеры

свернуть все

Вычислите и постройте график z-счета двух векторов данных, а затем сравните результаты.

Загрузите выборочные данные.

load lawdata

Две переменные загружаются в рабочую область: gpa и lsat.

Постройте график обеих переменных на одной оси.

plot([gpa,lsat])
legend('gpa','lsat','Location','East')

Figure contains an axes. The axes contains 2 objects of type line. These objects represent gpa, lsat.

Трудно сравнить эти две меры, поскольку они имеют очень разные шкалы.

Постройте график z-счета gpa и lsat на тех же осях.

Zgpa = zscore(gpa);
Zlsat = zscore(lsat);
plot([Zgpa, Zlsat])
legend('gpa z-scores','lsat z-scores','Location','Northeast')

Figure contains an axes. The axes contains 2 objects of type line. These objects represent gpa z-scores, lsat z-scores.

Теперь можно увидеть относительную эффективность индивидуумов в отношении обоих их gpa и lsat результаты. Например, третья индивидуальная gpa и lsat результаты являются одним стандартным отклонением ниже среднего значения выборки. Одиннадцатая индивидуальная gpa окружает среднее значение выборки, но имеет lsat набрать почти 1,25 стандартных отклонений выше среднего значения выборки.

Проверяйте среднее и стандартное отклонение z-счета, которые вы создали.

 mean([Zgpa,Zlsat])
ans = 1×2
10-14 ×

   -0.1088    0.0357

 std([Zgpa,Zlsat])
ans = 1×2

     1     1

По определению, z-счета gpa и lsat имеют среднее 0 и стандартное отклонение 1.

Загрузите выборочные данные.

load lawdata

Две переменные загружаются в рабочую область: gpa и lsat.

Вычислите z-счета gpa использование формулы населения для стандартного отклонения.

Z1 = zscore(gpa,1); % population formula
Z0 = zscore(gpa,0); % sample formula
disp([Z1 Z0])
    1.2554    1.2128
    0.8728    0.8432
   -1.2100   -1.1690
   -0.2749   -0.2656
    1.4679    1.4181
   -0.1049   -0.1013
   -0.4024   -0.3888
    1.4254    1.3771
    1.1279    1.0896
    0.1502    0.1451
    0.1077    0.1040
   -1.5076   -1.4565
   -1.4226   -1.3743
   -0.9125   -0.8815
   -0.5724   -0.5530

Для выборки из населения, формула стандартного отклонения населения с n в знаменателе соответствует максимальной оценке вероятности стандартного отклонения населения и может быть смещенным. Формула стандартного отклонения выборки, с другой стороны, является объективной оценкой стандартного отклонения населения для выборки.

Вычислить z- счета среднего и стандартного отклонений, вычисленных вдоль столбцов или строк матрицы данных.

Загрузите выборочные данные.

load flu

Массив набора данных flu загружается на рабочее место. flu имеет 52 наблюдения за 11 переменными. Первая переменная содержит даты (в неделях). Другие переменные содержат оценки гриппа для различных областей в США

Преобразуйте массив набора данных в матрицу данных.

flu2 = double(flu(:,2:end));

Новая матрица данных, flu2, является двойной матрицей данных 52 на 10. Строки соответствуют неделям, а столбцы соответствуют областям США в массиве набора данных flu.

Стандартизируйте оценку гриппа для каждой области (столбцы flu2).

Z1 = zscore(flu2,[ ],1);

Вы можете увидеть z-скорит в редакторе переменных двойным щелчком мыши по матрице Z1 созданный в рабочей области.

Стандартизируйте оценку гриппа для каждой недели (строки flu2).

Z2 = zscore(flu2,[ ],2);

Найдите z-оценки многомерного массива путем определения, чтобы стандартизировать данные по различным размерностям. Сравните результаты при использовании 'all', dim, и vecdim входные параметры.

Создайте массив 3 на 4 на 2.

X = reshape(1:24,[3 4 2])
X = 
X(:,:,1) =

     1     4     7    10
     2     5     8    11
     3     6     9    12


X(:,:,2) =

    13    16    19    22
    14    17    20    23
    15    18    21    24

Стандартизируйте X при помощи среднего и стандартного отклонения всех значений в X.

Zall = zscore(X,0,'all')
Zall = 
Zall(:,:,1) =

   -1.6263   -1.2021   -0.7778   -0.3536
   -1.4849   -1.0607   -0.6364   -0.2121
   -1.3435   -0.9192   -0.4950   -0.0707


Zall(:,:,2) =

    0.0707    0.4950    0.9192    1.3435
    0.2121    0.6364    1.0607    1.4849
    0.3536    0.7778    1.2021    1.6263

Получившийся многомерный массив z-значений имеет среднее 0 и стандартное отклонение 1. Для примера вычислите среднее и стандартное отклонение Zall.

mZall = mean(Zall(:,:,:),'all')
mZall = -9.2519e-18
sZall = std(Zall(:,:,:),0,'all')
sZall = 1.0000

Теперь стандартизируйте X вдоль второго измерения.

Zdim = zscore(X,0,2)
Zdim = 
Zdim(:,:,1) =

   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619


Zdim(:,:,2) =

   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619

Элементы в каждой строке каждой страницы Zdim имеют среднее 0 и стандартное отклонение 1. Например, вычислите среднее и стандартное отклонение первой строки второй страницы Zdim.

mZdim = mean(Zdim(1,:,2),'all')
mZdim = 0
sZdim = std(Zdim(1,:,2),0,'all')
sZdim = 1

Наконец, стандартизируйте X на основе вторых и третьих размерностей.

Zvecdim = zscore(X,0,[2 3])
Zvecdim = 
Zvecdim(:,:,1) =

   -1.4289   -1.0206   -0.6124   -0.2041
   -1.4289   -1.0206   -0.6124   -0.2041
   -1.4289   -1.0206   -0.6124   -0.2041


Zvecdim(:,:,2) =

    0.2041    0.6124    1.0206    1.4289
    0.2041    0.6124    1.0206    1.4289
    0.2041    0.6124    1.0206    1.4289

Элементы в каждом Zvecdim(i,:,:) срез имеет среднее значение 0 и стандартное отклонение 1. Для примера вычислите среднее и стандартное отклонение элементов в Zvecdim(1,:,:).

mZvecdim = mean(Zvecdim(1,:,:),'all')
mZvecdim = 2.7756e-17
sZvecdim = std(Zvecdim(1,:,:),0,'all')
sZvecdim = 1

Верните среднее и стандартное отклонения, используемые для вычисления z-счета.

Загрузите выборочные данные.

load lawdata

Две переменные загружаются в рабочую область: gpa и lsat.

Верните z-счета, среднее и стандартное отклонение gpa.

[Z,gpamean,gpastdev] = zscore(gpa)
Z = 15×1

    1.2128
    0.8432
   -1.1690
   -0.2656
    1.4181
   -0.1013
   -0.3888
    1.3771
    1.0896
    0.1451
      ⋮

gpamean = 3.0947
gpastdev = 0.2435

Входные параметры

свернуть все

Входные данные, заданные как вектор, матрица или многомерный массив.

Типы данных: double | single

Индикатор стандартного отклонения, используемого для вычисления z -счетов, заданный как 0 или 1.

Размерность, по которой можно вычислить z -счета X, заданный как положительный целочисленный скаляр. Если вы не задаете значение, то значение по умолчанию является первым измерением массива, не равным 1.

Для примера, для матрицы X, если dim = 1, затем zscore использует средства и стандартные отклонения вдоль столбцов X, и если dim = 2, затем zscore использует средства и стандартные отклонения по строкам X.

Вектор размерностей, по которому можно вычислить z -счета X, заданный как положительный целочисленный вектор. Каждый элемент vecdim представляет размерности массива входа X. Область выхода Z имеет те же размерности, что и X, но среднее mu и стандартное отклонение sigma каждый имеет длину 1 в рабочих размерностях. Другие длины размерности одинаковы для X, mu, и sigma.

Для примера, если X массив 2 на 3 на 3, тогда zscore(X,0,[1 2]) использует средства и стандартные отклонения на страницах X для стандартизации значений X.

Типы данных: single | double

Выходные аргументы

свернуть все

z- счетов, возвращенные как векторный, матричный или многомерный массив. Z имеет те же размерности, что и X.

Значения Z зависит от того, задаете ли вы 'all', dim, или vecdim. Если вы не задаете ни один из этих входных параметров, то применяются следующие условия:

  • Если X является вектором, тогда Z является вектором z -счетов со средним 0 и отклонением 1.

  • Если X является массивом, тогда zscore стандартизируется по первой нежесткой размерности X.

Для примера, который демонстрирует различия в Z когда вы используете 'all', dim, и vecdim, см. Z-Оценки Многомерного Массива.

Среднее значение X используется для вычисления z -счета, возвращаемых в виде скаляра, вектора, матрицы или многомерного массива. mu имеет длину 1 в заданных рабочих размерностях. Другие длины размерности одинаковы для X и mu.

Для примера, если X массив 2 на 3 на 3 и vecdim является [1 2], затем mu массив средств 1 на 1 на 3. Каждое значение в mu соответствует среднему значению страницы в X.

Стандартное отклонение X используется для вычисления z -счета, возвращаемых в виде скаляра, вектора, матрицы или многомерного массива. sigma имеет длину 1 в заданных рабочих размерностях. Другие длины размерности одинаковы для X и sigma.

Для примера, если X массив 2 на 3 на 3 и vecdim является [1 2], затем sigma массив стандартных отклонений 1 на 1 на 3. Каждое значение в sigma соответствует стандартному отклонению страницы в X.

Подробнее о

свернуть все

Z-счет

Для случайной переменной X со средним μ и стандартным отклонением σ, z - счет значения x

z=(xμ)σ.

Для выборочных данных со средним X¯ и стандартное S отклонения, z -скор x точки данных является

z=(xX¯)S.

z -счета измеряют расстояние между точками данных и средним значением с точки зрения стандартного отклонения. Это также называется стандартизацией данных. Стандартизированный набор данных имеет среднее значение 0 и стандартное отклонение 1 и сохраняет свойства формы исходного набора данных (те же перекос и куртоз).

Можно использовать z -счета, чтобы поместить данные в той же шкале перед последующим анализом. Это позволяет вам сравнить два или несколько наборов данных с различными модулями .

Многомерный массив

Многомерный массив является массивом с более чем двумя размерностями. Для примера, если X является массивом 1 на 3 на 4, то X является трехмерным массивом.

Первый несинглтон Размерность

Первый несинглтон- размерность является первой размерностью массива, размер которого не равен 1. Для примера, если X является массивом 1 на 2 на 3 на 4, затем второе измерение является первой несинглтонной размерностью X.

Выборка Стандартного Отклонения

Стандартная выборка S задаётся как

S=i=1n(xiX¯)2n1.

S является квадратным корнем объективной оценки отклонения населения, из которой X рисуется, пока X состоит из независимых, одинаково распределенных выборок. X¯ - среднее значение выборки.

Заметьте, что знаменатель в этой формуле отклонения равен n - 1.

Стандартное отклонение населения

Если данные являются полным населением значений, то можно использовать стандартное отклонение населения,

σ=i=1n(xiμ)2n.

Если X является случайной выборкой из населения, затем среднее μ оценивается средним значением выборки, и σ является смещенным максимальным оценщиком правдоподобия стандартного отклонения населения.

Заметьте, что знаменатель в этой формуле отклонения n.

Алгоритмы

zscore возвращает NaNs для любой выборки, содержащего NaNс.

zscore возвращает 0s для любой выборки, которая является постоянной (все значения одинаковы). Для примера, если X является вектором с таким же числовым значением, тогда Z является вектором 0с.

Расширенные возможности

.

См. также

| | |

Представлено до R2006a