zscore

Стандартизированный z - баллы

Описание

пример

Z = zscore(X) возвращается z - выигрывают за каждый элемент X таким образом, что столбцы X сосредотачиваются, чтобы иметь среднее значение 0 и масштабируются, чтобы иметь стандартное отклонение 1. Z одного размера с X.

пример

Z = zscore(X,flag) шкалы X использование стандартного отклонения обозначается flag.

пример

Z = zscore(X,flag,'all') стандартизирует X при помощи среднего и стандартного отклонения всех значений в X.

пример

Z = zscore(X,flag,dim) стандартизирует X по операционному измерению dim. Например, для матричного X, если dim = 1, затем zscore использует средние значения и стандартные отклонения вдоль столбцов X, если dim = 2, затем zscore использует средние значения и стандартные отклонения вдоль строк X.

пример

Z = zscore(X,flag,vecdim) стандартизирует X по размерностям, заданным векторным vecdim. Например, если X матрица, затем zscore(X,0,[1 2]) эквивалентно zscore(X,0,'all') потому что каждый элемент матрицы содержится в срезе массивов, заданном размерностями 1 и 2.

пример

[Z,mu,sigma] = zscore(___) также возвращает средние значения и стандартные отклонения, используемые в центрировании и масштабировании, mu и sigma, соответственно. Можно комбинировать с любым синтаксом из перечисленных выше.

Примеры

свернуть все

Вычислите и постройте z- множество двух векторов данных, и затем сравнивает результаты.

Загрузите выборочные данные.

load lawdata

Две переменные загружают в рабочую область: gpa и lsat.

Постройте обе переменные на тех же осях.

plot([gpa,lsat])
legend('gpa','lsat','Location','East')

Это затрудняет, чтобы сравнить эти две меры, потому что они находятся по совсем другой шкале.

Постройте z- множество gpa и lsat на тех же осях.

Zgpa = zscore(gpa);
Zlsat = zscore(lsat);
plot([Zgpa, Zlsat])
legend('gpa z-scores','lsat z-scores','Location','Northeast')

Теперь вы видите относительную производительность индивидуумов относительно обоих их gpa и lsat результаты. Например, gpa третьего индивидуума и lsat результатами является оба одно стандартное отклонение ниже демонстрационного среднего значения. gpa одиннадцатого индивидуума вокруг демонстрационного среднего значения, но имеет lsat выиграйте почти 1,25 стандартных отклонения выше демонстрационного среднего значения.

Проверяйте среднее и стандартное отклонение z- баллы вы создали.

 mean([Zgpa,Zlsat])
ans = 1×2
10-14 ×

   -0.1088    0.0357

 std([Zgpa,Zlsat])
ans = 1×2

     1     1

По определению, z- множество gpa и lsat имейте среднее значение 0 и стандартное отклонение 1.

Загрузите выборочные данные.

load lawdata

Две переменные загружают в рабочую область: gpa и lsat.

Вычислите z- множество gpa использование формулы населения для стандартного отклонения.

Z1 = zscore(gpa,1); % population formula
Z0 = zscore(gpa,0); % sample formula
disp([Z1 Z0])
    1.2554    1.2128
    0.8728    0.8432
   -1.2100   -1.1690
   -0.2749   -0.2656
    1.4679    1.4181
   -0.1049   -0.1013
   -0.4024   -0.3888
    1.4254    1.3771
    1.1279    1.0896
    0.1502    0.1451
    0.1077    0.1040
   -1.5076   -1.4565
   -1.4226   -1.3743
   -0.9125   -0.8815
   -0.5724   -0.5530

Для выборки от населения, формулы стандартного отклонения населения с n в знаменателе соответствует оценке наибольшего правдоподобия стандартного отклонения населения и может быть смещен. Демонстрационная формула стандартного отклонения, с другой стороны, является несмещенным средством оценки стандартного отклонения населения для выборки.

Вычислить z- баллы с помощью среднего и стандартного отклонения, вычисленного вдоль столбцов или строк матрицы данных.

Загрузите выборочные данные.

load flu

Массив набора данных flu загружается на рабочем месте. flu имеет 52 наблюдения относительно 11 переменных. Первая переменная содержит даты (в неделях). Другие переменные содержат оценки гриппа для различных областей в США.

Преобразуйте массив набора данных в матрицу данных.

flu2 = double(flu(:,2:end));

Новая матрица данных, flu2, 52 10 удваивает матрицу данных. Строки соответствуют неделям, и столбцы соответствуют американским областям в массиве набора данных flu.

Стандартизируйте оценку гриппа для каждой области (столбцы flu2).

Z1 = zscore(flu2,[ ],1);

Вы видите z- баллы в редакторе переменных путем двойного клика на матричном Z1 созданный в рабочей области.

Стандартизируйте оценку гриппа за каждую неделю (строки flu2).

Z2 = zscore(flu2,[ ],2);

Найдите z-множество многомерного массива путем определения, чтобы стандартизировать данные по различным измерениям. Сравните результаты при использовании 'all'dim , и vecdim входные параметры.

Создайте 3 4 2 массивами.

X = reshape(1:24,[3 4 2])
X = 
X(:,:,1) =

     1     4     7    10
     2     5     8    11
     3     6     9    12


X(:,:,2) =

    13    16    19    22
    14    17    20    23
    15    18    21    24

Стандартизируйте X при помощи среднего и стандартного отклонения всех значений в X.

Zall = zscore(X,0,'all')
Zall = 
Zall(:,:,1) =

   -1.6263   -1.2021   -0.7778   -0.3536
   -1.4849   -1.0607   -0.6364   -0.2121
   -1.3435   -0.9192   -0.4950   -0.0707


Zall(:,:,2) =

    0.0707    0.4950    0.9192    1.3435
    0.2121    0.6364    1.0607    1.4849
    0.3536    0.7778    1.2021    1.6263

Получившийся многомерный массив z-баллов имеет среднее значение 0 и стандартное отклонение 1. Например, вычислите среднее и стандартное отклонение Zall.

mZall = mean(Zall(:,:,:),'all')
mZall = -9.2519e-18
sZall = std(Zall(:,:,:),0,'all')
sZall = 1.0000

Теперь стандартизируйте X вдоль второго измерения.

Zdim = zscore(X,0,2)
Zdim = 
Zdim(:,:,1) =

   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619


Zdim(:,:,2) =

   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619
   -1.1619   -0.3873    0.3873    1.1619

Элементы в каждой строке каждой страницы Zdim имейте среднее значение 0 и стандартное отклонение 1. Например, вычислите среднее и стандартное отклонение первой строки второй страницы Zdim.

mZdim = mean(Zdim(1,:,2),'all')
mZdim = 0
sZdim = std(Zdim(1,:,2),0,'all')
sZdim = 1

Наконец, стандартизируйте X на основе вторых и третьих размерностей.

Zvecdim = zscore(X,0,[2 3])
Zvecdim = 
Zvecdim(:,:,1) =

   -1.4289   -1.0206   -0.6124   -0.2041
   -1.4289   -1.0206   -0.6124   -0.2041
   -1.4289   -1.0206   -0.6124   -0.2041


Zvecdim(:,:,2) =

    0.2041    0.6124    1.0206    1.4289
    0.2041    0.6124    1.0206    1.4289
    0.2041    0.6124    1.0206    1.4289

Элементы в каждом Zvecdim(i,:,:) срез имеет среднее значение 0 и стандартное отклонение 1. Например, вычислите среднее и стандартное отклонение элементов в Zvecdim(1,:,:).

mZvecdim = mean(Zvecdim(1,:,:),'all')
mZvecdim = 2.7756e-17
sZvecdim = std(Zvecdim(1,:,:),0,'all')
sZvecdim = 1

Возвратите среднее и стандартное отклонение, использованное для расчета z- баллы.

Загрузите выборочные данные.

load lawdata

Две переменные загружают в рабочую область: gpa и lsat.

Возвратитесь z- баллы, среднее значение и стандартное отклонение gpa.

[Z,gpamean,gpastdev] = zscore(gpa)
Z = 15×1

    1.2128
    0.8432
   -1.1690
   -0.2656
    1.4181
   -0.1013
   -0.3888
    1.3771
    1.0896
    0.1451
      ⋮

gpamean = 3.0947
gpastdev = 0.2435

Входные параметры

свернуть все

Входные данные, заданные как вектор, матрица или многомерный массив.

Типы данных: double | single

Индикатор для стандартного отклонения использовался для расчета z - баллы, заданные как 0 или 1.

Размерность, по которой можно вычислить z - множество X, заданный как положительный целочисленный скаляр. Если вы не задаете значение, то значением по умолчанию является первое измерение массива, размер которого не равняется 1.

Например, для матричного X, если dim = 1, затем zscore использует средние значения и стандартные отклонения вдоль столбцов X, и если dim = 2, затем zscore использует средние значения и стандартные отклонения вдоль строк X.

Вектор размерностей, по которым можно вычислить z - множество X, заданный как положительный целочисленный вектор. Каждый элемент vecdim представляет размерность входного массива X. Выход Z имеет те же размерности как X, но средний mu и стандартное отклонение sigma у каждого есть длина 1 в операционных размерностях. Другие длины размерности являются тем же самым для X\mu, и sigma.

Например, если X 2 3х3 массивом, затем zscore(X,0,[1 2]) использует средние значения и стандартные отклонения вдоль страниц X стандартизировать значения X.

Типы данных: single | double

Выходные аргументы

свернуть все

Баллы z-, возвращенные как вектор, матрица или многомерный массив. Z имеет те же размерности как X.

Значения Z зависьте от того, задаете ли вы 'all'dim , или vecdim. Если вы не задаете ни одного из этих входных параметров, то следующие условия применяются:

  • Если X вектор, затем Z вектор z - баллы со средним значением 0 и отклонением 1.

  • Если X массив, затем zscore стандартизирует по первому неодноэлементному измерению X.

Для примера, который демонстрирует различия в Z когда вы используете 'all'dim , и vecdim, смотрите Z-множество Многомерного массива.

Среднее значение X использованный для расчета z - баллы, возвращенные как скаляр, вектор, матрица или многомерный массив. mu имеет длину 1 в заданных операционных размерностях. Другие длины размерности являются тем же самым для X и mu.

Например, если X 2 3х3 массивом и vecdim [1 2], затем mu 1 1 3 массивами средних значений. Каждое значение в mu соответствует среднему значению страницы в X.

Стандартное отклонение X использованный для расчета z - баллы, возвращенные как скаляр, вектор, матрица или многомерный массив. sigma имеет длину 1 в заданных операционных размерностях. Другие длины размерности являются тем же самым для X и sigma.

Например, если X 2 3х3 массивом и vecdim [1 2], затем sigma 1 1 3 массивами стандартных отклонений. Каждое значение в sigma соответствует стандартному отклонению страницы в X.

Больше о

свернуть все

Z-счет

Для случайной переменной X со средним значением μ и стандартное отклонение σ, z - счет значения x

z=(xμ)σ.

Для выборочных данных со средним значением X¯ и стандартное отклонение S, z - счет точки данных x

z=(xX¯)S.

z- измеряют расстояние точки данных от среднего значения в терминах стандартного отклонения. Это также называется стандартизацией данных. Стандартизированный набор данных имеет среднее значение 0 и стандартное отклонение 1, и сохраняет свойства формы исходного набора данных (та же скошенность и эксцесс).

Можно использовать z - баллы, чтобы поместить данные по той же шкале перед последующим анализом. Это позволяет вам, чтобы сравнить два или больше набора данных с различными модулями.

Многомерный массив

Многомерный массив является массивом больше чем с двумя размерностями. Например, если X 1 массивом 3 на 4, то X 3D массив.

Первая неодноэлементная размерность

Первая неодноэлементная размерность является первой размерностью массива, размер которого не равен 1. Например, если X 1 2 массивом 3 на 4, затем второе измерение является первой неодноэлементной размерностью X.

Демонстрационное стандартное отклонение

Демонстрационным стандартным отклонением S дают

S=i=1n(xiX¯)2n1.

S является квадратным корнем из несмещенного средства оценки отклонения населения от который X чертится, настолько же долго как X состоит из независимых, тождественно распределенных выборок. X¯ демонстрационное среднее значение.

Заметьте, что знаменателем в этой формуле отклонения является n – 1.

Стандартное отклонение населения

Если данные являются целым населением значений, то можно использовать стандартное отклонение населения,

σ=i=1n(xiμ)2n.

Если X случайная выборка от населения, затем средний μ оценивается демонстрационным средним значением, и σ является смещенным средством оценки наибольшего правдоподобия стандартного отклонения населения.

Заметьте, что знаменателем в этой формуле отклонения является n.

Алгоритмы

zscore возвращает NaNs для любой выборки, содержащей NaNs.

zscore возвращает 0s для любой выборки, которая является постоянной (все значения являются тем же самым). Например, если X вектор того же числового значения, затем Z вектор 0s.

Расширенные возможности

Смотрите также

|

Представлено до R2006a