Многомерное распределение t

Определение

Функцией плотности вероятности t распределения d-dimensional многомерного Студента дают

f(x,Σ,ν)=1|Σ|1/21(νπ)dΓ((ν+d)/2)Γ(ν/2)(1+x Σ-1xν)(ν+d)/2.

где x является 1 d вектором, Σ является d-by-d симметричной, положительной определенной матрицей, и ν является положительной скалярной величиной. В то время как возможно задать t многомерного Студента для сингулярного Σ, плотность не может быть записана как выше. Для сингулярного случая только поддерживается генерация случайных чисел. Обратите внимание на то, что, в то время как большинство учебников задает t многомерного Студента с x, ориентированным как вектор-столбец, в целях программного обеспечения анализа данных, более удобно ориентировать x как вектор-строку, и программное обеспечение Statistics and Machine Learning Toolbox™ использует ту ориентацию.

Фон

T распределение многомерного Студента является обобщением t одномерного Студента к двум или больше переменным. Это - распределение для случайных векторов коррелированых переменных, каждый элемент которых имеет t распределение одномерного Студента. Таким же образом, когда t распределение одномерного Студента может быть создано путем деления стандартной одномерной нормальной случайной переменной квадратным корнем из одномерной случайной переменной хи-квадрата, t распределение многомерного Студента может быть создано путем деления многомерного нормального случайного вектора, имеющего нулевое среднее значение и модульные отклонения одномерной случайной переменной хи-квадрата.

T распределение многомерного Студента параметрируется с корреляционной матрицей, Σ, и параметр степеней свободы положительной скалярной величины, ν. ν походит на параметр степеней свободы t распределения одномерного Студента. Недиагональные элементы Σ содержат корреляции между переменными. Обратите внимание на то, что, когда Σ является единичной матрицей, переменные являются некоррелироваными; однако, они весьма зависимы.

T распределение многомерного Студента часто используется вместо многомерного нормального распределения в ситуациях, где известно, что предельные распределения отдельных переменных имеют более толстые хвосты, чем нормальное.

Пример

Постройте PDF и CDF Многомерного t-распределения

Постройте PDF t распределения двумерного Студента. Можно использовать это распределение в более высоком количестве размерностей также, несмотря на то, что визуализация не легка.

Rho = [1 .6; .6 1];
nu = 5;
x1 = -3:.2:3; x2 = -3:.2:3;
[X1,X2] = meshgrid(x1,x2);
F = mvtpdf([X1(:) X2(:)],Rho,nu);
F = reshape(F,length(x2),length(x1));
surf(x1,x2,F);
caxis([min(F(:))-.5*range(F(:)),max(F(:))]);
axis([-3 3 -3 3 0 .2])
xlabel('x1'); ylabel('x2'); zlabel('Probability Density');

Постройте cdf t распределения двумерного Студента.

F = mvtcdf([X1(:) X2(:)],Rho,nu);
F = reshape(F,length(x2),length(x1));
surf(x1,x2,F);
caxis([min(F(:))-.5*range(F(:)),max(F(:))]);
axis([-3 3 -3 3 0 1])
xlabel('x1'); ylabel('x2'); zlabel('Cumulative Probability');

Поскольку t распределение двумерного Студента задано на плоскости, можно также вычислить интегральные вероятности по прямоугольным областям. Например, этот контурный график иллюстрирует расчет, который следует вероятности, содержавшей в модульном показанном на рисунке квадрате.

contour(x1,x2,F,[.0001 .001 .01 .05:.1:.95 .99 .999 .9999]);
xlabel('x'); ylabel('y');
line([0 0 1 1 0],[1 0 0 1 1],'linestyle','--','color','k');

Вычислите значение вероятности, содержавшей в модульном квадрате.

F = mvtcdf([0 0],[1 1],Rho,nu)
F = 0.1401

Вычисление многомерной интегральной вероятности требует, чтобы значительно больше работало, чем вычисление одномерной вероятности. По умолчанию, mvtcdf функция вычисляет значения к меньше, чем полной точности машины и возвращает оценку ошибки как дополнительный второй выход.

[F,err] = mvtcdf([0 0],[1 1],Rho,nu)
F = 0.1401
err = 1.0000e-08

Смотрите также

| |

Похожие темы