Многомерное распределение t

Определение

Функция плотности вероятностей d-мерной многомерной t- распределения Студента задается

f(x,Σ,ν)=1|Σ|1/21(νπ)dΓ((ν+d)/2)Γ(ν/2)(1+x Σ-1xν)(ν+d)/2.

где x - 1xd вектор, Σ - симметричная, положительная определенная матрица г на г, и ν положительная скалярная величина. В то время как возможно задать многомерный Student's t для сингулярного, плотность не может быть записана как выше. Для сингулярного случая поддерживается только генерация случайных чисел. Обратите внимание, что хотя большинство учебников определяют многомерные Student's t с x, ориентированными как вектор-столбец, для целей программного обеспечения анализа данных x удобнее ориентироваться как вектор-строка, и программное обеспечение Statistics and Machine Learning Toolbox™ использует эту ориентацию.

Фон

Многомерная t- распределения Студента является обобщением одномерной t-составляющей Студента к двум или более переменным. Это распределение для случайных векторов коррелированных переменных, каждый элемент которых имеет одномерное t-распределение Стьюдента. Точно так же, как одномерное t- распределения Студента может быть построено путем деления стандартной одномерной нормальной случайной переменной на квадратный корень одномерной хи-квадратной случайной переменной, многомерное t- распределения Студента может быть построено путем деления многомерного нормального случайного вектора, имеющего нуль среднюю и модуль отклонений одномерную хи-квадратную случайную переменную

Многомерная t- распределения Ученика параметризована с помощью корреляционной матрицы и положительной скалярной величины степеней свободы параметра , аналогично параметру степеней свободы одномерного распределения Стьюдента. Off-диагональные элементы И содержат корреляции между переменными. Обратите внимание, что когда И являются тождества матрицей, переменные некоррелированы; однако они не являются независимыми.

Многомерное t-распределение Студента часто используется в качестве замены многомерного нормального распределения в ситуациях, когда известно, что маргинальные распределения отдельных переменных имеют более толстые хвосты, чем нормальные.

Пример

Построение графиков PDF и CDF многомерного t-распределения

Постройте PDF двухмерного распределения Student's t. Вы также можете использовать это распределение для большего количества размерностей, хотя визуализация не проста.

Rho = [1 .6; .6 1];
nu = 5;
x1 = -3:.2:3; x2 = -3:.2:3;
[X1,X2] = meshgrid(x1,x2);
F = mvtpdf([X1(:) X2(:)],Rho,nu);
F = reshape(F,length(x2),length(x1));
surf(x1,x2,F);
caxis([min(F(:))-.5*range(F(:)),max(F(:))]);
axis([-3 3 -3 3 0 .2])
xlabel('x1'); ylabel('x2'); zlabel('Probability Density');

Figure contains an axes. The axes contains an object of type surface.

Постройте график cdf двухмерного распределения Student's t.

F = mvtcdf([X1(:) X2(:)],Rho,nu);
F = reshape(F,length(x2),length(x1));
surf(x1,x2,F);
caxis([min(F(:))-.5*range(F(:)),max(F(:))]);
axis([-3 3 -3 3 0 1])
xlabel('x1'); ylabel('x2'); zlabel('Cumulative Probability');

Figure contains an axes. The axes contains an object of type surface.

Поскольку двухмерное распределение Стьюдента задано на плоскости, можно также вычислить совокупные вероятности по прямоугольным областям. Для примера этот контурный график иллюстрирует следующий расчет вероятности, содержащейся в модуле квадрате, показанном на рисунке.

contour(x1,x2,F,[.0001 .001 .01 .05:.1:.95 .99 .999 .9999]);
xlabel('x'); ylabel('y');
line([0 0 1 1 0],[1 0 0 1 1],'linestyle','--','color','k');

Figure contains an axes. The axes contains 2 objects of type contour, line.

Вычислите значение вероятности, содержащейся в модуле квадрате.

F = mvtcdf([0 0],[1 1],Rho,nu)
F = 0.1401

Вычисление многомерной совокупной вероятности требует значительно большей работы, чем вычисление одномерной вероятности. По умолчанию в mvtcdf функция вычисляет значения меньше полной точности машины и возвращает оценку ошибки в качестве опционального второго выхода.

[F,err] = mvtcdf([0 0],[1 1],Rho,nu)
F = 0.1401
err = 1.0000e-08

См. также

| |

Похожие темы