Этот пример показывает использование коэффициента правдоподобия, тестов Вальда и множителя Лагранжа. Эти тесты полезны для оценки и оценки модельных ограничений и, в конечном счете, для выбора модели, которая балансирует часто конкурентные цели адекватности и простоты.
Эконометрические модели являются балансом. С одной стороны, они должны быть достаточно подробными для учета соответствующих экономических факторов и их влияния на наблюдаемые шаблоны данных. С другой стороны, они должны избегать ненужных сложностей, которые приводят к вычислительным проблемам, сверхподбору кривой или проблемам с интерпретацией. Рабочие модели часто разрабатываются путем рассмотрения последовательности вложенных спецификаций, в которой большие, теоретические модели рассматриваются для упрощения ограничений параметров. Если параметры оценены по максимальной вероятности, для оценки адекватности ограниченных моделей обычно используются три классических теста. Они являются тестом коэффициента вероятности, тестом Уолда и тестом множителя Лагранжа.
Логарифмическая правдоподобность параметров модели , заданные данные , обозначается ( | ). Без ограничений на модель, оптимизируется при максимальной оценке правдоподобия (MLE) . С ограничениями формы () , оптимизируется в с обычно пониженной логарифмической правдоподобностью описания данных. Классические тесты оценивают статистическую значимость ограничений модели, используя информацию, полученную из этих оптимизаций. Эта среда очень общий; он охватывает как линейные, так и нелинейные модели, и линейные и нелинейные ограничения. В частности, он расширяет привычные среды t и F тестов для линейных моделей.
Каждый тест использует геометрию поверхности логарифмической правдоподобности, чтобы оценить значимость ограничений модели другим способом:
Тест коэффициента вероятности рассматривает различие в логарифмической правдоподобности при и . Если ограничения незначительны, это различие должна быть около нуля.
Тест Вальда рассматривает значение в . Если ограничения незначительны, это значение должно быть близко к значению в , который равен нулю.
Тест множителя Лагранжа рассматривает градиент, или счет, из в . Если ограничения незначительны, этот вектор должен быть рядом с счетом при , который равен нулю.
Тест коэффициента вероятности оценивает различие в логарифмической правдоподобности непосредственно. Тесты на множитель Вальда и Лагранжа делают это косвенно, с идеей, что незначительные изменения в оцененных величинах могут быть идентифицированы с незначительными изменениями параметров. Эта идентификация зависит от кривизны поверхности логарифмической правдоподобности в окрестности MLE. В результате тесты на множитель Уолда и Лагранжа включают оценку ковариации параметра в формулировку тестовой статистики.
Econometrics Toolbox™ software реализует коэффициент правдоподобия, тесты Уолда и множителя Лагранжа в функциях lratiotest
, waldtest
, и lmtest
, соответственно.
Рассмотрим следующие данные Бюро переписи населения США, дающие средний годовой заработок по уровню образования:
load Data_Income2 numLevels = 8; X = 100*repmat(1:numLevels,numLevels,1); % Levels: 100, 200, ..., 800 x = X(:); % Education y = Data(:); % Income n = length(y); % Sample size levelNames = DataTable.Properties.VariableNames; boxplot(Data,'labels',levelNames) grid on xlabel('Educational Attainment') ylabel('Average Annual Income (1999 Dollars)') title('{\bf Income and Education}')
Распределения доходов в данных зависят от уровня образования x
. Этот шаблон также очевиден на гистограмме данных, которая показывает небольшой размер выборки:
figure edges = [0:0.2:2]*1e5; centers =[0.1:0.2:1.9]*1e5; BinCounts = zeros(length(edges)-1,numLevels); for j = 1:numLevels BinCounts(:,j) = histcounts(Data(:,j),edges); end; h = bar(centers,BinCounts); axis tight grid on legend(h,levelNames) xlabel('Average Annual Income (1999 Dollars)') ylabel('Number of Observations') title('{\bf Income and Education}')
Общей моделью для этого типа данных является гамма- распределение с условной плотностью
где
и
Гамма- распределения являются суммами экспоненциальные распределения, и, таким образом, допускают естественные ограничения на значение . Экспоненциальное распределение с равный 1, монотонно уменьшается и слишком прост для описания унимодальных распределений в данных. В целях рисунка мы будем поддерживать ограниченную модель, которая является суммой двух экспоненциальных распределений, полученных путем наложения ограничения
Эта нулевая модель будет проверена на соответствие неограниченной альтернативе, представленной общим гамма- распределениям.
Функция логарифмической правдоподобности условной гамма-плотности и ее производные найдены аналитически:
где - дигамма-функция, производная от .
Функция логарифмической правдоподобности используется для поиска MLE для ограниченных и неограниченных моделей. Производные используются для построения градиентов и ковариационных оценок параметров для тестов на множитель Вальда и Лагранжа.
Поскольку оптимизаторы в MATLAB ® и ПО Optimization Toolbox™ находят минимумы, мы максимизируем логарифмическую правдоподобность путем минимизации отрицательной функции логарифмической правдоподобности. Использование найденный выше, мы кодируем отрицательную функцию логарифмической правдоподобности с вектором параметра p = [beta;rho]
:
nLLF = @(p)sum(p(2)*(log(p(1)+x))+gammaln(p(2))-(p(2)-1)*log(y)+y./(p(1)+x));
Используем функцию fmincon
чтобы вычислить ограниченные оценки параметров в = 2. Нижняя граница гарантирует, что логарифм в nLLF
оценивается при положительных аргументах:
options = optimoptions(@fmincon,'TolFun',1e-10,'Display','off'); rp0 = [1 1]; % Initial values rlb = [-min(x) 2]; % Lower bounds rub = [Inf 2]; % Upper bounds [rmle,rnLL] = fmincon(nLLF,rp0,[],[],[],[],rlb,rub,[],options); rbeta = rmle(1); % Restricted beta estimate rrho = rmle(2); % Restricted rho estimate rLL = -rnLL; % Restricted loglikelihood
Оценки неограниченных параметров вычисляются аналогичным образом, начиная с начальных значений, заданных ограниченными оценками:
up0 = [rbeta rrho]; % Initial values ulb = [-min(x) 0]; % Lower bounds uub = [Inf Inf]; % Upper bounds [umle,unLL] = fmincon(nLLF,up0,[],[],[],[],ulb,uub,[],options); ubeta = umle(1); % Unrestricted beta estimate urho = umle(2); % Unrestricted rho estimate uLL = -unLL; % Unrestricted loglikelihood
Отображаем MLE на логарифмическом контурном графике отрицательной поверхности логарифмической правдоподобности:
betas = 1e3:1e2:4e4; rhos = 0:0.1:10; [BETAS,RHOS] = meshgrid(betas,rhos); NLL = zeros(size(BETAS)); for i = 1:numel(NLL) NLL(i) = nLLF([BETAS(i),RHOS(i)]); end L = log10(unLL); v = logspace(L-0.1,L+0.1,100); contour(BETAS,RHOS,NLL,v) % Negative loglikelihood surface colorbar hold on plot(ubeta,urho,'bo','MarkerFaceColor','b') % Unrestricted MLE line([1e3 4e4],[2 2],'Color','k','LineWidth',2) % Restriction plot(rbeta,rrho,'bs','MarkerFaceColor','b') % Restricted MLE legend('nllf','umle','restriction','rmle') xlabel('\beta') ylabel('\rho') title('{\bf Unrestricted and Restricted MLEs}')
Интуитивная связь между кривизной поверхности логарифмической правдоподобности и дисперсией/ковариацией оценок параметров формализуется равенством информационной матрицы, которое идентифицирует отрицательное ожидаемое значение Гессиана с информационной матрицей Фишера. Вторые производные в гессианской экспрессии логарифмической гармонии. Информационная матрица Фишера выражает отклонение параметра; его обратной является асимптотическая ковариационная матрица.
Ковариационные оценки, необходимые для тестов на множитель Вальда и Лагранжа, вычисляются различными способами. Одним из подходов является использование векторного произведения градиентов (OPG), которое требует только первых производных логарифмической правдоподобности. Пользуясь популярностью благодаря относительной простоте, оценщик OPG может оказаться ненадежным, особенно с небольшими выборками. Другой, часто предпочтительный, метод оценки является обратным отрицательному ожидаемому Гессиану. По информационному матричному равенству эта оценка является асимптотической ковариацией, подходящей для больших выборок. Если аналитические ожидания трудно вычислить, ожидаемый Гессиан может быть заменен Гессианом, оцененным в оценках параметров, так называемой «наблюдаемой» информацией Фишера.
Мы вычисляем каждую из трех оценок, используя производные найдено ранее. Условные ожидания в Гессиане найдены с помощью
Мы оцениваем оценки в неограниченных оценках параметров, для теста Вальда, а затем в ограниченных оценках параметров для теста множителя Лагранжа.
Различные шкалы для и параметры отражаются в относительных размерах отклонений. Небольшой размер выборки отражается в различиях между оценщиками. Мы увеличиваем точность отображений, чтобы показать эти различия:
format long
Оцененные по оценкам неограниченных параметров, оценщики:
% OPG estimator: UG = [-urho./(ubeta+x)+y.*(ubeta+x).^(-2),-log(ubeta+x)-psi(urho)+log(y)]; Uscore = sum(UG)'; UEstCov1 = inv(UG'*UG) %#ok
UEstCov1 = 2×2
106 ×
6.163691005497379 -0.002335588739630
-0.002335588739630 0.000000949847074
% Hessian estimator (observed information): UDPsi = (psi(urho+0.0001)-psi(urho-0.0001))/(0.0002); % Digamma derivative UH = [sum(urho./(ubeta+x).^2)-2*sum(y./(ubeta+x).^3),-sum(1./(ubeta+x)); ... -sum(1./(ubeta+x)),-n*UDPsi]; UEstCov2 = -inv(UH) %#ok
UEstCov2 = 2×2
106 ×
5.914337099456258 -0.001864365342784
-0.001864365342784 0.000000648730549
% Expected Hessian estimator (expected information): UEH = [-sum(urho./((ubeta+x).^2)), -sum(1./(ubeta+x)); ... -sum(1./(ubeta+x)),-n*UDPsi]; UEstCov3 = -inv(UEH) %#ok
UEstCov3 = 2×2
106 ×
4.993542832706230 -0.001574105100614
-0.001574105100614 0.000000557232359
Оцененные по оценкам ограниченных параметров, оценщики:
% OPG estimator: RG = [-rrho./(rbeta+x)+y.*(rbeta+x).^(-2),-log(rbeta+x)-psi(rrho)+log(y)]; Rscore = sum(RG)'; REstCov1 = inv(RG'*RG) %#ok
REstCov1 = 2×2
107 ×
6.614326247028455 -0.000476569886244
-0.000476569886244 0.000000040110446
% Hessian estimator (observed information): RDPsi = (psi(rrho+0.0001)-psi(rrho-0.0001))/(0.0002); % Digamma derivative RH = [sum(rrho./(rbeta+x).^2)-2*sum(y./(rbeta+x).^3),-sum(1./(rbeta+x)); ... -sum(1./(rbeta+x)),-n*RDPsi]; REstCov2 = -inv(RH) %#ok
REstCov2 = 2×2
107 ×
2.708410822218739 -0.000153134983000
-0.000153134983000 0.000000011081061
% Expected Hessian estimator (expected information): REH = [-sum(rrho./((rbeta+x).^2)),-sum(1./(rbeta+x)); ... -sum(1./(rbeta+x)),-n*RDPsi]; REstCov3 = -inv(REH) %#ok
REstCov3 = 2×2
107 ×
2.613663014369842 -0.000147777891740
-0.000147777891740 0.000000010778169
Вернуться к кратким числовым отображениям:
format short
Критерий коэффициента правдоподобия, который оценивает статистическую значимость различия в логарифмической правдоподобности при неограниченных и ограниченных оценках параметра, обычно считается наиболее надежным из трех классических тестов. Его основным недостатком является то, что он требует оценки обеих моделей. Это может быть проблемой, если либо неограниченная модель, либо ограничения нелинейны, предъявляя значительные требования к необходимой оптимизации.
После того, как необходимые логарифмическая правдоподобность были получены с помощью максимальной оценки правдоподобия, используйте lratiotest
чтобы запустить тест коэффициента правдоподобия:
dof = 1; % Number of restrictions [LRh,LRp,LRstat,cV] = lratiotest(uLL,rLL,dof) %#ok
LRh = logical
1
LRp = 7.9882e-05
LRstat = 15.5611
cV = 3.8415
Тест отклоняет ограниченную модель (LRh = 1
), со значением p (LRp = 7.9882e-005
) значительно ниже уровня значимости по умолчанию (alpha = 0.05
) и тестовую статистику (LRstat = 15.5611
) значительно выше критического значения (cV = 3.8415
).
Как и тесты на множитель Уолда и Лагранжа, тест на отношение вероятностей является асимптотическим; тестовая статистическая величина оценивается с ограничительным распределением, полученным позволением размеру выборки стремиться к бесконечности. Такое же распределение хи-квадрат, со степенью свободы dof
, используется для оценки статистики отдельных тестов каждого из трех тестов с одним и тем же критическим значением cV
. Последствия для получения выводов из небольших выборок должны быть очевидными, и это одна из причин, по которой три теста часто используются вместе, как проверки друг против друга.
Тест Вальда подходит в ситуациях, когда ограничения предъявляют значительные требования к оценке параметра, как в случае с несколькими нелинейными ограничениями. Тест Уолда имеет то преимущество, что он требует только неограниченной оценки параметра. Его основным недостатком является то, что, в отличие от теста коэффициента вероятности, он также требует достаточно точной оценки параметра ковариации.
Чтобы выполнить тест Уолда, ограничения должны быть сформулированы как функции от пространства параметров p-размерности до q-мерного пространства ограничений:
с якобским
Для гамма- распределения под фактор, одно ограничение
преобразует 2-мерное пространство параметров в 1-мерное пространство ограничений с помощью якобиана [0 1].
Использование waldtest
чтобы запустить тест Уолда с каждой из неограниченных ковариационных оценок, вычисленных ранее. Количество ограничений dof
- длина входного вектора r
, поэтому его не нужно вводить явным образом, как для lratiotest
или lmtest
:
r = urho-2; % Restriction vector R = [0 1]; % Jacobian restrictions = {r,r,r}; Jacobians = {R,R,R}; UEstCov = {UEstCov1,UEstCov2,UEstCov3}; [Wh,Wp,Wstat,cV] = waldtest(restrictions,Jacobians,UEstCov) %#ok
Wh = 1x3 logical array
1 1 1
Wp = 1×3
0.0144 0.0031 0.0014
Wstat = 1×3
5.9878 8.7671 10.2066
cV = 1×3
3.8415 3.8415 3.8415
Тест отклоняет ограниченную модель с каждой из ковариационных оценок.
Проверки гипотезы в программном обеспечении Econometrics Toolbox и Statistics Toolbox™ работают на уровне 5% значимости по умолчанию. Уровень значимости может быть изменен с помощью опционального входа:
alpha = 0.01; % 1% significance level [Wh2,Wp2,Wstat2,cV2] = waldtest(restrictions,Jacobians,UEstCov,alpha) %#ok
Wh2 = 1x3 logical array
0 1 1
Wp2 = 1×3
0.0144 0.0031 0.0014
Wstat2 = 1×3
5.9878 8.7671 10.2066
cV2 = 1×3
6.6349 6.6349 6.6349
Оценщик OPG не может отклонить ограниченную модель на новом уровне значимости.
Тест множителя Лагранжа подходит в ситуациях, когда неограниченная модель предъявляет значительные требования к оценке параметра, как в случае, когда ограниченная модель является линейной, но неограниченная модель отсутствует. Тест множителя Лагранжа имеет преимущество, что он требует только ограниченной оценки параметра. Его основным недостатком является то, что, как и тест Вальда, он также требует достаточно точной оценки параметра ковариации.
Использование lmtest
чтобы запустить тест множителя Лагранжа с каждой из ограниченных ковариационных оценок, вычисленных ранее:
scores = {Rscore,Rscore,Rscore};
REstCov = {REstCov1,REstCov2,REstCov3};
[LMh,LMp,LMstat,cV] = lmtest(scores,REstCov,dof) %#ok
LMh = 1x3 logical array
1 1 1
LMp = 1×3
0.0000 0.0024 0.0027
LMstat = 1×3
33.4617 9.2442 8.9916
cV = 1×3
3.8415 3.8415 3.8415
Тест снова отклоняет ограниченную модель с каждой из ковариационных оценок на уровне значимости по умолчанию. Надежность оценщика OPG ставится под вопрос аномально большим значением первой тестовой статистики.
Три теста классической модели на мисспификацию образуют натуральный инструментарий для экономистов. В контексте максимальной оценки правдоподобия все они пытаются провести одно и то же различие между неограниченной и ограниченной моделью в некоторой иерархии постепенно более простых описаний данных. Каждый тест, однако, поставляется с различными требованиями, и поэтому может быть полезен в различных ситуациях моделирования, в зависимости от вычислительных требований. При совместном использовании выводы могут варьироваться среди тестов, особенно с небольшими выборками. Пользователи должны рассматривать тесты только как один из компонентов более широкого статистического и экономического анализа.
[1] Davidson, R., and J. G. MacKinnon. Эконометрическая теория и методы. Оксфорд, Великобритания: Oxford University Press, 2004.
[2] Godfrey, L. G. Misspecification Tests in Econometrics. Кембридж, Великобритания: Cambridge University Press, 1997.
[3] Грин, Уильям. H. Эконометрический анализ. 6th ed. Upper Saddle River, NJ: Prentice Hall, 2008.
[4] Гамильтон, Джеймс Д. Анализ временных рядов. Princeton, NJ: Princeton University Press, 1994.