Уверенность и границы прогноза

О границах уверенности и прогноза

Программное обеспечение Curve Fitting Toolbox™ позволяет вам вычислить доверительные границы для подходящих коэффициентов и границы прогноза для новых наблюдений или для подходящей функции. Кроме того, для границ прогноза, можно вычислить одновременные границы, которые учитывают все значения предиктора, или можно вычислить неодновременные границы, которые учитывают только отдельные значения предиктора. Содействующие доверительные границы представлены численно, в то время как границы прогноза отображены графически и также доступны численно.

Доступная уверенность и границы прогноза получены в итоге ниже.

Типы границ уверенности и прогноза

IntervalType

Описание

Подходящие коэффициенты

Доверительные границы для подходящих коэффициентов

Новое наблюдение

Прогноз ограничивает для нового наблюдения (значение ответа)

Новая функция

Прогноз ограничивает для нового значения функции

Примечание

Границы прогноза также часто описываются как доверительные границы, потому что вы вычисляете доверительный интервал для предсказанного ответа.

Уверенность и границы прогноза задают нижние значения и верхние значения связанного интервала, и задают ширину интервала. Ширина интервала указывает, насколько сомнительный вы о подходящих коэффициентах, предсказанном наблюдении или предсказанной подгонке. Например, очень широкий интервал для подходящих коэффициентов может указать, что необходимо использовать больше данных при подборе кривой, прежде чем можно будет сказать что-либо очень определенное в коэффициентах.

Границы заданы с уровнем уверенности, которую вы задаете. Уровень уверенности часто - 95%, но это может быть любое значение, такое как 90%, 99%, 99,9%, и так далее. Например, вы можете хотеть взять 5%-й шанс того, чтобы быть неправильным о предсказании нового наблюдения. Поэтому вы вычислили бы 95%-й интервал прогноза. Этот интервал указывает, что у вас есть 95%-й шанс, что новое наблюдение на самом деле содержится в более низких и верхних границах прогноза.

Доверительные границы на коэффициентах

Доверительными границами для подходящих коэффициентов дают

C=b±tS

где b является коэффициентами, произведенными подгонкой, t зависит от доверительного уровня и вычисляется с помощью инверсии кумулятивной функции распределения t Студента, и S является вектором диагональных элементов от предполагаемой ковариационной матрицы содействующих оценок, (XTX) –1s2. В линейной подгонке X является матрицей проекта, в то время как для нелинейного подходящего X якобиан подходящих значений относительно коэффициентов. XT является транспонированием X, и s 2 является среднеквадратической ошибкой.

Доверительные границы отображены в панели Результатов в приложении Curve Fitting с помощью следующего формата.

p1 = 1.275  (1.113, 1.437)

Подходящее значение для коэффициента, который p1 1.275, нижняя граница, 1.113, верхняя граница 1.437, и ширина интервала 0.324. По умолчанию доверительный уровень для границ составляет 95%.

Можно вычислить доверительные интервалы в командной строке с функцией confint.

Границы прогноза на подгонках

Как упомянуто ранее, можно вычислить границы прогноза для кривой по экспериментальным точкам. Прогноз основан на существующей подгонке к данным. Кроме того, границы могут быть одновременными и измерить уверенность для всех значений предиктора, или они могут быть неодновременными и измерить уверенность только для одного предопределенного значения предиктора. Если вы предсказываете новое наблюдение, неодновременные границы измеряют уверенность, что новое наблюдение находится в интервале, учитывая одно значение предиктора. Одновременные границы измеряют уверенность, что новое наблюдение находится в интервале независимо от значения предиктора.

Связанный типНаблюдениеФункциональный
Одновременный

y±fs2+xSxT

y±fxSxT

Неодновременный

y±ts2+xSxT

y±txSxT

Где:

  • s 2 является среднеквадратической ошибкой

  • t зависит от доверительного уровня и вычисляется с помощью инверсии кумулятивной функции распределения t Студента

  • f зависит от доверительного уровня и вычисляется с помощью инверсии кумулятивной функции распределения F.

  • S является ковариационной матрицей содействующих оценок, (XTX) –1s2.

  • x является вектором - строкой из матрицы проекта или якобиана, оцененного в заданном значении предиктора.

Можно графически отобразить границы прогноза с помощью приложения Curve Fitting. С приложением Curve Fitting можно отобразить неодновременные границы прогноза для новых наблюдений с Tools> Prediction Bounds. По умолчанию доверительный уровень для границ составляет 95%. Можно изменить этот уровень на любое значение с Tools> Prediction Bounds> Custom.

Можно отобразить числовые границы прогноза любого типа в командной строке с функцией predint.

Чтобы понять количества, сопоставленные с каждым типом интервала прогноза, вспомните, что данные, подгонка и невязки связаны через формулу

данные = соответствуют + невязки

где подгонка и условия невязок являются оценками условий в формуле

данные = модель + случайная ошибка

Предположим, что вы планируете взять новое наблюдение в значении предиктора x n +1. Вызовите новое наблюдение y n +1 (x n +1) и связанная ошибка ε n +1. Затем

y n +1 (x n +1) = f (x n +1) + ε n +1

где f (x n +1) является истинной, но неизвестной функцией, вы хотите оценить в x n +1. Вероятные значения для нового наблюдения или для предполагаемой функции обеспечиваются неодновременными границами прогноза.

Если вместо этого вы хотите, чтобы вероятное значение нового наблюдения было сопоставлено со значением предиктора, предыдущее уравнение становится

y n +1 (x) = f (x) + ε

Вероятные значения для этого нового наблюдения или для предполагаемой функции обеспечиваются одновременными границами прогноза.

Типы границ прогноза получены в итоге ниже.

Типы границ прогноза

Тип связанных

Одновременный или неодновременный

Связанное уравнение

Наблюдение

Неодновременный

y n +1 (x n +1)

Одновременный

y n +1 (x), для всего x

Функция

Неодновременный

f (x n +1)

Одновременный

f (x), для всего x

Неодновременные и одновременные границы прогноза для нового наблюдения и подходящей функции показывают ниже. Каждый график содержит три кривые: подгонка, более низкие доверительные границы и верхние доверительные границы. Подгонка является экспоненциалом одно термина к сгенерированным данным, и границы отражают 95%-й доверительный уровень. Обратите внимание на то, что интервалы, сопоставленные с новым наблюдением, более широки, чем подходящие функциональные интервалы из-за дополнительной неуверенности в предсказании нового значения ответа (кривая плюс случайные ошибки).

Вычислите интервалы прогноза

Вычислите и постройте наблюдение и функциональные интервалы прогноза для подгонки к шумным данным.

Сгенерируйте шумные данные с экспоненциальным трендом.

x = (0:0.2:5)';
y = 2*exp(-0.2*x) + 0.5*randn(size(x));

Соответствуйте кривой к данным с помощью экспоненциала одно термина.

fitresult = fit(x,y,'exp1');

Вычислите 95%-е наблюдение и функциональные интервалы прогноза, и одновременные и неодновременные.

p11 = predint(fitresult,x,0.95,'observation','off');
p12 = predint(fitresult,x,0.95,'observation','on');
p21 = predint(fitresult,x,0.95,'functional','off');
p22 = predint(fitresult,x,0.95,'functional','on');

Отобразите на графике данные, подгонку и интервалы прогноза. Обратите внимание на то, что границы наблюдения более широки, чем функциональные границы.

subplot(2,2,1)
plot(fitresult,x,y), hold on, plot(x,p11,'m--'), xlim([0 5]), ylim([-1 5])
title('Nonsimultaneous Observation Bounds','FontSize',9)
legend off
   
subplot(2,2,2)
plot(fitresult,x,y), hold on, plot(x,p12,'m--'), xlim([0 5]), ylim([-1 5])
title('Simultaneous Observation Bounds','FontSize',9)
legend off

subplot(2,2,3)
plot(fitresult,x,y), hold on, plot(x,p21,'m--'), xlim([0 5]), ylim([-1 5])
title('Nonsimultaneous Functional Bounds','FontSize',9)
legend off

subplot(2,2,4)
plot(fitresult,x,y), hold on, plot(x,p22,'m--'), xlim([0 5]), ylim([-1 5])
title('Simultaneous Functional Bounds','FontSize',9)
legend({'Data','Fitted curve', 'Prediction intervals'},...
       'FontSize',8,'Location','northeast')