exponenta event banner

resubPredict

Класс: RegingGP

Прогноз повторного замещения из обученной модели регрессии гауссова процесса

Синтаксис

ypred = resubPredict(gprMdl)
[ypred,ysd] = resubPredict(gprMdl)
[ypred,ysd,yint] = resubPredict(gprMdl)
[ypred,ysd,yint] = resubPredict(gprMdl,Name,Value)

Описание

ypred = resubPredict(gprMdl) возвращает прогнозируемые отклики, ypredдля обученной модели регрессии гауссова процесса (GPR), gprMdl.

[ypred,ysd] = resubPredict(gprMdl) также возвращает оцененные стандартные отклонения прогнозируемых откликов, соответствующие строкам gprMdl.X.

[ypred,ysd,yint] = resubPredict(gprMdl) также возвращает 95% интервалы прогнозирования, yintдля истинных ответов, соответствующих каждой строке обучающих данных, gprMdl.X.

[ypred,ysd,yint] = resubPredict(gprMdl,Name,Value) возвращает интервалы прогнозирования с дополнительными опциями, заданными одним или несколькими Name,Value аргументы пары. Например, можно указать уровень достоверности интервала прогнозирования.

Входные аргументы

развернуть все

Модель регрессии гауссова процесса, заданная как RegressionGP объект.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Уровень значимости для интервалов прогнозирования, указанный как пара, разделенная запятыми, состоящая из 'Alpha' и скалярное значение в диапазоне от 0 до 1.

Пример: 'Alpha',0.01 задает 99% интервалов прогнозирования.

Типы данных: single | double

Выходные аргументы

развернуть все

Прогнозируемые значения отклика, возвращаемые в виде вектора n-by-1, где n - количество наблюдений в обучающих данных.

Стандартное отклонение прогнозируемых значений отклика, соответствующих строкам gprMdl.X, возвращенный как вектор n-by-1. ysd(i), i = 1, 2,..., n, содержит оцененное стандартное отклонение нового отклика, соответствующего значениям предиктора при i-м наблюдении в тренировочных данных.

Интервалы прогнозирования для истинных значений ответа, соответствующих строкам gprMdl.X, возвращается в виде матрицы n-by-2, где n - количество наблюдений в данных обучения. Первый столбец yint содержит нижние пределы, а второй столбец содержит верхние пределы интервалов прогнозирования.

Примеры

развернуть все

В этом примере используется набор данных «Корпус» [1] из архива машинного обучения UCI [2], описанного в разделе http://archive.ics.uci.edu/ml/datasets/Housing. Загрузите данные и сохраните их в текущей папке как файл данных с именем housing.data.

В наборе данных 506 наблюдений. Первые 13 столбцов содержат предикторные значения, а последний столбец содержит ответные значения. Цель состоит в том, чтобы предсказать медианную стоимость домов, занятых владельцами в пригороде Бостона, в зависимости от 13 предикторов.

Загрузите данные и определите вектор отклика и матрицу предиктора.

load('housing.data');
X = housing(:,1:13);
y = housing(:,end);

Обучить модель GPR с использованием подмножества регрессоров ('sr') метод аппроксимации с Matern 3/2 ('Matern32') функция ядра. Прогнозировать с помощью полностью независимого условного ('fic') метод.

gprMdl = fitrgp(X,y,'KernelFunction','Matern32',...
'FitMethod','sr','PredictMethod','fic');

Спрогнозировать ответы с использованием обученной модели GPR. Вычислите 99% интервалы прогнозирования.

[ypred,~,yint] = resubPredict(gprMdl,'Alpha',0.01);

Постройте график фактических значений отклика вместе с прогнозами из модели GPR.

figure;
h1 = area([yint(:,1) yint(:,2)-yint(:,1)],-8,...
'FaceColor',[0.85,0.85,0.85],'EdgeColor',[0.85,0.85,0.85]);
hold on;
h1(1).FaceColor = 'none'; % remove color from bottom area
h1(1).EdgeColor = 'none';
h2 = plot(y,'r'); % Plot original response values
h3 = plot(ypred,'b--'); % Plot predicted response values
legend([h2 h3 h1(2)],'Actual response','Predicted response',...
'Prediction intervals','Location','South');
axis([0 510 -7 65]);
hold off

В серой области показаны 99% интервалы прогнозирования.

Совет

  • Можно выбрать метод прогнозирования во время обучения модели GPR с помощью PredictMethod аргумент пары имя-значение в fitrgp. Метод прогнозирования по умолчанию: 'exact' для n ≤ 10000, где n - количество наблюдений в данных обучения, и 'bcd'(снижение координат блока), в противном случае.

  • Расчет стандартных отклонений, ysdи интервалы прогнозирования, yint, не поддерживается, когда PredictMethod является 'bcd'.

Альтернативы

Чтобы вычислить прогнозируемые отклики для новых данных, используйте predict.

Ссылки

[1] Харрисон, Д. и Д. Л., Рубинфельд. «Гедонические цены и спрос на чистый воздух». Дж. Энвирон. Экономика и управление. Vol.5, 1978, стр. 81-102.

[2] Лихман, M. UCI Machine Learning Repository, Ирвайн, Калифорния: Калифорнийский университет, Школа информации и компьютерных наук, 2013. http://archive.ics.uci.edu/ml.

См. также

| | |

Представлен в R2015b