mnrval

Значения логистической регрессии многочлена

Описание

пример

pihat = mnrval(B,X) возвращает предсказанные вероятности для модели логистической регрессии многочлена с предикторами, X, и содействующие оценки, B.

pihat n-by-k матрица предсказанных вероятностей для каждой категории многочлена. B вектор или матрица, которая содержит содействующие оценки, возвращенные mnrfit. И X n-by-p матрица, которая содержит наблюдения n для предикторов p.

Примечание

mnrval автоматически включает постоянный термин во всех моделях. Не вводите столбец 1 с в X.

пример

[pihat,dlow,dhi] = mnrval(B,X,stats) также возвращает 95% ошибочных границ на предсказанных вероятностях, pihat, с помощью статистики в структуре, stats, возвращенный mnrfit.

Более низкие и верхние доверительные границы для pihat pihat минус dlow и pihat плюс dhi, соответственно. Доверительные границы неодновременны и только применяются к кривой по экспериментальным точкам, не к новым наблюдениям.

[pihat,dlow,dhi] = mnrval(B,X,stats,Name,Value) возвращает предсказанные вероятности и 95% ошибочных границ на предсказанных вероятностях pihat, с дополнительными опциями, заданными одним или несколькими Name,Value парные аргументы.

Например, можно задать тип модели, функцию ссылки и тип вероятностей, чтобы возвратиться.

yhat = mnrval(B,X,ssize) возвращается предсказанная категория значит объемы выборки, ssize.

пример

[yhat,dlow,dhi] = mnrval(B,X,ssize,stats) также вычисляет 95% ошибочных границ на предсказанных количествах yhat, с помощью статистики в структуре, stats, возвращенный mnrfit.

Более низкие и верхние доверительные границы для yhat yhat минус dlo и yhat плюс dhi, соответственно. Доверительные границы неодновременны, и они применяются к кривой по экспериментальным точкам, не к новым наблюдениям.

пример

[yhat,dlow,dhi] = mnrval(B,X,ssize,stats,Name,Value) возвращает предсказанные количества категории и 95% ошибочных границ на предсказанных количествах yhat, с дополнительными опциями, заданными одним или несколькими Name,Value парные аргументы.

Например, можно задать тип модели, функцию ссылки и тип предсказанных количеств, чтобы возвратиться.

Примеры

свернуть все

Соответствуйте регрессии многочлена для номинальных результатов и оцените вероятности категории.

Загрузите выборочные данные.

load fisheriris

Вектор-столбец, species, состоит из ирисовых цветов трех различных разновидностей, setosa, versicolor, virginica. Двойной матричный meas состоит из четырех типов измерений на цветах, длине и ширине чашелистиков и лепестков в сантиметрах, соответственно.

Задайте номинальную переменную отклика.

sp = nominal(species);
sp = double(sp);

Теперь в sp, 1, 2, и 3 указывают на разновидности setosa, versicolor, и virginica, соответственно.

Подбирайте номинальную модель, чтобы оценить разновидности с помощью цветочных измерений в качестве переменных предикторов.

[B,dev,stats] = mnrfit(meas,sp);

Оцените вероятность того, чтобы быть определенным видом разновидностей для ирисового цветка, имеющего измерения (6.3, 2.8, 4.9, 1.7).

x = [6.3, 2.8, 4.9, 1.7];
pihat = mnrval(B,x);
pihat
pihat = 1×3

         0    0.3977    0.6023

Вероятность ирисового цветка, имеющего измерения (6.3, 2.8, 4.9, 1.7), быть setosa 0, versicolor 0.3977, и virginica 0.6023.

Подбирайте модель регрессии многочлена для категориальных ответов с естественным упорядоченным расположением среди категорий. Затем оцените верхние и более низкие доверительные границы для оценок вероятности категории.

Загрузите выборочные данные и задайте переменные предикторы.

load('carbig.mat')
X = [Acceleration Displacement Horsepower Weight];

Переменные предикторы являются ускорением, объемом двигателя, лошадиной силой и весом автомобилей. Переменная отклика является милями на галлон (MPG).

Создайте порядковую переменную отклика, категоризирующую MPG на четыре уровня от 9 до 48 миль на галлон.

miles = ordinal(MPG,{'1','2','3','4'},[],[9,19,29,39,48]);
miles = double(miles);

Теперь в милях, 1 указывает, что автомобили с милями на галлон от 9 до 19, и 2 указывают на автомобили с милями на галлон от 20 до 29. Точно так же 3 и 4 указывают на автомобили с милями на галлон от 30 до 39 и 40 - 48, соответственно.

Подбирайте модель регрессии многочлена для переменной отклика miles. Для порядковой модели, 'link' по умолчанию logit и 'interactions' по умолчанию 'off'.

[B,dev,stats] = mnrfit(X,miles,'model','ordinal');

Вычислите оценки вероятности и 95% ошибочных границ для доверительных интервалов вероятности для миль на галлон автомобиля с x = (12, 113, 110, 2670).

x = [12,113,110,2670];
[pihat,dlow,hi] = mnrval(B,x,stats,'model','ordinal');
pihat
pihat = 1×4

    0.0615    0.8426    0.0932    0.0027

Вычислите доверительные границы для оценок вероятности категории.

LL = pihat - dlow;
UL = pihat + hi;
[LL;UL]
ans = 2×4

    0.0073    0.7829    0.0283   -0.0003
    0.1157    0.9022    0.1580    0.0057

Соответствуйте регрессии многочлена для номинальных результатов и оцените количества категории.

Загрузите выборочные данные.

load fisheriris

Вектор-столбец, species, состоит из ирисовых цветов трех различных разновидностей, setosa, versicolor, и virginica. Двойной матричный meas состоит из четырех типов измерений на цветах, длине и ширине чашелистиков и лепестков в сантиметрах, соответственно.

Задайте номинальную переменную отклика.

sp = nominal(species);
sp = double(sp);

Теперь в sp, 1, 2, и 3 указывают на разновидности setosa, versicolor, и virginica, соответственно.

Подбирайте номинальную модель, чтобы оценить разновидности на основе цветочных измерений.

[B,dev,stats] = mnrfit(meas,sp);

Оцените номер в каждой категории разновидностей для выборки 100 ирисовых цветов все с измерениями (6.3, 2.8, 4.9, 1.7).

x = [6.3, 2.8, 4.9, 1.7];
yhat = mnrval(B,x,18)
yhat = 1×3

         0    7.1578   10.8422

Оцените ошибочные границы для количеств.

[yhat,dlow,hi] = mnrval(B,x,18,stats,'model','nominal');

Вычислите доверительные границы для оценок вероятности категории.

LL = yhat - dlow;
UL = yhat + hi;
[LL;UL]
ans = 2×3

         0    3.3019    6.9863
         0   11.0137   14.6981

Создайте выборочные данные с одним переменным предиктором и категориальную переменную отклика с тремя категориями.

x = [-3 -2 -1 0 1 2 3]';
Y = [1 11 13; 2 9 14; 6 14 5; 5 10 10;...
		 5 14 6; 7 13 5; 8 11 6];
[Y x]
ans = 7×4

     1    11    13    -3
     2     9    14    -2
     6    14     5    -1
     5    10    10     0
     5    14     6     1
     7    13     5     2
     8    11     6     3

Существуют наблюдения относительно семи различных значений переменного предиктора x . Переменная отклика Y имеет три категории, и данные показывают, сколько из этих 25 индивидуумов находится в каждой категории Y для каждого наблюдения за x. Например, когда x -3, 1 из 25 индивидуумов наблюдается в категории 1, 11 наблюдаемых в категории 2 и 13 наблюдаемых в категории 3. Точно так же, когда x 1, 5 из индивидуумов наблюдаются в категории 1, 14 наблюдаются в категории 2, и 6 наблюдаются в категории 3.

Постройте номер в каждой категории по сравнению с x значения, на горизонтальном стеке.

bar(x,Y,'stacked'); 
ylim([0 25]);

Подбирайте номинальную модель для отдельных вероятностей категории ответа, с отдельными наклонами на одном переменном предикторе, x, для каждой категории.

betaHatNom = mnrfit(x,Y,'model','nominal',...
    'interactions','on')
betaHatNom = 2×2

   -0.6028    0.3832
    0.4068    0.1948

Первая строка betaHatOrd содержит условия прерывания для первых двух категорий ответа. Вторая строка содержит наклоны. mnrfit принимает третью категорию как ссылочную категорию и следовательно принимает, что коэффициенты для третьей категории являются нулем.

Вычислите предсказанные вероятности для трех категорий ответа.

xx = linspace(-4,4)';
piHatNom = mnrval(betaHatNom,xx,'model','nominal',...
    'interactions','on');

Вероятность того, чтобы быть в третьей категории равняется просто 1 - P (y = 1) - P (y = 2).

Постройте предполагаемое совокупное число в каждой категории на столбчатом графике.

line(xx,cumsum(25*piHatNom,2),'LineWidth',2);

Интегральная вероятность для третьей категории всегда равняется 1.

Теперь подбирайте "параллельную" порядковую модель для совокупных вероятностей категории ответа, с общим наклоном на одном переменном предикторе, x, через все категории:

betaHatOrd = mnrfit(x,Y,'model','ordinal',...
    'interactions','off')
betaHatOrd = 3×1

   -1.5001
    0.7266
    0.2642

Первые два элемента betaHatOrd условия прерывания для первых двух категорий ответа. Последний элемент betaHatOrd общий наклон.

Вычислите предсказанные интегральные вероятности для первых двух категорий ответа. Интегральная вероятность для третьей категории всегда равняется 1.

piHatOrd = mnrval(betaHatOrd,xx,'type','cumulative',...
    'model','ordinal','interactions','off');

Постройте предполагаемое совокупное число на столбчатом графике наблюдаемого совокупного числа.

figure()
bar(x,cumsum(Y,2),'grouped'); 
ylim([0 25]);
line(xx,25*piHatOrd,'LineWidth',2);

Входные параметры

свернуть все

Коэффициент оценивает для модели логистической регрессии многочлена в виде вектора или матрицы, возвращенной mnrfit. Это - вектор или матрица в зависимости от модели и взаимодействий.

Пример: B = mnrfit(X,y); pihat = mnrval(B,X)

Типы данных: single | double

Выборочные данные на предикторах в виде n-by-p. X содержит наблюдения n для предикторов p.

Примечание

mnrval автоматически включает постоянный термин во всех моделях. Не вводите столбец 1 с в X.

Пример: pihat = mnrval(B,X)

Типы данных: single | double

Статистика модели в виде структуры, возвращенной mnrfit. Необходимо использовать stats входной параметр в mnrval вычислить более низкие и верхние ошибочные границы на вероятностях категории и количествах.

Пример: [B,dev,stats] = mnrfit(X,y);[pihat,dlo,dhi] = mnrval(B,X,stats)

Объемы выборки, чтобы возвратить количество элементов в ответ категории для каждой комбинации переменных предикторов в виде n-1 вектор-столбца положительных целых чисел.

Например, для переменной отклика, имеющей три категории, если наблюдением за количеством индивидуумов в каждой категории является y 1, y 2, и y 3, соответственно, то объемом выборки, m, для того наблюдения является m = y 1 + y 2 + y 3.

Если объемы выборки для наблюдений n находятся в векторном sample, затем можно ввести объемы выборки можно следующим образом.

Пример: yhat = mnrval(B,X,sample)

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'model','ordinal','link','probit','type','cumulative' задает тот mnrval возвращает оценки для интегральных вероятностей для порядковой модели с функцией ссылки пробита.

Тип подгонки модели многочлена mnrfitВ виде разделенной запятой пары, состоящей из 'model' и одно из следующих.

'nominal'Значение по умолчанию. Задайте, когда не будет никакого упорядоченного расположения среди категорий ответа.
'ordinal'Задайте, когда будет естественное упорядоченное расположение среди категорий ответа.
'hierarchical'Задайте, когда выбор категории ответа будет последователен.

Пример: 'model', 'ordinal'

Индикатор для взаимодействия между категориями многочлена и коэффициентами в подгонке модели mnrfitВ виде разделенной запятой пары, состоящей из 'interactions' и одно из следующих.

'on'Значение по умолчанию для номинальных и иерархических моделей. Задайте, чтобы подобрать модель с различными прерываниями и коэффициентами через категории.
'off'Значение по умолчанию для порядковых моделей. Задайте, чтобы подобрать модель с различными прерываниями, но единый набор коэффициентов для переменных предикторов, через все категории многочлена. Это часто описывается как параллельная регрессия или пропорциональная модель разногласий.

Пример: 'interactions''off'

Типы данных: логический

Тип вероятностей или количеств, чтобы оценить в виде разделенной запятой пары включая 'type' и одно из следующих.

'category'Значение по умолчанию. Задайте, чтобы возвратить предсказания и ошибочные границы для вероятностей (или количества) категорий многочлена k.
'cumulative'Задайте, чтобы возвратить предсказания и доверительные границы для интегральных вероятностей (или количества) первого k – 1 категория многочлена как n (k – 1) матрица. Предсказанная интегральная вероятность для k th категория всегда равняется 1.
'conditional'Задайте, чтобы возвратить предсказания и ошибочные границы в терминах первого k – 1 условная вероятность категории (количества), т.е. вероятность (количество) для категории j, учитывая результат в категории j или выше. Когда 'type' 'conditional', и вы предоставляете аргумент ssize объема выборки, предсказанные количества в каждой строке X обусловливаются на соответствующем элементе ssize, через все категории.

Пример: 'type', 'cumulative'

Доверительный уровень для ошибки ограничивает в виде разделенной запятой пары, состоящей из 'confidence' и скалярное значение в области значений (0,1).

Например, для 99% ошибочных границ, можно задать доверие можно следующим образом:

Пример: 'confidence',0.99

Типы данных: single | double

Выходные аргументы

свернуть все

Вероятность оценивает для каждой категории многочлена, возвращенной как n (k – 1) матрица, где n является количеством наблюдений, и k является количеством категорий ответа.

Считайте оценки для номера в каждой категории ответа, возвращенной как n-by-k – 1 матрица, где n является количеством наблюдений, и k является количеством категорий ответа.

Более низкая ошибка, обязанная вычислить более низкую доверительную границу для pihat или yhat, возвращенный как вектор-столбец.

Более низкая доверительная граница для pihat pihat минус dlow. Точно так же более низкая доверительная граница для yhat yhat минус dlow. Доверительные границы неодновременны и только применяются к кривой по экспериментальным точкам, не к новым наблюдениям.

Верхняя ошибка, обязанная вычислить верхнюю доверительную границу для pihat или yhat, возвращенный как вектор-столбец.

Верхняя доверительная граница для pihat pihat плюс dhi. Точно так же верхняя доверительная граница для yhat yhat плюс dhi. Доверительные границы неодновременны и только применяются к кривой по экспериментальным точкам, не к новым наблюдениям.

Ссылки

[1] Маккуллаг, P. и Дж. А. Нелдер. Обобщенные линейные модели. Нью-Йорк: Chapman & Hall, 1990.

Представленный в R2006b