mnrval

Значения логистической регрессии многочлена

Синтаксис

pihat = mnrval(B,X)
[pihat,dlow,dhi] = mnrval(B,X,stats)
[pihat,dlow,dhi] = mnrval(B,X,stats,Name,Value)
yhat = mnrval(B,X,ssize)
[yhat,dlow,dhi] = mnrval(B,X,ssize,stats)
[yhat,dlow,dhi] = mnrval(B,X,ssize,stats,Name,Value)

Описание

пример

pihat = mnrval(B,X) возвращает предсказанные вероятности для модели логистической регрессии многочлена с предикторами, X, и содействующими оценками, B.

pihat является n-by-k матрицей предсказанных вероятностей для каждой категории многочлена. B является вектором или матрицей, которая содержит содействующие оценки, возвращенные mnrfit. И X является n-by-p матрица, которая содержит наблюдения n для предикторов p.

Примечание

mnrval автоматически включает постоянный термин во всех моделях. Не вводите столбец 1 с в X.

пример

[pihat,dlow,dhi] = mnrval(B,X,stats) также возвращает 95% ошибочных границ на предсказанных вероятностях, pihat, с помощью статистики в структуре, stats, возвращенном mnrfit.

Более низкими и верхними доверительными границами для pihat является pihat минус dlow и pihat плюс dhi, соответственно. Доверительные границы неодновременны и только применяются к кривой по экспериментальным точкам, не к новым наблюдениям.

[pihat,dlow,dhi] = mnrval(B,X,stats,Name,Value) возвращает предсказанные вероятности и 95% ошибочных границ на предсказанных вероятностях pihat, с дополнительными опциями, заданными одним или несколькими аргументами пары Name,Value.

Например, можно задать тип модели, функцию ссылки и тип вероятностей, чтобы возвратиться.

yhat = mnrval(B,X,ssize) возвращается предсказанная категория значит объемы выборки, ssize.

пример

[yhat,dlow,dhi] = mnrval(B,X,ssize,stats) также вычисляет 95% ошибочных границ на предсказанных количествах yhat, с помощью статистики в структуре, stats, возвращенном mnrfit.

Более низкими и верхними доверительными границами для yhat является yhat минус dlo и yhat плюс dhi, соответственно. Доверительные границы неодновременны, и они применяются к кривой по экспериментальным точкам, не к новым наблюдениям.

пример

[yhat,dlow,dhi] = mnrval(B,X,ssize,stats,Name,Value) возвращает предсказанные количества категории и 95% ошибочных границ на предсказанных количествах yhat, с дополнительными опциями, заданными одним или несколькими аргументами пары Name,Value.

Например, можно задать тип модели, функцию ссылки и тип предсказанных количеств, чтобы возвратиться.

Примеры

свернуть все

Соответствуйте регрессии многочлена для номинальных результатов и оцените вероятности категории.

Загрузите выборочные данные.

load fisheriris

Вектор-столбец, species, состоит из ирисовых цветов трех различных разновидностей, setosa, versicolor, virginica. Двойной матричный meas состоит из четырех типов измерений на цветах, длине и ширине чашелистиков и лепестков в сантиметрах, соответственно.

Задайте номинальную переменную отклика.

sp = nominal(species);
sp = double(sp);

Теперь в sp, 1, 2, и 3 указывают на разновидности setosa, versicolor, и virginica, соответственно.

Соответствуйте номинальной модели, чтобы оценить разновидности с помощью цветочных измерений в качестве переменных прогноза.

[B,dev,stats] = mnrfit(meas,sp);

Оцените вероятность того, чтобы быть определенным видом разновидностей для ирисового цветка, имеющего измерения (6.3, 2.8, 4.9, 1.7).

x = [6.3, 2.8, 4.9, 1.7];
pihat = mnrval(B,x);
pihat
pihat = 1×3

         0    0.3977    0.6023

Вероятность ирисового цветка, имеющего измерения (6.3, 2.8, 4.9, 1.7), быть setosa 0, versicolor 0.3977, и virginica 0.6023.

Соответствуйте модели регрессии многочлена для категориальных ответов с естественным упорядоченным расположением среди категорий. Затем оцените верхние и более низкие доверительные границы для оценок вероятности категории.

Загрузите выборочные данные и задайте переменные прогноза.

load('carbig.mat')
X = [Acceleration Displacement Horsepower Weight];

Переменные прогноза являются ускорением, объемом двигателя, лошадиной силой и весом автомобилей. Переменная отклика является милями на галлон (MPG).

Создайте порядковую переменную отклика, категоризирующую MPG на четыре уровня от 9 до 48 миль на галлон.

miles = ordinal(MPG,{'1','2','3','4'},[],[9,19,29,39,48]);
miles = double(miles);

Теперь в милях, 1 указывает, что автомобили с милями на галлон от 9 до 19, и 2 указывают на автомобили с милями на галлон от 20 до 29. Точно так же 3 и 4 указывают на автомобили с милями на галлон от 30 до 39 и 40 - 48, соответственно.

Соответствуйте модели регрессии многочлена для переменной отклика miles. Для порядковой модели 'link' по умолчанию является logit, и 'interactions' по умолчанию является 'off'.

[B,dev,stats] = mnrfit(X,miles,'model','ordinal');

Вычислите оценки вероятности и 95% ошибочных границ для доверительных интервалов вероятности для миль на галлон автомобиля с x = (12, 113, 110, 2670).

x = [12,113,110,2670];
[pihat,dlow,hi] = mnrval(B,x,stats,'model','ordinal');
pihat
pihat = 1×4

    0.0615    0.8426    0.0932    0.0027

Вычислите доверительные границы для оценок вероятности категории.

LL = pihat - dlow;
UL = pihat + hi;
[LL;UL]
ans = 2×4

    0.0073    0.7829    0.0283   -0.0003
    0.1157    0.9022    0.1580    0.0057

Соответствуйте регрессии многочлена для номинальных результатов и оцените количества категории.

Загрузите выборочные данные.

load fisheriris

Вектор-столбец, species, состоит из ирисовых цветов трех различных разновидностей, setosa, versicolor, и virginica. Двойной матричный meas состоит из четырех типов измерений на цветах, длине и ширине чашелистиков и лепестков в сантиметрах, соответственно.

Задайте номинальную переменную отклика.

sp = nominal(species);
sp = double(sp);

Теперь в sp, 1, 2, и 3 указывают на разновидности setosa, versicolor, и virginica, соответственно.

Соответствуйте номинальной модели, чтобы оценить разновидности на основе цветочных измерений.

[B,dev,stats] = mnrfit(meas,sp);

Оцените номер в каждой категории разновидностей для выборки 100 ирисовых цветов все с измерениями (6.3, 2.8, 4.9, 1.7).

x = [6.3, 2.8, 4.9, 1.7];
yhat = mnrval(B,x,18)
yhat = 1×3

         0    7.1578   10.8422

Оцените ошибочные границы для количеств.

[yhat,dlow,hi] = mnrval(B,x,18,stats,'model','nominal');

Вычислите доверительные границы для оценок вероятности категории.

LL = yhat - dlow;
UL = yhat + hi;
[LL;UL]
ans = 2×3

         0    3.3019    6.9863
         0   11.0137   14.6981

Создайте выборочные данные с одной переменной прогноза и категориальную переменную отклика с тремя категориями.

x = [-3 -2 -1 0 1 2 3]';
Y = [1 11 13; 2 9 14; 6 14 5; 5 10 10;...
		 5 14 6; 7 13 5; 8 11 6];
[Y x]
ans = 7×4

     1    11    13    -3
     2     9    14    -2
     6    14     5    -1
     5    10    10     0
     5    14     6     1
     7    13     5     2
     8    11     6     3

Существуют наблюдения относительно семи различных значений переменной прогноза x. Переменная отклика Y имеет три категории и данные, показывает, сколько из этих 25 человек находится в каждой категории Y для каждого наблюдения за x. Например, когда x-3, 1 из 25 человек наблюдается в категории 1, 11 наблюдаемых в категории 2 и 13 наблюдаемых в категории 3. Точно так же, когда x равняется 1, 5 из людей наблюдаются в категории 1, 14 наблюдаются в категории 2, и 6 наблюдаются в категории 3.

Постройте номер в каждой категории по сравнению со значениями x на горизонтальном стеке.

bar(x,Y,'stacked'); 
ylim([0 25]);

Соответствуйте номинальной модели для отдельных вероятностей категории ответа, с отдельными наклонами на одной переменной прогноза, x, для каждой категории.

betaHatNom = mnrfit(x,Y,'model','nominal',...
    'interactions','on')
betaHatNom = 2×2

   -0.6028    0.3832
    0.4068    0.1948

Первая строка betaHatOrd содержит условия прерывания для первых двух категорий ответа. Вторая строка содержит наклоны. mnrfit принимает третью категорию как ссылочную категорию и следовательно принимает, что коэффициенты для третьей категории являются нулем.

Вычислите предсказанные вероятности для трех категорий ответа.

xx = linspace(-4,4)';
piHatNom = mnrval(betaHatNom,xx,'model','nominal',...
    'interactions','on');

Вероятность того, чтобы быть в третьей категории равняется просто 1 - P (y = 1) - P (y = 2).

Постройте предполагаемое совокупное число в каждой категории на гистограмме.

line(xx,cumsum(25*piHatNom,2),'LineWidth',2);

Интегральная вероятность для третьей категории всегда равняется 1.

Теперь, соответствуйте "параллельной" порядковой модели для совокупных вероятностей категории ответа, с общим наклоном на одной переменной прогноза, x, через все категории:

betaHatOrd = mnrfit(x,Y,'model','ordinal',...
    'interactions','off')
betaHatOrd = 3×1

   -1.5001
    0.7266
    0.2642

Первые два элемента betaHatOrd являются условиями прерывания для первых двух категорий ответа. Последний элемент betaHatOrd является общим наклоном.

Вычислите предсказанные интегральные вероятности для первых двух категорий ответа. Интегральная вероятность для третьей категории всегда равняется 1.

piHatOrd = mnrval(betaHatOrd,xx,'type','cumulative',...
    'model','ordinal','interactions','off');

Постройте предполагаемое совокупное число на гистограмме наблюдаемого совокупного числа.

figure()
bar(x,cumsum(Y,2),'grouped'); 
ylim([0 25]);
line(xx,25*piHatOrd,'LineWidth',2);

Входные параметры

свернуть все

Коэффициент оценивает для модели логистической регрессии многочлена, заданной как вектор или матрица, возвращенная mnrfit. Это - вектор или матрица в зависимости от модели и взаимодействий.

Пример: B = mnrfit(X,y); pihat = mnrval(B,X)

Типы данных: single | double

Выборочные данные на предикторах, заданных как n-by-p. X содержит наблюдения n для предикторов p.

Примечание

mnrval автоматически включает постоянный термин во всех моделях. Не вводите столбец 1 с в X.

Пример: pihat = mnrval(B,X)

Типы данных: single | double

Образцовая статистика, заданная как структура, возвращенная mnrfit. Необходимо использовать входной параметр stats в mnrval, чтобы вычислить более низкие и верхние ошибочные границы на вероятностях категории и количествах.

Пример: [B,dev,stats] = mnrfit(X,y); [pihat,dlo,dhi] = mnrval(B,X,stats)

Объемы выборки, чтобы возвратить количество элементов в ответ категории для каждой комбинации переменных прогноза, заданных как n-1 вектор-столбец положительных целых чисел.

Например, для переменной отклика, имеющей три категории, если наблюдением за количеством людей в каждой категории является y 1, y 2, и y 3, соответственно, то объемом выборки, m, для того наблюдения является m = y 1 + y 2 + y 3.

Если объемы выборки для наблюдений n находятся в векторном sample, то можно ввести объемы выборки можно следующим образом.

Пример: yhat = mnrval(B,X,sample)

Типы данных: single | double

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'model','ordinal','link','probit','type','cumulative' указывает, что mnrval возвращает оценки для интегральных вероятностей для порядковой модели с функцией ссылки пробита.

Тип подгонки модели многочлена mnrfit, заданным как пара, разделенная запятой, состоящая из 'model' и одно из следующих.

'nominal'Значение по умолчанию. Задайте, когда не будет никакого упорядоченного расположения среди категорий ответа.
'ordinal'Задайте, когда будет естественное упорядоченное расположение среди категорий ответа.
'hierarchical'Задайте, когда выбор категории ответа будет последователен.

Пример: 'model', 'ordinal'

Индикатор для взаимодействия между категориями многочлена и коэффициентами в образцовой подгонке mnrfit, заданным как пара, разделенная запятой, состоящая из 'interactions' и одно из следующих.

'on'Значение по умолчанию для номинальных и иерархических моделей. Задайте, чтобы подобрать модель с различными прерываниями и коэффициентами через категории.
'off'Значение по умолчанию для порядковых моделей. Задайте, чтобы подобрать модель с различными прерываниями, но единый набор коэффициентов для переменных прогноза, через все категории многочлена. Это часто описывается как параллельная регрессия или пропорциональная модель разногласий.

Пример: 'interactions', 'off'

Типы данных: логический

Тип вероятностей или количеств, чтобы оценить, заданный как пара, разделенная запятой включая 'type' и одно из следующих.

'category'Значение по умолчанию. Задайте, чтобы возвратить прогнозы и ошибочные границы для вероятностей (или количества) категорий многочлена k.
'cumulative'Задайте, чтобы возвратить прогнозы и доверительные границы для интегральных вероятностей (или количества) первого k – 1 категория многочлена как n (k – 1) матрица. Предсказанная интегральная вероятность для k th категория всегда равняется 1.
'conditional'Задайте, чтобы возвратить прогнозы и ошибочные границы с точки зрения первого k – 1 условная вероятность категории (количества), т.е. вероятность (количество) для категории j, учитывая результат в категории j или выше. Когда 'type' является 'conditional', и вы предоставляете аргумент ssize объема выборки, предсказанные количества в каждой строке X обусловливаются на соответствующем элементе ssize через все категории.

Пример: 'type', 'cumulative'

Доверительный уровень для ошибочных границ, заданных как пара, разделенная запятой, состоящая из 'confidence' и скалярного значения в области значений (0,1).

Например, для 99% ошибочных границ, можно задать уверенность можно следующим образом:

Пример: 'confidence', 0.99

Типы данных: single | double

Выходные аргументы

свернуть все

Вероятность оценивает для каждой категории многочлена, возвращенной как n (k – 1) матрица, где n является количеством наблюдений, и k является количеством категорий ответа.

Считайте оценки для номера в каждой категории ответа, возвращенной как n-by-k – 1 матрица, где n является количеством наблюдений, и k является количеством категорий ответа.

Более низкая ошибка, обязанная вычислить более низкую доверительную границу для pihat или yhat, возвратилась как вектор-столбец.

Более низкой доверительной границей для pihat является pihat минус dlow. Точно так же более низкой доверительной границей для yhat является yhat минус dlow. Доверительные границы неодновременны и только применяются к кривой по экспериментальным точкам, не к новым наблюдениям.

Верхняя ошибка, обязанная вычислить верхнюю доверительную границу для pihat или yhat, возвратилась как вектор-столбец.

Верхней доверительной границей для pihat является pihat плюс dhi. Точно так же верхней доверительной границей для yhat является yhat плюс dhi. Доверительные границы неодновременны и только применяются к кривой по экспериментальным точкам, не к новым наблюдениям.

Ссылки

[1] Маккуллаг, P. и Дж. А. Нелдер. Обобщенные линейные модели. Нью-Йорк: Chapman & Hall, 1990.

Представленный в R2006b