Создайте и анализируйте модель линейной регрессии с эффектами взаимодействия и интерпретируйте результаты.
load hospital
Чтобы сохранить только первый столбец артериального давления, храните данные в таблице.
tbl = table(hospital.Sex,hospital.Age,hospital.Weight,hospital.Smoker,hospital.BloodPressure(:,1), ... 'VariableNames',{'Sex','Age','Weight','Smoker','BloodPressure'});
Для первоначальной модели используйте полную модель со всеми условиями и их попарными взаимодействиями.
mdl = stepwiselm(tbl,'interactions')
1. Removing Sex:Smoker, FStat = 0.050738, pValue = 0.8223 2. Removing Weight:Smoker, FStat = 0.07758, pValue = 0.78124 3. Removing Age:Weight, FStat = 1.9717, pValue = 0.16367 4. Removing Sex:Age, FStat = 0.32389, pValue = 0.57067 5. Removing Age:Smoker, FStat = 2.4939, pValue = 0.11768
mdl = Linear regression model: BloodPressure ~ 1 + Age + Smoker + Sex*Weight Estimated Coefficients: Estimate SE tStat pValue ________ ________ _______ __________ (Intercept) 133.17 10.337 12.883 1.76e-22 Sex_Male -35.269 17.524 -2.0126 0.047015 Age 0.11584 0.067664 1.712 0.090198 Weight -0.1393 0.080211 -1.7367 0.085722 Smoker_1 9.8307 1.0229 9.6102 1.2391e-15 Sex_Male:Weight 0.2341 0.11192 2.0917 0.039162 Number of observations: 100, Error degrees of freedom: 94 Root Mean Squared Error: 4.72 R-squared: 0.53, Adjusted R-Squared: 0.505 F-statistic vs. constant model: 21.2, p-value = 4e-14
Итоговой моделью в форме формулы является BloodPressure ~ 1 + Age + Smoker + Sex*Weight
. Эта модель включает все четыре основных эффекта (Возраст, Курильщик, Пол, Вес) и двухстороннее взаимодействие между Sex
и Weight
. Эта модель соответствует
где
артериальное давление
коэффициенты
переменная индикатора для курения; указывает на курящего пациента тогда как указывает на пациента для некурящих
переменная индикатора для пола; указывает на штекерного пациента тогда как указывает на пациентку
Age
переменная
Weight
переменная
остаточный член
Следующая таблица показывает подбиравшую линейную модель для каждого пола и курения комбинации.
Как замечено по этим моделям, и покажите, сколько изменяет прерывание функции отклика, когда переменная индикатора принимает значение 1 по сравнению с тем, когда это принимает значение 0. , однако, показывает эффект переменной Weight на переменной отклика, когда переменная индикатора для пола принимает значение 1 по сравнению с тем, когда это принимает значение 0. Можно исследовать основные эффекты и эффекты взаимодействия в итоговой модели с помощью методов LinearModel
класс можно следующим образом.
figure plotSlice(mdl)
Этот график показывает основные эффекты для всех переменных предикторов. Зеленая линия в каждом телевикторины изменение в переменной отклика как функция переменного предиктора, когда все другие переменные предикторы считаются постоянные. Например, для курящего штекерного пациента в возрасте 37,5, ожидаемое артериальное давление увеличивается как вес терпеливых увеличений, учитывая все остальное то же самое.
Пунктирные красные кривые в каждой телевикторине 95% доверительных границ для предсказанных значений отклика.
Горизонтальная пунктирная линия в каждом телевикторины предсказанный ответ для определенного значения переменного предиктора, соответствующего вертикальной пунктирной линии. Можно перетащить эти линии, чтобы получить предсказанные значения отклика в других значениях предиктора, как показано затем.
Например, ожидаемое значение переменной отклика 118.3497, когда пациентка является розеткой, для некурящих, возраст 40.3788, и взвешивает 139,9545 фунтов. Значения в квадратных скобках, [114.621, 122.079], показывают нижние и верхние пределы 95%-го доверительного интервала для предполагаемого ответа. Обратите внимание на то, что, для пациентки для некурящих, ожидаемые уменьшения артериального давления, когда вес увеличивается, учитывая все остальное считается постоянным.
plotEffects(mdl)
Этот график отображает основные эффекты. Круги показывают величину эффекта, и синие линии показывают верхние и более низкие пределы достоверности для основного эффекта. Например, быть курильщиком увеличивает ожидаемое артериальное давление на 10 модулей, по сравнению с тем, чтобы быть некурящим, учитывая все остальное считается постоянным. Ожидаемое артериальное давление увеличивает приблизительно два модуля для штекеров по сравнению с розетками, снова, учитывая другие предикторы, сохраненные постоянными. Увеличение возраста от 25 до 50 причин ожидаемое увеличение 4 модулей, тогда как изменение в весе от 111 до 202 причин об уменьшении с 4 модулями в ожидаемом артериальном давлении, учитывая все остальное сохраненное постоянным.
figure plotInteraction(mdl,'Sex','Weight')
Этот график отображается, удар изменения в одном факторе, учитывая другой фактор фиксируется в значении.
Будьте осторожны при интерпретации эффектов взаимодействия. Когда существует недостаточно данных по всем факторным комбинациям, или данные высоко сопоставляются, это может затруднить, чтобы определить эффект взаимодействия изменения одного фактора при хранении другого фиксированного. В таких случаях предполагаемый эффект взаимодействия является экстраполяцией из данных.
Синие круги показывают основной эффект конкретного термина, как в основном графике эффектов. Красные круги показывают удар изменения в одном термине для фиксированных значений другого термина. Например, в нижней половине этого графика, красные круги показывают удар изменения веса в розеточных и штекерных пациентах, отдельно. Вы видите, что увеличение веса розетки от 111 до 202 фунтов вызывает об уменьшении с 14 модулями в ожидаемом артериальном давлении, в то время как увеличение той же суммы в весе штекерных причин пациента об увеличении с 5 модулями ожидаемого артериального давления, снова, учитывая другие предикторы считаются постоянными.
figure plotInteraction(mdl,'Sex','Weight','predictions')
Этот график показывает эффект замены одной переменной, когда другой переменный предиктор считается постоянный. В этом примере последний рисунок показывает переменную отклика, артериальное давление, как функция веса, когда переменный пол фиксируется в штекерах и розетках. Линии для штекеров и розеток пересекаются, который указывает на сильное взаимодействие между весом и полом. Вы видите, что ожидаемое артериальное давление увеличивается, когда вес штекерного пациента увеличивается, но уменьшается, как вес пациентки увеличивается.
fitlm
| LinearModel
| plotEffects
| plotInteraction
| plotSlice
| stepwiselm