подвести итог

Статистика сводных данных распределения стандартной Байесовой модели линейной регрессии

Чтобы получить сводные данные Байесовой модели линейной регрессии для выбора предиктора, смотрите summarize.

Синтаксис

summarize(Mdl)
SummaryStatistics = summarize(Mdl)

Описание

пример

summarize(Mdl) отображает табличные сводные данные случайных коэффициентов регрессии и отклонение воздействия стандартной Байесовой модели Mdl линейной регрессии в командной строке. Для каждого параметра сводные данные включают:

  • Стандартное отклонение (квадратный корень из отклонения)

  • 95% equitailed вероятные интервалы

  • Вероятность, что параметр больше, чем 0

  • Описание дистрибутивов, если известный

пример

SummaryStatistics = summarize(Mdl) возвращает массив структур, который хранит a:

  • Таблица, содержащая сводные данные коэффициентов регрессии и отклонения воздействия

  • Таблица, содержащая ковариации между переменными

  • Описание совместного распределения параметров

Примеры

свернуть все

Считайте несколько моделью линейной регрессии, которая предсказывает США действительный валовой национальный продукт (GNPR) с помощью линейной комбинации индекса промышленного производства (IPI), общая занятость (E) и действительная заработная плата (WR).

GNPRt=β0+β1IPIt+β2Et+β3WRt+εt.

\forall t моменты времени, εt серия независимых Гауссовых воздействий со средним значением 0 и отклонение σ2.

Примите эти предшествующие дистрибутивы:

  • β|σ2N4(M,σ2V). M 4 1 вектор средних значений, и V масштабированная положительная определенная ковариационная матрица 4 на 4.

  • σ2IG(A,B). A и B форма и шкала, соответственно, обратного гамма распределения.

Эти предположения и вероятность данных подразумевают нормальную обратную гамму сопряженная модель.

Создайте сопряженную предшествующую модель нормальной обратной гаммы для параметров линейной регрессии. Задайте количество предикторов p и имена переменных.

p = 3;
VarNames = ["IPI" "E" "WR"];
PriorMdl = bayeslm(p,'ModelType','conjugate','VarNames',VarNames);

PriorMdl является conjugateblm Байесов объект модели линейной регрессии, представляющий предшествующее распределение отклонения воздействия и коэффициентов регрессии.

Обобщите предшествующее распределение.

summarize(PriorMdl)
 
           |  Mean     Std            CI95         Positive       Distribution     
-----------------------------------------------------------------------------------
 Intercept |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 IPI       |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 E         |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 WR        |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 Sigma2    | 0.5000   0.5000    [ 0.138,  1.616]     1.000   IG(3.00,    1)        
 

Функция отображает таблицу итоговой статистики и другой информации о предшествующем распределении в командной строке.

Загрузите набор данных Нельсона-Плоссера и создайте переменные для данных об ответе и предиктора.

load Data_NelsonPlosser
X = DataTable{:,PriorMdl.VarNames(2:end)};
y = DataTable.GNPR;

Оцените апостериорные распределения. Подавите отображение оценки.

PosteriorMdl = estimate(PriorMdl,X,y,'Display',false);

PosteriorMdl является объектом модели conjugateblm, который содержит апостериорные распределения β и σ2.

Получите итоговую статистику из апостериорного распределения.

summary = summarize(PosteriorMdl);

summary является массивом структур, содержащим три поля: MarginalDistributions, Covariances и JointDistribution.

Отобразите сводные данные предельного распределения и ковариации при помощи записи через точку.

summary.MarginalDistributions
ans=5×5 table
                   Mean          Std                  CI95              Positive           Distribution      
                 _________    __________    ________________________    _________    ________________________

    Intercept      -24.249        8.7821       -41.514       -6.9847    0.0032977    't (-24.25, 8.65^2, 68)'
    IPI             4.3913        0.1414        4.1134        4.6693            1    't (4.39, 0.14^2, 68)'  
    E            0.0011202    0.00032931    0.00047284     0.0017676      0.99952    't (0.00, 0.00^2, 68)'  
    WR              2.4683       0.34895        1.7822        3.1543            1    't (2.47, 0.34^2, 68)'  
    Sigma2          44.135         7.802        31.427        61.855            1    'IG(34.00, 0.00069)'    

summary.Covariances
ans=5×5 table
                 Intercept         IPI             E             WR         Sigma2
                 __________    ___________    ___________    ___________    ______

    Intercept        77.125        0.77133     -0.0023655         0.5311         0
    IPI             0.77133       0.019994    -6.5001e-06       -0.02948         0
    E            -0.0023655    -6.5001e-06     1.0844e-07    -8.0013e-05         0
    WR               0.5311       -0.02948    -8.0013e-05        0.12177         0
    Sigma2                0              0              0              0    60.871

Поле MarginalDistributions является таблицей итоговой статистики и другой информации об апостериорном распределении. Covariances является таблицей, содержащей ковариационную матрицу параметров.

Входные параметры

свернуть все

Стандартная Байесова модель линейной регрессии, заданная как объект модели в этой таблице.

Объект моделиОписание
conjugateblmЗависимый, нормальная обратная гамма спрягает модель, возвращенную bayeslm или estimate
semiconjugateblmНезависимый, нормальная обратная гамма полуспрягает модель, возвращенную bayeslm
diffuseblmРассейте предшествующую модель, возвращенную bayeslm
empiricalblmПредшествующая модель, охарактеризованная выборками от предшествующих дистрибутивов, возвращенных bayeslm или estimate
customblmПредшествующая функция распределения, которую вы объявляете возвращенный bayeslm

Выходные аргументы

свернуть все

Сводные данные распределения параметра, возвращенные как массив структур, содержащий информацию в этой таблице.

Поле структурыОписание
MarginalDistributions

Таблица, содержащая сводные данные дистрибутивов параметра. Строки соответствуют параметрам. Столбцы соответствуют:

  • Предполагаемое следующее среднее значение (Mean)

  • Стандартное отклонение (Std)

  • 95% equitailed вероятный интервал (CI95)

  • Апостериорная вероятность, что параметр больше, чем 0 (Positive)

  • Описание крайнего или условного апостериорного распределения параметра (Distribution)

Имена строки являются именами в Mdl.VarNames, и именем последней строки является Sigma2.

Covariances

Таблица, содержащая ковариации между параметрами. Строки и столбцы соответствуют прерыванию (если вы существуете), коэффициенты регрессии и отклонение воздействия. Имена строки и столбца совпадают с именами строки в MarginalDistributions.

JointDistribution

Скаляр строки, который описывает дистрибутивы коэффициентов регрессии (Beta) и отклонение воздействия (Sigma2), когда известный.

Для описаний распределения:

  • N(Mu,V) обозначает нормальное распределение со средним Mu и матрицей отклонения V. Это распределение может быть многомерным.

  • IG(A,B) обозначает обратное гамма распределение с формой A и шкала B.

  • t(Mu,V,DoF) обозначает распределение t Студента со средним Mu, отклонение V и степени свободы DoF.

Больше о

свернуть все

Байесова модель линейной регрессии

Bayesian linear regression model обрабатывает параметры β и σ 2 в модели yt нескольких линейных регрессий (MLR) = xt β + εt как случайные переменные.

В течение многих времен t = 1..., T:

  • yt является наблюдаемым ответом.

  • xt является 1 на (p + 1) вектор - строка из наблюдаемых величин предикторов p. Размещать образцовое прерывание, x 1t = 1 для всего t.

  • β (p + 1)-by-1 вектор-столбец коэффициентов регрессии, соответствующих переменным, которые составляют столбцы xt.

  • εt является случайным воздействием со средним значением нуля и Cov (ε) = σ 2IT×T, в то время как ε является T-by-1 вектор, содержащий все воздействия. Эти предположения подразумевают, что вероятность данных

    (β,σ2|y,x)=t=1Tϕ(yt;xtβ,σ2).

    ϕ (yt; xtβ, σ 2) является Гауссовой плотностью вероятности со средним xtβ и отклонением σ 2 оцененных в yt;.

Прежде, чем рассмотреть данные, вы налагаете предположение joint prior distribution на (β, σ 2). В Байесовом анализе вы обновляете распределение параметров при помощи информации о параметрах, полученных из вероятности данных. Результатом является joint posterior distribution (β, σ 2) или conditional posterior distributions параметров.

Введенный в R2017a