summarize

Статистика сводных данных распределения стандартной Байесовой модели линейной регрессии

Описание

Чтобы получить сводные данные Байесовой модели линейной регрессии для выбора предиктора, смотрите summarize.

пример

summarize(Mdl) отображает табличные сводные данные случайных коэффициентов регрессии и отклонение воздействия стандартной Байесовой модели Mdl линейной регрессии в командной строке. Для каждого параметра сводные данные включают:

  • Стандартное отклонение (квадратный корень из отклонения)

  • 95% equitailed вероятные интервалы

  • Вероятность, что параметр больше 0

  • Описание распределений, если известный

пример

SummaryStatistics = summarize(Mdl) возвращает массив структур, который хранит a:

  • Таблица, содержащая сводные данные коэффициентов регрессии и отклонения воздействия

  • Таблица, содержащая ковариации между переменными

  • Описание совместного распределения параметров

Примеры

свернуть все

Рассмотрите модель многофакторной линейной регрессии, которая предсказывает США действительный валовой национальный продукт (GNPR) использование линейной комбинации индекса промышленного производства (IPI), общая занятость (E), и действительная заработная плата (WR).

GNPRt=β0+β1IPIt+β2Et+β3WRt+εt.

\forall t моменты времени, εt серия независимых Гауссовых воздействий со средним значением 0 и отклонение σ2.

Примите эти предшествующие распределения:

  • β|σ2N4(M,σ2V). M 4 1 вектор из средних значений, и V масштабированная положительная определенная ковариационная матрица 4 на 4.

  • σ2IG(A,B). A и B форма и шкала, соответственно, обратного гамма распределения.

Эти предположения и вероятность данных подразумевают нормальную обратную гамму сопряженная модель.

Создайте сопряженную предшествующую модель нормальной обратной гаммы для параметров линейной регрессии. Задайте количество предикторов p и имена переменных.

p = 3;
VarNames = ["IPI" "E" "WR"];
PriorMdl = bayeslm(p,'ModelType','conjugate','VarNames',VarNames);

PriorMdl conjugateblm Байесов объект модели линейной регрессии, представляющий предшествующее распределение коэффициентов регрессии и отклонения воздействия.

Обобщите предшествующее распределение.

summarize(PriorMdl)
 
           |  Mean     Std            CI95         Positive       Distribution     
-----------------------------------------------------------------------------------
 Intercept |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 IPI       |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 E         |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 WR        |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 Sigma2    | 0.5000   0.5000    [ 0.138,  1.616]     1.000   IG(3.00,    1)        
 

Функция отображает таблицу итоговой статистики и другой информации о предшествующем распределении в командной строке.

Загрузите набор данных Нельсона-Плоссера и создайте переменные для данных об ответе и предиктора.

load Data_NelsonPlosser
X = DataTable{:,PriorMdl.VarNames(2:end)};
y = DataTable.GNPR;

Оцените апостериорные распределения. Подавите отображение оценки.

PosteriorMdl = estimate(PriorMdl,X,y,'Display',false);

PosteriorMdl conjugateblm объект модели, который содержит апостериорные распределения β и σ2.

Получите итоговую статистику из апостериорного распределения.

summary = summarize(PosteriorMdl);

summary массив структур, содержащий три поля: MarginalDistributions, Covariances, и JointDistribution.

Отобразите сводные данные предельного распределения и ковариации при помощи записи через точку.

summary.MarginalDistributions
ans=5×5 table
                   Mean          Std                  CI95              Positive            Distribution       
                 _________    __________    ________________________    _________    __________________________

    Intercept      -24.249        8.7821       -41.514       -6.9847    0.0032977    {'t (-24.25, 8.65^2, 68)'}
    IPI             4.3913        0.1414        4.1134        4.6693            1    {'t (4.39, 0.14^2, 68)'  }
    E            0.0011202    0.00032931    0.00047284     0.0017676      0.99952    {'t (0.00, 0.00^2, 68)'  }
    WR              2.4683       0.34895        1.7822        3.1543            1    {'t (2.47, 0.34^2, 68)'  }
    Sigma2          44.135         7.802        31.427        61.855            1    {'IG(34.00, 0.00069)'    }

summary.Covariances
ans=5×5 table
                 Intercept         IPI             E             WR         Sigma2
                 __________    ___________    ___________    ___________    ______

    Intercept        77.125        0.77133     -0.0023655         0.5311         0
    IPI             0.77133       0.019994    -6.5001e-06       -0.02948         0
    E            -0.0023655    -6.5001e-06     1.0844e-07    -8.0013e-05         0
    WR               0.5311       -0.02948    -8.0013e-05        0.12177         0
    Sigma2                0              0              0              0    60.871

MarginalDistributions поле является таблицей итоговой статистики и другой информации об апостериорном распределении. Covariances таблица, содержащая ковариационную матрицу параметров.

Входные параметры

свернуть все

Стандартная Байесова модель линейной регрессии в виде объекта модели в этой таблице.

Объект моделиОписание
conjugateblmЗависимый, нормальная обратная гамма спрягает предшествующую или следующую модель, возвращенную bayeslm или estimate
semiconjugateblmНезависимый, нормальная обратная гамма полуспрягает предшествующую модель, возвращенную bayeslm
diffuseblmРассейте предшествующую модель, возвращенную bayeslm
empiricalblmПредшествующая или следующая модель, охарактеризованная случайными ничьими от соответствующих распределений, возвращенных bayeslm или estimate
customblmПредшествующая функция распределения, которой вы объявляете возвращенный bayeslm

Выходные аргументы

свернуть все

Сводные данные распределения параметра, возвращенные как массив структур, содержащий информацию в этой таблице.

Поле структурыОписание
MarginalDistributions

Таблица, содержащая сводные данные распределений параметра. Строки соответствуют параметрам. Столбцы соответствуют:

  • Предполагаемое следующее среднее значение (Mean)

  • Стандартное отклонение (Std)

  • 95% equitailed вероятный интервал (CI95)

  • Апостериорная вероятность, что параметр больше 0 (Positive)

  • Описание крайнего или условного апостериорного распределения параметра (Distribution)

Имена строки являются именами в Mdl.VarNames, и именем последней строки является Sigma2.

Covariances

Таблица, содержащая ковариации между параметрами. Строки и столбцы соответствуют точке пересечения (если вы существуете), коэффициенты регрессии и отклонение воздействия. Имена строки и столбца совпадают с именами строки в MarginalDistributions.

JointDistribution

Строковый скаляр, который описывает распределения коэффициентов регрессии (Beta) и отклонение воздействия (Sigma2) когда известный.

Для описаний распределения:

  • N(Mu,V) обозначает нормальное распределение со средним Mu и матрица отклонения V. Это распределение может быть многомерным.

  • IG(A,B) обозначает обратное гамма распределение с формой A и масштабируйте B.

  • t(Mu,V,DoF) обозначает распределение t Студента со средним Mu, отклонение V, и степени свободы DoF.

Больше о

свернуть все

Байесова модель линейной регрессии

Bayesian linear regression model обрабатывает параметры β и σ2 в модели yt многофакторной линейной регрессии (MLR) = xt β + εt как случайные переменные.

В течение многих времен t = 1..., T:

  • yt является наблюдаемым ответом.

  • xt является 1 на (p + 1) вектор-строка из наблюдаемых величин предикторов p. Вмещать точку пересечения модели, x 1t = 1 для всего t.

  • β (p + 1)-by-1 вектор-столбец коэффициентов регрессии, соответствующих переменным, которые составляют столбцы xt.

  • εt является случайным воздействием со средним значением нуля и Cov (ε) = σ2T I ×T, в то время как ε является T-by-1 вектор, содержащий все воздействия. Эти предположения подразумевают, что вероятность данных

    (β,σ2|y,x)=t=1Tϕ(yt;xtβ,σ2).

    ϕ (yt; xtβ, σ2) Гауссова плотность вероятности со средним xtβ и отклонением σ2 оцененный в yt;.

Прежде, чем рассмотреть данные, вы налагаете предположение joint prior distribution на (β, σ2). В Байесовом анализе вы обновляете распределение параметров при помощи информации о параметрах, полученных из вероятности данных. Результатом является joint posterior distribution (β, σ2) или conditional posterior distributions параметров.

Введенный в R2017a