summarize

Сводная статистика распределения стандартной байесовской линейной регрессионой модели

Описание

Чтобы получить сводные данные байесовской линейной регрессионой модели для выбора предиктора, см. summarize.

пример

summarize(Mdl) отображает табличные сводные данные случайных коэффициентов регрессии и нарушения порядка отклонения стандартной байесовской линейной регрессионой Mdl в командной строке. Для каждого параметра сводных данных включает:

  • Стандартное отклонение (квадратный корень дисперсии)

  • 95% справедливых интервалов

  • Вероятность того, что параметр больше 0

  • Описание распределений, если известно

пример

SummaryStatistics = summarize(Mdl) возвращает массив структур, в котором хранится:

  • Таблица, содержащая сводные данные коэффициентов регрессии и отклонения нарушения порядка

  • Таблица, содержащая ковариации между переменными

  • Описание совместного распределения параметров

Примеры

свернуть все

Рассмотрим множественную линейную регрессионую модель, которая предсказывает реальный валовой национальный продукт США (GNPR) с использованием линейной комбинации индекса промышленного производства (IPI), общая занятость (E), и реальная заработная плата (WR).

GNPRt=β0+β1IPIt+β2Et+β3WRt+εt.

Для всех t временные точки, εt - серия независимых гауссовских нарушений порядка со средним значением 0 и отклонением σ2.

Предположим, что эти предыдущие распределения:

  • β|σ2N4(M,σ2V). M является вектором средств 4 на 1, и V является масштабированной 4 на 4 положительно определенной ковариационной матрицей.

  • σ2IG(A,B). A и B - форма и шкала, соответственно, обратного гамма- распределения.

Эти предположения и вероятность данных подразумевают нормальную-обратную-гамма-сопряженную модель.

Создайте нормально-обратную гамма-сопряженную предшествующую модель для параметров линейной регрессии. Задайте количество предикторов p и имена переменных.

p = 3;
VarNames = ["IPI" "E" "WR"];
PriorMdl = bayeslm(p,'ModelType','conjugate','VarNames',VarNames);

PriorMdl является conjugateblm Байесовский объект линейной регрессионной модели, представляющий предшествующее распределение коэффициентов регрессии и отклонение нарушения порядка.

Результирующие данные предыдущего распределения.

summarize(PriorMdl)
 
           |  Mean     Std            CI95         Positive       Distribution     
-----------------------------------------------------------------------------------
 Intercept |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 IPI       |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 E         |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 WR        |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 Sigma2    | 0.5000   0.5000    [ 0.138,  1.616]     1.000   IG(3.00,    1)        
 

Функция отображает таблицу сводной статистики и другую информацию о предыдущем распределении в командной строке.

Загрузите набор данных Нельсона-Плоссера и создайте переменные для данных предиктора и отклика.

load Data_NelsonPlosser
X = DataTable{:,PriorMdl.VarNames(2:end)};
y = DataTable.GNPR;

Оцените апостериорные распределения. Подавить отображение оценки.

PosteriorMdl = estimate(PriorMdl,X,y,'Display',false);

PosteriorMdl является conjugateblm объект модели, который содержит апостериорные распределения β и σ2.

Получите сводную статистику из апостериорного распределения.

summary = summarize(PosteriorMdl);

summary массив структур, содержащий три поля: MarginalDistributions, Covariances, и JointDistribution.

Отобразите маргинальные сводные данные распределения и ковариации при помощи записи через точку.

summary.MarginalDistributions
ans=5×5 table
                   Mean          Std                  CI95              Positive            Distribution       
                 _________    __________    ________________________    _________    __________________________

    Intercept      -24.249        8.7821       -41.514       -6.9847    0.0032977    {'t (-24.25, 8.65^2, 68)'}
    IPI             4.3913        0.1414        4.1134        4.6693            1    {'t (4.39, 0.14^2, 68)'  }
    E            0.0011202    0.00032931    0.00047284     0.0017676      0.99952    {'t (0.00, 0.00^2, 68)'  }
    WR              2.4683       0.34895        1.7822        3.1543            1    {'t (2.47, 0.34^2, 68)'  }
    Sigma2          44.135         7.802        31.427        61.855            1    {'IG(34.00, 0.00069)'    }

summary.Covariances
ans=5×5 table
                 Intercept         IPI             E             WR         Sigma2
                 __________    ___________    ___________    ___________    ______

    Intercept        77.125        0.77133     -0.0023655         0.5311         0
    IPI             0.77133       0.019994    -6.5001e-06       -0.02948         0
    E            -0.0023655    -6.5001e-06     1.0844e-07    -8.0013e-05         0
    WR               0.5311       -0.02948    -8.0013e-05        0.12177         0
    Sigma2                0              0              0              0    60.871

The MarginalDistributions field является таблицей суммарной статистики и другой информации о апостериорном распределении. Covariances - таблица, содержащая ковариационную матрицу параметров.

Входные параметры

свернуть все

Стандартная байесовская линейная регрессионая модель, заданная как объект модели в этой таблице.

Объект моделиОписание
conjugateblmЗависимая, нормальная-обратная-гамма-сопряженная априорная или апостериорная модель, возвращенная bayeslm или estimate
semiconjugateblmНезависимый, нормальная обратная гамма полуспрягает предшествующую модель, возвращенную bayeslm
diffuseblmДиффузная предыдущая модель, возвращенная bayeslm
empiricalblmПредыдущая или апостериорная модель, характеризующаяся случайными рисунками из соответствующих распределений, возвращаемыми bayeslm или estimate
customblmФункция предыдущего распределения, которую вы объявляете возвращенной bayeslm

Выходные аргументы

свернуть все

Сводные данные распределения параметров, возвращенная как массив структур, содержащий информацию в этой таблице.

Структурное полеОписание
MarginalDistributions

Таблица, содержащая сводные данные распределений параметров. Строки соответствуют параметрам. Столбцы соответствуют:

  • Расчетное апостериорное среднее (Mean)

  • Стандартное отклонение (Std)

  • 95% справедливого интервала (CI95)

  • Апостериорная вероятность того, что параметр больше 0 (Positive)

  • Описание маргинального или условного апостериорного распределения параметра (Distribution)

Имена строк являются именами в Mdl.VarNames, и имя последней строки Sigma2.

Covariances

Таблица, содержащая ковариации между параметрами. Строки и столбцы соответствуют точке пересечения (если он существует) коэффициентов регрессии и отклонения нарушения порядка. Имена строк и столбцов совпадают с именами строк в MarginalDistributions.

JointDistribution

Строковый скаляр, который описывает распределения коэффициентов регрессии (Beta) и отклонение нарушения порядка (Sigma2) когда известно.

Для описания распределения:

  • N(Mu,V) обозначает нормальное распределение со средним Mu и матрица отклонений V. Это распределение может быть многомерным.

  • IG(A,B) обозначает обратный гамма- распределение с формой A и масштабные B.

  • t(Mu,V,DoF) обозначает распределение t Студента со средним Mu, отклонение Vи степени свободы DoF.

Подробнее о

свернуть все

Байесовская линейная регрессионая модель

A Bayesian linear regression model обрабатывает параметры β и σ2 в модели многофакторной линейной регрессии (MLR) yt = xt β + εt как случайные переменные.

Для времен t = 1,..., T:

  • yt - наблюдаемая реакция.

  • xt является 1-бай- (p + 1) вектором-строкой наблюдаемых значений p предикторов. Чтобы разместить точку пересечения модели, x 1 t = 1 для всех t.

  • β является (p + 1) -на-1 вектор-столбец коэффициентов регрессии, соответствующих переменным, которые составляют столбцы xt.

  • εt является случайным нарушением порядка со средним значением нуля и Cov (ε) = σ2I T × T, в то время как ε является вектором T -by-1, содержащим все нарушения порядка. Эти предположения подразумевают, что вероятность данных является

    (β,σ2|y,x)=t=1Tϕ(yt;xtβ,σ2).

    ϕ (yt; xtβ, σ2) - Гауссова плотность вероятностей со средней xtβ и отклонением σ2 оценивается при yt;.

Прежде чем рассматривать данные, вы накладываете joint prior distribution предположение на (β, σ2). В байесовском анализе вы обновляете распределение параметров с помощью информации о параметрах, полученных из вероятности данных. Результатом является joint posterior distribution, σ2) или conditional posterior distributions параметров.

Введенный в R2017a