exponenta event banner

подвести итог

Сводная статистика распределения стандартной байесовской модели линейной регрессии

Описание

Чтобы получить сводку байесовской модели линейной регрессии для выбора предиктора, см. summarize.

пример

summarize(Mdl) отображает табличную сводку коэффициентов случайной регрессии и дисперсии возмущений стандартной байесовской модели линейной регрессии Mdl в командной строке. Для каждого параметра сводка включает в себя:

  • Стандартное отклонение (квадратный корень отклонения)

  • 95% равных достоверных интервалов

  • Вероятность того, что параметр больше 0

  • Описание распределений, если они известны

пример

SummaryStatistics = summarize(Mdl) возвращает массив структуры, в котором хранится:

  • Таблица, содержащая сводку коэффициентов регрессии и дисперсии возмущений

  • Таблица, содержащая ковариации между переменными

  • Описание совместного распределения параметров

Примеры

свернуть все

Рассмотрим модель множественной линейной регрессии, которая предсказывает реальный валовой национальный продукт США (GNPR) с использованием линейной комбинации индекса промышленного производства (IPI), общая занятость (E) и реальная заработная плата (WR).

GNPRt = β0 + β1IPIt + β2Et + β3WRt + αt.

Для всех t-временных точек αt - это ряд независимых гауссовых возмущений со средним значением 0 и дисперсией start2.

Предположим, что эти предыдущие распределения:

  • β'σ2∼N4 (М, λ 2В). M является вектором средства 4 на 1, а V является масштабированной матрицей положительной определенной ковариации 4 на 4.

  • σ2∼IG (A, B). А и В - форма и масштаб, соответственно, обратного гамма-распределения.

Эти допущения и правдоподобие данных подразумевают нормально-обратно-гамма-сопряженную модель.

Создайте нормально-обратно-гамма-сопряженную предыдущую модель для параметров линейной регрессии. Укажите количество предикторов p и имена переменных.

p = 3;
VarNames = ["IPI" "E" "WR"];
PriorMdl = bayeslm(p,'ModelType','conjugate','VarNames',VarNames);

PriorMdl является conjugateblm Объект байесовской модели линейной регрессии, представляющий предварительное распределение коэффициентов регрессии и дисперсии возмущений.

Подведите итоги предыдущего распределения.

summarize(PriorMdl)
 
           |  Mean     Std            CI95         Positive       Distribution     
-----------------------------------------------------------------------------------
 Intercept |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 IPI       |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 E         |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 WR        |  0      70.7107  [-141.273, 141.273]    0.500   t (0.00, 57.74^2,  6) 
 Sigma2    | 0.5000   0.5000    [ 0.138,  1.616]     1.000   IG(3.00,    1)        
 

Функция отображает таблицу сводной статистики и другую информацию о предыдущем распределении в командной строке.

Загрузите набор данных Нельсона-Плоссера и создайте переменные для данных предиктора и ответа.

load Data_NelsonPlosser
X = DataTable{:,PriorMdl.VarNames(2:end)};
y = DataTable.GNPR;

Оцените апостериорные распределения. Подавление отображения оценки.

PosteriorMdl = estimate(PriorMdl,X,y,'Display',false);

PosteriorMdl является conjugateblm объект модели, который содержит апостериорные распределения β и start2.

Получите сводную статистику из заднего распределения.

summary = summarize(PosteriorMdl);

summary - структурный массив, содержащий три поля: MarginalDistributions, Covariances, и JointDistribution.

Отображение сводки предельного распределения и ковариаций с помощью точечной нотации.

summary.MarginalDistributions
ans=5×5 table
                   Mean          Std                  CI95              Positive            Distribution       
                 _________    __________    ________________________    _________    __________________________

    Intercept      -24.249        8.7821       -41.514       -6.9847    0.0032977    {'t (-24.25, 8.65^2, 68)'}
    IPI             4.3913        0.1414        4.1134        4.6693            1    {'t (4.39, 0.14^2, 68)'  }
    E            0.0011202    0.00032931    0.00047284     0.0017676      0.99952    {'t (0.00, 0.00^2, 68)'  }
    WR              2.4683       0.34895        1.7822        3.1543            1    {'t (2.47, 0.34^2, 68)'  }
    Sigma2          44.135         7.802        31.427        61.855            1    {'IG(34.00, 0.00069)'    }

summary.Covariances
ans=5×5 table
                 Intercept         IPI             E             WR         Sigma2
                 __________    ___________    ___________    ___________    ______

    Intercept        77.125        0.77133     -0.0023655         0.5311         0
    IPI             0.77133       0.019994    -6.5001e-06       -0.02948         0
    E            -0.0023655    -6.5001e-06     1.0844e-07    -8.0013e-05         0
    WR               0.5311       -0.02948    -8.0013e-05        0.12177         0
    Sigma2                0              0              0              0    60.871

MarginalDistributions поле представляет собой таблицу сводной статистики и другой информации о заднем распределении. Covariances - таблица, содержащая ковариационную матрицу параметров.

Входные аргументы

свернуть все

Стандартная байесовская модель линейной регрессии, заданная в этой таблице как объект модели.

Объект моделиОписание
conjugateblmЗависимая, нормально-обратно-гамма-сопряженная предшествующая или задняя модель, возвращенная bayeslm или estimate
semiconjugateblmНезависимая, нормальная, обратная гамма-полунъюгатная предыдущая модель, возвращенная bayeslm
diffuseblmДиффузная предыдущая модель, возвращенная bayeslm
empiricalblmПредыдущая или задняя модель, характеризующаяся случайными розыгрышами из соответствующих распределений, возвращаемых bayeslm или estimate
customblmОбъявленная функция предыдущего распределения, возвращенная bayeslm

Выходные аргументы

свернуть все

Сводка распределения параметров, возвращаемая в виде структурного массива, содержащего информацию в этой таблице.

Поле структурыОписание
MarginalDistributions

Таблица, содержащая сводку распределений параметров. Строки соответствуют параметрам. Столбцы соответствуют:

  • Оценочное заднее среднее (Mean)

  • Стандартное отклонение (Std)

  • 95% равный достоверный интервал (CI95)

  • Задняя вероятность того, что параметр больше 0 (Positive)

  • Описание предельного или условного заднего распределения параметра (Distribution)

Имена строк - это имена в Mdl.VarNames, и имя последней строки: Sigma2.

Covariances

Таблица, содержащая ковариации между параметрами. Строки и столбцы соответствуют пересечению (если таковое существует) коэффициентов регрессии и дисперсии возмущений. Имена строк и столбцов совпадают с именами строк в MarginalDistributions.

JointDistribution

Строковый скаляр, описывающий распределения коэффициентов регрессии (Betaи дисперсию возмущений (Sigma2), когда известно.

Для описаний распределения:

  • N(Mu,V) обозначает нормальное распределение со средним Mu и матрица отклонений V. Это распределение может быть многомерным.

  • IG(A,B) обозначает обратное гамма-распределение с формой A и масштаб B.

  • t(Mu,V,DoF) обозначает распределение Стьюдента со средним Mu, отклонение Vи степени свободы DoF.

Подробнее

свернуть все

Байесовская модель линейной регрессии

Байесовская модель линейной регрессии рассматривает параметры β и start2 в модели множественной линейной регрессии (MLR) yt = xtβ + αt как случайные величины.

Для времени t = 1,...,T:

  • yt - наблюдаемый ответ.

  • xt - вектор строки 1-by- (p + 1) наблюдаемых значений p предикторов. Чтобы разместить пересечение модели, x1t = 1 для всех t.

  • β - вектор (p + 1) -by-1-столбца коэффициентов регрессии, соответствующих переменным, составляющим столбцы xt.

  • αt - случайное возмущение со средним значением ноля и Cov (λ) = start2IT × T, в то время, как start- T-by-1 вектор, содержащий все возмущения. Эти допущения подразумевают, что вероятность данных

    (β, start2 | y, x) =∏t=1Tϕ (yt; xtβ, start2).

    (yt; xtβ, start2) - гауссова плотность вероятности со средним значением xtβ и дисперсией start2, оцениваемой при yt;.

Перед рассмотрением данных необходимо наложить совместное предварительное предположение о распределении на (β, start2). В байесовском анализе выполняется обновление распределения параметров с использованием информации о параметрах, полученных из вероятности получения данных. Результатом является совместное апостериорное распределение (β, start2) или условное апостериорное распределение параметров.

Представлен в R2017a