Logistic

Создайте Logistic объект модели для пожизненной вероятности значения по умолчанию

Описание

Создайте и анализируйте Logistic объект модели, чтобы вычислить пожизненную вероятность (PD) значения по умолчанию с помощью этого рабочего процесса:

Использование fitLifetimePDModel создать Logistic объект модели.
Использование predict предсказать условный PD и predictLifetime предсказать пожизненный PD.
Использование modelDiscrimination возвратить данные ROC и AUROC.
Использование modelAccuracy возвратить RMSE наблюдаемых и предсказанных данных о PD.

Создание

Синтаксис

LogisticPDModel = fitLifetimePDModel(data,ModelType)

LogisticPDModel = fitLifetimePDModel(___,Name,Value)

Описание

пример

LogisticPDModel = fitLifetimePDModel(data,ModelType) создает Logistic Объект модели PD и наборы data и ModelType свойства.

Если вы не указываете переменную информацию для IDVar, AgeVar, LoanVars, MacroVars, и ResponseVarто:

IDVar установлен в первый столбец в data входной параметр.
LoanVars набор должен включать все столбцы от второго до предпоследних столбцов data входной параметр.
ResponseVar установлен в последний столбец в data входной параметр.

пример

LogisticPDModel = fitLifetimePDModel(___,Name,Value) задает опции с помощью одного или нескольких аргументов пары "имя-значение" в дополнение к входным параметрам в предыдущем синтаксисе. Дополнительные аргументы пары "имя-значение" устанавливают свойства объекта модели. Например, LogisticPDModel = fitLifetimePDModel(data(TrainDataInd,:),"Logistic",'ModelID',"Logistic_A",'Description',"Logisitic_model",'AgeVar',"YOB",'IDVar',"ID",'LoanVars',"ScoreGroup','MacroVars',{'GDP','Market',}'ResponseVar',"Default") создает Logistic объект модели.

Входные параметры

развернуть все

`data` данные
таблица

Данные в виде таблицы, где первым столбцом является IDVar, последним столбцом является ResponseVar, и всеми другими столбцами является LoanVars.

Типы данных: char | string

`ModelType` — Тип модели
представьте в виде строки со значением `"Logistic"` | вектор символов со значением `'Logistic'`

Тип модели в виде строки со значением "Logistic" или вектор символов со значением 'Logistic'.

Типы данных: char | string

Logistic Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример:

LogisticPDModel = fitLifetimePDModel(data(TrainDataInd,:),"Logistic",'ModelID',"Logistic_A",'Description',"Logisitic_model",'AgeVar',"YOB",'IDVar',"ID",'LoanVars',"ScoreGroup','MacroVars',{'GDP','Market',}'ResponseVar',"Default")

`'ModelID'` — Пользовательская модель ID
`" "` (значение по умолчанию) | представляет в виде строки | вектор символов

Пользовательская модель ID в виде разделенной запятой пары, состоящей из 'ModelID' и строка или вектор символов.

Типы данных: string | char

`'Description'` — Пользовательское описание для модели
`" "` (значение по умолчанию) | представляет в виде строки | вектор символов

Пользовательское описание для модели в виде разделенной запятой пары, состоящей из 'Description' и строка или вектор символов.

Типы данных: string | char

`'IDVar'` — Переменная ID, указывающая, который столбец в `data` содержит ID заемщика или ссуда
1-й столбец `data` (значение по умолчанию) | представляет в виде строки | вектор символов

Переменная ID, указывающая, который столбец в data содержит ссуду или ID заемщика в виде разделенной запятой пары, состоящей из 'IDVar' и строка или вектор символов.

Типы данных: string | char

`'AgeVar'` — Переменная возраста указание, который столбец в `data` содержит информацию о возрасте ссуды
если не заданный, то `LoanVars` (значение по умолчанию) | представляет в виде строки | вектор символов

Переменная возраста указание, который столбец в data содержит информацию о возрасте ссуды в виде разделенной запятой пары, состоящей из 'AgeVar' и строка или вектор символов.

Типы данных: string | char

`'LoanVars'` — Переменные ссуды, указывающие, который столбец в `data` содержит специфичную для ссуды информацию
все столбцы `data` это не первый или последний столбец (значение по умолчанию) | массив строк | массив ячеек из символьных векторов

Переменные ссуды, указывающие, который столбец в data содержит специфичную для ссуды информацию, такую как счет происхождения или соотношение стоимости актива к сумме кредита в виде разделенной запятой пары, состоящей из 'LoanVars' и массив строк или массив ячеек из символьных векторов.

Типы данных: string | cell

`'MacroVars'` — Макро-переменные, указывающие, который столбец в `data` содержит макроэкономическую информацию
если не заданный, то `LoanVars` (значение по умолчанию) | массив строк | массив ячеек из символьных векторов

Макро-переменные, указывающие, который столбец в data содержит макроэкономическую информацию, такую как рост валового внутреннего продукта (ВВП) или уровень безработицы в виде разделенной запятой пары, состоящей из 'MacroVars' и массив строк или массив ячеек из символьных векторов.

Типы данных: string | cell

`'ResponseVar'` — Переменная, указывающая, который столбец в `data` содержит переменную отклика
последний столбец `data` (значение по умолчанию) | логический

Переменная, указывающая, который столбец в data содержит переменную отклика в виде разделенной запятой пары, состоящей из 'ResponseVar' и строка или вектор символов.

Примечание

Переменная отклика в data должна быть бинарная переменная с 0 или 1 значения, с 1 указание на значение по умолчанию.

Типы данных: логический

Свойства

развернуть все

`ModelID` — Пользовательская модель ID
`" "` (значение по умолчанию) | строка

Пользовательская модель ID, возвращенная как строка.

Типы данных: string

`Description` — Пользовательское описание
`" "` (значение по умолчанию) | строка

Пользовательское описание, возвращенное как строка.

Типы данных: string

`Model` — Модель
вектор

Модель, возвращенная как вектор.

Типы данных: string

`IDVar` — Переменная ID, указывающая, который столбец в `data` содержит ID заемщика или ссуда
1-й столбец `data` (значение по умолчанию) | строка

Переменная ID, указывающая, который столбец в data содержит ссуду или ID заемщика, возвращенный как строка.

Типы данных: string

`AgeVar` — Переменная возраста указание, который столбец в `data` содержит информацию о возрасте ссуды
если не заданный, то `LoanVars` (значение по умолчанию) | строка

Переменная возраста указание, который столбец в data содержит информацию о возрасте ссуды, возвращенную как строка.

Типы данных: string

`LoanVars` — Переменные ссуды, указывающие, который столбец в `data` содержит специфичную для ссуды информацию
все столбцы `data` это не первый или последний столбец (значение по умолчанию) | массив строк

Переменные ссуды, указывающие, который столбец в data содержит специфичную для ссуды информацию, возвращенную как массив строк.

Типы данных: string

`MacroVars` — Макро-переменные, указывающие, который столбец в `data` содержит макроэкономическую информацию
если не заданный, то `LoanVars` (значение по умолчанию) | массив строк

Макро-переменные, указывающие, который столбец в data содержит макроэкономическую информацию, возвращенную как массив строк.

Типы данных: string

`ResponseVar` — Переменная, указывающая, который столбец в `data` содержит переменную отклика
последний столбец `data` (значение по умолчанию) | строка

Переменная, указывающая, который столбец в data содержит переменную отклика, возвращенную как строка или вектор символов.

Типы данных: string

Функции объекта

`predict`	Вычислите условный PD
`predictLifetime`	Вычислите совокупный пожизненный PD, крайний PD и вероятность выживания
`modelDiscrimination`	Вычислите данные ROC и AUROC
`modelAccuracy`	Вычислите RMSE предсказанных и наблюдаемых ФУНТОВ на сгруппированных данных

Примеры

свернуть все

Создайте логистическую пожизненную модель PD

Скрипт Open Live Script

В этом примере показано, как использовать fitLifetimePDModel создать Logistic модель с помощью кредита и макроэкономических данных.

Загрузка данных

Загрузите данные о кредитном портфеле.

load RetailCreditPanelData.mat
disp(head(data))

    ID    ScoreGroup    YOB    Default    Year
    __    __________    ___    _______    ____

    1      Low Risk      1        0       1997
    1      Low Risk      2        0       1998
    1      Low Risk      3        0       1999
    1      Low Risk      4        0       2000
    1      Low Risk      5        0       2001
    1      Low Risk      6        0       2002
    1      Low Risk      7        0       2003
    1      Low Risk      8        0       2004

disp(head(dataMacro))

    Year     GDP     Market
    ____    _____    ______

    1997     2.72      7.61
    1998     3.57     26.24
    1999     2.86      18.1
    2000     2.43      3.19
    2001     1.26    -10.51
    2002    -0.59    -22.95
    2003     0.63      2.78
    2004     1.85      9.48

Соедините два компонента данных в один набор данных.

data = join(data,dataMacro);
disp(head(data))

    ID    ScoreGroup    YOB    Default    Year     GDP     Market
    __    __________    ___    _______    ____    _____    ______

    1      Low Risk      1        0       1997     2.72      7.61
    1      Low Risk      2        0       1998     3.57     26.24
    1      Low Risk      3        0       1999     2.86      18.1
    1      Low Risk      4        0       2000     2.43      3.19
    1      Low Risk      5        0       2001     1.26    -10.51
    1      Low Risk      6        0       2002    -0.59    -22.95
    1      Low Risk      7        0       2003     0.63      2.78
    1      Low Risk      8        0       2004     1.85      9.48

Данные о разделе

Разделите данные на обучение и протестируйте разделы.

nIDs = max(data.ID);
uniqueIDs = unique(data.ID);

rng('default'); % for reproducibility
c = cvpartition(nIDs,'HoldOut',0.4);

TrainIDInd = training(c);
TestIDInd = test(c);

TrainDataInd = ismember(data.ID,uniqueIDs(TrainIDInd));
TestDataInd = ismember(data.ID,uniqueIDs(TestIDInd));

Создайте Logistic Пожизненная модель PD

Используйте fitLifetimePDModel создать Logistic модель с помощью обучающих данных.

pdModel = fitLifetimePDModel(data(TrainDataInd,:),"Logistic",...
    'AgeVar','YOB',...
    'IDVar','ID',...
    'LoanVars','ScoreGroup',...
    'MacroVars',{'GDP','Market'},...
    'ResponseVar','Default');
disp(pdModel)

  Logistic with properties:

        ModelID: "Logistic"
    Description: ""
          Model: [1x1 classreg.regr.CompactGeneralizedLinearModel]
          IDVar: "ID"
         AgeVar: "YOB"
       LoanVars: "ScoreGroup"
      MacroVars: ["GDP"    "Market"]
    ResponseVar: "Default"

Отобразите базовую модель.

disp(pdModel.Model)

Compact generalized linear regression model:
    logit(Default) ~ 1 + ScoreGroup + YOB + GDP + Market
    Distribution = Binomial

Estimated Coefficients:
                               Estimate        SE         tStat       pValue   
                              __________    _________    _______    ___________

    (Intercept)                  -2.7422      0.10136    -27.054     3.408e-161
    ScoreGroup_Medium Risk      -0.68968     0.037286    -18.497     2.1894e-76
    ScoreGroup_Low Risk          -1.2587     0.045451    -27.693    8.4736e-169
    YOB                         -0.30894     0.013587    -22.738    1.8738e-114
    GDP                         -0.11111     0.039673    -2.8006      0.0051008
    Market                    -0.0083659    0.0028358    -2.9502      0.0031761


388097 observations, 388091 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 1.85e+03, p-value = 0

Предскажите условный и пожизненный PD

Используйте predict функция, чтобы предсказать условные значения PD. Предсказание является предсказанием строки строкой.

dataCustomer1 = data(1:8,:);
CondPD = predict(pdModel,dataCustomer1)

CondPD = 8×1

    0.0092
    0.0053
    0.0045
    0.0039
    0.0037
    0.0037
    0.0019
    0.0012

Используйте predictLifetime предсказать пожизненные совокупные значения PD (вычисляющий крайний и значения PD выживания также поддерживается). predictLifetime функционируйте использует переменную ID (см. 'IDVar' свойство для Logistic объект), чтобы преобразовать условные ФУНТЫ к совокупным ФУНТАМ для каждого ID.

LifetimePD = predictLifetime(pdModel,dataCustomer1)

LifetimePD = 8×1

    0.0092
    0.0145
    0.0189
    0.0228
    0.0264
    0.0300
    0.0319
    0.0330

Подтвердите модель

Используйте modelDiscrimination измерять рейтинг клиентов PD.

DiscMeasure = modelDiscrimination(pdModel,data(TestDataInd,:),'DataID','test data');
disp(DiscMeasure)

                            AUROC 
                           _______

    Logistic, test data    0.70009

Используйте modelAccuracy измерять точность предсказанных значений PD. modelAccuracy функция требует сгруппированной переменной и сравнивает точность наблюдаемого уровня по умолчанию в группе со средним предсказанным PD для группы. Например, можно сгруппироваться к календарному году с помощью 'Year' переменная.

AccMeasure = modelAccuracy(pdModel,data(TestDataInd,:),'Year','DataID','test data');
disp(AccMeasure)

                                              RMSE  
                                            ________

    Logistic, grouped by Year, test data    0.000453

Ссылки

[1] Baesens, Барт, Дэниел Роеш и Харальд Шойле. Аналитика кредитного риска: техники измерений, приложения и примеры в SAS. Вайли, 2016.

[2] Беллини, Тициано. МСФО 9 и моделирование кредитного риска CECL и валидация: практическое руководство с примерами работало в R и SAS. Сан-Диего, CA: Elsevier, 2019.

[3] Breeden, Джозеф. Проживание с CECL: словарь моделирования. Санта-Фе, NM: наделенный даром предвидения LLC моделей, 2018.

Документация

Logistic

Описание

Создание

Синтаксис

Описание

Входные параметры

`data` данные
таблица

`ModelType` — Тип модели
представьте в виде строки со значением `"Logistic"` | вектор символов со значением `'Logistic'`

`'ModelID'` — Пользовательская модель ID
`" "` (значение по умолчанию) | представляет в виде строки | вектор символов

`'Description'` — Пользовательское описание для модели
`" "` (значение по умолчанию) | представляет в виде строки | вектор символов

`'ResponseVar'` — Переменная, указывающая, который столбец в `data` содержит переменную отклика
последний столбец `data` (значение по умолчанию) | логический

Свойства

`ModelID` — Пользовательская модель ID
`" "` (значение по умолчанию) | строка

`Description` — Пользовательское описание
`" "` (значение по умолчанию) | строка

`Model` — Модель
вектор

`IDVar` — Переменная ID, указывающая, который столбец в `data` содержит ID заемщика или ссуда
1-й столбец `data` (значение по умолчанию) | строка

`AgeVar` — Переменная возраста указание, который столбец в `data` содержит информацию о возрасте ссуды
если не заданный, то `LoanVars` (значение по умолчанию) | строка

`ResponseVar` — Переменная, указывающая, который столбец в `data` содержит переменную отклика
последний столбец `data` (значение по умолчанию) | строка

Функции объекта

Примеры

Создайте логистическую пожизненную модель PD

Ссылки

Смотрите также

Функции

Темы

Документация Risk Management Toolbox

Поддержка

Документация

Logistic

Описание

Создание

Синтаксис

Описание

Входные параметры

data данные таблица

ModelType — Тип модели представьте в виде строки со значением "Logistic" | вектор символов со значением 'Logistic'

'ModelID' — Пользовательская модель ID " " (значение по умолчанию) | представляет в виде строки | вектор символов

'Description' — Пользовательское описание для модели " " (значение по умолчанию) | представляет в виде строки | вектор символов

'ResponseVar' — Переменная, указывающая, который столбец в data содержит переменную отклика последний столбец data (значение по умолчанию) | логический

Свойства

ModelID — Пользовательская модель ID " " (значение по умолчанию) | строка

Description — Пользовательское описание " " (значение по умолчанию) | строка

Model — Модель вектор

IDVar — Переменная ID, указывающая, который столбец в data содержит ID заемщика или ссуда 1-й столбец data (значение по умолчанию) | строка

AgeVar — Переменная возраста указание, который столбец в data содержит информацию о возрасте ссуды если не заданный, то LoanVars (значение по умолчанию) | строка

MacroVars — Макро-переменные, указывающие, который столбец в data содержит макроэкономическую информацию если не заданный, то LoanVars (значение по умолчанию) | массив строк

ResponseVar — Переменная, указывающая, который столбец в data содержит переменную отклика последний столбец data (значение по умолчанию) | строка

Функции объекта

Примеры

Создайте логистическую пожизненную модель PD

Ссылки

Смотрите также

Функции

Темы

Документация Risk Management Toolbox

Поддержка

`data` данные
таблица

`ModelType` — Тип модели
представьте в виде строки со значением `"Logistic"` | вектор символов со значением `'Logistic'`

`'ModelID'` — Пользовательская модель ID
`" "` (значение по умолчанию) | представляет в виде строки | вектор символов

`'Description'` — Пользовательское описание для модели
`" "` (значение по умолчанию) | представляет в виде строки | вектор символов

`'ResponseVar'` — Переменная, указывающая, который столбец в `data` содержит переменную отклика
последний столбец `data` (значение по умолчанию) | логический

`ModelID` — Пользовательская модель ID
`" "` (значение по умолчанию) | строка

`Description` — Пользовательское описание
`" "` (значение по умолчанию) | строка

`Model` — Модель
вектор

`IDVar` — Переменная ID, указывающая, который столбец в `data` содержит ID заемщика или ссуда
1-й столбец `data` (значение по умолчанию) | строка

`AgeVar` — Переменная возраста указание, который столбец в `data` содержит информацию о возрасте ссуды
если не заданный, то `LoanVars` (значение по умолчанию) | строка

`ResponseVar` — Переменная, указывающая, который столбец в `data` содержит переменную отклика
последний столбец `data` (значение по умолчанию) | строка