exponenta event banner

plotbins

Количество гистограмм графика для переменных предиктора

Описание

пример

plotbins(sc,PredictorName) строит счет гистограммы для заданных переменных предиктора. При изменении ячеек предиктора с помощью modifybins или autobinning, повторный запуск plotbins для обновления фигуры в соответствии с изменениями.

пример

hFigure = plotbins(sc,PredictorName) возвращает маркер к фигуре. plotbins строит счет гистограммы для заданных переменных предиктора. При изменении ячеек предиктора с помощью modifybins или autobinning, повторный запуск plotbins для обновления фигуры в соответствии с изменениями.

пример

hFigure = plotbins(___,Name,Value) возвращает маркер к фигуре. plotbins строит подсчет гистограммы для заданных переменных предиктора с использованием необязательных аргументов пары имя-значение. При изменении ячеек предиктора с помощью modifybins или autobinning, повторный запуск plotbins для обновления фигуры в соответствии с изменениями.

Примеры

свернуть все

Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data (с использованием набора данных из Refaat 2011).

load CreditCardData 
sc = creditscorecard(data);

Выполнить автоматическое binning для PredictorName входной аргумент для CustIncome использование значений по умолчанию для алгоритма Monotone.

sc = autobinning(sc, 'CustIncome')
sc = 
  creditscorecard with properties:

                GoodLabel: 0
              ResponseVar: 'status'
               WeightsVar: ''
                 VarNames: {1x11 cell}
        NumericPredictors: {1x7 cell}
    CategoricalPredictors: {'ResStatus'  'EmpStatus'  'OtherCC'}
           BinMissingData: 0
                    IDVar: ''
            PredictorVars: {1x10 cell}
                     Data: [1200x11 table]

Использовать bininfo для отображения данных автозагрузки.

[bi, cp] = bininfo(sc, 'CustIncome')
bi=8×6 table
           Bin           Good    Bad     Odds         WOE       InfoValue 
    _________________    ____    ___    _______    _________    __________

    {'[-Inf,29000)' }     53      58    0.91379     -0.79457       0.06364
    {'[29000,33000)'}     74      49     1.5102     -0.29217     0.0091366
    {'[33000,35000)'}     68      36     1.8889     -0.06843    0.00041042
    {'[35000,40000)'}    193      98     1.9694    -0.026696    0.00017359
    {'[40000,42000)'}     68      34          2    -0.011271    1.0819e-05
    {'[42000,47000)'}    164      66     2.4848      0.20579     0.0078175
    {'[47000,Inf]'  }    183      56     3.2679      0.47972      0.041657
    {'Totals'       }    803     397     2.0227          NaN       0.12285

cp = 6×1

       29000
       33000
       35000
       40000
       42000
       47000

Удалите вручную вторую точку реза (границу между вторым и третьим бункерами) для объединения бункеров 2 и 3. Используйте modifybins для обновления карты показателей и последующего просмотра обновленной информации о ячейке.

cp(2) = [];
sc = modifybins(sc,'CustIncome','CutPoints',cp);
bi = bininfo(sc,'CustIncome')
bi=7×6 table
           Bin           Good    Bad     Odds         WOE       InfoValue 
    _________________    ____    ___    _______    _________    __________

    {'[-Inf,29000)' }     53      58    0.91379     -0.79457       0.06364
    {'[29000,35000)'}    142      85     1.6706     -0.19124     0.0071274
    {'[35000,40000)'}    193      98     1.9694    -0.026696    0.00017359
    {'[40000,42000)'}     68      34          2    -0.011271    1.0819e-05
    {'[42000,47000)'}    164      66     2.4848      0.20579     0.0078175
    {'[47000,Inf]'  }    183      56     3.2679      0.47972      0.041657
    {'Totals'       }    803     397     2.0227          NaN       0.12043

Постройте график количества гистограмм для обновленной информации о ячейке для PredictorName названный CustIncome.

plotbins(sc,'CustIncome')

Figure contains an axes. The axes with title CustIncome contains 3 objects of type bar, line. These objects represent Good, Bad.

Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data (с использованием набора данных из Refaat 2011).

load CreditCardData 
sc = creditscorecard(data);

Выполнить автоматическое binning для PredictorName входной аргумент для CustIncome использование значений по умолчанию для алгоритма Monotone.

sc = autobinning(sc, 'CustIncome')
sc = 
  creditscorecard with properties:

                GoodLabel: 0
              ResponseVar: 'status'
               WeightsVar: ''
                 VarNames: {1x11 cell}
        NumericPredictors: {1x7 cell}
    CategoricalPredictors: {'ResStatus'  'EmpStatus'  'OtherCC'}
           BinMissingData: 0
                    IDVar: ''
            PredictorVars: {1x10 cell}
                     Data: [1200x11 table]

Использовать bininfo для отображения данных автозагрузки.

[bi, cp] = bininfo(sc, 'CustIncome')
bi=8×6 table
           Bin           Good    Bad     Odds         WOE       InfoValue 
    _________________    ____    ___    _______    _________    __________

    {'[-Inf,29000)' }     53      58    0.91379     -0.79457       0.06364
    {'[29000,33000)'}     74      49     1.5102     -0.29217     0.0091366
    {'[33000,35000)'}     68      36     1.8889     -0.06843    0.00041042
    {'[35000,40000)'}    193      98     1.9694    -0.026696    0.00017359
    {'[40000,42000)'}     68      34          2    -0.011271    1.0819e-05
    {'[42000,47000)'}    164      66     2.4848      0.20579     0.0078175
    {'[47000,Inf]'  }    183      56     3.2679      0.47972      0.041657
    {'Totals'       }    803     397     2.0227          NaN       0.12285

cp = 6×1

       29000
       33000
       35000
       40000
       42000
       47000

Постройте график данных ячейки для CustIncome без строки веса доказательств (WOE) и без легенды путем установки 'WOE' и 'Legend' аргументы «имя-значение» для 'Off'. Кроме того, установите 'BinText' аргумент пары имя-значение для 'PercentRows' показать в виде текста над строками графика пропорцию «Хорошо» и «Плохо» в каждом бункере, то есть вероятность «Хорошо» и «Плохо» в каждом бункере.

plotbins(sc,'CustIncome','WOE','Off','Legend','Off','BinText','PercentRows')

Figure contains an axes. The axes with title CustIncome contains 9 objects of type bar, text.

Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data с отсутствующими значениями.

load CreditCardData.mat 
head(dataMissing,5)
ans=5×11 table
    CustID    CustAge    TmAtAddress     ResStatus     EmpStatus    CustIncome    TmWBank    OtherCC    AMBalance    UtilRate    status
    ______    _______    ___________    ___________    _________    __________    _______    _______    _________    ________    ______

      1          53          62         <undefined>    Unknown        50000         55         Yes       1055.9        0.22        0   
      2          61          22         Home Owner     Employed       52000         25         Yes       1161.6        0.24        0   
      3          47          30         Tenant         Employed       37000         61         No        877.23        0.29        0   
      4         NaN          75         Home Owner     Employed       53000         20         Yes       157.37        0.08        0   
      5          68          56         Home Owner     Employed       53000         14         Yes       561.84        0.11        0   

fprintf('Number of rows: %d\n',height(dataMissing))
Number of rows: 1200
fprintf('Number of missing values CustAge: %d\n',sum(ismissing(dataMissing.CustAge)))
Number of missing values CustAge: 30
fprintf('Number of missing values ResStatus: %d\n',sum(ismissing(dataMissing.ResStatus)))
Number of missing values ResStatus: 40

Использовать creditscorecard с аргументом имя-значение 'BinMissingData' установить в значение true в ячейку отсутствующих числовых или категориальных данных в отдельной ячейке.

sc = creditscorecard(dataMissing,'IDVar','CustID','BinMissingData',true);
sc = autobinning(sc);

disp(sc)
  creditscorecard with properties:

                GoodLabel: 0
              ResponseVar: 'status'
               WeightsVar: ''
                 VarNames: {1x11 cell}
        NumericPredictors: {1x6 cell}
    CategoricalPredictors: {'ResStatus'  'EmpStatus'  'OtherCC'}
           BinMissingData: 1
                    IDVar: 'CustID'
            PredictorVars: {1x9 cell}
                     Data: [1200x11 table]

Просмотр и печать информации о ячейках для числовых данных для 'CustAge' который включает отсутствующие данные в отдельной ячейке с маркировкой <missing>.

[bi,cp] = bininfo(sc,'CustAge');
disp(bi)
         Bin         Good    Bad     Odds       WOE       InfoValue 
    _____________    ____    ___    ______    ________    __________

    {'[-Inf,33)'}     69      52    1.3269    -0.42156      0.018993
    {'[33,37)'  }     63      45       1.4    -0.36795      0.012839
    {'[37,40)'  }     72      47    1.5319     -0.2779     0.0079824
    {'[40,46)'  }    172      89    1.9326    -0.04556     0.0004549
    {'[46,48)'  }     59      25      2.36     0.15424     0.0016199
    {'[48,51)'  }     99      41    2.4146     0.17713     0.0035449
    {'[51,58)'  }    157      62    2.5323     0.22469     0.0088407
    {'[58,Inf]' }     93      25      3.72     0.60931      0.032198
    {'<missing>'}     19      11    1.7273    -0.15787    0.00063885
    {'Totals'   }    803     397    2.0227         NaN      0.087112
plotbins(sc,'CustAge')

Figure contains an axes. The axes with title CustAge contains 3 objects of type bar, line. These objects represent Good, Bad.

Просмотр и печать информации о ячейках для категориальных данных для 'ResStatus' который включает отсутствующие данные в отдельной ячейке с маркировкой <missing>.

[bi,cg] = bininfo(sc,'ResStatus');
disp(bi)
         Bin          Good    Bad     Odds        WOE       InfoValue 
    ______________    ____    ___    ______    _________    __________

    {'Tenant'    }    296     161    1.8385    -0.095463     0.0035249
    {'Home Owner'}    352     171    2.0585     0.017549    0.00013382
    {'Other'     }    128      52    2.4615      0.19637     0.0055808
    {'<missing>' }     27      13    2.0769     0.026469    2.3248e-05
    {'Totals'    }    803     397    2.0227          NaN     0.0092627
plotbins(sc,'ResStatus')

Figure contains an axes. The axes with title ResStatus contains 3 objects of type bar, line. These objects represent Good, Bad.

Входные аргументы

свернуть все

Модель кредитной карты показателей, указанная как creditscorecard объект. Использовать creditscorecard для создания creditscorecard объект.

Имя одного или более предикторов для построения графика, заданное с использованием символьного вектора или массива ячеек символьных векторов, содержащих одно или более имен предикторов.

Типы данных: char | cell

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: plotbins(sc,PredictorName,'BinText','Count','WOE','On')

Информация, отображаемая поверх количества выводимых на печать ячеек, определяемая как разделенная запятыми пара, состоящая из 'BinText' и символьный вектор со значениями:

  • None - Поверх ячеек не отображается текст.

  • Count - Для каждой ячейки отображается подсчет для «Хорошо» и «Плохо».

  • PercentRows - Для каждой ячейки отображает подсчет «Хорошо» и «Плохо» в процентах от количества наблюдений в ячейке.

  • PercentCols - Для каждой ячейки отображает количество «Хорошо» и «Плохо» в процентах от общего количества «Хорошо» и общего количества «Плохо» во всей выборке.

  • PercentTotal - Для каждой ячейки отображает число «Хорошо» и «Плохо» в процентах от общего количества наблюдений во всей выборке.

Типы данных: char

Индикатор для строки веса доказательств (WOE), указанной как пара, разделенная запятыми, состоящая из 'WOE' и вектор символов со значениями On или Off. Если установлено значение Onлиния WOE нанесена поверх гистограммы.

Типы данных: char

Индикатор для легенды на графике, указанный как разделенная запятыми пара, состоящая из 'Legend' и вектор символов со значениями On или Off.

Типы данных: char

Выходные аргументы

свернуть все

Маркер изображения для графика гистограммы для переменных предиктора, возвращаемый как объект фигуры или массив объектов фигуры, если их более одного PredictorName указывается в качестве входных данных.

Ссылки

[1] Андерсон, R. The Credit Скоринг Toolkit. Издательство Оксфордского университета, 2007 год.

[2] Рефаат, М. Карты оценки кредитных рисков: разработка и внедрение с использованием SAS. lulu.com, 2011.

Представлен в R2014b