Измените интервалы предиктора
вручную изменяет интервалы предиктора для числовых предикторов или категориальных предикторов, используя необязательные аргументы пары "имя-значение". Для числовых предикторов могут быть заданы минимальное значение, максимальное значение и точки разреза. Для категориальных предикторов могут быть заданы группы категорий. Метки интервал могут быть заданы для обоих типов предикторов.sc
= modifybins(sc
,PredictorName
,Name,Value
)
Создайте creditscorecard
объект с использованием CreditCardData.mat
файл для загрузки data
(использование набора данных из Refaat 2011).
load CreditCardData
sc = creditscorecard(data);
Предиктор CustIncome
является числовым. По умолчанию каждое значение предиктора помещается в отдельное интервал.
bi = bininfo(sc,'CustIncome')
bi=46×6 table
Bin Good Bad Odds WOE InfoValue
_________ ____ ___ _______ _________ __________
{'18000'} 2 3 0.66667 -1.1099 0.0056227
{'19000'} 1 2 0.5 -1.3976 0.0053002
{'20000'} 4 2 2 -0.011271 6.3641e-07
{'21000'} 6 3 2 -0.011271 9.5462e-07
{'22000'} 4 2 2 -0.011271 6.3641e-07
{'23000'} 4 4 1 -0.70442 0.0035885
{'24000'} 5 5 1 -0.70442 0.0044856
{'25000'} 4 9 0.44444 -1.5153 0.026805
{'26000'} 4 11 0.36364 -1.716 0.038999
{'27000'} 6 6 1 -0.70442 0.0053827
{'28000'} 13 11 1.1818 -0.53736 0.0061896
{'29000'} 11 10 1.1 -0.60911 0.0069988
{'30000'} 18 16 1.125 -0.58664 0.010493
{'31000'} 24 8 3 0.39419 0.0038382
{'32000'} 21 15 1.4 -0.36795 0.0042797
{'33000'} 35 19 1.8421 -0.093509 0.00039951
⋮
Использование modifybins
установить минимальное значение 0 и вырезать точки каждые 10000, с 20000 до 60000. Отображение обновленной информации о интервале, включая точки разреза.
sc = modifybins(sc,'CustIncome','MinValue',0,'CutPoints',20000:10000:60000); [bi,cp] = bininfo(sc,'CustIncome')
bi=7×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ _________ _________
{'[0,20000)' } 3 5 0.6 -1.2152 0.010765
{'[20000,30000)'} 61 63 0.96825 -0.73668 0.060942
{'[30000,40000)'} 324 173 1.8728 -0.076967 0.0024846
{'[40000,50000)'} 304 123 2.4715 0.20042 0.013781
{'[50000,60000)'} 103 32 3.2188 0.46457 0.022144
{'[60000,Inf]' } 8 1 8 1.375 0.010235
{'Totals' } 803 397 2.0227 NaN 0.12035
cp = 5×1
20000
30000
40000
50000
60000
Первое и последнее интервалы содержат очень мало точек. Чтобы объединить первый интервал во второе, удалите первую точку разреза. Точно так же, чтобы объединить последний интервал в последнее, удалите последнюю точку разреза. Затем используйте modifybins
для обновления карты показателей и отображения обновленной информации о интервале.
cp(1)=[]; cp(end)=[]; sc = modifybins(sc,'CustIncome','CutPoints',cp); bi = bininfo(sc,'CustIncome')
bi=5×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ _________ _________
{'[0,30000)' } 64 68 0.94118 -0.76504 0.070065
{'[30000,40000)'} 324 173 1.8728 -0.076967 0.0024846
{'[40000,50000)'} 304 123 2.4715 0.20042 0.013781
{'[50000,Inf]' } 111 33 3.3636 0.5086 0.028028
{'Totals' } 803 397 2.0227 NaN 0.11436
Создайте creditscorecard
объект с использованием CreditCardData.mat
файл для загрузки data
(использование набора данных из Refaat 2011).
load CreditCardData
sc = creditscorecard(data);
binning map или правила для категориальных данных суммируются в таблице «группировка категорий», возвращаемой как необязательный выход. По умолчанию каждая категория помещается в отдельный интервал. Вот информация для предиктора ResStatus
.
[bi,cg] = bininfo(sc,'ResStatus')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ _________
{'Home Owner'} 365 177 2.0621 0.019329 0.0001682
{'Tenant' } 307 167 1.8383 -0.095564 0.0036638
{'Other' } 131 53 2.4717 0.20049 0.0059418
{'Totals' } 803 397 2.0227 NaN 0.0097738
cg=3×2 table
Category BinNumber
______________ _________
{'Home Owner'} 1
{'Tenant' } 2
{'Other' } 3
К категориям групп 'Tenant'
и 'Other'
, измените таблицу группировок категорий cg
, так что номер интервала для 'Other'
совпадает с номером интервала для 'Tenant'
. Затем используйте modifybins
для обновления карты показателей.
cg.BinNumber(3) = 2; sc = modifybins(sc,'ResStatus','CatGrouping',cg);
Отображение обновленной информации о интервале. Обратите внимание, что метки интервалов были обновлены и что информация о принадлежности интервалов содержится в группе категорий cg
.
[bi,cg] = bininfo(sc,'ResStatus')
bi=3×6 table
Bin Good Bad Odds WOE InfoValue
__________ ____ ___ ______ _________ __________
{'Group1'} 365 177 2.0621 0.019329 0.0001682
{'Group2'} 438 220 1.9909 -0.015827 0.00013772
{'Totals'} 803 397 2.0227 NaN 0.00030592
cg=3×2 table
Category BinNumber
______________ _________
{'Home Owner'} 1
{'Tenant' } 2
{'Other' } 2
Создайте creditscorecard
объект (с использованием набора данных из Refaat 2011).
load CreditCardData sc = creditscorecard(data,'IDVar','CustID','GoodLabel',0);
Для численного предиктора CustAge
, используйте modifybins
функция для установки следующих точек реза:
cp = [25 37 49 65]; sc = modifybins(sc,'CustAge','CutPoints',cp,'MinValue',0,'MaxValue',75); bininfo(sc,'CustAge')
ans=6×6 table
Bin Good Bad Odds WOE InfoValue
___________ ____ ___ ______ _________ _________
{'[0,25)' } 9 8 1.125 -0.58664 0.0052464
{'[25,37)'} 125 92 1.3587 -0.39789 0.030268
{'[37,49)'} 340 183 1.8579 -0.084959 0.0031898
{'[49,65)'} 298 108 2.7593 0.31054 0.030765
{'[65,75]'} 31 6 5.1667 0.93781 0.022031
{'Totals' } 803 397 2.0227 NaN 0.0915
Используйте modifybins
функция для объединения второго и третьего интервалов.
sc = modifybins(sc,'CustAge','CutPoints',cp([1 3 4])); bininfo(sc,'CustAge')
ans=5×6 table
Bin Good Bad Odds WOE InfoValue
___________ ____ ___ ______ ________ _________
{'[0,25)' } 9 8 1.125 -0.58664 0.0052464
{'[25,49)'} 465 275 1.6909 -0.17915 0.020355
{'[49,65)'} 298 108 2.7593 0.31054 0.030765
{'[65,75]'} 31 6 5.1667 0.93781 0.022031
{'Totals' } 803 397 2.0227 NaN 0.078397
Отобразите информацию о интервале для категориального предиктора ResStatus
.
[bi,cg] = bininfo(sc,'ResStatus');
disp(bi)
Bin Good Bad Odds WOE InfoValue ______________ ____ ___ ______ _________ _________ {'Home Owner'} 365 177 2.0621 0.019329 0.0001682 {'Tenant' } 307 167 1.8383 -0.095564 0.0036638 {'Other' } 131 53 2.4717 0.20049 0.0059418 {'Totals' } 803 397 2.0227 NaN 0.0097738
Используйте modifybins
функция для объединения категорий 2 и 3.
cg.BinNumber(3) = 2; sc = modifybins(sc,'ResStatus','CatGrouping',cg); bininfo(sc,'ResStatus')
ans=3×6 table
Bin Good Bad Odds WOE InfoValue
__________ ____ ___ ______ _________ __________
{'Group1'} 365 177 2.0621 0.019329 0.0001682
{'Group2'} 438 220 1.9909 -0.015827 0.00013772
{'Totals'} 803 397 2.0227 NaN 0.00030592
Создайте creditscorecard
объект (с использованием набора данных из Refaat 2011).
load CreditCardData sc = creditscorecard(data,'IDVar','CustID','GoodLabel',0)
sc = creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: '' VarNames: {1x11 cell} NumericPredictors: {1x6 cell} CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'} BinMissingData: 0 IDVar: 'CustID' PredictorVars: {1x9 cell} Data: [1200x11 table]
Для численного предиктора TmAtAddress
, используйте modifybins
функция для установки следующих точек реза:
cp = [30 80 120]; sc = modifybins(sc,'TmAtAddress','CutPoints',cp,'MinValue',0,'MaxValue',210); bininfo(sc,'TmAtAddress')
ans=5×6 table
Bin Good Bad Odds WOE InfoValue
_____________ ____ ___ ______ _________ __________
{'[0,30)' } 330 154 2.1429 0.057722 0.0013305
{'[30,80)' } 379 201 1.8856 -0.070187 0.0024086
{'[80,120)' } 78 36 2.1667 0.068771 0.00044396
{'[120,210]'} 16 6 2.6667 0.27641 0.0013301
{'Totals' } 803 397 2.0227 NaN 0.0055131
Используйте modifybins
функция для разделения второго интервала.
sc = modifybins(sc,'TmAtAddress','CutPoints',[cp(1) 50 cp(2:end)]); bininfo(sc,'TmAtAddress')
ans=6×6 table
Bin Good Bad Odds WOE InfoValue
_____________ ____ ___ ______ _________ __________
{'[0,30)' } 330 154 2.1429 0.057722 0.0013305
{'[30,50)' } 211 104 2.0288 0.0030488 2.4387e-06
{'[50,80)' } 168 97 1.732 -0.15517 0.005449
{'[80,120)' } 78 36 2.1667 0.068771 0.00044396
{'[120,210]'} 16 6 2.6667 0.27641 0.0013301
{'Totals' } 803 397 2.0227 NaN 0.0085559
Отобразите информацию о интервале для категориального предиктора ResStatus
.
[bi,cg] = bininfo(sc,'ResStatus')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ _________
{'Home Owner'} 365 177 2.0621 0.019329 0.0001682
{'Tenant' } 307 167 1.8383 -0.095564 0.0036638
{'Other' } 131 53 2.4717 0.20049 0.0059418
{'Totals' } 803 397 2.0227 NaN 0.0097738
cg=3×2 table
Category BinNumber
______________ _________
{'Home Owner'} 1
{'Tenant' } 2
{'Other' } 3
Используйте modifybins
функция для объединения категорий 2 и 3.
cg.BinNumber(3) = 2; sc = modifybins(sc,'ResStatus','CatGrouping',cg); bininfo(sc,'ResStatus')
ans=3×6 table
Bin Good Bad Odds WOE InfoValue
__________ ____ ___ ______ _________ __________
{'Group1'} 365 177 2.0621 0.019329 0.0001682
{'Group2'} 438 220 1.9909 -0.015827 0.00013772
{'Totals'} 803 397 2.0227 NaN 0.00030592
Используйте modifybins
функцию разделения интервала 2 и размещения Other
под интервалом 3.
cg.BinNumber(3) = 3; sc = modifybins(sc,'ResStatus','CatGrouping',cg); [bi,cg] = bininfo(sc,'ResStatus')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ _________
{'Home Owner'} 365 177 2.0621 0.019329 0.0001682
{'Tenant' } 307 167 1.8383 -0.095564 0.0036638
{'Other' } 131 53 2.4717 0.20049 0.0059418
{'Totals' } 803 397 2.0227 NaN 0.0097738
cg=3×2 table
Category BinNumber
______________ _________
{'Home Owner'} 1
{'Tenant' } 2
{'Other' } 3
Создайте creditscorecard
объект с использованием CreditCardData.mat
файл для загрузки data
(использование набора данных из Refaat 2011).
load CreditCardData
sc = creditscorecard(data);
Использование modifybins
чтобы сбросить минимальное значение и создать три интервала для предиктора CustIncome
и отобразить обновленную информацию о интервале.
sc = modifybins(sc,'CustIncome','MinValue',0,'CutPoints',[30000 50000]); bi = bininfo(sc,'CustIncome')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ ________ _________
{'[0,30000)' } 64 68 0.94118 -0.76504 0.070065
{'[30000,50000)'} 628 296 2.1216 0.047762 0.0017421
{'[50000,Inf]' } 111 33 3.3636 0.5086 0.028028
{'Totals' } 803 397 2.0227 NaN 0.099836
Измените метки интервала и отобразите обновленную информацию о интервале.
NewLabels = {'Up to 30k','30k to 50k','50k and more'}; sc = modifybins(sc,'CustIncome','BinLabels',NewLabels); bi = bininfo(sc,'CustIncome')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
________________ ____ ___ _______ ________ _________
{'Up to 30k' } 64 68 0.94118 -0.76504 0.070065
{'30k to 50k' } 628 296 2.1216 0.047762 0.0017421
{'50k and more'} 111 33 3.3636 0.5086 0.028028
{'Totals' } 803 397 2.0227 NaN 0.099836
Метки интервала должны быть последним шагом изменения интервала. Как и в этом примере, пользовательские метки интервала часто содержат информацию о точках реза, минимальных или максимальных значениях для числовых данных или информацию о группировании категорий для категориальных данных. Чтобы предотвратить ситуации, когда определяемые пользователем метки и точки реза являются несогласованными (и метки вводят в заблуждение), creditscorecard
объект переопределяет пользовательские метки каждый раз, когда интервалы изменяются с помощью modifybins
.
Чтобы проиллюстрировать modifybins
переопределяют пользовательские метки каждый раз, когда интервалы изменяются, сбрасывают первую точку разреза до 31000 и отображают обновленную информацию о интервале. Обратите внимание, что метки интервалов сбрасываются в формат по умолчанию и точно отражают изменение точек реза.
sc = modifybins(sc,'CustIncome','CutPoints',[31000 50000]); bi = bininfo(sc,'CustIncome')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ ________ _________
{'[0,31000)' } 82 84 0.97619 -0.72852 0.079751
{'[31000,50000)'} 610 280 2.1786 0.074251 0.0040364
{'[50000,Inf]' } 111 33 3.3636 0.5086 0.028028
{'Totals' } 803 397 2.0227 NaN 0.11182
Создайте creditscorecard
объект с использованием CreditCardData.mat
файл для загрузки dataMissing
с отсутствующими значениями.
load CreditCardData.mat
head(dataMissing,5)
ans=5×11 table
CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate status
______ _______ ___________ ___________ _________ __________ _______ _______ _________ ________ ______
1 53 62 <undefined> Unknown 50000 55 Yes 1055.9 0.22 0
2 61 22 Home Owner Employed 52000 25 Yes 1161.6 0.24 0
3 47 30 Tenant Employed 37000 61 No 877.23 0.29 0
4 NaN 75 Home Owner Employed 53000 20 Yes 157.37 0.08 0
5 68 56 Home Owner Employed 53000 14 Yes 561.84 0.11 0
fprintf('Number of rows: %d\n',height(dataMissing))
Number of rows: 1200
fprintf('Number of missing values CustAge: %d\n',sum(ismissing(dataMissing.CustAge)))
Number of missing values CustAge: 30
fprintf('Number of missing values ResStatus: %d\n',sum(ismissing(dataMissing.ResStatus)))
Number of missing values ResStatus: 40
Использование creditscorecard
с аргументом имя-значение 'BinMissingData'
установлено на true
чтобы сохранить отсутствующие данные в отдельном интервале.
sc = creditscorecard(dataMissing,'IDVar','CustID','BinMissingData',true); sc = autobinning(sc); disp(sc)
creditscorecard with properties: GoodLabel: 0 ResponseVar: 'status' WeightsVar: '' VarNames: {1x11 cell} NumericPredictors: {1x6 cell} CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'} BinMissingData: 1 IDVar: 'CustID' PredictorVars: {1x9 cell} Data: [1200x11 table]
Отображение информации о интервале для числовых данных для 'CustAge'
который включает отсутствующие данные в отдельном интервале, маркированном <missing>
.
[bi,cp] = bininfo(sc,'CustAge');
disp(bi)
Bin Good Bad Odds WOE InfoValue _____________ ____ ___ ______ ________ __________ {'[-Inf,33)'} 69 52 1.3269 -0.42156 0.018993 {'[33,37)' } 63 45 1.4 -0.36795 0.012839 {'[37,40)' } 72 47 1.5319 -0.2779 0.0079824 {'[40,46)' } 172 89 1.9326 -0.04556 0.0004549 {'[46,48)' } 59 25 2.36 0.15424 0.0016199 {'[48,51)' } 99 41 2.4146 0.17713 0.0035449 {'[51,58)' } 157 62 2.5323 0.22469 0.0088407 {'[58,Inf]' } 93 25 3.72 0.60931 0.032198 {'<missing>'} 19 11 1.7273 -0.15787 0.00063885 {'Totals' } 803 397 2.0227 NaN 0.087112
plotbins(sc,'CustAge')
Для числового предиктора CustAge
, удалите точки разреза 48
и 51
а затем используйте modifybins
для определения 'MinValue'
от 0
чтобы вручную изменить раскладывание и заметить, что это не влияет на данные в <missing>
интервал и <missing>
Интервал остается в конце.
cp(cp==48) = []; cp(cp==51) = []; sc = modifybins(sc,'CustAge','CutPoints',cp,'MinValue',0); bi = bininfo(sc,'CustAge'); disp(bi)
Bin Good Bad Odds WOE InfoValue _____________ ____ ___ ______ ________ __________ {'[0,33)' } 69 52 1.3269 -0.42156 0.018993 {'[33,37)' } 63 45 1.4 -0.36795 0.012839 {'[37,40)' } 72 47 1.5319 -0.2779 0.0079824 {'[40,46)' } 172 89 1.9326 -0.04556 0.0004549 {'[46,58)' } 315 128 2.4609 0.19612 0.013701 {'[58,Inf]' } 93 25 3.72 0.60931 0.032198 {'<missing>'} 19 11 1.7273 -0.15787 0.00063885 {'Totals' } 803 397 2.0227 NaN 0.086808
plotbins(sc,'CustAge')
Отображение информации о интервале для категориальных данных для 'ResStatus'
который включает отсутствующие данные в отдельном интервале, маркированном <missing>
.
[bi,cg] = bininfo(sc,'ResStatus');
disp(bi)
Bin Good Bad Odds WOE InfoValue ______________ ____ ___ ______ _________ __________ {'Tenant' } 296 161 1.8385 -0.095463 0.0035249 {'Home Owner'} 352 171 2.0585 0.017549 0.00013382 {'Other' } 128 52 2.4615 0.19637 0.0055808 {'<missing>' } 27 13 2.0769 0.026469 2.3248e-05 {'Totals' } 803 397 2.0227 NaN 0.0092627
plotbins(sc,'ResStatus')
Для категориального предиктора ResStatus
, использовать modifybins
чтобы вручную объединить 'HomeOwner'
и 'Other'
в одну группу путем присвоения этим категориям того же номера интервала. Заметьте, что это не влияет на данные в <missing>
интервал и <missing>
Интервал остается в конце.
cg.BinNumber(3) = 2; sc = modifybins(sc,'ResStatus','CatGrouping',cg); [bi,cg] = bininfo(sc,'ResStatus'); disp(bi)
Bin Good Bad Odds WOE InfoValue _____________ ____ ___ ______ _________ __________ {'Group1' } 296 161 1.8385 -0.095463 0.0035249 {'Group2' } 480 223 2.1525 0.062196 0.0022419 {'<missing>'} 27 13 2.0769 0.026469 2.3248e-05 {'Totals' } 803 397 2.0227 NaN 0.00579
disp(cg)
Category BinNumber ______________ _________ {'Tenant' } 1 {'Home Owner'} 2 {'Other' } 2
sc
- Модель карты показателей кредитаcreditscorecard
объектМодель карты показателей кредита, заданная как creditscorecard
объект. Использование creditscorecard
для создания creditscorecard
объект.
PredictorName
- Имя предиктораИмя предиктора, заданное как вектор символов, содержащее имя предиктора. PredictorName
учитывает регистр.
Типы данных: char
Задайте необязательные разделенные разделенными запятой парами Name,Value
аргументы. Name
- имя аргумента и Value
- соответствующее значение. Name
должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN
.
sc = modifybins(sc,PredictorName,'MinValue',10,'CutPoints',[23, 44, 66, 88])
'MinValue'
- Минимальное допустимое значение (только числовые предикторы)-Inf
(по умолчанию) | числоМинимальное приемлемое значение, заданное как разделенная разделенными запятой парами, состоящая из 'MinValue'
и числовое значение (только для числовых предикторов). Значения ниже этого числа рассматриваются вне области значений.
Типы данных: double
'MaxValue'
- Максимально допустимое значение (только числовые предикторы)Inf
(по умолчанию) | числоМаксимально допустимое значение, заданное как разделенная разделенными запятой парами, состоящая из 'MaxValue'
и числовое значение (только для числовых предикторов). Значения выше этого числа считаются вне области значений.
Типы данных: double
'CutPoints'
- Разделение точек между интерваламиРазделение точек между интервалами, заданное как разделенная разделенными запятой парами, состоящая из 'CutPoints'
и недекретируемый числовой массив. Если есть NumBins
интервалы, есть n = NumBins
– 1
точки разреза, так что C1, C2,... C n описать контуры интервала с помощью следующего соглашения :
Первый интервал включает любые значения > = MinValue
, но < C1.
Второй интервал включает любые значения > = C1, но < C2.
Последний интервал включает любые значения > = C n и < = MaxValue
.
Примечание
Точки разреза не включают MinValue
или MaxValue
.
По умолчанию точки разреза заданы так, чтобы каждое наблюдаемое значение предиктора помещалось в отдельное интервал. Если отсортированные наблюдаемые значения V1,..., V M, точки разреза по умолчанию являются V2,..., V M, которые определяют M интервалы.
Типы данных: double
'CatGrouping'
- Таблица с двумя столбцами с именем Category
и BinNumber
Category
и BinNumber
Таблица с двумя столбцами с именем Category
и BinNumber
, заданная как разделенная разделенными запятой парами, состоящая из 'CatGrouping'
и таблицу, где первый столбец содержит исчерпывающий список категорий для предиктора, а второй столбец содержит номер интервала, которому принадлежит каждая категория.
По умолчанию каждая категория помещается в отдельный интервал. Если наблюдаемые категории '
Cat1 <reservedrangesplaceholder0>
…,'
Кот M '
группировка категорий по умолчанию следующая.
Категория | BinNumber |
---|---|
' Cat1 <reservedrangesplaceholder0> | 1 |
' Cat2 <reservedrangesplaceholder0> | 2 |
... | ... |
' Кот M’ ' | M |
Типы данных: double
'BinLabels'
- Метки интервала для каждого интервалаМетки интервала для каждого интервала, заданные как разделенная разделенными запятой парами, состоящая из 'BinLabels'
и массив ячеек из векторов символов с именами меток интервала.
Примечание
'BinLabels'
не поддерживает значение <missing>
.
Метки интервала используются для маркировки интервалов в различных функциях объекта, таких как bininfo
, plotbins
, и displaypoints
. A creditscorecard
объект автоматически устанавливает интервалы по умолчанию при каждом изменении интервалов. Формат по умолчанию для меток интервала зависит от типа предиктора.
Формат для BinLabels
является:
Числовые данные - Перед любым ручным или автоматическим изменением интервалов предиктора по умолчанию существует интервал для каждого наблюдаемого значения предиктора. В этом случае метки интервала просто показывают значения предиктора. После изменения интервалов предиктора существуют значения, отличные от значений для MinValue
или MaxValue
или ненефектные точки реза C1, C2,..., C n. В этом случае метки интервала:
Интервал Bin 1: '[
MinValue
, C1
)'
Bin 2 label: '[C1
, C2
)'
Последняя метка интервала: '[Cn
, MaxValue
]'
Например, если существует три интервала, MinValue
0 и MaxValue
равен 40, а точка разреза 1 равна 20, а точка разреза 2 равна 30, тогда соответствующие три метки интервала:
'[0,20)' '[20,30)' '[30,40]'
Категориальные данные - Для категориальных данных перед любым изменением интервалов предиктора существует по одному интервалу для категории. В этом случае метки интервал просто показывают категории предикторов. После изменения интервалов метки устанавливаются на 'Group1'
, 'Group2'
, и так далее, для интервала 1, интервала 2 и так далее, соответственно. Например, предположим, что у нас есть следующая группировка категорий
Категория | BinNumber |
---|---|
' Cat1 <reservedrangesplaceholder0> | 1 |
' Cat2 <reservedrangesplaceholder0> | 2 |
' Cat3 <reservedrangesplaceholder0> | 2 |
Bin 1 содержит 'Cat1'
только для метки интервала задано значение 'Group1'
. Интервал 2 содержит 'Cat2'
и 'Cat3'
и для его метки интервала задано значение 'Group2'
.
Совет
Использование BinLabels
должен быть последним шагом (при необходимости) в изменении интервалов. BinLabels
определения переопределяются каждый раз, когда интервалы изменяются с помощью modifybins
или autobinning
функций.
Типы данных: cell
sc
- Модель карты показателей кредитаcreditscorecard
объектМодель карты показателей кредита, возвращенная как обновленная creditscorecard
объект. Для получения дополнительной информации об использовании creditscorecard
объект, см. creditscorecard
.
[1] Anderson, R. The Credit Scoring Toolkit. Oxford University Press, 2007.
[2] Refaat, M. Кредитные карты оценки риска: Разработка и реализация с использованием SAS. lulu.com, 2011.
autobinning
| bindata
| bininfo
| creditscorecard
| displaypoints
| fitmodel
| formatpoints
| modifypredictor
| plotbins
| predictorinfo
| probdefault
| score
| setmodel
| validatemodel
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.