Изменение ячеек предиктора
вручную изменяет ячейки предиктора для числовых предикторов или категориальных предикторов, используя необязательные аргументы пары имя-значение. Для числовых предикторов можно указать минимальное значение, максимальное значение и точки отсечения. Для категориальных предикторов можно указать группировки категорий. Метки ячеек могут быть указаны для обоих типов предикторов.sc = modifybins(sc,PredictorName,Name,Value)
Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data (с использованием набора данных из Refaat 2011).
load CreditCardData
sc = creditscorecard(data);Предсказатель CustIncome является числовым. По умолчанию каждое значение предиктора помещается в отдельный бункер.
bi = bininfo(sc,'CustIncome')bi=46×6 table
Bin Good Bad Odds WOE InfoValue
_________ ____ ___ _______ _________ __________
{'18000'} 2 3 0.66667 -1.1099 0.0056227
{'19000'} 1 2 0.5 -1.3976 0.0053002
{'20000'} 4 2 2 -0.011271 6.3641e-07
{'21000'} 6 3 2 -0.011271 9.5462e-07
{'22000'} 4 2 2 -0.011271 6.3641e-07
{'23000'} 4 4 1 -0.70442 0.0035885
{'24000'} 5 5 1 -0.70442 0.0044856
{'25000'} 4 9 0.44444 -1.5153 0.026805
{'26000'} 4 11 0.36364 -1.716 0.038999
{'27000'} 6 6 1 -0.70442 0.0053827
{'28000'} 13 11 1.1818 -0.53736 0.0061896
{'29000'} 11 10 1.1 -0.60911 0.0069988
{'30000'} 18 16 1.125 -0.58664 0.010493
{'31000'} 24 8 3 0.39419 0.0038382
{'32000'} 21 15 1.4 -0.36795 0.0042797
{'33000'} 35 19 1.8421 -0.093509 0.00039951
⋮
Использовать modifybins для установки минимального значения 0 и точек отсечения каждые 10000, от 20000 до 60000. Отображение обновленной информации о ячейке, включая точки реза.
sc = modifybins(sc,'CustIncome','MinValue',0,'CutPoints',20000:10000:60000); [bi,cp] = bininfo(sc,'CustIncome')
bi=7×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ _________ _________
{'[0,20000)' } 3 5 0.6 -1.2152 0.010765
{'[20000,30000)'} 61 63 0.96825 -0.73668 0.060942
{'[30000,40000)'} 324 173 1.8728 -0.076967 0.0024846
{'[40000,50000)'} 304 123 2.4715 0.20042 0.013781
{'[50000,60000)'} 103 32 3.2188 0.46457 0.022144
{'[60000,Inf]' } 8 1 8 1.375 0.010235
{'Totals' } 803 397 2.0227 NaN 0.12035
cp = 5×1
20000
30000
40000
50000
60000
Первый и последний бункеры содержат очень мало точек. Чтобы объединить первый бункер во второй, удалите первую точку реза. Аналогично, чтобы объединить последнюю ячейку в последнюю, удалите последнюю точку реза. Затем использовать modifybins для обновления карты показателей и просмотра обновленной информации о ячейке.
cp(1)=[]; cp(end)=[]; sc = modifybins(sc,'CustIncome','CutPoints',cp); bi = bininfo(sc,'CustIncome')
bi=5×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ _________ _________
{'[0,30000)' } 64 68 0.94118 -0.76504 0.070065
{'[30000,40000)'} 324 173 1.8728 -0.076967 0.0024846
{'[40000,50000)'} 304 123 2.4715 0.20042 0.013781
{'[50000,Inf]' } 111 33 3.3636 0.5086 0.028028
{'Totals' } 803 397 2.0227 NaN 0.11436
Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data (с использованием набора данных из Refaat 2011).
load CreditCardData
sc = creditscorecard(data);Карта привязки или правила для категориальных данных суммируются в таблице «группирования категорий», возвращаемой как необязательный вывод. По умолчанию каждая категория помещается в отдельную ячейку. Вот информация для предиктора ResStatus.
[bi,cg] = bininfo(sc,'ResStatus')bi=4×6 table
Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ _________
{'Home Owner'} 365 177 2.0621 0.019329 0.0001682
{'Tenant' } 307 167 1.8383 -0.095564 0.0036638
{'Other' } 131 53 2.4717 0.20049 0.0059418
{'Totals' } 803 397 2.0227 NaN 0.0097738
cg=3×2 table
Category BinNumber
______________ _________
{'Home Owner'} 1
{'Tenant' } 2
{'Other' } 3
Для группирования категорий 'Tenant' и 'Other', изменить таблицу группировки категорий cg, таким образом, номер ячейки для 'Other' совпадает с номером ячейки для 'Tenant'. Затем использовать modifybins для обновления карты показателей.
cg.BinNumber(3) = 2; sc = modifybins(sc,'ResStatus','CatGrouping',cg);
Просмотрите обновленную информацию о ячейке. Обратите внимание, что метки ячеек были обновлены и что информация о членстве в ячейках содержится в группировке категорий. cg.
[bi,cg] = bininfo(sc,'ResStatus')bi=3×6 table
Bin Good Bad Odds WOE InfoValue
__________ ____ ___ ______ _________ __________
{'Group1'} 365 177 2.0621 0.019329 0.0001682
{'Group2'} 438 220 1.9909 -0.015827 0.00013772
{'Totals'} 803 397 2.0227 NaN 0.00030592
cg=3×2 table
Category BinNumber
______________ _________
{'Home Owner'} 1
{'Tenant' } 2
{'Other' } 2
Создать creditscorecard (с использованием набора данных из Refaat 2011).
load CreditCardData sc = creditscorecard(data,'IDVar','CustID','GoodLabel',0);
Для числового предиктора CustAge, используйте modifybins для установки следующих точек реза:
cp = [25 37 49 65]; sc = modifybins(sc,'CustAge','CutPoints',cp,'MinValue',0,'MaxValue',75); bininfo(sc,'CustAge')
ans=6×6 table
Bin Good Bad Odds WOE InfoValue
___________ ____ ___ ______ _________ _________
{'[0,25)' } 9 8 1.125 -0.58664 0.0052464
{'[25,37)'} 125 92 1.3587 -0.39789 0.030268
{'[37,49)'} 340 183 1.8579 -0.084959 0.0031898
{'[49,65)'} 298 108 2.7593 0.31054 0.030765
{'[65,75]'} 31 6 5.1667 0.93781 0.022031
{'Totals' } 803 397 2.0227 NaN 0.0915
Используйте modifybins для объединения 2-го и 3-го бункеров.
sc = modifybins(sc,'CustAge','CutPoints',cp([1 3 4])); bininfo(sc,'CustAge')
ans=5×6 table
Bin Good Bad Odds WOE InfoValue
___________ ____ ___ ______ ________ _________
{'[0,25)' } 9 8 1.125 -0.58664 0.0052464
{'[25,49)'} 465 275 1.6909 -0.17915 0.020355
{'[49,65)'} 298 108 2.7593 0.31054 0.030765
{'[65,75]'} 31 6 5.1667 0.93781 0.022031
{'Totals' } 803 397 2.0227 NaN 0.078397
Отображение сведений о ячейке для категориального предиктора ResStatus.
[bi,cg] = bininfo(sc,'ResStatus');
disp(bi) Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ _________
{'Home Owner'} 365 177 2.0621 0.019329 0.0001682
{'Tenant' } 307 167 1.8383 -0.095564 0.0036638
{'Other' } 131 53 2.4717 0.20049 0.0059418
{'Totals' } 803 397 2.0227 NaN 0.0097738
Используйте modifybins для объединения категорий 2 и 3.
cg.BinNumber(3) = 2; sc = modifybins(sc,'ResStatus','CatGrouping',cg); bininfo(sc,'ResStatus')
ans=3×6 table
Bin Good Bad Odds WOE InfoValue
__________ ____ ___ ______ _________ __________
{'Group1'} 365 177 2.0621 0.019329 0.0001682
{'Group2'} 438 220 1.9909 -0.015827 0.00013772
{'Totals'} 803 397 2.0227 NaN 0.00030592
Создать creditscorecard (с использованием набора данных из Refaat 2011).
load CreditCardData sc = creditscorecard(data,'IDVar','CustID','GoodLabel',0)
sc =
creditscorecard with properties:
GoodLabel: 0
ResponseVar: 'status'
WeightsVar: ''
VarNames: {1x11 cell}
NumericPredictors: {1x6 cell}
CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'}
BinMissingData: 0
IDVar: 'CustID'
PredictorVars: {1x9 cell}
Data: [1200x11 table]
Для числового предиктора TmAtAddress, используйте modifybins для установки следующих точек реза:
cp = [30 80 120]; sc = modifybins(sc,'TmAtAddress','CutPoints',cp,'MinValue',0,'MaxValue',210); bininfo(sc,'TmAtAddress')
ans=5×6 table
Bin Good Bad Odds WOE InfoValue
_____________ ____ ___ ______ _________ __________
{'[0,30)' } 330 154 2.1429 0.057722 0.0013305
{'[30,80)' } 379 201 1.8856 -0.070187 0.0024086
{'[80,120)' } 78 36 2.1667 0.068771 0.00044396
{'[120,210]'} 16 6 2.6667 0.27641 0.0013301
{'Totals' } 803 397 2.0227 NaN 0.0055131
Используйте modifybins функция для разделения 2-й ячейки.
sc = modifybins(sc,'TmAtAddress','CutPoints',[cp(1) 50 cp(2:end)]); bininfo(sc,'TmAtAddress')
ans=6×6 table
Bin Good Bad Odds WOE InfoValue
_____________ ____ ___ ______ _________ __________
{'[0,30)' } 330 154 2.1429 0.057722 0.0013305
{'[30,50)' } 211 104 2.0288 0.0030488 2.4387e-06
{'[50,80)' } 168 97 1.732 -0.15517 0.005449
{'[80,120)' } 78 36 2.1667 0.068771 0.00044396
{'[120,210]'} 16 6 2.6667 0.27641 0.0013301
{'Totals' } 803 397 2.0227 NaN 0.0085559
Отображение сведений о ячейке для категориального предиктора ResStatus.
[bi,cg] = bininfo(sc,'ResStatus')bi=4×6 table
Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ _________
{'Home Owner'} 365 177 2.0621 0.019329 0.0001682
{'Tenant' } 307 167 1.8383 -0.095564 0.0036638
{'Other' } 131 53 2.4717 0.20049 0.0059418
{'Totals' } 803 397 2.0227 NaN 0.0097738
cg=3×2 table
Category BinNumber
______________ _________
{'Home Owner'} 1
{'Tenant' } 2
{'Other' } 3
Используйте modifybins для объединения категорий 2 и 3.
cg.BinNumber(3) = 2; sc = modifybins(sc,'ResStatus','CatGrouping',cg); bininfo(sc,'ResStatus')
ans=3×6 table
Bin Good Bad Odds WOE InfoValue
__________ ____ ___ ______ _________ __________
{'Group1'} 365 177 2.0621 0.019329 0.0001682
{'Group2'} 438 220 1.9909 -0.015827 0.00013772
{'Totals'} 803 397 2.0227 NaN 0.00030592
Используйте modifybins функция для разделения ячейки 2 и размещения Other под бункером 3.
cg.BinNumber(3) = 3; sc = modifybins(sc,'ResStatus','CatGrouping',cg); [bi,cg] = bininfo(sc,'ResStatus')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ _________
{'Home Owner'} 365 177 2.0621 0.019329 0.0001682
{'Tenant' } 307 167 1.8383 -0.095564 0.0036638
{'Other' } 131 53 2.4717 0.20049 0.0059418
{'Totals' } 803 397 2.0227 NaN 0.0097738
cg=3×2 table
Category BinNumber
______________ _________
{'Home Owner'} 1
{'Tenant' } 2
{'Other' } 3
Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data (с использованием набора данных из Refaat 2011).
load CreditCardData
sc = creditscorecard(data);Использовать modifybins для сброса минимального значения и создания трех ячеек для предиктора CustIncome и просмотр обновленной информации о ячейке.
sc = modifybins(sc,'CustIncome','MinValue',0,'CutPoints',[30000 50000]); bi = bininfo(sc,'CustIncome')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ ________ _________
{'[0,30000)' } 64 68 0.94118 -0.76504 0.070065
{'[30000,50000)'} 628 296 2.1216 0.047762 0.0017421
{'[50000,Inf]' } 111 33 3.3636 0.5086 0.028028
{'Totals' } 803 397 2.0227 NaN 0.099836
Измените метки ячейки и просмотрите обновленную информацию о ячейке.
NewLabels = {'Up to 30k','30k to 50k','50k and more'};
sc = modifybins(sc,'CustIncome','BinLabels',NewLabels);
bi = bininfo(sc,'CustIncome')bi=4×6 table
Bin Good Bad Odds WOE InfoValue
________________ ____ ___ _______ ________ _________
{'Up to 30k' } 64 68 0.94118 -0.76504 0.070065
{'30k to 50k' } 628 296 2.1216 0.047762 0.0017421
{'50k and more'} 111 33 3.3636 0.5086 0.028028
{'Totals' } 803 397 2.0227 NaN 0.099836
Этикетки ячеек должны быть последним шагом изменения ячеек. Как и в этом примере, пользовательские метки ячеек часто содержат информацию о точках реза, минимальных или максимальных значениях для числовых данных или информацию о группировках категорий для категориальных данных. Для предотвращения ситуаций, когда пользовательские метки и точки реза противоречивы (а метки вводят в заблуждение), creditscorecard объект переопределяет пользовательские метки при каждом изменении ячеек с помощью modifybins.
Проиллюстрировать modifybins переопределение пользовательских меток при каждом изменении ячеек, сброс первой точки реза до 31000 и отображение обновленной информации о ячейках. Обратите внимание, что метки ячеек сброшены в формат по умолчанию и точно отражают изменение точек реза.
sc = modifybins(sc,'CustIncome','CutPoints',[31000 50000]); bi = bininfo(sc,'CustIncome')
bi=4×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ ________ _________
{'[0,31000)' } 82 84 0.97619 -0.72852 0.079751
{'[31000,50000)'} 610 280 2.1786 0.074251 0.0040364
{'[50000,Inf]' } 111 33 3.3636 0.5086 0.028028
{'Totals' } 803 397 2.0227 NaN 0.11182
Создать creditscorecard с использованием CreditCardData.mat для загрузки файла dataMissing с отсутствующими значениями.
load CreditCardData.mat
head(dataMissing,5)ans=5×11 table
CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate status
______ _______ ___________ ___________ _________ __________ _______ _______ _________ ________ ______
1 53 62 <undefined> Unknown 50000 55 Yes 1055.9 0.22 0
2 61 22 Home Owner Employed 52000 25 Yes 1161.6 0.24 0
3 47 30 Tenant Employed 37000 61 No 877.23 0.29 0
4 NaN 75 Home Owner Employed 53000 20 Yes 157.37 0.08 0
5 68 56 Home Owner Employed 53000 14 Yes 561.84 0.11 0
fprintf('Number of rows: %d\n',height(dataMissing))Number of rows: 1200
fprintf('Number of missing values CustAge: %d\n',sum(ismissing(dataMissing.CustAge)))Number of missing values CustAge: 30
fprintf('Number of missing values ResStatus: %d\n',sum(ismissing(dataMissing.ResStatus)))Number of missing values ResStatus: 40
Использовать creditscorecard с аргументом имя-значение 'BinMissingData' установить в значение true в складское место отсутствующих данных в отдельном складском месте.
sc = creditscorecard(dataMissing,'IDVar','CustID','BinMissingData',true); sc = autobinning(sc); disp(sc)
creditscorecard with properties:
GoodLabel: 0
ResponseVar: 'status'
WeightsVar: ''
VarNames: {1x11 cell}
NumericPredictors: {1x6 cell}
CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'}
BinMissingData: 1
IDVar: 'CustID'
PredictorVars: {1x9 cell}
Data: [1200x11 table]
Просмотр информации о ячейках для числовых данных для 'CustAge' который включает отсутствующие данные в отдельной ячейке с маркировкой <missing>.
[bi,cp] = bininfo(sc,'CustAge');
disp(bi) Bin Good Bad Odds WOE InfoValue
_____________ ____ ___ ______ ________ __________
{'[-Inf,33)'} 69 52 1.3269 -0.42156 0.018993
{'[33,37)' } 63 45 1.4 -0.36795 0.012839
{'[37,40)' } 72 47 1.5319 -0.2779 0.0079824
{'[40,46)' } 172 89 1.9326 -0.04556 0.0004549
{'[46,48)' } 59 25 2.36 0.15424 0.0016199
{'[48,51)' } 99 41 2.4146 0.17713 0.0035449
{'[51,58)' } 157 62 2.5323 0.22469 0.0088407
{'[58,Inf]' } 93 25 3.72 0.60931 0.032198
{'<missing>'} 19 11 1.7273 -0.15787 0.00063885
{'Totals' } 803 397 2.0227 NaN 0.087112
plotbins(sc,'CustAge')
Для числового предиктора CustAge, удалить точки разреза 48 и 51 а затем использовать modifybins для определения 'MinValue'из 0 чтобы вручную изменить привязку и заметить, что это не влияет на данные в <missing> bin и <missing> бункер остается в конце.
cp(cp==48) = []; cp(cp==51) = []; sc = modifybins(sc,'CustAge','CutPoints',cp,'MinValue',0); bi = bininfo(sc,'CustAge'); disp(bi)
Bin Good Bad Odds WOE InfoValue
_____________ ____ ___ ______ ________ __________
{'[0,33)' } 69 52 1.3269 -0.42156 0.018993
{'[33,37)' } 63 45 1.4 -0.36795 0.012839
{'[37,40)' } 72 47 1.5319 -0.2779 0.0079824
{'[40,46)' } 172 89 1.9326 -0.04556 0.0004549
{'[46,58)' } 315 128 2.4609 0.19612 0.013701
{'[58,Inf]' } 93 25 3.72 0.60931 0.032198
{'<missing>'} 19 11 1.7273 -0.15787 0.00063885
{'Totals' } 803 397 2.0227 NaN 0.086808
plotbins(sc,'CustAge')
Просмотр информации о ячейках для категориальных данных для 'ResStatus' который включает отсутствующие данные в отдельной ячейке с маркировкой <missing>.
[bi,cg] = bininfo(sc,'ResStatus');
disp(bi) Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ __________
{'Tenant' } 296 161 1.8385 -0.095463 0.0035249
{'Home Owner'} 352 171 2.0585 0.017549 0.00013382
{'Other' } 128 52 2.4615 0.19637 0.0055808
{'<missing>' } 27 13 2.0769 0.026469 2.3248e-05
{'Totals' } 803 397 2.0227 NaN 0.0092627
plotbins(sc,'ResStatus')
Для категориального предиктора ResStatus, использовать modifybins для объединения вручную 'HomeOwner' и 'Other' в одну группу путем присвоения этим категориям одного и того же номера ячейки. Обратите внимание, что это не влияет на данные в <missing> bin и <missing> бункер остается в конце.
cg.BinNumber(3) = 2; sc = modifybins(sc,'ResStatus','CatGrouping',cg); [bi,cg] = bininfo(sc,'ResStatus'); disp(bi)
Bin Good Bad Odds WOE InfoValue
_____________ ____ ___ ______ _________ __________
{'Group1' } 296 161 1.8385 -0.095463 0.0035249
{'Group2' } 480 223 2.1525 0.062196 0.0022419
{'<missing>'} 27 13 2.0769 0.026469 2.3248e-05
{'Totals' } 803 397 2.0227 NaN 0.00579
disp(cg)
Category BinNumber
______________ _________
{'Tenant' } 1
{'Home Owner'} 2
{'Other' } 2
sc - Модель кредитной карты показателейcreditscorecard объектМодель кредитной карты показателей, указанная как creditscorecard объект. Использовать creditscorecard для создания creditscorecard объект.
PredictorName - Наименование предиктораИмя предиктора, определяемое как символьный вектор, содержащий имя предиктора. PredictorName чувствителен к регистру.
Типы данных: char
Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.
sc = modifybins(sc,PredictorName,'MinValue',10,'CutPoints',[23, 44, 66, 88])'MinValue' - Минимально допустимое значение (только числовые предикторы)-Inf
(по умолчанию) | числовыеМинимальное допустимое значение, указанное как пара, разделенная запятыми, состоящая из 'MinValue' и числовое значение (только для числовых предикторов). Значения ниже этого числа считаются выходящими за пределы диапазона.
Типы данных: double
'MaxValue' - Максимально допустимое значение (только числовые предикторы)Inf
(по умолчанию) | числовыеМаксимальное допустимое значение, указанное как пара, разделенная запятыми, состоящая из 'MaxValue' и числовое значение (только для числовых предикторов). Значения выше этого числа считаются выходящими за пределы диапазона.
Типы данных: double
'CutPoints' - Точки разделения между ячейкамиТочки разделения между ячейками, указанные как разделенная запятыми пара, состоящая из 'CutPoints' и не повторяющийся числовой массив. Если есть NumBins ячейки, имеются n = NumBins – 1 точки отсечения, чтобы C1, C2,..., Cn описывали границы бункера следующим соглашением:
Примечание
Точки реза не включают MinValue или MaxValue.
По умолчанию точки отсечения определяются таким образом, что каждое наблюдаемое значение предиктора помещается в отдельный бункер. Если отсортированными наблюдаемыми значениями являются V1,..., ВМ, точками отсечения по умолчанию являются V2,..., ВМ, которые определяют M ячеек.
Типы данных: double
'CatGrouping' - Таблица с двумя столбцами Category и BinNumberCategory и BinNumberТаблица с двумя столбцами Category и BinNumber, указанная как пара, разделенная запятыми, состоящая из 'CatGrouping' и таблицу, в которой первый столбец содержит исчерпывающий список категорий для предиктора, а второй столбец содержит номер ячейки, которой принадлежит каждая категория.
По умолчанию каждая категория помещается в отдельную ячейку. Если наблюдаемые категории 'Cat1'…,'CatM', группировка категорий по умолчанию выглядит следующим образом.
| Категория | BinNumber |
|---|---|
'Cat1' | 1 |
'Cat2' | 2 |
| ... | ... |
'КатМ "' | M |
Типы данных: double
'BinLabels' - Этикетки ячеек для каждой ячейкиМетки ячеек для каждой ячейки, указанные как разделенная запятыми пара, состоящая из 'BinLabels' и массив ячеек векторов символов с именами меток ячеек.
Примечание
'BinLabels' не поддерживает значение <missing>.
Метки ячеек используются для маркировки ячеек в различных функциях объекта, таких как bininfo, plotbins, и displaypoints. A creditscorecard объект автоматически устанавливает ячейки по умолчанию при каждом изменении ячеек. Формат по умолчанию для меток ячеек зависит от типа предиктора.
Формат для BinLabels является:
Числовые данные - перед любым ручным или автоматическим изменением ячеек предиктора по умолчанию имеется ячейка для каждого наблюдаемого значения предиктора. В этом случае метки ячейки просто показывают предикторные значения. Как только ячейки предиктора были изменены, существуют значения по умолчанию для MinValue или MaxValueили не по умолчанию точки реза C1, C2,..., Cn. В этом случае этикетки складских мест:
Этикетка ячейки 1: '[MinValue, C1)'
Этикетка ячейки 2: '[C1, C2)'
Метка последней ячейки: '[Cn, MaxValue]'
Например, если имеется три ячейки, MinValue равно 0 и MaxValue равно 40, а точка среза 1 равна 20, а точка разреза 2 равна 30, то соответствующими тремя метками бункера являются:
'[0,20)' '[20,30)' '[30,40]'
Категориальные данные - для категориальных данных перед любой модификацией бункеров предиктора существует один бункер на категорию. В этом случае метки ячеек просто показывают категории предикторов. После изменения ячеек для меток устанавливается значение 'Group1', 'Group2'и так далее, для ячейки 1, ячейки 2 и так далее соответственно. Например, предположим, что у нас есть следующая группировка категорий
| Категория | BinNumber |
|---|---|
'Cat1' | 1 |
'Cat2' | 2 |
'Cat3' | 2 |
Ячейка 1 содержит 'Cat1' только и для его метки ячейки установлено значение 'Group1'. Ячейка 2 содержит 'Cat2' и 'Cat3' и для его метки ячейки установлено значение 'Group2'.
Совет
Используя BinLabels должен быть последним шагом (при необходимости) при изменении ячеек. BinLabels определения переопределяются при каждом изменении ячеек с помощью modifybins или autobinning функции.
Типы данных: cell
sc - Модель кредитной карты показателейcreditscorecard объектМодель кредитной карты показателей, возвращенная как обновленная creditscorecard объект. Для получения дополнительной информации об использовании creditscorecard объект, см. creditscorecard.
[1] Андерсон, R. The Credit Скоринг Toolkit. Издательство Оксфордского университета, 2007 год.
[2] Рефаат, М. Карты оценки кредитных рисков: разработка и внедрение с использованием SAS. lulu.com, 2011.
autobinning | bindata | bininfo | creditscorecard | displaypoints | fitmodel | formatpoints | modifypredictor | plotbins | predictorinfo | probdefault | score | setmodel | validatemodel
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.