Количество гистограмм графика для переменных предиктора
plotbins( строит счет гистограммы для заданных переменных предиктора. При изменении ячеек предиктора с помощью sc,PredictorName)modifybins или autobinning, повторный запуск plotbins для обновления фигуры в соответствии с изменениями.
возвращает маркер к фигуре. hFigure = plotbins(sc,PredictorName)plotbins строит счет гистограммы для заданных переменных предиктора. При изменении ячеек предиктора с помощью modifybins или autobinning, повторный запуск plotbins для обновления фигуры в соответствии с изменениями.
возвращает маркер к фигуре. hFigure = plotbins(___,Name,Value)plotbins строит подсчет гистограммы для заданных переменных предиктора с использованием необязательных аргументов пары имя-значение. При изменении ячеек предиктора с помощью modifybins или autobinning, повторный запуск plotbins для обновления фигуры в соответствии с изменениями.
Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data (с использованием набора данных из Refaat 2011).
load CreditCardData
sc = creditscorecard(data);Выполнить автоматическое binning для PredictorName входной аргумент для CustIncome использование значений по умолчанию для алгоритма Monotone.
sc = autobinning(sc, 'CustIncome')sc =
creditscorecard with properties:
GoodLabel: 0
ResponseVar: 'status'
WeightsVar: ''
VarNames: {1x11 cell}
NumericPredictors: {1x7 cell}
CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'}
BinMissingData: 0
IDVar: ''
PredictorVars: {1x10 cell}
Data: [1200x11 table]
Использовать bininfo для отображения данных автозагрузки.
[bi, cp] = bininfo(sc, 'CustIncome')bi=8×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ _________ __________
{'[-Inf,29000)' } 53 58 0.91379 -0.79457 0.06364
{'[29000,33000)'} 74 49 1.5102 -0.29217 0.0091366
{'[33000,35000)'} 68 36 1.8889 -0.06843 0.00041042
{'[35000,40000)'} 193 98 1.9694 -0.026696 0.00017359
{'[40000,42000)'} 68 34 2 -0.011271 1.0819e-05
{'[42000,47000)'} 164 66 2.4848 0.20579 0.0078175
{'[47000,Inf]' } 183 56 3.2679 0.47972 0.041657
{'Totals' } 803 397 2.0227 NaN 0.12285
cp = 6×1
29000
33000
35000
40000
42000
47000
Удалите вручную вторую точку реза (границу между вторым и третьим бункерами) для объединения бункеров 2 и 3. Используйте modifybins для обновления карты показателей и последующего просмотра обновленной информации о ячейке.
cp(2) = []; sc = modifybins(sc,'CustIncome','CutPoints',cp); bi = bininfo(sc,'CustIncome')
bi=7×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ _________ __________
{'[-Inf,29000)' } 53 58 0.91379 -0.79457 0.06364
{'[29000,35000)'} 142 85 1.6706 -0.19124 0.0071274
{'[35000,40000)'} 193 98 1.9694 -0.026696 0.00017359
{'[40000,42000)'} 68 34 2 -0.011271 1.0819e-05
{'[42000,47000)'} 164 66 2.4848 0.20579 0.0078175
{'[47000,Inf]' } 183 56 3.2679 0.47972 0.041657
{'Totals' } 803 397 2.0227 NaN 0.12043
Постройте график количества гистограмм для обновленной информации о ячейке для PredictorName названный CustIncome.
plotbins(sc,'CustIncome')
Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data (с использованием набора данных из Refaat 2011).
load CreditCardData
sc = creditscorecard(data);Выполнить автоматическое binning для PredictorName входной аргумент для CustIncome использование значений по умолчанию для алгоритма Monotone.
sc = autobinning(sc, 'CustIncome')sc =
creditscorecard with properties:
GoodLabel: 0
ResponseVar: 'status'
WeightsVar: ''
VarNames: {1x11 cell}
NumericPredictors: {1x7 cell}
CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'}
BinMissingData: 0
IDVar: ''
PredictorVars: {1x10 cell}
Data: [1200x11 table]
Использовать bininfo для отображения данных автозагрузки.
[bi, cp] = bininfo(sc, 'CustIncome')bi=8×6 table
Bin Good Bad Odds WOE InfoValue
_________________ ____ ___ _______ _________ __________
{'[-Inf,29000)' } 53 58 0.91379 -0.79457 0.06364
{'[29000,33000)'} 74 49 1.5102 -0.29217 0.0091366
{'[33000,35000)'} 68 36 1.8889 -0.06843 0.00041042
{'[35000,40000)'} 193 98 1.9694 -0.026696 0.00017359
{'[40000,42000)'} 68 34 2 -0.011271 1.0819e-05
{'[42000,47000)'} 164 66 2.4848 0.20579 0.0078175
{'[47000,Inf]' } 183 56 3.2679 0.47972 0.041657
{'Totals' } 803 397 2.0227 NaN 0.12285
cp = 6×1
29000
33000
35000
40000
42000
47000
Постройте график данных ячейки для CustIncome без строки веса доказательств (WOE) и без легенды путем установки 'WOE' и 'Legend' аргументы «имя-значение» для 'Off'. Кроме того, установите 'BinText' аргумент пары имя-значение для 'PercentRows' показать в виде текста над строками графика пропорцию «Хорошо» и «Плохо» в каждом бункере, то есть вероятность «Хорошо» и «Плохо» в каждом бункере.
plotbins(sc,'CustIncome','WOE','Off','Legend','Off','BinText','PercentRows')

Создать creditscorecard с использованием CreditCardData.mat для загрузки файла data с отсутствующими значениями.
load CreditCardData.mat
head(dataMissing,5)ans=5×11 table
CustID CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank OtherCC AMBalance UtilRate status
______ _______ ___________ ___________ _________ __________ _______ _______ _________ ________ ______
1 53 62 <undefined> Unknown 50000 55 Yes 1055.9 0.22 0
2 61 22 Home Owner Employed 52000 25 Yes 1161.6 0.24 0
3 47 30 Tenant Employed 37000 61 No 877.23 0.29 0
4 NaN 75 Home Owner Employed 53000 20 Yes 157.37 0.08 0
5 68 56 Home Owner Employed 53000 14 Yes 561.84 0.11 0
fprintf('Number of rows: %d\n',height(dataMissing))Number of rows: 1200
fprintf('Number of missing values CustAge: %d\n',sum(ismissing(dataMissing.CustAge)))Number of missing values CustAge: 30
fprintf('Number of missing values ResStatus: %d\n',sum(ismissing(dataMissing.ResStatus)))Number of missing values ResStatus: 40
Использовать creditscorecard с аргументом имя-значение 'BinMissingData' установить в значение true в ячейку отсутствующих числовых или категориальных данных в отдельной ячейке.
sc = creditscorecard(dataMissing,'IDVar','CustID','BinMissingData',true); sc = autobinning(sc); disp(sc)
creditscorecard with properties:
GoodLabel: 0
ResponseVar: 'status'
WeightsVar: ''
VarNames: {1x11 cell}
NumericPredictors: {1x6 cell}
CategoricalPredictors: {'ResStatus' 'EmpStatus' 'OtherCC'}
BinMissingData: 1
IDVar: 'CustID'
PredictorVars: {1x9 cell}
Data: [1200x11 table]
Просмотр и печать информации о ячейках для числовых данных для 'CustAge' который включает отсутствующие данные в отдельной ячейке с маркировкой <missing>.
[bi,cp] = bininfo(sc,'CustAge');
disp(bi) Bin Good Bad Odds WOE InfoValue
_____________ ____ ___ ______ ________ __________
{'[-Inf,33)'} 69 52 1.3269 -0.42156 0.018993
{'[33,37)' } 63 45 1.4 -0.36795 0.012839
{'[37,40)' } 72 47 1.5319 -0.2779 0.0079824
{'[40,46)' } 172 89 1.9326 -0.04556 0.0004549
{'[46,48)' } 59 25 2.36 0.15424 0.0016199
{'[48,51)' } 99 41 2.4146 0.17713 0.0035449
{'[51,58)' } 157 62 2.5323 0.22469 0.0088407
{'[58,Inf]' } 93 25 3.72 0.60931 0.032198
{'<missing>'} 19 11 1.7273 -0.15787 0.00063885
{'Totals' } 803 397 2.0227 NaN 0.087112
plotbins(sc,'CustAge')
Просмотр и печать информации о ячейках для категориальных данных для 'ResStatus' который включает отсутствующие данные в отдельной ячейке с маркировкой <missing>.
[bi,cg] = bininfo(sc,'ResStatus');
disp(bi) Bin Good Bad Odds WOE InfoValue
______________ ____ ___ ______ _________ __________
{'Tenant' } 296 161 1.8385 -0.095463 0.0035249
{'Home Owner'} 352 171 2.0585 0.017549 0.00013382
{'Other' } 128 52 2.4615 0.19637 0.0055808
{'<missing>' } 27 13 2.0769 0.026469 2.3248e-05
{'Totals' } 803 397 2.0227 NaN 0.0092627
plotbins(sc,'ResStatus')
sc - Модель кредитной карты показателейcreditscorecard объектМодель кредитной карты показателей, указанная как creditscorecard объект. Использовать creditscorecard для создания creditscorecard объект.
PredictorName - имя одного или нескольких предикторов для построения графика;Имя одного или более предикторов для построения графика, заданное с использованием символьного вектора или массива ячеек символьных векторов, содержащих одно или более имен предикторов.
Типы данных: char | cell
Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.
plotbins(sc,PredictorName,'BinText','Count','WOE','On')'BinText' - Информация, отображаемая поверх количества выводимых на печать ячеек 'None'
(по умолчанию) | символьный вектор со значениями 'None', 'Count', 'PercentRows', 'PercentCols', 'PercentTotal'Информация, отображаемая поверх количества выводимых на печать ячеек, определяемая как разделенная запятыми пара, состоящая из 'BinText' и символьный вектор со значениями:
None - Поверх ячеек не отображается текст.
Count - Для каждой ячейки отображается подсчет для «Хорошо» и «Плохо».
PercentRows - Для каждой ячейки отображает подсчет «Хорошо» и «Плохо» в процентах от количества наблюдений в ячейке.
PercentCols - Для каждой ячейки отображает количество «Хорошо» и «Плохо» в процентах от общего количества «Хорошо» и общего количества «Плохо» во всей выборке.
PercentTotal - Для каждой ячейки отображает число «Хорошо» и «Плохо» в процентах от общего количества наблюдений во всей выборке.
Типы данных: char
'WOE' - Показатель веса доказательств (WOE)'On'
(по умолчанию) | символьный вектор со значениями 'On', 'Off'Индикатор для строки веса доказательств (WOE), указанной как пара, разделенная запятыми, состоящая из 'WOE' и вектор символов со значениями On или Off. Если установлено значение Onлиния WOE нанесена поверх гистограммы.
Типы данных: char
'Legend' - Индикатор для условных обозначений на графике'On'
(по умолчанию) | символьный вектор со значениями 'On', 'Off'Индикатор для легенды на графике, указанный как разделенная запятыми пара, состоящая из 'Legend' и вектор символов со значениями On или Off.
Типы данных: char
hFigure - Ручка рисунка для графика гистограммы для переменных предиктораМаркер изображения для графика гистограммы для переменных предиктора, возвращаемый как объект фигуры или массив объектов фигуры, если их более одного PredictorName указывается в качестве входных данных.
[1] Андерсон, R. The Credit Скоринг Toolkit. Издательство Оксфордского университета, 2007 год.
[2] Рефаат, М. Карты оценки кредитных рисков: разработка и внедрение с использованием SAS. lulu.com, 2011.
autobinning | bindata | bininfo | creditscorecard | displaypoints | fitmodel | formatpoints | modifybins | modifypredictor | predictorinfo | probdefault | score | setmodel | validatemodel
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.