Поддержки приложений Binning Explorer следующие задачи:
Измените алгоритм раскладывания для одного или нескольких предикторов
Ручное раскладывание, чтобы объединить интервалы для числового или категориального предиктора
Binning Explorer позволяет вам импортировать данные или начинающий непосредственно с данных, хранимых в таблице MATLAB® или путем загрузки существующего creditscorecard
объект.
Начинать непосредственно с данных:
Поместите данные о протоколе результатов кредита в свое рабочее пространство MATLAB. Данные должны быть в таблице MATLAB, где каждый столбец данных может быть любым из следующих типов данных:
Числовой
Логический
Массив ячеек из символьных векторов
Массив символов
Категориальный
Кроме того, таблица должна содержать бинарную переменную отклика.
Откройте Binning Explorer от панели инструментов MATLAB: На вкладке Apps, под Computational Finance, кликают по значку приложения.
Выберите данные из панели Step 1 окна Import Data.
От панели Step 2, набор Variable Type для каждого из предикторов, по мере необходимости. Если таблица входа MATLAB содержит столбец для weights
, от панели Step 2, с помощью столбца Variable Type, кликают по выпадающему, чтобы выбрать Weights. Если данные содержат отсутствующие значения от панели Step 2, установите Bin missing data: на Yes. Для получения дополнительной информации о работе с недостающими данными смотрите, Приписывают Моделированию Протокола результатов Отсутствующие значения.
От панели Step 3 выберите первоначальный алгоритм раскладывания и нажмите Import Data. Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.
creditscorecard
ОбъектНачинать использовать существующий creditscorecard
объект:
Поместите creditscorecard
возразите в своем рабочем пространстве MATLAB. Создайте creditscorecard
возразите любому при помощи creditscorecard
или путем нажатия на Export в Binning Explorer, чтобы экспортировать и сохранить creditscorecard
возразите против рабочего пространства MATLAB.
Откройте Binning Explorer от панели инструментов MATLAB: На вкладке Apps, под Computational Finance, кликают по значку приложения.
От панели Step 1 окна Import Data выберите creditscorecard
объект.
От панели Step 3 выберите алгоритм раскладывания. При использовании существующего creditscorecard
объект, рекомендуется выбрать опцию No Binning. Чтобы отобразить графики предиктора, нажмите Import Data.
Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.
creditscorecard
ОбъектЗапустить Binning Explorer с командной строки MATLAB:
Поместите данные о протоколе результатов кредита или существующий creditscorecard
возразите в своем рабочем пространстве MATLAB.
В командной строке MATLAB:
Войти binningExplorer(data)
или binningExplorer(data,Name,Value)
открыть таблицу в приложении Binning Explorer путем определения таблицы (data
) как введено.
Войти binningExplorer(sc)
открыть существующий creditscorecard
объект в приложении Binning Explorer путем определения creditscorecard
объект (sc
) как введено.
Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.
После того, как вы импортируете данные или creditscorecard
объект в Binning Explorer, можно изменить тип предиктора.
Кликните по любому графику предиктора. Имя выбранного предиктора отображается на панели инструментов Binning Explorer под Selected Predictor.
На панели инструментов Binning Explorer тип предиктора для выбранного предиктора отображается под Predictor Type.
Чтобы изменить тип предиктора, под Predictor Type, выберите: Numeric
категориальный
, или Ordinal
. График предиктора обновляется и детали в Bin Information, и панели Predictor Information также обновляются.
После того, как вы импортируете данные или creditscorecard
объект в Binning Explorer, можно изменить алгоритм раскладывания для отдельного предиктора или для нескольких предикторов.
Кликните по любому графику предиктора. Выбранный предиктор строит отображения с синей схемой.
Совет
Когда вы выбираете график предиктора с синей схемой, сообщение о состоянии появляется в нижней части Binning Explorer, который отображает последнюю информацию о раскладывании для того предиктора. Используйте эту информацию, чтобы определить, какой алгоритм раскладывания последний раз применяется к отдельному графику предиктора.
На панели инструментов Binning Explorer нажмите Apply Monotone и выберите Monotone, Split, Merge, Equal Frequency или Equal Width. График предиктора обновляется с изменением алгоритма. Детали в Bin Information и панелях Predictor Information также обновляются.
Чтобы изменить алгоритм раскладывания для нескольких предикторов, мультивыберите больше чем один график предиктора при помощи Ctrl + нажатие кнопки, чтобы подсветить каждый график предиктора с синей схемой.
Нажмите Apply Monotone и выберите Monotone, Split, Merge, Equal Frequency или Equal Width. Все выбранные графики предиктора обновляются для изменения алгоритма.
После того, как вы импортируете данные или creditscorecard
объект в Binning Explorer, можно изменить опции алгоритма раскладывания для отдельного предиктора или для нескольких предикторов.
Кликните по любому графику предиктора. График предиктора отображается с синей схемой.
Совет
Когда вы выбираете график предиктора с синей схемой, сообщение о состоянии появляется в нижней части Binning Explorer, который отображает последнюю информацию о раскладывании для того предиктора. Используйте эту информацию, чтобы определить, какой алгоритм раскладывания последний раз применяется к отдельному графику предиктора.
На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма.
От связанного окна параметров Алгоритма:
Monotone
Для Trend выберите одно из следующего:
Auto (default) — Автоматически определяет, увеличивается ли тренд WOE или уменьшается.
Increasing — Ищет увеличивающийся тренд WOE.
Decreasing — Ищет уменьшающийся тренд WOE.
Значение Trend не обязательно отражает значение получившейся кривой WOE. Опция Trend говорит алгоритму искать увеличение или уменьшение тренда, но результат не может показать желаемый тренд. Например, алгоритм не может найти уменьшающийся тренд, когда данные на самом деле имеют увеличивающийся тренд WOE. Для получения дополнительной информации об опции Trend смотрите Монотонность.
Для Initial number of bins введите начальный номер интервалов (значением по умолчанию является 10
). Начальное количество интервалов должно быть целым числом> 2
. Используемый для числовых предикторов только.
Для Category Sorting, используемого для категориальных предикторов только, избранного одного из следующего:
Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.
Goods — Категории сортируются по приказу увеличения значений “Хороших”.
Bads — Категории сортируются по приказу увеличения значений “Плохо”.
Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).
'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.
Для получения дополнительной информации смотрите сортировку Категорий
Split
Для Measure выберите одно из следующего: Gini (значение по умолчанию), Chi2, InfoValue или Entropy.
Для Tolerance задайте значение допуска, выше которого усиление в информационном значении должно быть для разделения, которое будет принято. Значением по умолчанию является 1e-4
.
Для Significance, только для меры Chi2, задают порог уровня значения для статистической величины хи-квадрата, выше которой происходит разделение. Значения находятся в интервале [0,1]
. Значением по умолчанию является 0.9
(90%-й уровень значения).
Для Bin distribution задайте значения для
MinBad — Задает минимальный номер n (n> =0
) из Bads на интервал. Значением по умолчанию является 1
, избегать чистых интервалов.
MaxBad — Задает максимальное количество n (n> =0
) из Bads на интервал. Значением по умолчанию является Inf
.
MinGood — Задает минимальный номер n (n> =0
) из Товаров на интервал. Значением по умолчанию является 1
, избегать чистых интервалов.
MaxGood — Задает максимальное количество n (n> =0
) из Товаров на интервал. Значением по умолчанию является Inf
.
MinCount — Задает минимальный номер n (n> =0
) из наблюдений на интервал. Значением по умолчанию является 1
, избегать пустых интервалов.
MaxCount — Задает максимальное количество n (n> =0
) из наблюдений на интервал. Значением по умолчанию является Inf
.
MaxNumBins — Задает максимальное количество n (n> =2
) из интервалов, следующих из разделения. Значением по умолчанию является 5
.
Для Initial number bins задайте целое число, которое определяет номер (n> 0) интервалов, что предиктор первоначально сгруппирован в перед разделением. Допустимый для числовых предикторов только. Значением по умолчанию является 50
.
Для Category sorting, используемого для категориальных предикторов только, выбирают значение:
Goods — Категории сортируются по приказу увеличения значений “Хороших”.
Bads — Категории сортируются по приказу увеличения значений “Плохо”.
Odds — (значение по умолчанию) категории сортируется по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.
Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).
'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм. (Существующий порядок категорий виден в категории, группирующей дополнительный выход от bininfo
.)
Для получения дополнительной информации смотрите сортировку Категорий
Merge
Для Measure выберите одно из следующего: Chi2 (значение по умолчанию), Gini, InfoValue или Entropy.
Для Tolerance задайте минимальный порог, ниже которого слияние происходит для информационного значения и энтропийной статистики. Допустимые значения находятся в интервале (0.1)
. Значением по умолчанию является 1e-3
.
Для Significance задайте порог уровня значения для статистической величины хи-квадрата, ниже которой происходит слияние. Значения находятся в интервале [0,1]
. Значением по умолчанию является 0.9
(90%-й уровень значения).
Для Bin distribution задайте следующее:
MinNumBins — Задает минимальный номер n (n> =2
) из интервалов тот результат слияния. Значением по умолчанию является 2
.
MaxNumBins — Задает максимальное количество n (n> =2
) из интервалов тот результат слияния. Значением по умолчанию является 5
.
Для Initial number of bins задайте целое число, которое определяет номер (n> 0) интервалов, что предиктор первоначально сгруппирован в перед слиянием. Допустимый для числовых предикторов только. Значением по умолчанию является 50
.
Для Category sorting, используемого для категориальных предикторов только. Выберите значение:
Goods — Категории сортируются по приказу увеличения значений “Хороших”.
Bads — Категории сортируются по приказу увеличения значений “Плохо”.
Odds — (значение по умолчанию) категории сортируется по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.
Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).
'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм. (Существующий порядок категорий виден в категории, группирующей дополнительный выход от bininfo
.)
Для получения дополнительной информации смотрите сортировку Категорий
Equal Frequency
Для Number of bins введите номер интервалов. Значением по умолчанию является 5
, и количество интервалов должно быть положительным числом.
Для Category Sorting выберите одно из следующего:
Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.
Goods — Категории сортируются по приказу увеличения значений “Хороших”.
Bads — Категории сортируются по приказу увеличения значений “Плохо”.
Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).
'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.
Примечание
Можно использовать Category Sorting с категориальными предикторами только.
Equal Width
Для Number of bins введите номер интервалов. Значением по умолчанию является 5
и количество интервалов должно быть положительным числом.
Для Category Sorting выберите одно из следующего:
Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.
Goods — Категории сортируются по приказу увеличения значений “Хороших”.
Bads — Категории сортируются по приказу увеличения значений “Плохо”.
Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).
'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.
Примечание
Можно использовать Category Sorting с категориальными предикторами только.
Нажмите OK. График предиктора обновляется с изменением опций алгоритма. Детали в Bin Information и панелях Predictor Information также обновляются.
Чтобы изменить опцию алгоритма раскладывания для нескольких предикторов, мультивыберите больше чем один график предиктора при помощи Ctrl + нажатие кнопки, чтобы подсветить каждый график предиктора с синей схемой.
На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма. Сделайте свой выбор от Окна параметров Алгоритма и нажмите OK. Выбранные графики предиктора обновляются для изменения алгоритма.
После того, как вы импортируете данные или creditscorecard
объект в Binning Explorer, можно разделить интервалы для числового предиктора.
Кликните по любому числовому графику предиктора. График предиктора отображается с синей схемой.
На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный числовой предиктор в новом окне с вкладками.
Кликните по интервалу, чтобы включить кнопку Split для того интервала.
Примечание
Кнопка Split включена, когда область значений данных выбранного интервала имеет больше чем одно значение.
На панели инструментов Binning Explorer текстовые поля Edges отображают значения для ребер выбранного интервала. Нажмите Split, чтобы открыть диалоговое окно Split.
Используйте управление Number of bins, чтобы разделить выбранный интервал в несколько интервалов. Нажмите OK, чтобы завершить операцию разделения.
График для выбранного числового предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.
После того, как вы импортируете данные или creditscorecard
объект в Binning Explorer, можно разделить интервалы для категориального предиктора.
Кликните по любому категориальному графику предиктора. График предиктора отображается с синей схемой.
На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный категориальный предиктор в новом окне с вкладками.
Кликните по интервалу, чтобы включить кнопку Split для того интервала.
Примечание
Кнопка Split включена, когда выбранный интервал имеет больше чем одну категорию в нем.
Используйте управление Number of bins, чтобы разделить выбранный интервал в несколько интервалов.
Используйте средства управления стрелой на диалоговом окне Split, чтобы управлять содержимым для каждого из интервалов, в которые вы разделяете выбранный интервал.
Нажмите OK, чтобы завершить операцию разделения.
График для выбранного категориального предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.
После того, как вы импортируете данные или creditscorecard
объект в Binning Explorer, можно разделить или объединить интервалы для предиктора.
Кликните по любому графику предиктора. График предиктора отображается с синей схемой.
На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный предиктор в новом окне с вкладками.
Примечание
Кнопка Merge активна только, когда больше чем один интервал выбран. Только смежные интервалы могут быть объединены для числовых или порядковых предикторов. Несмежные интервалы могут быть объединены для категориальных предикторов.
Чтобы объединить интервалы, выберите два или больше интервала для слияния при помощи Ctrl + нажатие кнопки, чтобы мультивыбрать интервалы, чтобы отобразиться с синими основами.
При выполнении слияния с числовым предиктором текстовые поля Edges на панели инструментов Binning Explorer отображают значения для ребер выбранных интервалов, чтобы объединить.
Нажмите Merge, чтобы завершить операцию слияния. График для выбранного предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.
После того, как вы импортируете данные или creditscorecard
объект в Binning Explorer, можно изменить контуры интервала для одного предиктора.
Кликните по любому графику предиктора. График предиктора отображается с синей схемой.
На панели инструментов Binning Explorer нажмите Manual Binning. Щелкните, чтобы выбрать определенный интервал, где вы хотите изменить размерности интервала. Выбранный интервал отображается с синей схемой.
На панели инструментов Binning Explorer текстовые поля Edges отображают значения для ребер выбранного интервала.
Отредактируйте значения в текстовых полях Edges, чтобы изменить размерности выбранного интервала.
Нажмите Enter, чтобы завершить операцию. График для выбранного предиктора обновляется с информацией о размерности обновленного интервала. Детали в Bin Information и панелях Predictor Information также обновляются.
После того, как вы импортируете данные или creditscorecard
объект в Binning Explorer, можно измениться, алгоритм применился к одному или нескольким предикторам, и можно также переопределить количество интервалов.
Кликните по любому графику предиктора. График предиктора отображается с синей схемой.
В качестве альтернативы выберите два или больше предиктора при помощи Ctrl + нажатие кнопки, чтобы мультивыбрать предикторы, чтобы отобразиться с синими основами.
На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма.
Окно параметров Алгоритма отображает опции для текущего алгоритма раскладывания. В зависимости от которого текущий алгоритм, можно изменить контуры интервала:
Если вашим текущим алгоритмом для выбранных интервалов является EqualWidth
или EqualFrequency
, введите номер в поле Number of bins. Опционально, для EqualWidth
и EqualFrequency
опции, под Category Sorting, задают тип сортировки.
Если вашим текущим алгоритмом для выбранных интервалов является Monotone
разделение
, или Merge
значение по умолчанию 10
для Monotone
или 50
для Split
и Merge
используется для Initial number of bins. Опционально, для Monotone
, можно установить значения для Trend и Category Sorting.
Нажмите OK, чтобы завершить операцию. Графики для выбранных предикторов обновляются с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.
Binning Explorer имеет опции для отображения графиков предиктора и опций графика и связанных таблиц, отображенных в Bin Information.
От элемента панели инструментов Binning Explorer для Plot Options выберите любую из следующих опций графика предиктора:
No labels (значение по умолчанию)
Bin count
% Bin level
% Data level
% Total count
WOE curve
Выбранная метка применяется ко всем графикам предиктора.
Можно установить табличные параметры отображения для получения информации о предикторе, отображенной в Bin Information.
От элемента панели инструментов Binning Explorer для Table Columns выберите любую из следующих опций:
Odds
WOE
InfoValue
Entropy
Chi2
Gini
Members (опция включена для категориальных предикторов),
Когда выбрано, эти опции применяются ко всем предикторам для получения информации, отображенной в Bin Information.
Binning Explorer позволяет вам экспортировать и сохранить свои определения раскладывания протокола результатов кредита creditscorecard
объект.
Нажмите Export и обеспечьте creditscorecard
имя объекта. creditscorecard
объект сохранен в рабочее пространство MATLAB.
Вновь открыть ранее сохраненный creditscorecard
возразите, нажмите Import Data и выберите creditscorecard
объект от панели Step 1 окна Import Data.
Эта тема показывает некоторые результаты при использовании Binning Explorer с протоколами результатов кредита тот поиск и устранение неисправностей потребности. Для получения дополнительной информации на полном процессе создания и разработки протоколов результатов кредита, см. Обзор Binning Explorer и Примера Тематического исследования Binning Explorer.
Когда вы преобразуете числовой предиктор с сотнями значений (например, текущие данные) к категориальным данным, получившиеся данные имеют сотни категорий. Следующий пример иллюстрирует этот сценарий.
load CreditCardData
Откройте Binning Explorer и выберите числовой предиктор AMBalance. От панели инструментов Binning Explorer измените тип предиктора в Categorical.
Выберите Manual Binning на панели инструментов Binning Explorer и нажмите Split. Диалоговое окно Split отображается можно следующим образом:
Предиктор имеет слишком много категорий, чтобы отобразиться правильно.
Решение: Если у вас есть категориальный предиктор с большим количеством категорий, используйте Algorithm Options, чтобы изменить алгоритм раскладывания для того предиктора к Equal Frequency с набором Number of bins к 100
(или другое меньшее значение). Диалоговое окно Split затем отображается правильно.
При использовании Binning Explorer, если вы импортируете данные, которые не были ранее сгруппированы и вы выбираете No Binning из окна Import Data, получившиеся графики могут быть искажены. Например, если вы загружаете следующий набор данных в рабочее пространство MATLAB и используете Binning Explorer, чтобы импортировать данные с помощью No Binning, следующих отображений графика для предиктора TmAtAddress.
load CreditCardData
Решение: Когда вы импортируете данные, которые не были ранее сгруппированы, выберите Monotone из окна Import Data вместо этого. Следующий график отображается для предиктора TmAtAddress.