Общие задачи Binning Explorer

Приложение Binning Explorer поддерживает следующие задачи:

Импорт данных

Binning Explorer позволяет вам импортировать данные, либо начав непосредственно с данных, хранящихся в MATLAB® таблица или путем загрузки существующего creditscorecard объект.

Очистить начало от данных

Чтобы начать непосредственно с данных:

  1. Поместите данные карты показателей кредита в рабочее рабочее пространство MATLAB. Данные должны находиться в таблице MATLAB, где каждый столбец данных может быть любым из следующих типов данных:

    • Числовой

    • Логичный

    • Массив ячеек из символьных векторов

    • Символьный массив

    • Категоричный

    В сложении таблица должна содержать переменную двоичного отклика.

  2. Откройте Binning Explorer с панели инструментов MATLAB: На вкладке Apps, в разделе Computational Finance, щелкните значок приложения.

  3. Щелкните Import Data и выберите данные из панели Step 1 окна Импорт данных.

  4. На панели Step 2 установите Variable Type для каждого из предикторов по мере необходимости. Если входная таблица MATLAB содержит столбец для weightsна панели Step 2, используя столбец Variable Type, щелкните раскрывающийся список, чтобы выбрать Weights. Если данные содержат отсутствующие значения, на панели Step 2 установите для Bin missing data: значение Yes. Для получения дополнительной информации о работе с отсутствующими данными смотрите Моделирование карты показателей кредита с отсутствующими значениями.

  5. На панели Step 3 выберите алгоритм начального раскладывания и нажатия кнопки Import Data. Интервалы строятся и отображаются для каждого предиктора. Нажимая на отдельный график предиктора на панели Overview, детали для этого графика предиктора отображаются на основной панели с дополнительной информацией на панелях Bin Information и Predictor Information.

Начните с существующей creditscorecard Объект

Как начать использовать существующее creditscorecard объект:

  1. Поместите creditscorecard объект в рабочем пространстве MATLAB. Создайте creditscorecard объект либо при помощи creditscorecard или нажав Export в Binning Explorer, чтобы экспортировать и сохранить creditscorecard объект в рабочем пространстве MATLAB.

  2. Откройте Binning Explorer на панели инструментов MATLAB: На вкладке Apps в разделе Computational Finance щелкните значок приложения.

  3. Щелкните Import Data и на Step 1 панели окна Импорт данных выберите creditscorecard объект.

  4. На панели Step 3 выберите алгоритм раскладывания. При использовании существующей creditscorecard объект, рекомендуется выбрать опцию No Binning. Чтобы отобразить графики предиктора, нажмите Import Data.

    Интервалы строятся и отображаются для каждого предиктора. При щелчке по отдельному графику предиктора на панели Overview график предиктора отображается на основной панели, а связанная с ним информация отображается на панелях Bin Information и Predictor Information.

Начните с командной строки MATLAB используя данные или существующее creditscorecard Объект

Чтобы начать Binning Explorer из командной строки MATLAB:

  1. Разместите данные карты показателей кредита или существующие creditscorecard объект в рабочем пространстве MATLAB.

  2. В командной строке MATLAB:

    • Войти binningExplorer(data) или binningExplorer(data,Name,Value) чтобы открыть таблицу в приложении Binning Explorer путем определения таблицы (data) как вход.

    • Войти binningExplorer(sc) чтобы открыть существующее creditscorecard объект в приложении Binning Explorer путем определения creditscorecard объект (sc) как вход.

    Интервалы строятся и отображаются для каждого предиктора. При щелчке по отдельному графику предиктора на панели Overview детали для этого графика предиктора отображаются на основной панели и соответствующие детали отображаются на панелях Bin Information и Predictor Information.

Измените тип предиктора

После импорта данных или creditscorecard объект в Binning Explorer, можно изменить тип предиктора.

  1. Щелкните любой график предиктора. Имя выбранного предиктора отображается на Binning Explorer панели инструментов под Selected Predictor.

    На Binning Explorer панели инструментов тип предиктора для выбранного предиктора отображается под Predictor Type.

  2. Чтобы изменить тип предиктора, в разделе Predictor Type выберите: Numeric, Categorical, или Ordinal. График предиктора обновляется, и детали в Bin Information и Predictor Information панелях также обновляются.

Алгоритм раскладывания для одного или нескольких предикторов

После импорта данных или creditscorecard объект в Binning Explorer, можно изменить алгоритм раскладывания для отдельного предиктора или для нескольких предикторов.

  1. Щелкните любой график предиктора на панели Overview. Выбранный график предиктора отображается на основной панели.

    Select plot for ResStatus with blue outline

    Совет

    Когда вы выбираете график предиктора, выше появляется сообщение о состоянии Bin Information которое отображает последнюю информацию о раскладывании для этого предиктора. Используйте эту информацию, чтобы определить, какой алгоритм раскладывания последний раз применяется к отдельному графику предиктора.

  2. На Binning Explorer панели инструментов щелкните, чтобы выбрать Monotone, Split, Merge, Equal Frequency, или Equal Width. График предиктора обновляется изменением алгоритма. Также обновляются детали в Bin Information и Predictor Information панелях.

  3. Чтобы изменить алгоритм раскладывания для нескольких предикторов, выберите несколько графиков предиктора с помощью Ctrl + нажатие кнопки или Shift + нажатие кнопки, чтобы подсветить каждый график предиктора с синим контуром.

    Multiselected plots each have a blue outline

  4. Щелкните, чтобы выбрать Monotone, Split, Merge, Equal Frequency или Equal Width. Все выбранные предикторные графики обновляются для изменения алгоритма.

Измените опции алгоритма для алгоритмов раскладывания

После импорта данных или creditscorecard объект в Binning Explorer, можно изменить опции алгоритма раскладывания для отдельного предиктора или для нескольких предикторов.

  1. Щелкните любой график предиктора на панели Overview. График предиктора отображается с синим контуром и отображается на основной панели.

    Select plot for ResStatus with blue outline

    Совет

    Когда вы выбираете график предиктора с синим контуром, выше появляется сообщение о состоянии Bin Information которое отображает последнюю информацию о раскладывании для этого предиктора. Используйте эту информацию, чтобы определить, какой алгоритм раскладывания последний раз применяется к отдельному графику предиктора.

  2. На Binning Explorer панели инструментов щелкните Options, чтобы открыть список опций для Monotone, Split, Merge, Equal Frequency, и Equal Width алгоритмы. Щелкните опцию, чтобы открыть связанное диалоговое окно Опции алгоритма (Algorithm options). Например, нажатие кнопки мыши Monotone Options открывает Algorithm options dialog box for Monotone.

    Select options using Algorithm Options dialog box

  3. Из связанного диалогового окна опции:

    • Monotone

      • Для Trend выберите один из следующих вариантов:

        • Auto (default) - автоматически определяет, увеличивается или уменьшается тренд ГОРЕ.

        • Increasing - ищет растущий тренд ГОРЕ.

        • Decreasing - ищет снижающийся тренд ГОРЕ.

        Значение Trend не обязательно отражает значение полученной кривой ГОРЕ. Опция Trend предписывает алгоритму искать увеличивающийся или уменьшающийся тренд, но результат может не показать желаемый тренд. Например, алгоритм не может найти уменьшающийся тренд, когда данные на самом деле имеют увеличивающийся тренд ГОРЕ. Для получения дополнительной информации об опции Trend см. «Монотон».

        • Для Initial number of bins введите начальное количество интервалов (по умолчанию это 10). Начальное количество интервалов должно быть целым числом > 2. Используется только для числовых предикторов.

        • Для Category Sorting, используемых только для категориальных предикторов, выберите один из следующих:

          • Odds (default) - Категории сортируются по порядку увеличения значений шансов, определяемым как отношение наблюдений «Хорошо» к «Плохо», для данной категории.

          • Goods - Категории сортируются по порядку возрастания значений «Хорошо».

          • Bads - Категории сортируются по порядку возрастания значений «Bad».

          • Totals - Категории сортируются по порядку увеличения значений от общего количества наблюдений («Хорошо» плюс «Плохо»).

          • None - сортировка не применяется. Существующий порядок категорий остается неизменным перед применением алгоритма.

          Для получения дополнительной информации смотрите Сортировка категорий

    • Split

      • Для Measure выберите одно из следующего: Gini (дефолт), Chi2, InfoValue, или Entropy.

      • Для Tolerance задайте значение допуска, выше которого коэффициент усиления в информационном значении должен быть принят для разделения. Значение по умолчанию является 1e-4.

      • Для Significance только для Chi2 меры задайте порог уровня значимости для статистики хи-квадрат, выше которого происходит разделение. Значения указаны в интервале [0,1]. По умолчанию это 0.9(уровень значимости 90%).

      • Для Bin distribution задайте значения для

        • MinBad - Задает минимальное n числа (n > = 0) Бадса на интервал. Значение по умолчанию 1, чтобы избежать чистых интервалов.

        • MaxBad - Задает максимальное n числа (n > = 0) Бадса на интервал. Значение по умолчанию Inf.

        • MinGood - Задает минимальное n числа (n > = 0) Товаров за интервал. Значение по умолчанию 1, чтобы избежать чистых интервалов.

        • MaxGood - Задает максимальное n числа (n > = 0) Товаров за интервал. Значение по умолчанию Inf.

        • MinCount - Задает минимальное n числа (n > = 0) наблюдений за интервалом. Значение по умолчанию 1, чтобы избежать пустых интервалов.

        • MaxCount - Задает максимальное n числа (n > = 0) наблюдений за интервалом. Значение по умолчанию Inf.

        • MaxNumBins - Задает максимальное n числа (n > = 2) интервалов в результате расщепления. Значение по умолчанию 5.

      • Для Initial number bins задайте целое число, которое определяет число (n > 0) интервалов, в которые предиктор первоначально привязан перед разделением. Действителен только для числовых предикторов. По умолчанию это 50.

      • Для Category sorting, используемых только для категориальных предикторов, выберите значение:

        • Goods - Категории сортируются по порядку возрастания значений «Хорошо».

        • Bads - Категории сортируются по порядку возрастания значений «Bad».

        • Odds - (по умолчанию) Категории сортируются по порядку увеличения значений шансов, определяемому как отношение наблюдений «Хорошо» к «Плохо», для данной категории.

        • Totals - Категории сортируются по порядку увеличения значений общего количества наблюдений («Хорошо» плюс «Плохо»).

        • None - сортировка не применяется. Существующий порядок категорий остается неизменным перед применением алгоритма. (Существующий порядок категорий можно увидеть в необязательном выходе группы категорий из bininfo.)

        Для получения дополнительной информации смотрите Сортировка категорий

    • Merge

      • Для Measure выберите одно из следующего: Chi2 (дефолт), Gini, InfoValue, или Entropy.

      • Для Tolerance укажите минимальный порог, ниже которого происходит слияние для статистики информационного значения и энтропии. Допустимые значения указаны в интервале (0.1). По умолчанию это 1e-3.

      • Для Significance задайте порог уровня значимости для статистики хи-квадрат, ниже которого происходит слияние. Значения указаны в интервале [0,1]. По умолчанию это 0.9(уровень значимости 90%).

      • Для Bin distribution задайте следующее:

        • MinNumBins - Задает минимальное n числа (n > = 2) интервалов, которые являются результатом слияния. Значение по умолчанию 2.

        • MaxNumBins - Задает максимальное n числа (n > = 2) интервалов, которые являются результатом слияния. Значение по умолчанию 5.

      • Для Initial number of bins задайте целое число, которое определяет число (n > 0) интервалов, в которые предиктор первоначально привязан перед слиянием. Действителен только для числовых предикторов. По умолчанию это 50.

      • Для Category sorting используется только для категориальных предикторов. Выберите значение:

        • Goods - Категории сортируются по порядку возрастания значений «Хорошо».

        • Bads - Категории сортируются по порядку возрастания значений «Bad».

        • Odds - (по умолчанию) Категории сортируются по порядку увеличения значений шансов, определяемому как отношение наблюдений «Хорошо» к «Плохо», для данной категории.

        • Totals - Категории сортируются по порядку увеличения значений общего количества наблюдений («Хорошо» плюс «Плохо»).

        • None - сортировка не применяется. Существующий порядок категорий остается неизменным перед применением алгоритма. (Существующий порядок категорий можно увидеть в необязательном выходе группы категорий из bininfo.)

        Для получения дополнительной информации смотрите Сортировка категорий

    • Equal Frequency

      • Для Number of bins введите количество интервалов. Значение по умолчанию является 5, и количество интервалов должно быть положительным числом.

      • Для Category Sorting выберите один из следующих вариантов:

        • Odds (default) - Категории сортируются по порядку увеличения значений шансов, определяемым как отношение наблюдений «Хорошо» к «Плохо», для данной категории.

        • Goods - Категории сортируются по порядку возрастания значений «Хорошо».

        • Bads - Категории сортируются по порядку возрастания значений «Bad».

        • Totals - Категории сортируются по порядку увеличения значений от общего количества наблюдений («Хорошо» плюс «Плохо»).

        • None - сортировка не применяется. Существующий порядок категорий остается неизменным перед применением алгоритма.

        Примечание

        Вы можете использовать Category Sorting только с категориальными предикторами.

    • Equal Width

      • Для Number of bins введите количество интервалов. Значение по умолчанию является 5 и количество интервалов должно быть положительным числом.

      • Для Category Sorting выберите один из следующих вариантов:

        • Odds (default) - Категории сортируются по порядку увеличения значений шансов, определяемым как отношение наблюдений «Хорошо» к «Плохо», для данной категории.

        • Goods - Категории сортируются по порядку возрастания значений «Хорошо».

        • Bads - Категории сортируются по порядку возрастания значений «Bad».

        • Totals - Категории сортируются по порядку увеличения значений от общего количества наблюдений («Хорошо» плюс «Плохо»).

        • None - сортировка не применяется. Существующий порядок категорий остается неизменным перед применением алгоритма.

        Примечание

        Вы можете использовать Category Sorting только с категориальными предикторами.

    Нажмите OK. Выбранный график предиктора обновляется изменением опций алгоритма. Также обновляются детали в Bin Information и Predictor Information панелях. В сложение обновленные опции алгоритма применяются к любому последующему применению этого алгоритма к другим предикторам, как описано в Change Раскладывания Algorithm for One или More Predictors.

  4. Чтобы изменить опцию алгоритма раскладывания для нескольких предикторов, выберите несколько графиков предиктора с помощью Ctrl + нажатие кнопки или Shift + нажатие кнопки, чтобы подсветить каждый график предиктора с синим контуром .

    Multiselected plots each have a blue outline

  5. На Binning Explorer панели инструментов щелкните Options, чтобы открыть список опций для Monotone, Split, Merge, Equal Frequency, и Equal Width алгоритмы. Щелкните опцию, чтобы открыть связанное диалоговое окно Опции алгоритма (Algorithm options). Сделайте выбор из соответствующего диалогового окна Опции и нажмите OK. Выбранные предикторные графики обновляются для изменения алгоритма.

Разделение интервалов для числового предиктора

После импорта данных или creditscorecard объект на Binning Explorer, можно разделить интервалы для числового предиктора.

  1. Щелкните любой график числового предиктора на панели Overview. График предиктора отображается на основной панели.

    Select plot for ResStatus with blue outline

  2. На панели инструментов Binning Explorer включена кнопка Split. На основной панели щелкните интервалом, чтобы применить операцию Split. Для отмены выбора интервала используйте команду Ctrl + нажатие кнопки.

    Select a bin to enable the Split button

  3. На Binning Explorer панели инструментов в Edges текстовых полях отображаются значения для ребер выбранного интервала. Нажмите кнопку Split, чтобы открыть диалоговое окно Разделить (Split).

    Use Split dialog to specify the edges of a bin

  4. Используйте элемент управления Number of bins для разделения выбранного интервала на несколько интервалов. Щелкните OK, чтобы завершить операцию разделения.

    График для выбранного числового предиктора обновляется информацией о новом интервале. Также обновляются детали в Bin Information и Predictor Information панелях.

Разделение интервалов для категориального предиктора

После импорта данных или creditscorecard объект на Binning Explorer, можно разделить интервалы для категориального предиктора.

  1. Щелкните любой категориальный график предиктора на панели Overview. График предиктора отображается на основной панели.

    Select plot for EmpStatus with blue outline

  2. На основной панели щелкните интервал, чтобы включить кнопку Split для этого интервала. Для отмены выбора интервала используйте команду Ctrl + нажатие кнопки.

    Select EmpStatus bin displays with blue outline

    На панели инструментов Binning Explorer щелкните Split, чтобы открыть диалоговое окно «Разделение» для выбранного интервала.

    Примечание

    Кнопка Split активируется, если выбранный интервал имеет несколько уникальных категорий.

    Use the Split dialog to specify splitting for a selected bin

    Используйте элемент управления Number of bins для разделения выбранного интервала на несколько интервалов.

    Используйте элементы управления со стрелами в диалоговом окне Разделить (Split), чтобы управлять содержимым для каждого из интервалов, на которые вы разделяете выбранное интервал.

  3. Щелкните OK, чтобы завершить операцию разделения.

    График для выбранного категориального предиктора обновляется информацией о новом интервале. Также обновляются детали в Bin Information и Predictor Information панелях.

Ручное раскладывание для объединения интервалов для числового или категориального предиктора

После импорта данных или creditscorecard объект на Binning Explorer, можно разделить или объединить интервалы для предиктора.

  1. Щелкните любой график предиктора на панели Overview. Выбранный график предиктора отображается на основной панели.

    Select plot for ResStatus with blue outline

  2. На основной панели для объединения интервалов выберите два или более интервалов для объединения с помощью Ctrl + нажатие кнопки или Shift + нажатие кнопки, чтобы создать несколько интервалов для отображения с синими контурами. Чтобы изменить выбор интервала, используйте команду Ctrl + нажатие кнопки, чтобы отменить выбор интервала.

    Примечание

    Кнопка Merge активна только при выборе нескольких интервалов. Только смежные интервалы могут быть объединены для числовых или порядковых предикторов. Несвязанные интервалы могут быть объединены для категориальных предикторов.

    Select two or more bins to merge

  3. Щелкните Merge, чтобы завершить операцию слияния. График для выбранного предиктора обновляется информацией о новом интервале. Также обновляются детали в Bin Information и Predictor Information панелях.

Изменение контуров интервала для одного предиктора

После импорта данных или creditscorecard объект в Binning Explorer, можно изменить контуры интервала для одного предиктора.

  1. Щелкните любой график числового предиктора на панели Overview. Выбранный график предиктора отображается с синим контуром, а график предиктора отображается на основной панели.

  2. На основной панели щелкните, чтобы выбрать конкретный интервал, в котором необходимо изменить размерности интервала. Выбранное интервал отображается с синим контуром.

    Select a bin to change bin dimensions using manual binning

  3. На Binning Explorer панели инструментов в Edges текстовых полях отображаются значения для ребер выбранного интервала.

    Specify the edges for the selected bin

    Измените значения в Edges текстовых полях, чтобы изменить размерности выбранного интервала.

  4. Щелкните основную панель, чтобы завершить операцию. График для предиктора обновляется информацией об размерности обновленного интервала. Также обновляются детали в Bin Information и Predictor Information панелях.

Изменение контуров интервала для нескольких предикторов

После импорта данных или creditscorecard объект в Binning Explorer, можно изменить алгоритм, примененный к одному или нескольким предикторам, и можно также переопределить количество интервалов.

  1. На панели Overview щелкните любой график предиктора. График предиктора отображается с синим контуром.

    Select plot for ResStatus with blue outline

    Другой способ - выбрать два или более предиктора при помощи Ctrl + нажатие кнопки или Shift + нажатие кнопки, чтобы мультиселектировать предикторы для отображения с синими контурами.

    Select two or more predictor plots using CTRL + click

  2. На Binning Explorer панели инструментов щелкните Options, чтобы открыть список опций для Monotone, Split, Merge, Equal Frequency, и Equal Width алгоритмы. Щелкните опцию, чтобы открыть связанное диалоговое окно Опции алгоритма (Algorithm options). Сделайте выбор из соответствующего диалогового окна Опции и нажмите OK. Выбранные предикторные графики обновляются для изменения алгоритма, а графики для выбранных предикторов обновляются информацией о новом интервале. Также обновляются детали в Bin Information и Predictor Information панелях.

Задать опции для отображения

Binning Explorer имеет опции для отображения графиков предиктора и опций графика и связанных таблиц, отображаемых в Bin Information.

Опции графика

  1. Из элемента Binning Explorer панели инструментов для Plot Options выберите любую из следующих опций графика предиктора:

    • No labels (по умолчанию)

    • Bin count

    • % Bin level

    • % Data level

    • % Total count

  2. Выбранная метка применяется ко всем графикам предиктора.

Опции таблицы

Можно задать параметры отображения таблицы для информации предиктора, отображаемой в Bin Information.

  1. На панели Binning Explorer элемента для Table Columns выберите одну из следующих опций:

    • Odds

    • WOE

    • InfoValue

    • Entropy

    • Gini

    • Chi2

    • Members (опция включена для категориальных предикторов)

  2. При выборе эти опции применяются ко всем предикторам для информации, отображаемой в Bin Information.

Экспорт и сохранение раскладывание

Binning Explorer позволяет вам экспортировать и сохранить определения раскладывания карты показателей кредита в creditscorecard объект.

  1. Нажмите Export, а затем нажмите Export Scorecard и укажите creditscorecard имя объекта. The creditscorecard объект сохраняется в рабочем пространстве MATLAB.

    Примечание

    При экспорте ранее существующего creditscorecard объект, который был подобран (использование fitmodel), все настройки модели в creditscorecard объект потерян. Необходимо перезапустить fitmodel на обновленном creditscorecard объект.

  2. Как повторно открыть ранее сохраненную creditscorecard объект нажмите Import Data и выберите creditscorecard объект из панели Step 1 окна Импорт данных.

Диагностируйте проблемы раскладывание

В этом разделе показаны некоторые результаты при использовании Binning Explorer с кредитными картами результатов, которые нуждаются в диагностике. Для получения дополнительной информации об общем процессе создания и разработки карт результатов кредитования, смотрите Обзор Binning Explorer и Пример примера исследования Binning Explorer.

Численный предиктор, преобразованный в категориальный предиктор, не отображает правильно разделенные данные

Когда вы преобразуете численный предиктор с сотнями значений (для примера, непрерывных данных) в категориальные данные, получившиеся данные имеют сотни категорий. Следующий пример иллюстрирует этот сценарий.

load CreditCardData

Откройте Binning Explorer и выберите AMBalance числового предиктора из панели Overview. На панели инструментов Binning Explorer смените тип предиктора на Categorical.

От Binning Explorer панели инструментов и нажатия кнопки Split. Диалоговое окно «Разделение» отображается следующим образом:

Split dialog for numeric predictor AMBalance with too many bins

Предиктор имеет слишком много категорий, чтобы отображать правильно.

Решение: Если у вас есть категориальный предиктор с большим количеством категорий, используйте Algorithm Options, чтобы изменить алгоритм раскладывания для этого предиктора, чтобы Equal Frequency с набором Number of bins, равным 100 (или другое меньшее значение). Диалоговое окно «Разделение» отображается правильно.

Split dialog for AMBalance with number of bins set to 100

График предиктора появляется искаженным

При использовании Binning Explorer, если вы импортируете данные, которые ранее не были привязаны, и выбираете No Binning в окне Импортировать данные (Import Data), получившиеся графики могут быть искажены. Например, если вы загружаете следующий набор данных в рабочее пространство MATLAB и используете Binning Explorer для импорта данных с помощью No Binning, следующий график отобразится для предиктора TmAtAddress.

load CreditCardData

Plot for TmAtAddress that has not been binned

Решение: При импорте данных, которые ранее не были привязаны, выберите Monotone в окне Импорт данных. Следующий график отображается для предиктора TmAtAddress.

Plot for TmAtAddress after binning using Monotone binning algorithm

См. также

Приложения

Классы

Похожие примеры

Подробнее о

Внешние веб-сайты