Общие задачи Binning Explorer

Поддержки приложений Binning Explorer следующие задачи:

Импортируйте данные

Binning Explorer позволяет вам импортировать данные или начинающий непосредственно с данных, хранимых в таблице MATLAB® или путем загрузки существующего creditscorecard объект.

Чистый запуск из данных

Начинать непосредственно с данных:

  1. Поместите данные о протоколе результатов кредита в свое рабочее пространство MATLAB. Данные должны быть в таблице MATLAB, где каждый столбец данных может быть любым из следующих типов данных:

    • Числовой

    • Логический

    • Массив ячеек из символьных векторов

    • Массив символов

    • Категориальный

    Кроме того, таблица должна содержать бинарную переменную отклика.

  2. Откройте Binning Explorer от панели инструментов MATLAB: На вкладке Apps, под Computational Finance, кликают по значку приложения.

  3. Выберите данные из панели Step 1 окна Import Data.

  4. От панели Step 2, набор Variable Type для каждого из предикторов, по мере необходимости. Если таблица входа MATLAB содержит столбец для weights, от панели Step 2, с помощью столбца Variable Type, кликают по выпадающему, чтобы выбрать Weights. Если данные содержат отсутствующие значения от панели Step 2, установите Bin missing data: на Yes. Для получения дополнительной информации о работе с недостающими данными смотрите, Приписывают Моделированию Протокола результатов Отсутствующие значения.

  5. От панели Step 3 выберите первоначальный алгоритм раскладывания и нажмите Import Data. Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.

Запустите с существующего creditscorecard Объект

Начинать использовать существующий creditscorecard объект:

  1. Поместите creditscorecard возразите в своем рабочем пространстве MATLAB. Создайте creditscorecard возразите любому при помощи creditscorecard или путем нажатия на Export в Binning Explorer, чтобы экспортировать и сохранить creditscorecard возразите против рабочего пространства MATLAB.

  2. Откройте Binning Explorer от панели инструментов MATLAB: На вкладке Apps, под Computational Finance, кликают по значку приложения.

  3. От панели Step 1 окна Import Data выберите creditscorecard объект.

  4. От панели Step 3 выберите алгоритм раскладывания. При использовании существующего creditscorecard объект, рекомендуется выбрать опцию No Binning. Чтобы отобразить графики предиктора, нажмите Import Data.

    Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.

Запустите с командной строки MATLAB Используя данные или существующий creditscorecard Объект

Запустить Binning Explorer с командной строки MATLAB:

  1. Поместите данные о протоколе результатов кредита или существующий creditscorecard возразите в своем рабочем пространстве MATLAB.

  2. В командной строке MATLAB:

    • Войти binningExplorer(data) или binningExplorer(data,Name,Value) открыть таблицу в приложении Binning Explorer путем определения таблицы (data) как введено.

    • Войти binningExplorer(sc) открыть существующий creditscorecard объект в приложении Binning Explorer путем определения creditscorecard объект (sc) как введено.

    Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.

Измените тип предиктора

После того, как вы импортируете данные или creditscorecard объект в Binning Explorer, можно изменить тип предиктора.

  1. Кликните по любому графику предиктора. Имя выбранного предиктора отображается на панели инструментов Binning Explorer под Selected Predictor.

    На панели инструментов Binning Explorer тип предиктора для выбранного предиктора отображается под Predictor Type.

  2. Чтобы изменить тип предиктора, под Predictor Type, выберите: Numericкатегориальный, или Ordinal. График предиктора обновляется и детали в Bin Information, и панели Predictor Information также обновляются.

Измените алгоритм раскладывания для одного или нескольких предикторов

После того, как вы импортируете данные или creditscorecard объект в Binning Explorer, можно изменить алгоритм раскладывания для отдельного предиктора или для нескольких предикторов.

  1. Кликните по любому графику предиктора. Выбранный предиктор строит отображения с синей схемой.

    Select plot for ResStatus with blue outline

    Совет

    Когда вы выбираете график предиктора с синей схемой, сообщение о состоянии появляется в нижней части Binning Explorer, который отображает последнюю информацию о раскладывании для того предиктора. Используйте эту информацию, чтобы определить, какой алгоритм раскладывания последний раз применяется к отдельному графику предиктора.

  2. На панели инструментов Binning Explorer нажмите Apply Monotone и выберите Monotone, Split, Merge, Equal Frequency или Equal Width. График предиктора обновляется с изменением алгоритма. Детали в Bin Information и панелях Predictor Information также обновляются.

  3. Чтобы изменить алгоритм раскладывания для нескольких предикторов, мультивыберите больше чем один график предиктора при помощи Ctrl + нажатие кнопки, чтобы подсветить каждый график предиктора с синей схемой.

    Multiselected plots each have a blue outline

  4. Нажмите Apply Monotone и выберите Monotone, Split, Merge, Equal Frequency или Equal Width. Все выбранные графики предиктора обновляются для изменения алгоритма.

Измените опции алгоритма для алгоритмов раскладывания

После того, как вы импортируете данные или creditscorecard объект в Binning Explorer, можно изменить опции алгоритма раскладывания для отдельного предиктора или для нескольких предикторов.

  1. Кликните по любому графику предиктора. График предиктора отображается с синей схемой.

    Select plot for ResStatus with blue outline

    Совет

    Когда вы выбираете график предиктора с синей схемой, сообщение о состоянии появляется в нижней части Binning Explorer, который отображает последнюю информацию о раскладывании для того предиктора. Используйте эту информацию, чтобы определить, какой алгоритм раскладывания последний раз применяется к отдельному графику предиктора.

  2. На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма.

    Select options using Algorithm Options dialog box

  3. От связанного окна параметров Алгоритма:

    • Monotone

      • Для Trend выберите одно из следующего:

        • Auto (default) — Автоматически определяет, увеличивается ли тренд WOE или уменьшается.

        • Increasing — Ищет увеличивающийся тренд WOE.

        • Decreasing — Ищет уменьшающийся тренд WOE.

        Значение Trend не обязательно отражает значение получившейся кривой WOE. Опция Trend говорит алгоритму искать увеличение или уменьшение тренда, но результат не может показать желаемый тренд. Например, алгоритм не может найти уменьшающийся тренд, когда данные на самом деле имеют увеличивающийся тренд WOE. Для получения дополнительной информации об опции Trend смотрите Монотонность.

        • Для Initial number of bins введите начальный номер интервалов (значением по умолчанию является 10). Начальное количество интервалов должно быть целым числом> 2. Используемый для числовых предикторов только.

        • Для Category Sorting, используемого для категориальных предикторов только, избранного одного из следующего:

          • Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

          • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

          • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

          • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

          • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.

          Для получения дополнительной информации смотрите сортировку Категорий

    • Split

      • Для Measure выберите одно из следующего: Gini (значение по умолчанию), Chi2, InfoValue или Entropy.

      • Для Tolerance задайте значение допуска, выше которого усиление в информационном значении должно быть для разделения, которое будет принято. Значением по умолчанию является 1e-4.

      • Для Significance, только для меры Chi2, задают порог уровня значения для статистической величины хи-квадрата, выше которой происходит разделение. Значения находятся в интервале [0,1]. Значением по умолчанию является 0.9 (90%-й уровень значения).

      • Для Bin distribution задайте значения для

        • MinBad — Задает минимальный номер n (n> =0) из Bads на интервал. Значением по умолчанию является 1, избегать чистых интервалов.

        • MaxBad — Задает максимальное количество n (n> =0) из Bads на интервал. Значением по умолчанию является Inf.

        • MinGood — Задает минимальный номер n (n> =0) из Товаров на интервал. Значением по умолчанию является 1, избегать чистых интервалов.

        • MaxGood — Задает максимальное количество n (n> =0) из Товаров на интервал. Значением по умолчанию является Inf.

        • MinCount — Задает минимальный номер n (n> =0) из наблюдений на интервал. Значением по умолчанию является 1, избегать пустых интервалов.

        • MaxCount — Задает максимальное количество n (n> =0) из наблюдений на интервал. Значением по умолчанию является Inf.

        • MaxNumBins — Задает максимальное количество n (n> =2) из интервалов, следующих из разделения. Значением по умолчанию является 5.

      • Для Initial number bins задайте целое число, которое определяет номер (n> 0) интервалов, что предиктор первоначально сгруппирован в перед разделением. Допустимый для числовых предикторов только. Значением по умолчанию является 50.

      • Для Category sorting, используемого для категориальных предикторов только, выбирают значение:

        • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

        • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

        • Odds — (значение по умолчанию) категории сортируется по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

        • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

        • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм. (Существующий порядок категорий виден в категории, группирующей дополнительный выход от bininfo.)

        Для получения дополнительной информации смотрите сортировку Категорий

    • Merge

      • Для Measure выберите одно из следующего: Chi2 (значение по умолчанию), Gini, InfoValue или Entropy.

      • Для Tolerance задайте минимальный порог, ниже которого слияние происходит для информационного значения и энтропийной статистики. Допустимые значения находятся в интервале (0.1). Значением по умолчанию является 1e-3.

      • Для Significance задайте порог уровня значения для статистической величины хи-квадрата, ниже которой происходит слияние. Значения находятся в интервале [0,1]. Значением по умолчанию является 0.9 (90%-й уровень значения).

      • Для Bin distribution задайте следующее:

        • MinNumBins — Задает минимальный номер n (n> =2) из интервалов тот результат слияния. Значением по умолчанию является 2.

        • MaxNumBins — Задает максимальное количество n (n> =2) из интервалов тот результат слияния. Значением по умолчанию является 5.

      • Для Initial number of bins задайте целое число, которое определяет номер (n> 0) интервалов, что предиктор первоначально сгруппирован в перед слиянием. Допустимый для числовых предикторов только. Значением по умолчанию является 50.

      • Для Category sorting, используемого для категориальных предикторов только. Выберите значение:

        • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

        • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

        • Odds — (значение по умолчанию) категории сортируется по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

        • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

        • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм. (Существующий порядок категорий виден в категории, группирующей дополнительный выход от bininfo.)

        Для получения дополнительной информации смотрите сортировку Категорий

    • Equal Frequency

      • Для Number of bins введите номер интервалов. Значением по умолчанию является 5, и количество интервалов должно быть положительным числом.

      • Для Category Sorting выберите одно из следующего:

        • Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

        • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

        • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

        • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

        • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.

        Примечание

        Можно использовать Category Sorting с категориальными предикторами только.

    • Equal Width

      • Для Number of bins введите номер интервалов. Значением по умолчанию является 5 и количество интервалов должно быть положительным числом.

      • Для Category Sorting выберите одно из следующего:

        • Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

        • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

        • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

        • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

        • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.

        Примечание

        Можно использовать Category Sorting с категориальными предикторами только.

    Нажмите OK. График предиктора обновляется с изменением опций алгоритма. Детали в Bin Information и панелях Predictor Information также обновляются.

  4. Чтобы изменить опцию алгоритма раскладывания для нескольких предикторов, мультивыберите больше чем один график предиктора при помощи Ctrl + нажатие кнопки, чтобы подсветить каждый график предиктора с синей схемой.

    Multiselected plots each have a blue outline

  5. На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма. Сделайте свой выбор от Окна параметров Алгоритма и нажмите OK. Выбранные графики предиктора обновляются для изменения алгоритма.

Разделите интервалы для числового предиктора

После того, как вы импортируете данные или creditscorecard объект в Binning Explorer, можно разделить интервалы для числового предиктора.

  1. Кликните по любому числовому графику предиктора. График предиктора отображается с синей схемой.

    Select plot for ResStatus with blue outline

  2. На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный числовой предиктор в новом окне с вкладками.

  3. Кликните по интервалу, чтобы включить кнопку Split для того интервала.

    Select a bin to enable the Split button

    Примечание

    Кнопка Split включена, когда область значений данных выбранного интервала имеет больше чем одно значение.

  4. На панели инструментов Binning Explorer текстовые поля Edges отображают значения для ребер выбранного интервала. Нажмите Split, чтобы открыть диалоговое окно Split.

    Use Split dialog to specify the edges of a bin

  5. Используйте управление Number of bins, чтобы разделить выбранный интервал в несколько интервалов. Нажмите OK, чтобы завершить операцию разделения.

    График для выбранного числового предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.

Разделите интервалы для категориального предиктора

После того, как вы импортируете данные или creditscorecard объект в Binning Explorer, можно разделить интервалы для категориального предиктора.

  1. Кликните по любому категориальному графику предиктора. График предиктора отображается с синей схемой.

    Select EmpStatus bin displays with blue outline

  2. На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный категориальный предиктор в новом окне с вкладками.

  3. Кликните по интервалу, чтобы включить кнопку Split для того интервала.

    Select a bin to enable the Split button

    Примечание

    Кнопка Split включена, когда выбранный интервал имеет больше чем одну категорию в нем.

    Use the Split dialog to specify splitting for a selected bin

    Используйте управление Number of bins, чтобы разделить выбранный интервал в несколько интервалов.

    Используйте средства управления стрелой на диалоговом окне Split, чтобы управлять содержимым для каждого из интервалов, в которые вы разделяете выбранный интервал.

  4. Нажмите OK, чтобы завершить операцию разделения.

    График для выбранного категориального предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.

Ручное раскладывание, чтобы объединить интервалы для числового или категориального предиктора

После того, как вы импортируете данные или creditscorecard объект в Binning Explorer, можно разделить или объединить интервалы для предиктора.

  1. Кликните по любому графику предиктора. График предиктора отображается с синей схемой.

    Select plot for ResStatus with blue outline

  2. На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный предиктор в новом окне с вкладками.

    Примечание

    Кнопка Merge активна только, когда больше чем один интервал выбран. Только смежные интервалы могут быть объединены для числовых или порядковых предикторов. Несмежные интервалы могут быть объединены для категориальных предикторов.

  3. Чтобы объединить интервалы, выберите два или больше интервала для слияния при помощи Ctrl + нажатие кнопки, чтобы мультивыбрать интервалы, чтобы отобразиться с синими основами.

    Select two or more bins to merge

    При выполнении слияния с числовым предиктором текстовые поля Edges на панели инструментов Binning Explorer отображают значения для ребер выбранных интервалов, чтобы объединить.

  4. Нажмите Merge, чтобы завершить операцию слияния. График для выбранного предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.

Измените контуры интервала для одного предиктора

После того, как вы импортируете данные или creditscorecard объект в Binning Explorer, можно изменить контуры интервала для одного предиктора.

  1. Кликните по любому графику предиктора. График предиктора отображается с синей схемой.

    Select plot for TmAtAddress with blue outline

  2. На панели инструментов Binning Explorer нажмите Manual Binning. Щелкните, чтобы выбрать определенный интервал, где вы хотите изменить размерности интервала. Выбранный интервал отображается с синей схемой.

    Select a bin to change bin dimensions using manual binning

  3. На панели инструментов Binning Explorer текстовые поля Edges отображают значения для ребер выбранного интервала.

    Specify the edges for the selected bin

    Отредактируйте значения в текстовых полях Edges, чтобы изменить размерности выбранного интервала.

  4. Нажмите Enter, чтобы завершить операцию. График для выбранного предиктора обновляется с информацией о размерности обновленного интервала. Детали в Bin Information и панелях Predictor Information также обновляются.

Измените контуры интервала для нескольких предикторов

После того, как вы импортируете данные или creditscorecard объект в Binning Explorer, можно измениться, алгоритм применился к одному или нескольким предикторам, и можно также переопределить количество интервалов.

  1. Кликните по любому графику предиктора. График предиктора отображается с синей схемой.

    Select plot for ResStatus with blue outline

    В качестве альтернативы выберите два или больше предиктора при помощи Ctrl + нажатие кнопки, чтобы мультивыбрать предикторы, чтобы отобразиться с синими основами.

    Select two or more predictor plots using CTRL + click

  2. На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма.

  3. Окно параметров Алгоритма отображает опции для текущего алгоритма раскладывания. В зависимости от которого текущий алгоритм, можно изменить контуры интервала:

    • Если вашим текущим алгоритмом для выбранных интервалов является EqualWidth или EqualFrequency, введите номер в поле Number of bins. Опционально, для EqualWidth и EqualFrequency опции, под Category Sorting, задают тип сортировки.

    • Если вашим текущим алгоритмом для выбранных интервалов является Monotoneразделение, или Merge значение по умолчанию 10 для Monotone или 50 для Split и Merge используется для Initial number of bins. Опционально, для Monotone, можно установить значения для Trend и Category Sorting.

  4. Нажмите OK, чтобы завершить операцию. Графики для выбранных предикторов обновляются с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.

Установите опции для отображения

Binning Explorer имеет опции для отображения графиков предиктора и опций графика и связанных таблиц, отображенных в Bin Information.

Постройте опции

  1. От элемента панели инструментов Binning Explorer для Plot Options выберите любую из следующих опций графика предиктора:

    • No labels (значение по умолчанию)

    • Bin count

    • % Bin level

    • % Data level

    • % Total count

    • WOE curve

  2. Выбранная метка применяется ко всем графикам предиктора.

Табличные опции

Можно установить табличные параметры отображения для получения информации о предикторе, отображенной в Bin Information.

  1. От элемента панели инструментов Binning Explorer для Table Columns выберите любую из следующих опций:

    • Odds

    • WOE

    • InfoValue

    • Entropy

    • Chi2

    • Gini

    • Members (опция включена для категориальных предикторов),

  2. Когда выбрано, эти опции применяются ко всем предикторам для получения информации, отображенной в Bin Information.

Экспортируйте и сохраните раскладывание

Binning Explorer позволяет вам экспортировать и сохранить свои определения раскладывания протокола результатов кредита creditscorecard объект.

  1. Нажмите Export и обеспечьте creditscorecard имя объекта. creditscorecard объект сохранен в рабочее пространство MATLAB.

    Примечание

    Если вы экспортируете ранее существующий creditscorecard объект, который был подходящим (использование fitmodel), все согласующиеся настройки в creditscorecard объект потерян. Необходимо повторно выполниться fitmodel на обновленном creditscorecard объект.

  2. Вновь открыть ранее сохраненный creditscorecard возразите, нажмите Import Data и выберите creditscorecard объект от панели Step 1 окна Import Data.

Диагностируйте раскладывание

Эта тема показывает некоторые результаты при использовании Binning Explorer с протоколами результатов кредита тот поиск и устранение неисправностей потребности. Для получения дополнительной информации на полном процессе создания и разработки протоколов результатов кредита, см. Обзор Binning Explorer и Примера Тематического исследования Binning Explorer.

Числовой предиктор, конвертированный к категориальному предиктору, не отображает Разделение данных правильно

Когда вы преобразуете числовой предиктор с сотнями значений (например, текущие данные) к категориальным данным, получившиеся данные имеют сотни категорий. Следующий пример иллюстрирует этот сценарий.

load CreditCardData

Откройте Binning Explorer и выберите числовой предиктор AMBalance. От панели инструментов Binning Explorer измените тип предиктора в Categorical.

Выберите Manual Binning на панели инструментов Binning Explorer и нажмите Split. Диалоговое окно Split отображается можно следующим образом:

Split dialog for numeric predictor AMBalance with too many bins

Предиктор имеет слишком много категорий, чтобы отобразиться правильно.

Решение: Если у вас есть категориальный предиктор с большим количеством категорий, используйте Algorithm Options, чтобы изменить алгоритм раскладывания для того предиктора к Equal Frequency с набором Number of bins к 100 (или другое меньшее значение). Диалоговое окно Split затем отображается правильно.

Split dialog for AMBalance with number of bins set to 100

График предиктора кажется искаженным

При использовании Binning Explorer, если вы импортируете данные, которые не были ранее сгруппированы и вы выбираете No Binning из окна Import Data, получившиеся графики могут быть искажены. Например, если вы загружаете следующий набор данных в рабочее пространство MATLAB и используете Binning Explorer, чтобы импортировать данные с помощью No Binning, следующих отображений графика для предиктора TmAtAddress.

load CreditCardData

Plot for TmAtAddress that has not been binned

Решение: Когда вы импортируете данные, которые не были ранее сгруппированы, выберите Monotone из окна Import Data вместо этого. Следующий график отображается для предиктора TmAtAddress.

Plot for TmAtAddress after binning using Monotone binning algorithm

Смотрите также

Приложения

Классы

Связанные примеры

Больше о

Внешние веб-сайты