Общие задачи Binning Explorer

Поддержки приложений Binning Explorer следующие задачи:

Importdata

Binning Explorer позволяет вам импортировать данные или начинающий непосредственно с данных, хранимых в таблице MATLAB® или путем загрузки существующего объекта creditscorecard.

Чистый запуск от данных

Начинать непосредственно с данных:

  1. Поместите данные о протоколе результатов кредита в свое рабочее пространство MATLAB. Данные должны быть в таблице MATLAB, где каждый столбец данных может быть любым из следующих типов данных:

    • Числовой

    • Логический

    • Массив ячеек из символьных векторов

    • Массив символов

    • Категориальный

    Кроме того, таблица должна содержать бинарную переменную отклика.

  2. Откройте Binning Explorer от панели инструментов MATLAB: На вкладке Apps, под Computational Finance, кликают по значку приложения.

  3. Выберите данные из панели Step 1 окна Import Data.

  4. От панели Step 2, набор Variable Type для каждого из предикторов, по мере необходимости. Если таблица входа MATLAB содержит столбец для weights, от панели Step 2, с помощью столбца Variable Type, кликните по выпадающему, чтобы выбрать Weights. Если данные содержат отсутствующие значения от панели Step 2, установите Bin missing data: на Yes. Для получения дополнительной информации о работе с недостающими данными смотрите, Приписывают Моделированию Протокола результатов Отсутствующие значения (Financial Toolbox).

  5. От панели Step 3 выберите первоначальный алгоритм раскладывания и нажмите Import Data. Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.

Запустите с существующего объекта creditscorecard

Начинать использовать существующий объект creditscorecard:

  1. Поместите объект creditscorecard в свое рабочее пространство MATLAB. Создайте объект creditscorecard или при помощи creditscorecard или путем нажатия на Export в Binning Explorer, чтобы экспортировать и сохранить объект creditscorecard в рабочее пространство MATLAB.

  2. Откройте Binning Explorer от панели инструментов MATLAB: На вкладке Apps, под Computational Finance, кликают по значку приложения.

  3. От панели Step 1 окна Import Data выберите объект creditscorecard.

  4. От панели Step 3 выберите алгоритм раскладывания. При использовании существующего объекта creditscorecard рекомендуется выбрать опцию No Binning. Чтобы отобразить графики предиктора, нажмите Import Data.

    Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.

Запустите с командной строки MATLAB Используя данные или существующий объект creditscorecard

Запустить Binning Explorer с командной строки MATLAB:

  1. Поместите данные о протоколе результатов кредита или существующий объект creditscorecard в вашем рабочем пространстве MATLAB.

  2. В подсказке команды MATLAB:

    • Введите binningExplorer(data) или binningExplorer(data,Name,Value), чтобы открыть таблицу в приложении Binning Explorer путем определения таблицы (data), как введено.

    • Введите binningExplorer(sc), чтобы открыть существующий объект creditscorecard в приложении Binning Explorer путем определения объекта creditscorecard (sc), как введено.

    Интервалы построены и отображены для каждого предиктора. Путем нажатия на отдельный график предиктора детали для того предиктора строят отображение в панелях Predictor Information и Bin Information.

Измените тип предиктора

После того, как вы импортируете данные или объект creditscorecard в Binning Explorer, можно изменить тип предиктора.

  1. Кликните по любому графику предиктора. Имя выбранного предиктора отображается на панели инструментов Binning Explorer под Selected Predictor.

    На панели инструментов Binning Explorer тип предиктора для выбранного предиктора отображается под Predictor Type.

  2. Чтобы изменить тип предиктора, под Predictor Type, выберите: Numeric, Categorical или Ordinal. График предиктора обновляется и детали в Bin Information, и панели Predictor Information также обновляются.

Измените алгоритм раскладывания для одного или нескольких предикторов

После того, как вы импортируете данные или объект creditscorecard в Binning Explorer, можно изменить алгоритм раскладывания для отдельного предиктора или для нескольких предикторов.

  1. Кликните по любому графику предиктора. Выбранный предиктор строит отображения с синей схемой.

    Совет

    Когда вы выбираете график предиктора с синей схемой, сообщение о состоянии появляется в нижней части Binning Explorer, который отображает последнюю информацию о раскладывании для того предиктора. Используйте эту информацию, чтобы определить, какой алгоритм раскладывания последний раз применяется к отдельному графику предиктора.

  2. На панели инструментов Binning Explorer нажмите Apply Monotone и выберите Monotone, Split, Merge, Equal Frequency или Equal Width. График предиктора обновляется с изменением алгоритма. Детали в Bin Information и панелях Predictor Information также обновляются.

  3. Чтобы изменить алгоритм раскладывания для нескольких предикторов, мультивыберите больше чем один график предиктора при помощи Ctrl + нажатие кнопки, чтобы подсветить каждый график предиктора с синей схемой.

  4. Нажмите Apply Monotone и выберите Monotone, Split, Merge, Equal Frequency или Equal Width. Все выбранные графики предиктора обновляются для изменения алгоритма.

Измените опции алгоритма для алгоритмов раскладывания

После того, как вы импортируете данные или объект creditscorecard в Binning Explorer, можно изменить опции алгоритма раскладывания для отдельного предиктора или для нескольких предикторов.

  1. Кликните по любому графику предиктора. График предиктора отображается с синей схемой.

    Совет

    Когда вы выбираете график предиктора с синей схемой, сообщение о состоянии появляется в нижней части Binning Explorer, который отображает последнюю информацию о раскладывании для того предиктора. Используйте эту информацию, чтобы определить, какой алгоритм раскладывания последний раз применяется к отдельному графику предиктора.

  2. На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма.

  3. От связанного окна параметров Алгоритма:

    • Monotone

      • Для Trend выберите одно из следующего:

        • Auto (default) — Автоматически определяет, увеличивается ли тренд WOE или уменьшается.

        • Increasing — Ищет увеличивающийся тренд WOE.

        • Decreasing — Ищет уменьшающийся тренд WOE.

        Значение Trend не обязательно отражает значение получившейся кривой WOE. Опция Trend говорит алгоритму искать увеличение или уменьшение тренда, но результат не может показать желаемый тренд. Например, алгоритм не может найти уменьшающийся тренд, когда данные на самом деле имеют увеличивающийся тренд WOE. Для получения дополнительной информации об опции Trend смотрите Монотонность (Financial Toolbox).

        • Для Initial number of bins введите начальный номер интервалов (значением по умолчанию является 10). Начальное количество интервалов должно быть целым числом> 2. Используемый для числовых предикторов только.

        • Для Category Sorting, используемого для категориальных предикторов только, избранного одного из следующего:

          • Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

          • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

          • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

          • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

          • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.

          Для получения дополнительной информации смотрите сортировку Категорий (Financial Toolbox)

    • Split

      • Для Measure выберите одно из следующего: Gini (значение по умолчанию), Chi2, InfoValue или Entropy.

      • Для Tolerance задайте значение допуска, выше которого усиление в информационном значении должно быть для разделения, которое будет принято. Значением по умолчанию является 1e-4.

      • Для Significance, только для меры Chi2, задают порог уровня значения для статистической величины хи-квадрата, выше которой происходит разделение. Значения находятся в интервале [0,1]. Значением по умолчанию является 0.9 (90%-й уровень значения).

      • Для Bin distribution задайте значения для

        • MinBad — Задает минимальный номер n (n> =0) Bads на интервал. Значением по умолчанию является 1, чтобы избежать чистых интервалов.

        • MaxBad — Задает максимальное количество n (n> =0) Bads на интервал. Значением по умолчанию является Inf.

        • MinGood — Задает минимальный номер n (n> =0) Товаров на интервал. Значением по умолчанию является 1, чтобы избежать чистых интервалов.

        • MaxGood — Задает максимальное количество n (n> =0) Товаров на интервал. Значением по умолчанию является Inf.

        • MinCount — Задает минимальный номер n (n> =0) наблюдений на интервал. Значением по умолчанию является 1, чтобы избежать пустых интервалов.

        • MaxCount — Задает максимальное количество n (n> =0) наблюдений на интервал. Значением по умолчанию является Inf.

        • MaxNumBins — Задает максимальное количество n (n> =2) интервалов, следующих из разделения. Значением по умолчанию является 5.

      • Для Initial number bins задайте целое число, которое определяет номер (n> 0) интервалов, что предиктор первоначально сгруппирован в перед разделением. Допустимый для числовых предикторов только. Значением по умолчанию является 50.

      • Для Category sorting, используемого для категориальных предикторов только, выбирают значение:

        • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

        • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

        • Odds — (значение по умолчанию) категории сортируется по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

        • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

        • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм. (Существующий порядок категорий виден в категории, группирующей дополнительный вывод от bininfo.)

        Для получения дополнительной информации смотрите сортировку Категорий (Financial Toolbox)

    • Merge

      • Для Measure выберите одно из следующего: Chi2 (значение по умолчанию), Gini, InfoValue или Entropy.

      • Для Tolerance задайте минимальный порог, ниже которого слияние происходит для информационного значения и энтропийной статистики. Допустимые значения находятся в интервале (0.1). Значением по умолчанию является 1e-3.

      • Для Significance задайте порог уровня значения для статистической величины хи-квадрата, ниже которой происходит слияние. Значения находятся в интервале [0,1]. Значением по умолчанию является 0.9 (90%-й уровень значения).

      • Для Bin distribution задайте следующее:

        • MinNumBins — Задает минимальный номер n (n> =2) интервалов тот результат слияния. Значением по умолчанию является 2.

        • MaxNumBins — Задает максимальное количество n (n> =2) интервалов тот результат слияния. Значением по умолчанию является 5.

      • Для Initial number of bins задайте целое число, которое определяет номер (n> 0) интервалов, что предиктор первоначально сгруппирован в перед слиянием. Допустимый для числовых предикторов только. Значением по умолчанию является 50.

      • Для Category sorting, используемого для категориальных предикторов только. Выберите значение:

        • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

        • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

        • Odds — (значение по умолчанию) категории сортируется по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

        • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

        • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм. (Существующий порядок категорий виден в категории, группирующей дополнительный вывод от bininfo.)

        Для получения дополнительной информации смотрите сортировку Категорий (Financial Toolbox)

    • Equal Frequency

      • Для Number of bins введите номер интервалов. Значением по умолчанию является 5, и количество интервалов должно быть положительным числом.

      • Для Category Sorting выберите одно из следующего:

        • Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

        • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

        • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

        • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

        • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.

        Примечание

        Можно использовать Category Sorting с категориальными предикторами только.

    • Equal Width

      • Для Number of bins введите номер интервалов. Значением по умолчанию является 5, и количество интервалов должно быть положительным числом.

      • Для Category Sorting выберите одно из следующего:

        • Odds (default) — Категории сортируются по приказу увеличения значений разногласий, заданных как отношение “Хороших” к “Плохим” наблюдениям, для данной категории.

        • Goods — Категории сортируются по приказу увеличения значений “Хороших”.

        • Bads — Категории сортируются по приказу увеличения значений “Плохо”.

        • Totals — Категории сортируются по приказу увеличения значений общего количества наблюдений (“Хороший” плюс “Плохой”).

        • 'none' Никакая сортировка не применяется. Существующий порядок категорий неизменен прежде, чем применить алгоритм.

        Примечание

        Можно использовать Category Sorting с категориальными предикторами только.

    Нажмите OK. График предиктора обновляется с изменением опций алгоритма. Детали в Bin Information и панелях Predictor Information также обновляются.

  4. Чтобы изменить опцию алгоритма раскладывания для нескольких предикторов, мультивыберите больше чем один график предиктора при помощи Ctrl + нажатие кнопки, чтобы подсветить каждый график предиктора с синей схемой.

  5. На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма. Сделайте свой выбор от Окна параметров Алгоритма и нажмите OK. Выбранные графики предиктора обновляются для изменения алгоритма.

Разделите интервалы для числового предиктора

После того, как вы импортируете данные или объект creditscorecard в Binning Explorer, можно разделить интервалы для числового предиктора.

  1. Кликните по любому числовому графику предиктора. График предиктора отображается с синей схемой.

  2. На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный числовой предиктор в новом окне с вкладками.

  3. Кликните по интервалу, чтобы включить кнопку Split для того интервала.

    Примечание

    Кнопка Split включена, когда область значений данных выбранного интервала имеет больше чем одно значение.

  4. На панели инструментов Binning Explorer текстовые поля Edges отображают значения для ребер выбранного интервала. Нажмите Split, чтобы открыть диалоговое окно Split.

  5. Используйте управление Number of bins, чтобы разделить выбранный интервал в несколько интервалов. Нажмите OK, чтобы завершить операцию разделения.

    График для выбранного числового предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.

Разделите интервалы для категориального предиктора

После того, как вы импортируете данные или объект creditscorecard в Binning Explorer, можно разделить интервалы для категориального предиктора.

  1. Кликните по любому категориальному графику предиктора. График предиктора отображается с синей схемой.

  2. На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный категориальный предиктор в новом окне с вкладками.

  3. Кликните по интервалу, чтобы включить кнопку Split для того интервала.

    Примечание

    Кнопка Split включена, когда выбранный интервал имеет больше чем одну категорию в нем.

    Используйте управление Number of bins, чтобы разделить выбранный интервал в несколько интервалов.

    Используйте средства управления стрелкой на диалоговом окне Split, чтобы управлять содержимым для каждого из интервалов, в которые вы разделяете выбранный интервал.

  4. Нажмите OK, чтобы завершить операцию разделения.

    График для выбранного категориального предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.

Ручное раскладывание, чтобы объединить интервалы для числового или категориального предиктора

После того, как вы импортируете данные или объект creditscorecard в Binning Explorer, можно разделить или объединить интервалы для предиктора.

  1. Кликните по любому графику предиктора. График предиктора отображается с синей схемой.

  2. На панели инструментов Binning Explorer нажмите Manual Binning, чтобы открыть выбранный предиктор в новом окне с вкладками.

    Примечание

    Кнопка Merge активна только, когда больше чем один интервал выбран. Только смежные интервалы могут быть объединены для числовых или порядковых предикторов. Несмежные интервалы могут быть объединены для категориальных предикторов.

  3. Чтобы объединить интервалы, выберите два или больше интервала для слияния при помощи Ctrl + нажатие кнопки, чтобы мультивыбрать интервалы, чтобы отобразиться с синими основами.

    При выполнении слияния с числовым предиктором текстовые поля Edges на панели инструментов Binning Explorer отображают значения для ребер выбранных интервалов, чтобы объединить.

  4. Нажмите Merge, чтобы завершить операцию слияния. График для выбранного предиктора обновляется с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.

Измените контуры интервала для одного предиктора

После того, как вы импортируете данные или объект creditscorecard в Binning Explorer, можно изменить контуры интервала для одного предиктора.

  1. Кликните по любому графику предиктора. График предиктора отображается с синей схемой.

  2. На панели инструментов Binning Explorer нажмите Manual Binning. Щелкните, чтобы выбрать определенный интервал, где вы хотите изменить размерности интервала. Выбранный интервал отображается с синей схемой.

  3. На панели инструментов Binning Explorer текстовые поля Edges отображают значения для ребер выбранного интервала.

    Отредактируйте значения в текстовых полях Edges, чтобы изменить размерности выбранного интервала.

  4. Нажмите Enter, чтобы завершить операцию. График для выбранного предиктора обновляется с информацией о размерности обновленного интервала. Детали в Bin Information и панелях Predictor Information также обновляются.

Измените контуры интервала для нескольких предикторов

После того, как вы импортируете данные или объект creditscorecard в Binning Explorer, можно измениться, алгоритм применился к одному или нескольким предикторам, и можно также переопределить количество интервалов.

  1. Кликните по любому графику предиктора. График предиктора отображается с синей схемой.

    Также выберите два или больше предиктора при помощи Ctrl + нажатие кнопки, чтобы мультивыбрать предикторы, чтобы отобразиться с синими основами.

  2. На панели инструментов Binning Explorer нажмите Algorithm Options, чтобы открыть Окно параметров Алгоритма.

  3. Окно параметров Алгоритма отображает опции для текущего алгоритма раскладывания. В зависимости от которого текущий алгоритм, можно изменить контуры интервала:

    • Если вашим текущим алгоритмом для выбранных интервалов является EqualWidth или EqualFrequency, введите номер в поле Number of bins. Опционально, для EqualWidth и опций EqualFrequency, под Category Sorting, задают тип сортировки.

    • Если вашим текущим алгоритмом для выбранных интервалов является Monotone, Split или Merge, значение по умолчанию 10 для Monotone или 50 для Split и Merge используется для Initial number of bins. Опционально, для Monotone, можно установить значения для Trend и Category Sorting.

  4. Нажмите OK, чтобы завершить операцию. Графики для выбранных предикторов обновляются с новой информацией об интервале. Детали в Bin Information и панелях Predictor Information также обновляются.

Установите опции для отображения

Binning Explorer имеет опции для отображения графиков предиктора и опций графика и связанных таблиц, отображенных в Bin Information.

Постройте опции

  1. От элемента панели инструментов Binning Explorer для Plot Options выберите любую из следующих опций графика предиктора:

    • No labels (значение по умолчанию)

    • Bin count

    • % Bin level

    • % Data level

    • % Total count

    • WOE curve

  2. Выбранная метка применяется ко всем графикам предиктора.

Табличные опции

Можно установить табличные параметры экрана для получения информации о предикторе, отображенной в Bin Information.

  1. От элемента панели инструментов Binning Explorer для Table Columns выберите любую из следующих опций:

    • Odds

    • WOE

    • InfoValue

    • Entropy

    • Chi2

    • Gini

    • Members (опция включена для категориальных предикторов),

  2. Когда выбрано, эти опции применяются ко всем предикторам для получения информации, отображенной в Bin Information.

Экспортируйте и сохраните раскладывание

Binning Explorer позволяет вам экспортировать и сохранить свои определения раскладывания протокола результатов кредита объекту creditscorecard.

  1. Нажмите Export и обеспечьте имя объекта creditscorecard. Объект creditscorecard сохранен в рабочее пространство MATLAB.

    Примечание

    Если вы экспортируете ранее существующий объект creditscorecard, который был подходящим (использование fitmodel), все согласующиеся настройки в объекте creditscorecard потеряны. Необходимо повторно выполнить fitmodel на обновленном объекте creditscorecard.

  2. Чтобы вновь открыть ранее сохраненный объект creditscorecard, нажмите Import Data и выберите объект creditscorecard из панели Step 1 окна Import Data.

Диагностируйте раскладывание

Эта тема показывает некоторые результаты при использовании Binning Explorer с протоколами результатов кредита тот поиск и устранение неисправностей потребности. Для получения дополнительной информации на полном процессе создания и разработки протоколов результатов кредита, см. Обзор Binning Explorer и Примера Тематического исследования Binning Explorer.

Числовой предиктор, конвертированный к категориальному предиктору, не отображает Разделение данных правильно

Когда вы преобразовываете числовой предиктор с сотнями значений (например, текущие данные) к категориальным данным, получившиеся данные имеют сотни категорий. Следующий пример иллюстрирует этот сценарий.

load CreditCardData

Откройте Binning Explorer и выберите числовой предиктор AMBalance. От панели инструментов Binning Explorer измените тип предиктора на Categorical.

Выберите Manual Binning на панели инструментов Binning Explorer и нажмите Split. Диалоговое окно Split отображается можно следующим образом:

Предиктор имеет слишком много категорий, чтобы отобразиться правильно.

Решение: Если у вас есть категориальный предиктор с большим количеством категорий, используйте Algorithm Options, чтобы изменить алгоритм раскладывания для того предиктора к Equal Frequency с набором Number of bins к 100 (или другое меньшее значение). Диалоговое окно Split затем отображается правильно.

График предиктора кажется искаженным

При использовании Binning Explorer, если вы импортируете данные, которые не были ранее сгруппированы и вы выбираете No Binning из окна Import Data, получившиеся графики могут быть искажены. Например, если вы загружаете следующий набор данных в рабочее пространство MATLAB и используете Binning Explorer, чтобы импортировать данные с помощью No Binning, следующих отображений графика для предиктора TmAtAddress.

load CreditCardData

Решение: Когда вы импортируете данные, которые не были ранее сгруппированы, выберите Monotone из окна Import Data вместо этого. Следующий график отображается для предиктора TmAtAddress.

Смотрите также

Приложения

Классы

Связанные примеры

Больше о

Внешние веб-сайты