При создании creditscorecard
объект, таблица, используемая для входа data
аргумент либо определяет, либо не задает веса наблюдений. Если на data
не использует веса, тогда «отсчитывает» для Good
, Bad
, и Odds
используются функциями кредитования счета карты. Однако, если опционально WeightsVar
аргумент задается при создании creditscorecard
объект, затем «counts» для Good
, Bad
, и Odds
- сумма весов.
Для примера вот фрагмент входа таблицы, который не задает наблюдательные веса:
Если вы складываете данные предиктора возраста клиента с клиентами до 45 лет в одном интервале и 46 лет и выше в другом интервале, вы получаете следующую статистику:
Good
означает общее количество строк с 0
значение в status
переменная отклика. Bad
количество 1
"s в status
столбец. Odds
- отношение Good
на Bad
. The Good
, Bad
, и Odds
указывается для каждого интервала. Это означает, что в выборке 381 человек, которым 45 лет, и младше, которые выплатили свои кредиты, 241 в той же возрастной области значений, которые допустили дефолт, и, следовательно, шансы быть хорошими для этой возрастной области значений 1.581
.
Предположим, что моделист считает, что люди 45 и младше недостаточно представлены в этой выборке. Моделист хочет отдать всем строкам с возрастом до 45 лет больший вес. Предположим, что моделист считает, что возрастная группа до 45 лет должна иметь на 50% больше веса, чем строки с возрастом 46 лет и выше. Данные таблицы расширяются, чтобы включить веса наблюдений. A Weight
столбец добавляется в таблицу, где все строки с возрастом 45 лет и младше имеют вес 1.5
, и все другие строки имеют вес 1
. Существуют и другие причины использовать веса, для примера недавним точкам данных могут быть присвоены более высокие веса, чем старым точкам данных.
Если вы бинете взвешенные данные, основанные на возрасте (45 лет и ниже, против 46 лет и выше), ожидают, что каждая строка с возрастом 45 лет и младше должна насчитывать 1,5 наблюдения, и, следовательно, Good
и Bad
«счетчики» увеличены на 50%:
«Counts» теперь являются «взвешенными частотами» и больше не являются целочисленными значениями. The Odds
не изменяйте для первого интервала. Конкретные веса, приведенные в этом примере, имеют эффект масштабирования общего Good
и Bad
отсчитывает в первом интервале по тому же масштабному коэффициенту, поэтому их отношение не изменяется. Однако Odds
значение общей выборки изменяется; первый интервал теперь имеет больший вес, и, поскольку шансы в этом интервале меньше, общее Odds
теперь тоже ниже. Другая статистика кредитной карты показателей, не показанная здесь, например WOE
и Information Value
затрагиваются подобным образом.
В целом, эффект весов заключается не только в масштабировании частот в конкретном интервале, потому что представители этого интервала будут иметь различные веса. Цель этого примера состоит в том, чтобы продемонстрировать концепцию перехода от отсчётов к сумме весов.
autobinning
| bininfo
| creditscorecard
| fitmodel
| validatemodel