Вычислите R-квадрат, RMSE, корреляцию и среднюю ошибку выборки предсказанных и наблюдаемых LGD
вычисляет R-квадрат, корневую среднюю квадратную ошибку (RMSE), корреляцию и выборку среднюю ошибку наблюдаемых и предсказанных потерь с учетом данных по умолчанию (LGD). AccMeasure
= modelAccuracy(lgdModel
,data
)modelAccuracy
Поддержки сравнение с образцом модели, а также поддерживают различные типы корреляции. По умолчанию modelAccuracy
вычисляет метрики в шкале LGD. Можно использовать ModelLevel
аргумент пары "имя-значение" для вычисления метрик с помощью преобразованной шкалы базовой модели.
[
задает опции, использующие один или несколько аргументы пары "имя-значение" в дополнение к входным параметрам в предыдущем синтаксисе.AccMeasure
,AccData
] = modelAccuracy(___,Name,Value
)
В этом примере показано, как использовать fitLGDModel
для подгонки данных к Regression
моделировать и затем использовать modelAccuracy
вычислить R-квадрат, RMSE, корреляцию и среднюю ошибку выборки предсказанных и наблюдаемых LGD.
Загрузка данных
Загрузите данные потерь по умолчанию.
load LGDData.mat
head(data)
ans=8×4 table
LTV Age Type LGD
_______ _______ ___________ _________
0.89101 0.39716 residential 0.032659
0.70176 2.0939 residential 0.43564
0.72078 2.7948 residential 0.0064766
0.37013 1.237 residential 0.007947
0.36492 2.5818 residential 0
0.796 1.5957 residential 0.14572
0.60203 1.1599 residential 0.025688
0.92005 0.50253 investment 0.063182
Данные о разделах
Разделите данные на обучающие и тестовые разделы.
rng('default'); % for reproducibility NumObs = height(data); c = cvpartition(NumObs,'HoldOut',0.4); TrainingInd = training(c); TestInd = test(c);
Создание Regression
ЛГД- Модели
Использование fitLGDModel
для создания Regression
модели с использованием обучающих данных.
lgdModel = fitLGDModel(data(TrainingInd,:),'regression');
disp(lgdModel)
Regression with properties: ResponseTransform: "logit" BoundaryTolerance: 1.0000e-05 ModelID: "Regression" Description: "" UnderlyingModel: [1x1 classreg.regr.CompactLinearModel] PredictorVars: ["LTV" "Age" "Type"] ResponseVar: "LGD"
Отобразите базовую модель.
disp(lgdModel.UnderlyingModel)
Compact linear regression model: LGD_logit ~ 1 + LTV + Age + Type Estimated Coefficients: Estimate SE tStat pValue ________ ________ _______ __________ (Intercept) -4.7549 0.36041 -13.193 3.0997e-38 LTV 2.8565 0.41777 6.8377 1.0531e-11 Age -1.5397 0.085716 -17.963 3.3172e-67 Type_investment 1.4358 0.2475 5.8012 7.587e-09 Number of observations: 2093, Error degrees of freedom: 2089 Root Mean Squared Error: 4.24 R-squared: 0.206, Adjusted R-Squared: 0.205 F-statistic vs. constant model: 181, p-value = 2.42e-104
Вычисление R-квадрата, RMSE, корреляции и средней ошибки выборки предсказанных и наблюдаемых LGD
Использование modelAccuracy
для вычисления RSquared
, RMSE
, Correlation
, и SampleMeanError
предсказанных и наблюдаемых LGD для тестовых данных набора.
[AccMeasure,AccData] = modelAccuracy(lgdModel,data(TestInd,:))
AccMeasure=1×4 table
RSquared RMSE Correlation SampleMeanError
________ _______ ___________ _______________
Regression 0.070867 0.25988 0.26621 0.10759
AccData=1394×3 table
Observed Predicted_Regression Residuals_Regression
_________ ____________________ ____________________
0.0064766 0.00091169 0.0055649
0.007947 0.0036758 0.0042713
0.063182 0.18774 -0.12456
0 0.0010877 -0.0010877
0.10904 0.011213 0.097823
0 0.041992 -0.041992
0.89463 0.052947 0.84168
0 3.7188e-06 -3.7188e-06
0.072437 0.0090124 0.063425
0.036006 0.023928 0.012078
0 0.0034833 -0.0034833
0.39549 0.0065253 0.38896
0.057675 0.071956 -0.014281
0.014439 0.0061499 0.008289
0 0.0012183 -0.0012183
0 0.0019828 -0.0019828
⋮
Сгенерируйте график поля точек предсказанных и наблюдаемых ЛГД, используя modelAccuracyPlot
.
modelAccuracyPlot(lgdModel,data(TestInd,:),'ModelLevel',"underlying")
В этом примере показано, как использовать fitLGDModel
для подгонки данных к Tobit
моделировать и затем использовать modelAccuracy
вычислить R-квадрат, RMSE, корреляцию и среднюю ошибку выборки предсказанных и наблюдаемых LGD.
Загрузка данных
Загрузите данные потерь по умолчанию.
load LGDData.mat
head(data)
ans=8×4 table
LTV Age Type LGD
_______ _______ ___________ _________
0.89101 0.39716 residential 0.032659
0.70176 2.0939 residential 0.43564
0.72078 2.7948 residential 0.0064766
0.37013 1.237 residential 0.007947
0.36492 2.5818 residential 0
0.796 1.5957 residential 0.14572
0.60203 1.1599 residential 0.025688
0.92005 0.50253 investment 0.063182
Данные о разделах
Разделите данные на обучающие и тестовые разделы.
rng('default'); % for reproducibility NumObs = height(data); c = cvpartition(NumObs,'HoldOut',0.4); TrainingInd = training(c); TestInd = test(c);
Создание Tobit
ЛГД- Модели
Использование fitLGDModel
для создания Tobit
модели с использованием обучающих данных.
lgdModel = fitLGDModel(data(TrainingInd,:),'tobit');
disp(lgdModel)
Tobit with properties: CensoringSide: "both" LeftLimit: 0 RightLimit: 1 ModelID: "Tobit" Description: "" UnderlyingModel: [1x1 risk.internal.credit.TobitModel] PredictorVars: ["LTV" "Age" "Type"] ResponseVar: "LGD"
Отобразите базовую модель.
disp(lgdModel.UnderlyingModel)
Tobit regression model: LGD = max(0,min(Y*,1)) Y* ~ 1 + LTV + Age + Type Estimated coefficients: Estimate SE tStat pValue _________ _________ _______ __________ (Intercept) 0.058257 0.027276 2.1358 0.032809 LTV 0.20126 0.031373 6.415 1.7363e-10 Age -0.095407 0.0072543 -13.152 0 Type_investment 0.10208 0.018054 5.6542 1.7802e-08 (Sigma) 0.29288 0.005704 51.346 0 Number of observations: 2093 Number of left-censored observations: 547 Number of uncensored observations: 1521 Number of right-censored observations: 25 Log-likelihood: -698.383
Вычисление R-квадрата, RMSE, корреляции и средней ошибки выборки предсказанных и наблюдаемых LGD
Использование modelAccuracy
для вычисления RSquared
, RMSE
, Correlation
, и SampleMeanError
предсказанных и наблюдаемых LGD для тестовых данных набора.
[AccMeasure,AccData] = modelAccuracy(lgdModel,data(TestInd,:),'CorrelationType',"kendall")
AccMeasure=1×4 table
RSquared RMSE Correlation SampleMeanError
________ _______ ___________ _______________
Tobit 0.08527 0.23712 0.29964 -0.034412
AccData=1394×3 table
Observed Predicted_Tobit Residuals_Tobit
_________ _______________ _______________
0.0064766 0.087889 -0.081412
0.007947 0.12432 -0.11638
0.063182 0.32043 -0.25724
0 0.093354 -0.093354
0.10904 0.16718 -0.058144
0 0.22382 -0.22382
0.89463 0.23695 0.65768
0 0.010234 -0.010234
0.072437 0.1592 -0.086761
0.036006 0.19893 -0.16292
0 0.12764 -0.12764
0.39549 0.14568 0.2498
0.057675 0.26181 -0.20413
0.014439 0.14483 -0.13039
0 0.094123 -0.094123
0 0.10944 -0.10944
⋮
Сгенерируйте график поля точек предсказанных и наблюдаемых LGDs с помощью modelAccuracyPlot
.
modelAccuracyPlot(lgdModel,data(TestInd,:))
lgdModel
- Потеря по умолчанию заданная модельRegression
| объекта Tobit
объектПотеря по умолчанию заданная модель, заданная как ранее созданная Regression
или Tobit
использование объекта fitLGDModel
.
Типы данных: object
data
- ДанныеДанные, заданные как NumRows
-by- NumCols
таблица с предиктором и значениями отклика. Имена переменных и типы данных должны соответствовать базовой модели.
Типы данных: table
Задайте необязательные разделенные разделенными запятой парами Name,Value
аргументы. Name
- имя аргумента и Value
- соответствующее значение. Name
должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN
.
[AccMeasure,AccData] = modelAccuracy(lgdModel,data(TestInd,:),'DataID','Testing','CorrelationType','spearman')
'CorrelationType'
- Тип корреляции"pearson"
(по умолчанию) | вектор со значением 'pearson'
, 'spearman'
, или 'kendall'
| строку со значением "pearson"
, "spearman"
, или "kendall'"
Тип корреляции, заданный как разделенная разделенными запятой парами, состоящая из 'CorrelationType'
и вектор символов или строка.
Типы данных: char
| string
'DataID'
- Идентификатор набора данных""
(по умолчанию) | вектор символов | строкаИдентификатор набора данных, заданный как разделенная разделенными запятой парами, состоящая из 'DataID'
и вектор символов или строка. The DataID
включено в выход для целей отчетности.
Типы данных: char
| string
'ModelLevel'
- Уровень модели'top'
(по умолчанию) | вектор символов со значением 'top'
или 'underlying'
| строку со значением "top"
или "underlying"
Уровень модели, заданный как разделенная разделенными запятой парами, состоящая из 'ModelLevel'
и вектор символов или строка.
'top'
- Метрики точности вычисляются в шкале LGD на верхнем уровне модели.
'underlying'
- Для Regression
только модель, метрики вычисляются в преобразованной шкале базовой модели. Метрики вычисляются на преобразованных данных LGD.
Примечание
ModelLevel
не влияет на Tobit
модель, потому что нет преобразования отклика.
Типы данных: char
| string
'ReferenceLGD'
- Значения LGD, предсказанные для data
по образцу модели[ ]
(по умолчанию) | числовой вектор'ReferenceID'
- Идентификатор для эталонной модели'Reference'
(по умолчанию) | вектор символов | строкаИдентификатор образца модели, заданный как разделенная запятой пара, состоящий из 'ReferenceID'
и вектор символов или строка. 'ReferenceID'
используется в modelAccuracy
выходы для целей отчетности.
Типы данных: char
| string
AccMeasure
- Измерение точностиИзмерение точности, возвращенное как таблица со столбцами 'RSquared'
, 'RMSE'
, 'Correlation'
, и 'SampleMeanError'
. AccMeasure
имеет одну строку, если только lgdModel
измеряется точность, и она имеет две строки, если задана информация об образце модели. Имена строк AccMeasure
сообщить идентификатор модели и данные (при наличии).
AccData
- Данные точности Данные точности, возвращенные как таблица с наблюдаемыми значениями LGD, предсказанными значениями LGD и невязками (наблюдаемые минус предсказанные). Дополнительные столбцы для предсказанных и остаточных значений включены в образец модели, если они предусмотрены. The ModelID
и ReferenceID
метки добавляются в имена столбцов.
Model accuracy измеряет точность предсказанной вероятности значений LGD, используя различные метрики.
R-квадрат - чтобы вычислить R-квадрат метрики, modelAccuracy
подходит для линейной регрессии наблюдаемых значений LGD по сравнению с предсказанными значениями LGD
Сообщается R-квадрат этой регрессии. Для получения дополнительной информации смотрите Коэффициент детерминации (R-Квадрат).
RMSE - для вычисления корневой средней квадратной ошибки (RMSE), modelAccuracy
использует следующую формулу N где количество наблюдений:
Корреляция - Это корреляция между наблюдаемым и предсказанным ЛГД:
Для получения дополнительной информации и подробной информации о различных типах корреляции см. corr
.
Средняя ошибка выборки - это различие между средним наблюдаемым LGD и средним предсказанным LGD или, эквивалентно, средним значением невязок:
[1] Baesens, Bart, Daniel Roesch, and Harald Scheule. Аналитика кредитных рисков: методы измерения, приложения и примеры в SAS. Уайли, 2016.
[2] Беллини, Тициано. МСФО (IFRS) 9 и CECL «Моделирование и валидация кредитных рисков: практическое руководство с примерами, используемыми в R и SAS». Сан-Диего, Калифорния: Elsevier, 2019.
fitLGDModel
| modelAccuracyPlot
| modelDiscrimination
| modelDiscriminationPlot
| predict
| Regression
| Tobit
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.