Информация о эффективности классификатора
Чтобы просмотреть информацию о производительности классификатора, создайте classperformance
объект при помощи classperf
функция. Используйте запись через точку для доступа к свойствам объекта, таким как CorrectRate
, ErrorRate
, Sensitivity
, и Specificity
.
Label
- Имя объекта''
(по умолчанию) | вектор символовИмя объекта, заданное как вектор символов. Используйте запись через точку, чтобы задать это свойство.
Пример:
'cp_kfold'
Типы данных: char
Description
- Описание объекта''
(по умолчанию) | вектор символовОписание объекта, заданное как вектор символов. Используйте запись через точку, чтобы задать это свойство.
Пример:
'performance_data_kfold'
Типы данных: char
ClassLabels
- Уникальный набор истинных метокЭто свойство доступно только для чтения.
Уникальный набор истинных меток из groundTruth
, заданный как вектор положительных целых чисел или массив ячеек из векторов символов. Это свойство эквивалентно выходу, когда вы запускаете уникальный
.(groundTruth
)
Пример:
{'ovarian','liver','normal'}
Типы данных: double
| cell
GroundTruth
- Истинные метки для всех наблюденийЭто свойство доступно только для чтения.
Истинные метки для всех наблюдений в вашем наборе данных, заданные как вектор положительных целых чисел или массив ячеек из векторов символов.
Пример:
{'ovarian','liver','normal','ovarian','ovarian','liver'}
Типы данных: double
| cell
NumberOfObservations
- Количество наблюденийЭто свойство доступно только для чтения.
Количество наблюдений в наборе данных, заданное как положительное целое число.
Пример:
200
Типы данных: double
ControlClasses
- Индексы для управления классами из истинных метокИндексы классов управления из истинных меток (ClassLabels
), заданный как вектор положительных целых чисел. Это свойство указывает на контрольные (или отрицательные) классы в диагностическом тесте. По умолчанию ControlClasses
содержит все классы, кроме первого класса, возвращенные grp2idx
.(groundTruth
)
Вы можете задать это свойство с помощью записи через точку или 'Negative'
аргумент пары "имя-значение" classperf
функция.
Пример:
[3]
Типы данных: double
TargetClasses
- Индексы к целевым классам из истинных меток Индексы к целевым классам из истинных меток (ClassLabels
), заданный как вектор положительных целых чисел. Это свойство указывает целевые (или положительные) классы в диагностическом тесте. По умолчанию TargetClasses
содержит первый класс, возвращенный grp2idx
.(groundTruth
)
Вы можете задать это свойство с помощью записи через точку или 'Positive'
аргумент пары "имя-значение" classperf
функция.
Пример:
[1 2]
Типы данных: double
SampleDistribution
- Количество оценок для каждой выборкиЭто свойство доступно только для чтения.
Количество вычислений для каждой выборки во время валидации, заданное в виде числового вектора. Для примера, если вы используете ресубституцию, SampleDistribution
является вектором таковых и ValidationCounter
= 1. Если у вас есть 10-кратная перекрестная валидация, SampleDistribution
является также вектором таковых, но ValidationCounter
= 10.
SampleDistribution
полезно при выполнении разбиений Монте-Карло тестовых наборов, и это может помочь определить, проверяется ли каждая выборка равное количество раз.
Пример:
[0 0 2 0]
Типы данных: double
ErrorDistribution
- Частота неправильной классификации каждой выборкиЭто свойство доступно только для чтения.
Частота неправильной классификации каждой выборки, заданная как числовой вектор.
Пример:
[0 0 1 0]
Типы данных: double
SampleDistributionByClass
- Частота истинных классов во время валидацииЭто свойство доступно только для чтения.
Частота истинных классов во время валидации, заданная как числовой вектор.
Пример:
[10 10 0]
Типы данных: double
ErrorDistributionByClass
- Частота ошибок для каждого классаЭто свойство доступно только для чтения.
Частота ошибок для каждого класса во время валидации, заданная как числовой вектор.
Пример:
[0 0 0]
Типы данных: double
ValidationCounter
- Количество валидацийЭто свойство доступно только для чтения.
Количество валидаций виде положительного целого числа.
Пример:
10
Типы данных: double
CountingMatrix
- Матрица неточностей классификацииЭто свойство доступно только для чтения.
Матрица неточностей классификации, заданная как числовой массив. Порядок строк и столбцов в матрице тот же, что и в grp2idx(groundTruth)
. Столбцы представляют истинные классы, а строки - предсказание классификатора. Последняя строка в CountingMatrix
зарезервирован для подсчета неубедительных результатов.
Пример:
[10 0 0;0 10 0; 0 0 0; 0 0 0]
Типы данных: double
CorrectRate
- Правильная скорость классификатораЭто свойство доступно только для чтения.
Правильная скорость классификатора, заданная как положительная скалярная величина. CorrectRate
определяется как количество правильно классифицированных выборок, разделенное на количество классифицированных выборок. Неубедительные результаты не учитываются.
Пример: 1
Типы данных: double
ErrorRate
- Вероятность ошибок классификатораЭто свойство доступно только для чтения.
Вероятность ошибок классификатора, заданная как положительная скалярная величина. ErrorRate
определяется как количество неправильно классифицированных выборок, разделенных на количество классифицированных выборок. Неубедительные результаты не учитываются.
Пример: 0
Типы данных: double
LastCorrectRate
- Правильная скорость классификатора во время последнего запускаЭто свойство доступно только для чтения.
Правильная скорость классификатора во время последнего прогона проверки, заданная как положительная скалярная величина. В отличие от CorrectRate
, LastCorrectRate
применяется только к оцененным выборкам из последнего запуска валидации объекта эффективности классификатора.
Пример: 1
Типы данных: double
LastErrorRate
- Вероятность ошибок классификатора при последней валидацииЭто свойство доступно только для чтения.
Вероятность ошибок классификатора во время последнего прогона проверки, заданная как положительная скалярная величина. В отличие от ErrorRate
, LastErrorRate
применяется только к оцененным выборкам из последнего запуска валидации объекта эффективности классификатора.
Пример: 0
Типы данных: double
InconclusiveRate
- Неубедительная скорость классификатораЭто свойство доступно только для чтения.
Неубедительная скорость классификатора, заданная как положительная скалярная величина. InconclusiveRate
определяется как количество неклассифицированных (нерезультативных) выборок, разделенных на общее количество выборок.
Пример: 0
Типы данных: double
ClassifiedRate
- Классифицированная норма классификатораЭто свойство доступно только для чтения.
Классифицированная скорость классификатора, заданная как положительная скалярная величина. ClassifiedRate
определяется как количество классифицированных выборок, разделенных на общее количество выборок.
Пример: 1
Типы данных: double
Sensitivity
- Чувствительность классификатораЭто свойство доступно только для чтения.
Чувствительность классификатора, заданная как положительная скалярная величина. Sensitivity
определяется как количество правильно классифицированных положительных выборок, разделенных на количество истинно положительных выборок.
Неубедительные результаты, которые являются истинными положительными результатами, считаются ошибками для вычислений Sensitivity
. Другими словами, неубедительные результаты могут снизить диагностическое значение теста.
Пример: 1
Типы данных: double
Specificity
- Специфика классификатораЭто свойство доступно только для чтения.
Специфика классификатора, заданная как положительная скалярная величина. Specificity
определяется как количество правильно классифицированных отрицательных выборок, разделенных на количество истинно отрицательных выборок.
Неубедительные результаты, которые являются истинными негативами, учитываются как ошибки для вычислений Specificity
. Другими словами, неубедительные результаты могут снизить диагностическое значение теста.
Пример:
0.8
Типы данных: double
PositivePredictiveValue
- Положительное прогнозирующее значение классификатораЭто свойство доступно только для чтения.
Положительное прогнозирующее значение классификатора, заданное как положительная скалярная величина. PositivePredictiveValue
определяется как количество правильно классифицированных положительных выборок, разделенных на количество положительных классифицированных выборок.
Неубедительные результаты классифицируются как отрицательные при вычислении PositivePredictiveValue
.
Пример: 1
Типы данных: double
NegativePredictiveValue
- Отрицательное прогнозирующее значение классификатораЭто свойство доступно только для чтения.
Отрицательное прогнозирующее значение классификатора, заданное как положительная скалярная величина. NegativePredictiveValue
определяется как количество правильно классифицированных отрицательных выборок, разделенных на количество отрицательных классифицированных выборок.
Неубедительные результаты классифицируются как положительные при вычислении NegativePredictiveValue
.
Пример: 1
Типы данных: double
PositiveLikelihood
- Положительная вероятность классификатораЭто свойство доступно только для чтения.
Положительная вероятность классификатора, заданная как положительная скалярная величина. PositiveLikelihood
определяется как
.Sensitivity
/ (1 - Specificity
)
Пример: 5
Типы данных: double
NegativeLikelihood
- Отрицательная вероятность классификатораЭто свойство доступно только для чтения.
Отрицательная вероятность классификатора, заданная как положительная скалярная величина. NegativeLikelihood
определяется как (1 -
.Sensitivity
) / Specificity
Пример: 0
Типы данных: double
Prevalence
- Распространенность классификатораЭто свойство доступно только для чтения.
Распространенность классификатора, заданная как положительная скалярная величина. Prevalence
определяется как количество истинных положительных выборок, разделенных на общее количество выборок.
Пример: 1
Типы данных: double
DiagnosticTable
- Диагностическая таблицаЭто свойство доступно только для чтения.
Диагностическая таблица, заданная как числовой массив два на два. Первая строка указывает количество выборок, классифицированных как положительные, с количеством истинных срабатываний в первом столбце и количеством ложных срабатываний во втором столбце. Вторая строка указывает количество выборок, классифицированных как отрицательные, с количеством ложных срабатываний в первом столбце и количеством истинных срабатываний во втором столбце.
Правильные классификации появляются в диагональных элементах, а ошибки - в off-диагональных элементах. Неубедительные результаты считаются ошибками и подсчитываются в недиагональных элементах. Например, см. Пример диагностической таблицы.
Пример:
[20 0;0 0]
Типы данных: double
Предположим, что исследование рака, проведенное 10 пациентами, дает эти результаты.
Пациент | Выходы классификатора | Имеет рак |
---|---|---|
1 | Положительный | Да |
2 | Положительный | Да |
3 | Положительный | Да |
4 | Положительный | Нет |
5 | Отрицательный | Да |
6 | Отрицательный | Нет |
7 | Отрицательный | Нет |
8 | Отрицательный | Нет |
9 | Отрицательный | Нет |
10 | Неокончательный | Да |
Используя эти результаты, функция вычисляет DiagnosticTable
следующим образом:
classify
| classperf
| crossvalind
| grp2idx
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.