predict

Прогнозируйте метки с помощью дискриминантной модели классификации анализа

Синтаксис

label = predict(Mdl,X)

[label,score,cost]
= predict(Mdl,X)

Описание

label = predict(Mdl,X) возвращает вектор предсказанных меток классов для данных предиктора в таблице или матрице X, на основе обученной классификационной модели дискриминантного анализа Mdl.

[label,score,cost] = predict(Mdl,X) также возвращает:

Матрица классификационных оценок (score), указывающий вероятность того, что метка происходит от определенного класса. Для дискриминантного анализа счетов являются апостериорными вероятностями.
Матрица ожидаемых классификационных затрат (cost). Для каждого наблюдения в X, предсказанная метка класса соответствует минимальным ожидаемым затратам классификации среди всех классов.

Входные параметры

расширить все

`Mdl` - Дискриминантная модель классификации анализа
`ClassificationDiscriminant` объект модели | `CompactClassificationDiscriminant` объект модели

Модель классификации дискриминантного анализа, заданная как ClassificationDiscriminant или CompactClassificationDiscriminant объект модели, возвращенный fitcdiscr.

`X` - Данные предиктора, которые будут классифицированы
числовая матрица | таблица

Данные предиктора, которые будут классифицированы, заданные как числовая матрица или таблица.

Каждая строка X соответствует одному наблюдению, и каждый столбец соответствует одной переменной. Все переменные предиктора в X должны быть числовыми векторами.

Для числовой матрицы - переменные, которые составляют столбцы X должен иметь тот же порядок, что и переменные предиктора, которые обучали Mdl.
Для таблицы:
- predict не поддерживает многополюсные переменные и массивы ячеек, кроме массивов ячеек векторов символов.
- Если вы тренировались Mdl использование таблицы (для примера, Tbl), затем все переменные предиктора в X должны иметь те же имена переменных и типы данных, что и обученные Mdl (хранится в Mdl.PredictorNames). Однако порядок столбцов X не должен соответствовать порядку столбцов Tbl. Tbl и X может содержать дополнительные переменные (переменные отклика, веса наблюдений и т.д.), но predict игнорирует их.
- Если вы тренировались Mdl используя числовую матрицу, затем имена предикторов в Mdl.PredictorNames и соответствующие имена переменных предиктора в X должно быть то же самое. Чтобы задать имена предикторов во время обучения, смотрите PredictorNames Аргумент пары "имя-значение" из fitcdiscr. X может содержать дополнительные переменные (переменные отклика, веса наблюдений и т.д.), но predict игнорирует их.

Типы данных: table | double | single

Выходные аргументы

расширить все

`label` - Предсказанные метки классов
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из векторов символов

Предсказанные метки классов, возвращенные как категориальный или символьный массив, логический или числовой вектор или массив ячеек из векторов символов.

label:

Является совпадающим типом данных, что и наблюдаемые метки классов (Y) который обучал Mdl. (Программа обрабатывает массивы строк как массивы ячеек векторов символов.)
Имеет длину, равную количеству строк X.

`score` - Предсказанные апостериорные вероятности класса
числовая матрица

Предсказанные апостериорные вероятности класса, возвращенные как числовая матрица размера N-by- K. N количество наблюдений (строк) в X, и K количество классов (в Mdl.ClassNames). score(i,j) - апостериорная вероятность того, что наблюдение i в X является классом j в Mdl.ClassNames.

`cost` - Ожидаемые классификационные затраты
числовая матрица

Ожидаемые классификационные затраты, возвращенные как матрица размера N-by- K. N количество наблюдений (строк) в X, и K количество классов (в Mdl.ClassNames). cost(i,j) - стоимость классификации строки i от X как класс j в Mdl.ClassNames.

Примеры

расширить все

Предсказание меток классов с помощью дискриминантной модели анализа

Попробовать в MATLAB

Загрузите набор данных радужки Фишера. Определите размер выборки.

load fisheriris
N = size(meas,1);

Разделите данные на обучающие и тестовые наборы. Продержитесь 10% данных для проверки.

rng(1); % For reproducibility
cvp = cvpartition(N,'Holdout',0.1);
idxTrn = training(cvp); % Training set indices
idxTest = test(cvp);    % Test set indices

Сохраните обучающие данные в таблице.

tblTrn = array2table(meas(idxTrn,:));
tblTrn.Y = species(idxTrn);

Обучите дискриминантную модель анализа с помощью опций набора обучающих данных и по умолчанию.

Mdl = fitcdiscr(tblTrn,'Y');

Спрогнозируйте метки для тестового набора. Вы обучали Mdl используя таблицу данных, но можно предсказать метки с помощью матрицы.

labels = predict(Mdl,meas(idxTest,:));

Создайте матрицу неточностей для тестового набора.

confusionchart(species(idxTest),labels)

Figure contains an object of type ConfusionMatrixChart.

Mdl ошибочно классифицирует одну ирису версиколора как virginica в тестовом наборе.

Апостериорные области вероятностей класса Plot

Попробовать в MATLAB

Загрузите набор данных радужки Фишера. Рассмотрите обучение, используя только длины и ширины лепестков.

load fisheriris
X = meas(:,3:4);

Обучите квадратичную модель дискриминантного анализа, используя весь набор данных.

Mdl = fitcdiscr(X,species,'DiscrimType','quadratic');

Задайте сетку значений в наблюдаемом пространстве предикторов. Спрогнозируйте апостериорные вероятности для каждого образца в сетке.

xMax = max(X);
xMin = min(X);
d = 0.01;
[x1Grid,x2Grid] = meshgrid(xMin(1):d:xMax(1),xMin(2):d:xMax(2));

[~,score] = predict(Mdl,[x1Grid(:),x2Grid(:)]);
Mdl.ClassNames

ans = 3x1 cell
    {'setosa'    }
    {'versicolor'}
    {'virginica' }

score является матрицей апостериорных вероятностей классов. Столбцы соответствуют классам в Mdl.ClassNames. Для примера, score(j,1) - апостериорная вероятность того, что наблюдение j является сетозой радужной оболочки.

Постройте график апостериорной вероятности классификации версиколоров для каждого наблюдения в сетке и постройте график обучающих данных.

figure;
contourf(x1Grid,x2Grid,reshape(score(:,2),size(x1Grid,1),size(x1Grid,2)));
h = colorbar;
caxis([0 1]);
colormap jet;
hold on
gscatter(X(:,1),X(:,2),species,'mcy','.x+');
axis tight
title('Posterior Probability of versicolor'); 
hold off

Figure contains an axes. The axes with title Posterior Probability of versicolor contains 4 objects of type contour, line. These objects represent setosa, versicolor, virginica.

Апостериорная область вероятности открывает фрагмент контура принятия решения.

Подробнее о

расширить все

Апостериорная вероятность

Апостериорная вероятность того, что x точек принадлежит классу k, является продуктом априорной вероятности и многомерной нормальной плотности. Плотность распределения многомерного нормального с 1-by-<reservedrangesplaceholder6>, средним μk и d d ковариацией Σ <reservedrangesplaceholder2> в точке 1-by-<reservedrangesplaceholder1> x,

$P (x | k) = \frac{1}{{({(2 π)}^{d} | Σ_{k} |)}^{1 / 2}} \exp (- \frac{1}{2} (x - μ_{k}) Σ_{k}^{- 1} {(x - μ_{k})}^{T}),$

где $| Σ_{k} |$ является определяющим, и, k, $Σ_{k}^{- 1}$ - обратная матрица.

Пусть P (k) представляет априорную вероятность k класса. Тогда апостериорная вероятность того, что x наблюдения имеет класс k,

$\hat{P} (k | x) = \frac{P (x | k) P (k)}{P (x)},$

где P (<reservedrangesplaceholder6>) является постоянной нормализацией, сумма по k P (x | k) P (<reservedrangesplaceholder0>).

Предварительная вероятность

Предыдущая вероятность является одним из трех вариантов:

'uniform' - априорная вероятность k классов на единицу превышает общее количество классов.
'empirical' - априорная вероятность k классов количество обучающих выборок класса k разделенный на общее количество обучающих выборок.
Custom - априорная вероятность k классов является kпервый элемент prior вектор. Посмотрите fitcdiscr.

После создания классификационной модели (Mdl) можно задать предшествующее с помощью записи через точку:

Mdl.Prior = v;

где v является вектором положительных элементов, представляющих частоту, с которой происходит каждый элемент. Вам не нужно переобучать классификатор, когда вы задаете новый предыдущий.

Стоимость

Матрица ожидаемых затрат на наблюдение определяется в Затратах.

Предсказанная метка класса

predict классифицирует так, чтобы минимизировать ожидаемые классификационные затраты:

$\hat{y} = \underset{y = 1, ..., K}{\arg \min} \sum_{k = 1}^{K} \hat{P} (k | x) C (y | k),$

где

$\hat{y}$ - предсказанная классификация.
K - количество классов.
$\hat{P} (k | x)$ - апостериорная вероятность k классов для x наблюдений.
$C (y | k)$ - стоимость классификации наблюдения как y, когда его истинный класс k.

Расширенные возможности

Длинные» массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Эта функция полностью поддерживает длинные массивы. Вы можете использовать модели, обученные на памяти или высоких данных с этой функцией.

Для получения дополнительной информации см. Раздел «Длинные массивы»

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Указания и ограничения по применению:

Использовать saveLearnerForCoder, loadLearnerForCoder, и codegen (MATLAB Coder), чтобы сгенерировать код для predict функция. Сохраните обученную модель при помощи saveLearnerForCoder. Задайте функцию точки входа, которая загружает сохраненную модель при помощи loadLearnerForCoder и вызывает predict функция. Затем используйте codegen чтобы сгенерировать код для функции точки входа.
Чтобы сгенерировать одноточный код C/C + + для предсказания, задайте аргумент имя-значение 'DataType','single' когда вы вызываете loadLearnerForCoder функция.

Эта таблица содержит примечания к аргументам predict. Аргументы, не включенные в эту таблицу, полностью поддерживаются.

Аргумент Примечания и ограничения

Аргумент	Примечания и ограничения
`Mdl`	Для указаний по применению и ограничений объекта модели, смотрите Генерацию кода CompactClassificationDiscriminant объект.
`X`	`X` должна быть матрицей одинарной точности или двойной точности или таблицей, содержащей числовые переменные. Количество строк или наблюдений в `X` может быть размером переменной, но количеством столбцов в `X` должен быть фиксирован. Если вы хотите задать `X` в качестве таблицы, тогда ваша модель должна быть обучена с помощью таблицы, а ваша функция точки входа для предсказания должна: Примите данные как массивы. Составьте таблицу из входных параметров данных и задайте имена переменных в таблице. Передайте таблицу в `predict`. Пример этого рабочего процесса таблицы см. в разделе Генерация кода для классификации данных в таблице. Для получения дополнительной информации об использовании таблиц в генерации кода смотрите Генерация кода для таблиц (MATLAB Coder) и Ограничения таблицы для генерации кода (MATLAB Coder).

Mdl

Для указаний по применению и ограничений объекта модели, смотрите Генерацию кода CompactClassificationDiscriminant объект.

X

X должна быть матрицей одинарной точности или двойной точности или таблицей, содержащей числовые переменные.
Количество строк или наблюдений в X может быть размером переменной, но количеством столбцов в X должен быть фиксирован.
Если вы хотите задать X в качестве таблицы, тогда ваша модель должна быть обучена с помощью таблицы, а ваша функция точки входа для предсказания должна:
- Примите данные как массивы.
- Составьте таблицу из входных параметров данных и задайте имена переменных в таблице.
- Передайте таблицу в predict.
Пример этого рабочего процесса таблицы см. в разделе Генерация кода для классификации данных в таблице. Для получения дополнительной информации об использовании таблиц в генерации кода смотрите Генерация кода для таблиц (MATLAB Coder) и Ограничения таблицы для генерации кода (MATLAB Coder).

Для получения дополнительной информации смотрите Введение в генерацию кода.

См. также

Темы

Классификация дискриминантного анализа

Введенный в R2011b

Statistics and Machine Learning Toolbox документация

Поддержка

Сообщество Экспонента

Документация

predict

Синтаксис

Описание

Входные параметры

Mdl - Дискриминантная модель классификации анализа ClassificationDiscriminant объект модели | CompactClassificationDiscriminant объект модели

X - Данные предиктора, которые будут классифицированы числовая матрица | таблица

Выходные аргументы

label - Предсказанные метки классов категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из векторов символов

score - Предсказанные апостериорные вероятности класса числовая матрица

cost - Ожидаемые классификационные затраты числовая матрица

Примеры

Предсказание меток классов с помощью дискриминантной модели анализа

Апостериорные области вероятностей класса Plot

Подробнее о

Апостериорная вероятность

Предварительная вероятность

Стоимость

Предсказанная метка класса

Расширенные возможности

Длинные» массивы Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C + + Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

См. также

Темы

Statistics and Machine Learning Toolbox документация

Поддержка

`Mdl` - Дискриминантная модель классификации анализа
`ClassificationDiscriminant` объект модели | `CompactClassificationDiscriminant` объект модели

`X` - Данные предиктора, которые будут классифицированы
числовая матрица | таблица

`label` - Предсказанные метки классов
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из векторов символов

`score` - Предсказанные апостериорные вероятности класса
числовая матрица

`cost` - Ожидаемые классификационные затраты
числовая матрица

Длинные» массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®