predict

Предскажите метки с помощью k - самая близкая соседняя модель классификации

Синтаксис

label = predict(mdl,X)

[label,score,cost]
= predict(mdl,X)

Описание

label = predict(mdl,X) возвращает вектор предсказанных меток класса для данных о предикторе в таблице или матричном X, на основе обученного k - самая близкая соседняя модель mdl классификации. Смотрите предсказанную метку класса.

пример

[label,score,cost] = predict(mdl,X) также возвращается:

Матрица A классификационных оценок (score) указание на вероятность, что метка прибывает из конкретного класса. Для k - самый близкий сосед, баллы являются апостериорными вероятностями. Смотрите Апостериорную вероятность.
Матрица A ожидаемой стоимости классификации (cost). Для каждого наблюдения в X, предсказанная метка класса соответствует минимальным ожидаемым затратам классификации среди всех классов. Смотрите Ожидаемую Стоимость.

Примеры

свернуть все

Предсказания Классификации k - ближайших соседей

Скрипт Open Live Script

Создайте классификатор k - ближайших соседей для ирисовых данных Фишера, где k = 5. Оцените некоторые предсказания модели на новых данных.

Загрузите ирисовый набор данных Фишера.

load fisheriris
X = meas;
Y = species;

Создайте классификатор для пяти самых близких соседей. Стандартизируйте некатегориальные данные о предикторе.

mdl = fitcknn(X,Y,'NumNeighbors',5,'Standardize',1);

Предскажите классификации для цветов с минимумом, средним значением и максимальными характеристиками.

Xnew = [min(X);mean(X);max(X)];
[label,score,cost] = predict(mdl,Xnew)

label = 3x1 cell
    {'versicolor'}
    {'versicolor'}
    {'virginica' }

score = 3×3

    0.4000    0.6000         0
         0    1.0000         0
         0         0    1.0000

cost = 3×3

    0.6000    0.4000    1.0000
    1.0000         0    1.0000
    1.0000    1.0000         0

Вторые и третьи строки счета и матриц стоимости имеют двоичные значения, что означает, что у всех пяти самых близких соседей средних и максимальных цветочных измерений есть идентичные классификации.

Входные параметры

свернуть все

`mdl` — k - самая близкая соседняя модель классификатора
`ClassificationKNN` объект

модель классификатора k - ближайших соседей в виде ClassificationKNN объект.

`X` — Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

Данные о предикторе, которые будут классифицированы в виде числовой матрицы или таблицы.

Каждая строка X соответствует одному наблюдению, и каждый столбец соответствует одной переменной.

Для числовой матрицы:
- Переменные, которые составляют столбцы X должен иметь тот же порядок, как переменные предикторы раньше обучали mdl.
- Если вы обучаете mdl с помощью таблицы (например, Tbl), затем X может быть числовая матрица если Tbl содержит все числовые переменные предикторы. k - самая близкая соседняя классификация требует гомогенных предикторов. Поэтому обрабатывать все числовые предикторы в Tbl как категориальный во время обучения, набор 'CategoricalPredictors','all' когда вы обучаете использование fitcknn. Если Tbl содержит неоднородные предикторы (например, типы числовых и категориальных данных) и X числовая матрица, затем predict выдает ошибку.
Для таблицы:
- predict не поддерживает многостолбцовые переменные и массивы ячеек кроме массивов ячеек из символьных векторов.
- Если вы обучаете mdl с помощью таблицы (например, Tbl), затем все переменные предикторы в X должен иметь те же имена переменных и типы данных как используемые, чтобы обучить mdl (сохраненный в mdl.PredictorNames). Однако порядок следования столбцов X не должен соответствовать порядку следования столбцов Tbl. Оба Tbl и X может содержать дополнительные переменные (переменные отклика, веса наблюдения, и так далее), но predict игнорирует их.
- Если вы обучаете mdl с помощью числовой матрицы затем предиктор называет в mdl.PredictorNames и соответствующий переменный предиктор называет в X должно быть то же самое. Чтобы задать имена предиктора во время обучения, смотрите PredictorNames аргумент пары "имя-значение" fitcknn. Все переменные предикторы в X должны быть числовые векторы. X может содержать дополнительные переменные (переменные отклика, веса наблюдения, и так далее), но predict игнорирует их.

Если вы устанавливаете 'Standardize',true в fitcknn обучать mdl, затем программное обеспечение стандартизирует столбцы X использование соответствующих средних значений в mdl.Mu и стандартные отклонения в mdl.Sigma.

Типы данных: double | single | table

Выходные аргументы

свернуть все

`label` — Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

Предсказанный класс помечает для наблюдений (строки) в X, возвращенный как категориальный массив, символьный массив, логический вектор, вектор числовых значений или массив ячеек из символьных векторов. label имеет длину, равную количеству строк в X. Метка является классом с минимальной ожидаемой стоимостью. Смотрите Предсказанную Метку Класса.

`score` — Предсказанные баллы класса или апостериорные вероятности
числовая матрица

Предсказанные баллы класса или апостериорные вероятности, возвращенные как числовая матрица размера n-by-K. n является количеством наблюдений (строки) в X, и K является количеством классов (в mdl.ClassNames). score(i,j) апостериорная вероятность то наблюдение i в X имеет класс j в mdl.ClassNames. Смотрите апостериорную вероятность.

Типы данных: single | double

`cost` — Ожидаемые затраты классификации
числовая матрица

Ожидаемые затраты классификации, возвращенные как числовая матрица размера n-by-K. n является количеством наблюдений (строки) в X, и K является количеством классов (в mdl.ClassNames). cost(i,j) стоимость классификации строки i из X как класс j в mdl.ClassNames. Смотрите ожидаемую стоимость.

Типы данных: single | double

Алгоритмы

свернуть все

Предсказанная метка класса

predict классифицирует путем минимизации ожидаемой стоимости классификации:

$\hat{y} = \underset{y = 1, ..., K}{\arg \min} \sum_{j = 1}^{K} \hat{P} (j | x) C (y | j),$

где

$\hat{y}$ предсказанная классификация.
K является количеством классов.
$\hat{P} (j | x)$ апостериорная вероятность класса j для наблюдения x.
$C (y | j)$ стоимость классификации наблюдения как y, когда его истинным классом является j.

Апостериорная вероятность

Считайте вектор (точка единого запроса) xnew и модель mdl.

k является количеством самых близких соседей, используемых в предсказании, mdl.NumNeighbors.
nbd(mdl,xnew) задает k самые близкие соседи xnew в mdl.X.
Y(nbd) задает классификации точек в nbd(mdl,xnew), а именно, mdl.Y(nbd).
W(nbd) задает веса точек в nbd(mdl,xnew).
prior задает уголовное прошлое классов в mdl.Y.

Если модель содержит вектор априорных вероятностей, то веса наблюдения W нормированы классом, чтобы суммировать к уголовному прошлому. Этот процесс может включить вычисление для точки xnew, потому что веса могут зависеть от расстояния от xnew к точкам в mdl.X.

Апостериорная вероятность p (j |xnew)

$p (j | x new) = \frac{\sum_{i \in nbd} W (i) 1_{Y (X (i)) = j}}{\sum_{i \in nbd} W (i)} .$

Здесь, $1_{Y (X (i)) = j}$ 1 когда mdl.Y(i) = j, и 0 в противном случае.

Истинная стоимость Misclassification

Два затрат сопоставлены с классификацией KNN: истинная стоимость misclassification в классе и ожидаемом misclassification стоится на наблюдение.

Можно установить истинную стоимость misclassification в классе при помощи 'Cost' аргумент пары "имя-значение", когда вы запускаете fitcknn. Значение Cost(i,j) стоимость классификации наблюдения в класс j если его истинным классом является i. По умолчанию, Cost(i,j) = 1 если i ~= j, и Cost(i,j) = 0 если i = j. Другими словами, стоимостью является 0 для правильной классификации и 1 для неправильной классификации.

Ожидаемая стоимость

Два затрат сопоставлены с классификацией KNN: истинная стоимость misclassification в классе и ожидаемом misclassification стоится на наблюдение. Третий выход predict ожидаемая стоимость misclassification на наблюдение.

Предположим, что у вас есть Nobs наблюдения, что вы хотите классифицировать с обученным классификатором mdl, и у вас есть K классы. Вы помещаете наблюдения в матричный Xnew с одним наблюдением на строку. Команда

[label,score,cost] = predict(mdl,Xnew)

возвращает матричный cost из размера Nobs- K, среди других выходных параметров. Каждая строка cost матрица содержит ожидаемую (среднюю) стоимость классификации наблюдения в каждый K классы. cost(n,j)

$\sum_{i = 1}^{K} \hat{P} (i | X n e w (n)) C (j | i),$

где

K является количеством классов.
$\hat{P} (i | X n e w (n))$ апостериорная вероятность класса i для наблюдения Xnew (n).
$C (j | i)$ истинная misclassification стоимость классификации наблюдения как j, когда его истинным классом является i.

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Эта функция полностью поддерживает "высокие" массивы. Можно использовать модели, обученные или на или на высоких данных в оперативной памяти с этой функцией.

Для получения дополнительной информации смотрите Длинные массивы (MATLAB).

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Указания и ограничения по применению:

Используйте saveLearnerForCoder, loadLearnerForCoder, и codegen сгенерировать код для predict функция. Сохраните обученную модель при помощи saveLearnerForCoder. Задайте функцию точки входа, которая загружает сохраненную модель при помощи loadLearnerForCoder и вызывает predict функция. Затем используйте codegen сгенерировать код для функции точки входа.

Эта таблица содержит примечания об аргументах predict. Аргументы, не включенные в эту таблицу, полностью поддержаны.

Аргумент Примечания и ограничения

Аргумент	Примечания и ограничения
`mdl`	`ClassificationKNN` объект модели является полным объектом, который не имеет соответствующего компактного объекта. Для этой модели, `saveLearnerForCoder` сохраняет компактную версию, которая не включает свойства гипероптимизации параметров управления. Если `mdl` обученное использование модели kd-алгоритма-поиска-по-дереву, и типом сборки генерации кода является MEX-функция, затем `codegen` генерирует MEX-функцию с помощью Intel^® Threading Building Blocks (TBB) в параллельном расчете. В противном случае, `codegen` генерирует код с помощью `parfor`. MEX-функция для kd-алгоритма-поиска-по-дереву — `codegen` генерирует оптимизированное использование MEX-функции Intel TBB для параллельного расчета на многожильных платформах. Можно использовать MEX-функцию, чтобы ускорить алгоритмы MATLAB^®. Для получения дополнительной информации на Intel TBB, см. https://software.intel.com/en-us/intel-tbb. Если вы генерируете MEX-функцию, чтобы протестировать сгенерированный код `parfor` версия, можно отключить использование Intel TBB. Установите `ExtrinsicCalls` свойство настройки MEX возражает против `false`. Для получения дополнительной информации смотрите `coder.MexCodeConfig`. MEX-функция для алгоритма исчерпывающего поиска и автономного кода C/C++ для обоих алгоритмов — сгенерированный код `predict` использование `parfor` создать циклы, которые запускают параллельно на поддерживаемой общей памяти многожильные платформы в сгенерированном коде. Если ваш компилятор не поддерживает интерфейс приложения Open Multiprocessing (OpenMP), или вы отключаете библиотеку OpenMP, MATLAB Coder™ обрабатывает `parfor`- циклы как `for`- циклы. Чтобы найти поддерживаемые компиляторы, см. Поддерживаемые Компиляторы. Чтобы отключить библиотеку OpenMP, установите `EnableOpenMP` свойство настройки возражает против `false`. Для получения дополнительной информации смотрите `coder.CodeConfig`. Для указаний и ограничений по применению объекта модели смотрите Генерацию кода `ClassificationKNN` объект.
`X`	Для общей генерации кода, `X` должна быть матрица с двойной точностью или с одинарной точностью или таблица, содержащая `single` или `double` переменные предикторы. Если вы хотите задать `X` как таблица, затем ваша модель должна быть обучена с помощью таблицы, и необходимо гарантировать, что точка входа функционирует для предсказания: Принимает данные как массивы Составляет таблицу от аргументов ввода данных и задает имена переменных в таблице Передает таблицу `predict` Для примера этого табличного рабочего процесса смотрите, Генерируют Код, чтобы Классифицировать Числовые данные на Таблицу. Для получения дополнительной информации об использовании таблиц в генерации кода смотрите Генерацию кода для Таблиц (MATLAB Coder) и Табличные Ограничения для Генерации кода (MATLAB Coder). Количество строк или наблюдения, в `X` может быть переменный размер, но количество столбцов в `X` должен быть зафиксирован.

mdl

ClassificationKNN объект модели является полным объектом, который не имеет соответствующего компактного объекта. Для этой модели, saveLearnerForCoder сохраняет компактную версию, которая не включает свойства гипероптимизации параметров управления.
Если mdl обученное использование модели kd-алгоритма-поиска-по-дереву, и типом сборки генерации кода является MEX-функция, затем codegen генерирует MEX-функцию с помощью Intel^® Threading Building Blocks (TBB) в параллельном расчете. В противном случае, codegen генерирует код с помощью parfor.
- MEX-функция для kd-алгоритма-поиска-по-дереву — codegen генерирует оптимизированное использование MEX-функции Intel TBB для параллельного расчета на многожильных платформах. Можно использовать MEX-функцию, чтобы ускорить алгоритмы MATLAB^®. Для получения дополнительной информации на Intel TBB, см. https://software.intel.com/en-us/intel-tbb.
  Если вы генерируете MEX-функцию, чтобы протестировать сгенерированный код parfor версия, можно отключить использование Intel TBB. Установите ExtrinsicCalls свойство настройки MEX возражает против false. Для получения дополнительной информации смотрите coder.MexCodeConfig.
- MEX-функция для алгоритма исчерпывающего поиска и автономного кода C/C++ для обоих алгоритмов — сгенерированный код predict использование parfor создать циклы, которые запускают параллельно на поддерживаемой общей памяти многожильные платформы в сгенерированном коде. Если ваш компилятор не поддерживает интерфейс приложения Open Multiprocessing (OpenMP), или вы отключаете библиотеку OpenMP, MATLAB Coder™ обрабатывает parfor- циклы как for- циклы. Чтобы найти поддерживаемые компиляторы, см. Поддерживаемые Компиляторы. Чтобы отключить библиотеку OpenMP, установите EnableOpenMP свойство настройки возражает против false. Для получения дополнительной информации смотрите coder.CodeConfig.
Для указаний и ограничений по применению объекта модели смотрите Генерацию кода ClassificationKNN объект.

X

Для общей генерации кода, X должна быть матрица с двойной точностью или с одинарной точностью или таблица, содержащая single или double переменные предикторы.
Если вы хотите задать X как таблица, затем ваша модель должна быть обучена с помощью таблицы, и необходимо гарантировать, что точка входа функционирует для предсказания:
- Принимает данные как массивы
- Составляет таблицу от аргументов ввода данных и задает имена переменных в таблице
- Передает таблицу predict
Для примера этого табличного рабочего процесса смотрите, Генерируют Код, чтобы Классифицировать Числовые данные на Таблицу. Для получения дополнительной информации об использовании таблиц в генерации кода смотрите Генерацию кода для Таблиц (MATLAB Coder) и Табличные Ограничения для Генерации кода (MATLAB Coder).
Количество строк или наблюдения, в X может быть переменный размер, но количество столбцов в X должен быть зафиксирован.

Для получения дополнительной информации смотрите Введение в Генерацию кода.

Смотрите также

ClassificationKNN | fitcknn

Документация

predict

Синтаксис

Описание

Примеры

Предсказания Классификации k - ближайших соседей

Входные параметры

`mdl` — k - самая близкая соседняя модель классификатора
`ClassificationKNN` объект

`X` — Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

Выходные аргументы

`label` — Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

`score` — Предсказанные баллы класса или апостериорные вероятности
числовая матрица

`cost` — Ожидаемые затраты классификации
числовая матрица

Алгоритмы

Предсказанная метка класса

Апостериорная вероятность

Истинная стоимость Misclassification

Ожидаемая стоимость

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Представленный в R2012a

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

predict

Синтаксис

Описание

Примеры

Предсказания Классификации k - ближайших соседей

Входные параметры

mdl — k - самая близкая соседняя модель классификатора ClassificationKNN объект

X — Данные о предикторе, которые будут классифицированы числовая матрица | таблица

Выходные аргументы

label — Предсказанные метки класса категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

score — Предсказанные баллы класса или апостериорные вероятности числовая матрица

cost — Ожидаемые затраты классификации числовая матрица

Алгоритмы

Предсказанная метка класса

Апостериорная вероятность

Истинная стоимость Misclassification

Ожидаемая стоимость

Расширенные возможности

"Высокие" массивы Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++ Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Представленный в R2012a

Документация Statistics and Machine Learning Toolbox

Поддержка

`mdl` — k - самая близкая соседняя модель классификатора
`ClassificationKNN` объект

`X` — Данные о предикторе, которые будут классифицированы
числовая матрица | таблица

`label` — Предсказанные метки класса
категориальный массив | символьный массив | логический вектор | вектор числовых значений | массив ячеек из символьных векторов

`score` — Предсказанные баллы класса или апостериорные вероятности
числовая матрица

`cost` — Ожидаемые затраты классификации
числовая матрица

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.