Закодируйте метки данных в одногорячие векторы
кодирует метки данных в категориальном массиве B
= onehotencode(A
,featureDim
)A
в одногорячий закодированный массив B
. Функция заменяет каждый элемент A
с числовым вектором из длины равняются количеству уникальных классов в A
по измерению, заданному featureDim
. Вектор содержит 1
в положении, соответствующем классу метки в A
, и 0
в любом положении. Любой <undefined>
значения закодированы к NaN
значения.
кодирует метки категориальных данных в таблице tblB
= onehotencode(tblA
)tblA
в таблицу одногорячих закодированных числовых значений. Функция заменяет одну переменную tblA
со столькими же переменных сколько количество уникальных классов в tblA
. Каждая строка в tblB
содержит 1
в переменной, соответствующей классу метки в tlbA
, и 0
во всех других переменных.
___ = onehotencode(___,
кодирует метки в числовые значения типа данных typename
)typename
. Используйте этот синтаксис с любым из аргументов ввода и вывода в предыдущих синтаксисах.
___ = onehotencode(___,'ClassNames',
также задает имена классов, чтобы использовать для кодирования. Используйте этот синтаксис когда classes
)A
или tblA
не содержит категориальные значения, когда это необходимо, чтобы исключить любые метки класса из того, чтобы быть закодированным, или, когда это необходимо, закодировать векторные элементы в определенном порядке. Любая метка в A
или tblA
из класса, который не существует в classes
закодирован к вектору из NaN
значения.
Чтобы закодировать метки данных, можно также использовать dummyvar
, который создает фиктивные переменные из сгруппированных переменных. Следующая таблица выдерживает сравнение onehotencode
и dummyvar
функции для различных вариантов использования.
Вариант использования | Когда использовать onehotencode | Когда использовать dummyvar |
---|---|---|
Кодирование нескольких переменных | Использование onehotencode в цикле. Для примера смотрите Одногорячий, Кодируют Таблицу с Несколькими Переменными. | Задайте входной параметр group как массив ячеек или положительная целочисленная матрица. Для примеров смотрите, Создают Фиктивные Переменные из Нескольких Сгруппированных переменных и Создают Фиктивные Переменные из Числовых Сгруппированных переменных. |
Кодирование переменной в формате массива ячеек | Преобразуйте переменную массива ячеек в категориальный массив. | Задайте входной параметр group как массив ячеек, содержащий одну или несколько сгруппированных переменных. |
Кодирование некатегориальных меток данных | Задайте метки данных как категориальный массив или задайте классы, чтобы закодировать использование ClassNames аргумент значения имени. Для примера смотрите Одногорячий, Кодируют Подмножество Классов. | Вы не должны преобразовывать метки данных, потому что dummyvar принимает некатегориальные сгруппированные переменные как вход. |
Кодирование массива меток данных | Задайте размерность, чтобы расшириться (featureDim ). | Программное обеспечение автоматически определяет размерность, чтобы расшириться. dummyvar возвращает фиктивные переменные как числовой массив со столбцами, созданными из столбцов входных сгруппированных переменных. |
Во многих случаях вы не должны использовать onehotencode
или dummyvar
функция для кодирования. Большинство функций Statistics and Machine Learning Toolbox™ может работать непосредственно с категориальными данными об ответе. Большая часть классификации и функций регрессии также принимают категориальные предикторы.