Опишите генерированные признаки
describe( распечатывает описание признаковTransformer), генерированных Transformer. Создайте FeatureTransformer объект Transformer при помощи gencfeatures функция.
describe( распечатывает описание функций, идентифицированных Transformer,Index)Index.
Генерируйте признаки из таблицы данных о предикторе при помощи gencfeatures. Смотрите генерированные признаки при помощи describe объектная функция.
Считайте данные об отключении электроэнергии в рабочую область как таблица. Удалите наблюдения с отсутствующими значениями и отобразите первые несколько строк таблицы.
outages = readtable("outages.csv");
Tbl = rmmissing(outages);
head(Tbl)ans=8×6 table
Region OutageTime Loss Customers RestorationTime Cause
_____________ ________________ ______ __________ ________________ ___________________
{'SouthWest'} 2002-02-01 12:18 458.98 1.8202e+06 2002-02-07 16:50 {'winter storm' }
{'SouthEast'} 2003-02-07 21:15 289.4 1.4294e+05 2003-02-17 08:14 {'winter storm' }
{'West' } 2004-04-06 05:44 434.81 3.4037e+05 2004-04-06 06:10 {'equipment fault'}
{'MidWest' } 2002-03-16 06:18 186.44 2.1275e+05 2002-03-18 23:23 {'severe storm' }
{'West' } 2003-06-18 02:49 0 0 2003-06-18 10:54 {'attack' }
{'NorthEast'} 2003-07-16 16:23 239.93 49434 2003-07-17 01:12 {'fire' }
{'MidWest' } 2004-09-27 11:09 286.72 66104 2004-09-27 16:37 {'equipment fault'}
{'SouthEast'} 2004-09-05 17:48 73.387 36073 2004-09-05 20:46 {'equipment fault'}
Некоторые переменные, такие как OutageTime и RestorationTime, имейте типы данных, которые не поддерживаются функциями обучения классификатора как fitcensemble.
Генерируйте 25 признаков от предикторов в Tbl это может использоваться, чтобы обучить уволенный ансамбль. Задайте Region табличная переменная как ответ.
Transformer = gencfeatures(Tbl,"Region",25,"TargetLearner","bag")
Transformer =
FeatureTransformer with properties:
Type: 'classification'
TargetLearner: 'bag'
NumEngineeredFeatures: 22
NumOriginalFeatures: 3
TotalNumFeatures: 25
Transformer объект содержит информацию о генерированных признаках, и преобразования раньше создавали их.
Чтобы лучше изучить генерированные признаки, используйте describe объектная функция.
Info = describe(Transformer)
Info=25×4 table
Type IsOriginal InputVariables Transformations
___________ __________ ___________________________ _________________________________________________________________________________________________________________
Loss Numeric true Loss ""
Customers Numeric true Customers ""
c(Cause) Categorical true Cause "Variable of type categorical converted from a cell data type"
RestorationTime-OutageTime Numeric false OutageTime, RestorationTime "Elapsed time in seconds between OutageTime and RestorationTime"
sdn(OutageTime) Numeric false OutageTime "Serial date number from 01-Feb-2002 12:18:00"
woe3(c(Cause)) Numeric false Cause "Variable of type categorical converted from a cell data type -> Weight of Evidence (positive class = SouthEast)"
doy(OutageTime) Numeric false OutageTime "Day of the year"
year(OutageTime) Numeric false OutageTime "Year"
kmd1 Numeric false Loss, Customers "Euclidean distance to centroid 1 (kmeans clustering with k = 10)"
kmd5 Numeric false Loss, Customers "Euclidean distance to centroid 5 (kmeans clustering with k = 10)"
quarter(OutageTime) Numeric false OutageTime "Quarter of the year"
woe2(c(Cause)) Numeric false Cause "Variable of type categorical converted from a cell data type -> Weight of Evidence (positive class = NorthEast)"
year(RestorationTime) Numeric false RestorationTime "Year"
month(OutageTime) Numeric false OutageTime "Month of the year"
Loss.*Customers Numeric false Loss, Customers "Loss .* Customers"
tods(OutageTime) Numeric false OutageTime "Time of the day in seconds"
⋮
Info таблица показывает следующее:
Первые три генерированных признака являются исходными к Tbl, несмотря на то, что программное обеспечение преобразует исходный Cause переменная к категориальной переменной c(Cause).
OutageTime и RestorationTime переменные не включены как генерированные признаки, потому что они - datetime переменные, которые не могут использоваться, чтобы обучить сложенную в мешок модель ансамбля. Однако программное обеспечение выводит многие генерированные признаки от этих переменных, таких как четвертая функция RestorationTime-OutageTime.
Некоторыми генерированными признаками является комбинация нескольких преобразований. Например, программное обеспечение генерирует шестой признак woe3(c(Cause)) путем преобразования Cause переменная к категориальной переменной и затем вычислению Веса значений Доказательства для получившейся переменной.
Transformer — Покажите трансформаторFeatureTransformer объектПокажите трансформатор в виде FeatureTransformer объект.
Index — Функции, чтобы описатьФункции, чтобы описать в виде числового или логического вектора, указывающего на положение функций, или массив строк или массив ячеек из символьных векторов, указывающий на имена функций.
Пример: 1:12
Типы данных: single | double | logical | string | cell
Info — Покажите описанияПокажите описания, возвращенные как таблица. Каждая строка соответствует генерированному признаку, и каждый столбец предоставляет следующую информацию.
| ColumnName | Описание |
|---|---|
Type | Указывает на тип данных функции, любого numeric или categorical
|
IsOriginal | Указывает, является ли функцией исходная функция (true) или спроектированная функция (false) |
InputVariables | Указывает, что исходные функции раньше генерировали признак |
Transformations | Описывает преобразования, используемые, чтобы генерировать признак, в порядке, они применяются — Для получения дополнительной информации, видят Преобразования Функции. |
Эта таблица предоставляет дополнительную информацию о некоторых более комплексных описаниях преобразования функции в Info.Transformations.
| Демонстрационное имя функции | Демонстрационное описание преобразования в Info | Дополнительная информация |
|---|---|---|
eb4(Variable) | Equal-width binning (number of bins = 4) | Программное обеспечение разделяет Variable значения в 4 интервалы равной ширины. Получившейся функцией является категориальная переменная. |
fenc(Variable) | Frequency encoding (number of levels = 10) | Программное обеспечение вычисляет частоту 10 категории (или уровни) в Variable. В получившейся функции программное обеспечение заменяет каждое категориальное значение на соответствующую частоту категории, создавая числовую переменную. |
kmc1 | Centroid encoding (component #1) (kmeans clustering with k = 10) | Программное обеспечение использует k - означает кластеризироваться, чтобы присвоить каждое наблюдение одному из 10 кластеры. Каждая строка в получившейся функции соответствует наблюдению и является 1компонент Св. кластерного центроида сопоставлен с тем наблюдением. Получившейся функцией является числовая переменная. |
kmd4 | Euclidean distance to centroid 4 (kmeans clustering with k = 10) | Программное обеспечение использует k - означает кластеризироваться, чтобы присвоить каждое наблюдение одному из 10 кластеры. Каждая строка в получившейся функции является Евклидовым расстоянием от соответствующего наблюдения до центроида 4кластер th. Получившейся функцией является числовая переменная. |
kmi | Cluster index encoding (kmeans clustering with k = 10) | Программное обеспечение использует k - означает кластеризироваться, чтобы присвоить каждое наблюдение одному из 10 кластеры. Каждая строка в получившейся функции является кластерным индексом для соответствующего наблюдения. Получившейся функцией является категориальная переменная. |
q50(Variable) | Equiprobable binning (number of bins = 50) | Программное обеспечение разделяет Variable значения в 50 интервалы равной вероятности. Получившейся функцией является категориальная переменная. |
woe5(Variable) | Weight of Evidence (positive class = Class5) | Программное обеспечение выполняет следующие шаги, чтобы создать получившуюся функцию:
|
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.