Описание созданных функций
describe( печатает описание элементов, созданных Transformer)Transformer. Создать FeatureTransformer объект Transformer с помощью gencfeatures функция.
describe( печатает описание функций, идентифицированных Transformer,Index)Index.
Создание функций из таблицы данных предиктора с помощью gencfeatures. Проверьте созданные элементы с помощью describe объектная функция.
Считывание данных об отключении питания в рабочую область в виде таблицы. Удалите наблюдения с отсутствующими значениями и отобразите первые несколько строк таблицы.
outages = readtable("outages.csv");
Tbl = rmmissing(outages);
head(Tbl)ans=8×6 table
Region OutageTime Loss Customers RestorationTime Cause
_____________ ________________ ______ __________ ________________ ___________________
{'SouthWest'} 2002-02-01 12:18 458.98 1.8202e+06 2002-02-07 16:50 {'winter storm' }
{'SouthEast'} 2003-02-07 21:15 289.4 1.4294e+05 2003-02-17 08:14 {'winter storm' }
{'West' } 2004-04-06 05:44 434.81 3.4037e+05 2004-04-06 06:10 {'equipment fault'}
{'MidWest' } 2002-03-16 06:18 186.44 2.1275e+05 2002-03-18 23:23 {'severe storm' }
{'West' } 2003-06-18 02:49 0 0 2003-06-18 10:54 {'attack' }
{'NorthEast'} 2003-07-16 16:23 239.93 49434 2003-07-17 01:12 {'fire' }
{'MidWest' } 2004-09-27 11:09 286.72 66104 2004-09-27 16:37 {'equipment fault'}
{'SouthEast'} 2004-09-05 17:48 73.387 36073 2004-09-05 20:46 {'equipment fault'}
Некоторые переменные, такие как OutageTime и RestorationTime, имеют типы данных, которые не поддерживаются функциями обучения классификатора, такие как fitcensemble.
Создать 25 функций из предикторов в Tbl который может быть использован для обучения пакетированного ансамбля. Укажите Region табличная переменная в качестве ответа.
Transformer = gencfeatures(Tbl,"Region",25,"TargetLearner","bag")
Transformer =
FeatureTransformer with properties:
Type: 'classification'
TargetLearner: 'bag'
NumEngineeredFeatures: 22
NumOriginalFeatures: 3
TotalNumFeatures: 25
Transformer содержит информацию о созданных элементах и преобразованиях, используемых для их создания.
Чтобы лучше понять сгенерированные функции, используйте describe объектная функция.
Info = describe(Transformer)
Info=25×4 table
Type IsOriginal InputVariables Transformations
___________ __________ ___________________________ _________________________________________________________________________________________________________________
Loss Numeric true Loss ""
Customers Numeric true Customers ""
c(Cause) Categorical true Cause "Variable of type categorical converted from a cell data type"
RestorationTime-OutageTime Numeric false OutageTime, RestorationTime "Elapsed time in seconds between OutageTime and RestorationTime"
sdn(OutageTime) Numeric false OutageTime "Serial date number from 01-Feb-2002 12:18:00"
woe3(c(Cause)) Numeric false Cause "Variable of type categorical converted from a cell data type -> Weight of Evidence (positive class = SouthEast)"
doy(OutageTime) Numeric false OutageTime "Day of the year"
year(OutageTime) Numeric false OutageTime "Year"
kmd1 Numeric false Loss, Customers "Euclidean distance to centroid 1 (kmeans clustering with k = 10)"
kmd5 Numeric false Loss, Customers "Euclidean distance to centroid 5 (kmeans clustering with k = 10)"
quarter(OutageTime) Numeric false OutageTime "Quarter of the year"
woe2(c(Cause)) Numeric false Cause "Variable of type categorical converted from a cell data type -> Weight of Evidence (positive class = NorthEast)"
year(RestorationTime) Numeric false RestorationTime "Year"
month(OutageTime) Numeric false OutageTime "Month of the year"
Loss.*Customers Numeric false Loss, Customers "Loss .* Customers"
tods(OutageTime) Numeric false OutageTime "Time of the day in seconds"
⋮
Info таблица показывает следующее:
Первые три сгенерированных элемента являются исходными для Tbl, хотя программное обеспечение преобразует оригинал Cause переменная - категориальная переменная c(Cause).
OutageTime и RestorationTime переменные не включены в качестве сгенерированных элементов, поскольку они datetime переменные, которые нельзя использовать для обучения модели фасованного ансамбля. Однако программное обеспечение извлекает многие из сгенерированных элементов из этих переменных, таких как четвертый элемент. RestorationTime-OutageTime.
Некоторые созданные элементы представляют собой комбинацию нескольких преобразований. Например, программа генерирует шестую функцию woe3(c(Cause)) путем преобразования Cause переменной категориальной переменной и последующего вычисления значений веса доказательства для результирующей переменной.
Transformer - Функциональный трансформаторFeatureTransformer объектФункциональный трансформатор, указанный как FeatureTransformer объект.
Index - Характеристики для описанияЭлементы для описания, указанные как числовой или логический вектор, указывающий положение элементов, или строковый массив или массив ячеек символьных векторов, указывающих имена элементов.
Пример: 1:12
Типы данных: single | double | logical | string | cell
Info - Описания функцийОписания функций, возвращаемые в виде таблицы. Каждая строка соответствует сформированному элементу, и каждый столбец предоставляет следующую информацию.
| Имя столбца | Описание |
|---|---|
Type | Указывает тип данных элемента. numeric или categorical
|
IsOriginal | Указывает, является ли элемент исходным (true) или конструкторский элемент (false) |
InputVariables | Указывает исходные элементы, используемые для создания элемента |
Transformations | Описание преобразований, используемых для создания элемента, в порядке их применения. Дополнительные сведения см. в разделе Преобразования элементов. |
Эта таблица содержит дополнительную информацию о некоторых из более сложных описаний преобразования элементов в Info.Transformations.
| Имя образца элемента | Пример описания преобразования в Info | Дополнительная информация |
|---|---|---|
eb4(Variable) | Equal-width binning (number of bins = 4) | Программное обеспечение разделяет Variable значения в 4 бункеры равной ширины. Результирующий элемент является категориальной переменной. |
fenc(Variable) | Frequency encoding (number of levels = 10) | Программное обеспечение вычисляет частоту 10 категории (или уровни) в Variable. В результирующем элементе программа заменяет каждое категориальное значение на соответствующую частоту категории, создавая числовую переменную. |
kmc1 | Centroid encoding (component #1) (kmeans clustering with k = 10) | Программное обеспечение использует кластеризацию k-means для назначения каждого наблюдения одному из 10 кластеры. Каждая строка в результирующем элементе соответствует наблюдению и является 1первый компонент центроида кластера, связанный с этим наблюдением. Результирующий элемент является числовой переменной. |
kmd4 | Euclidean distance to centroid 4 (kmeans clustering with k = 10) | Программное обеспечение использует кластеризацию k-means для назначения каждого наблюдения одному из 10 кластеры. Каждая строка в результирующем элементе является евклидовым расстоянием от соответствующего наблюдения до центроида 43-й кластер. Результирующий элемент является числовой переменной. |
kmi | Cluster index encoding (kmeans clustering with k = 10) | Программное обеспечение использует кластеризацию k-means для назначения каждого наблюдения одному из 10 кластеры. Каждая строка в результирующей функции является индексом кластера для соответствующего наблюдения. Результирующий элемент является категориальной переменной. |
q50(Variable) | Equiprobable binning (number of bins = 50) | Программное обеспечение разделяет Variable значения в 50 бункеры равной вероятности. Результирующий элемент является категориальной переменной. |
woe5(Variable) | Weight of Evidence (positive class = Class5) | Программа выполняет следующие действия для создания результирующего элемента:
|
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.