описать

Описание созданных функций

Синтаксис

описать (трансформатор)

описание (трансформатор, индекс)

Информация = описать (___)

Описание

describe(Transformer) печатает описание элементов, созданных Transformer. Создать FeatureTransformer объект Transformer с помощью gencfeatures функция.

describe(Transformer,Index) печатает описание функций, идентифицированных Index.

пример

Info = describe(___) возвращает описания элементов в таблице. Имена строк Info соответствуют именам элементов.

Примеры

свернуть все

Создание и проверка элементов

Открыть сценарий в реальном времени

Создание функций из таблицы данных предиктора с помощью gencfeatures. Проверьте созданные элементы с помощью describe объектная функция.

Считывание данных об отключении питания в рабочую область в виде таблицы. Удалите наблюдения с отсутствующими значениями и отобразите первые несколько строк таблицы.

outages = readtable("outages.csv");
Tbl = rmmissing(outages);
head(Tbl)

ans=8×6 table
       Region           OutageTime        Loss     Customers     RestorationTime            Cause       
    _____________    ________________    ______    __________    ________________    ___________________

    {'SouthWest'}    2002-02-01 12:18    458.98    1.8202e+06    2002-02-07 16:50    {'winter storm'   }
    {'SouthEast'}    2003-02-07 21:15     289.4    1.4294e+05    2003-02-17 08:14    {'winter storm'   }
    {'West'     }    2004-04-06 05:44    434.81    3.4037e+05    2004-04-06 06:10    {'equipment fault'}
    {'MidWest'  }    2002-03-16 06:18    186.44    2.1275e+05    2002-03-18 23:23    {'severe storm'   }
    {'West'     }    2003-06-18 02:49         0             0    2003-06-18 10:54    {'attack'         }
    {'NorthEast'}    2003-07-16 16:23    239.93         49434    2003-07-17 01:12    {'fire'           }
    {'MidWest'  }    2004-09-27 11:09    286.72         66104    2004-09-27 16:37    {'equipment fault'}
    {'SouthEast'}    2004-09-05 17:48    73.387         36073    2004-09-05 20:46    {'equipment fault'}

Некоторые переменные, такие как OutageTime и RestorationTime, имеют типы данных, которые не поддерживаются функциями обучения классификатора, такие как fitcensemble.

Создать 25 функций из предикторов в Tbl который может быть использован для обучения пакетированного ансамбля. Укажите Region табличная переменная в качестве ответа.

Transformer = gencfeatures(Tbl,"Region",25,"TargetLearner","bag")

Transformer = 
  FeatureTransformer with properties:

                     Type: 'classification'
            TargetLearner: 'bag'
    NumEngineeredFeatures: 22
      NumOriginalFeatures: 3
         TotalNumFeatures: 25

Transformer содержит информацию о созданных элементах и преобразованиях, используемых для их создания.

Чтобы лучше понять сгенерированные функции, используйте describe объектная функция.

Info = describe(Transformer)

Info=25×4 table
                                     Type        IsOriginal          InputVariables                                                            Transformations                                                 
                                  ___________    __________    ___________________________    _________________________________________________________________________________________________________________

    Loss                          Numeric          true        Loss                           ""                                                                                                               
    Customers                     Numeric          true        Customers                      ""                                                                                                               
    c(Cause)                      Categorical      true        Cause                          "Variable of type categorical converted from a cell data type"                                                   
    RestorationTime-OutageTime    Numeric          false       OutageTime, RestorationTime    "Elapsed time in seconds between OutageTime and RestorationTime"                                                 
    sdn(OutageTime)               Numeric          false       OutageTime                     "Serial date number from 01-Feb-2002 12:18:00"                                                                   
    woe3(c(Cause))                Numeric          false       Cause                          "Variable of type categorical converted from a cell data type -> Weight of Evidence (positive class = SouthEast)"
    doy(OutageTime)               Numeric          false       OutageTime                     "Day of the year"                                                                                                
    year(OutageTime)              Numeric          false       OutageTime                     "Year"                                                                                                           
    kmd1                          Numeric          false       Loss, Customers                "Euclidean distance to centroid 1 (kmeans clustering with k = 10)"                                               
    kmd5                          Numeric          false       Loss, Customers                "Euclidean distance to centroid 5 (kmeans clustering with k = 10)"                                               
    quarter(OutageTime)           Numeric          false       OutageTime                     "Quarter of the year"                                                                                            
    woe2(c(Cause))                Numeric          false       Cause                          "Variable of type categorical converted from a cell data type -> Weight of Evidence (positive class = NorthEast)"
    year(RestorationTime)         Numeric          false       RestorationTime                "Year"                                                                                                           
    month(OutageTime)             Numeric          false       OutageTime                     "Month of the year"                                                                                              
    Loss.*Customers               Numeric          false       Loss, Customers                "Loss .* Customers"                                                                                              
    tods(OutageTime)              Numeric          false       OutageTime                     "Time of the day in seconds"                                                                                     
      ⋮

Info таблица показывает следующее:

Первые три сгенерированных элемента являются исходными для Tbl, хотя программное обеспечение преобразует оригинал Cause переменная - категориальная переменная c(Cause).
OutageTime и RestorationTime переменные не включены в качестве сгенерированных элементов, поскольку они datetime переменные, которые нельзя использовать для обучения модели фасованного ансамбля. Однако программное обеспечение извлекает многие из сгенерированных элементов из этих переменных, таких как четвертый элемент. RestorationTime-OutageTime.
Некоторые созданные элементы представляют собой комбинацию нескольких преобразований. Например, программа генерирует шестую функцию woe3(c(Cause)) путем преобразования Cause переменной категориальной переменной и последующего вычисления значений веса доказательства для результирующей переменной.

Входные аргументы

свернуть все

`Transformer` - Функциональный трансформатор
`FeatureTransformer` объект

Функциональный трансформатор, указанный как FeatureTransformer объект.

`Index` - Характеристики для описания
числовой вектор | логический вектор | строковый массив | массив ячеек символьных векторов

Элементы для описания, указанные как числовой или логический вектор, указывающий положение элементов, или строковый массив или массив ячеек символьных векторов, указывающих имена элементов.

Пример: 1:12

Типы данных: single | double | logical | string | cell

Выходные аргументы

свернуть все

`Info` - Описания функций
стол

Описания функций, возвращаемые в виде таблицы. Каждая строка соответствует сформированному элементу, и каждый столбец предоставляет следующую информацию.

Имя столбца	Описание
`Type`	Указывает тип данных элемента. `numeric` или `categorical`
`IsOriginal`	Указывает, является ли элемент исходным (`true`) или конструкторский элемент (`false`)
`InputVariables`	Указывает исходные элементы, используемые для создания элемента
`Transformations`	Описание преобразований, используемых для создания элемента, в порядке их применения. Дополнительные сведения см. в разделе Преобразования элементов.

Алгоритмы

свернуть все

Преобразования элементов

Эта таблица содержит дополнительную информацию о некоторых из более сложных описаний преобразования элементов в Info.Transformations.

Имя образца элемента	Пример описания преобразования в `Info`	Дополнительная информация
`eb4(Variable)`	`Equal-width binning (number of bins = 4)`	Программное обеспечение разделяет `Variable` значения в `4` бункеры равной ширины. Результирующий элемент является категориальной переменной.
`fenc(Variable)`	`Frequency encoding (number of levels = 10)`	Программное обеспечение вычисляет частоту `10` категории (или уровни) в `Variable`. В результирующем элементе программа заменяет каждое категориальное значение на соответствующую частоту категории, создавая числовую переменную.
`kmc1`	`Centroid encoding (component #1) (kmeans clustering with k = 10)`	Программное обеспечение использует кластеризацию k-means для назначения каждого наблюдения одному из `10` кластеры. Каждая строка в результирующем элементе соответствует наблюдению и является `1`первый компонент центроида кластера, связанный с этим наблюдением. Результирующий элемент является числовой переменной.
`kmd4`	`Euclidean distance to centroid 4 (kmeans clustering with k = 10)`	Программное обеспечение использует кластеризацию k-means для назначения каждого наблюдения одному из `10` кластеры. Каждая строка в результирующем элементе является евклидовым расстоянием от соответствующего наблюдения до центроида `4`3-й кластер. Результирующий элемент является числовой переменной.
`kmi`	`Cluster index encoding (kmeans clustering with k = 10)`	Программное обеспечение использует кластеризацию k-means для назначения каждого наблюдения одному из `10` кластеры. Каждая строка в результирующей функции является индексом кластера для соответствующего наблюдения. Результирующий элемент является категориальной переменной.
`q50(Variable)`	`Equiprobable binning (number of bins = 50)`	Программное обеспечение разделяет `Variable` значения в `50` бункеры равной вероятности. Результирующий элемент является категориальной переменной.
`woe5(Variable)`	`Weight of Evidence (positive class = Class5)`	Программа выполняет следующие действия для создания результирующего элемента: Вычислите общее количество наблюдений `Class5` в качестве ответа (а) и сколько из них имеют другой ответ (b). Для каждой категории в `Variable`, определить, сколько наблюдений в этой категории `Class5` в качестве ответа (с) и сколько из них имеют другой ответ (d). Для каждой категории вычислите вес доказательств (WoE) как $\ln \frac{((c + 0,5}{) / a (d +}$ 0,5 )/b). Замените каждое категориальное значение соответствующим WoE, создав числовую переменную.

См. также

FeatureTransformer | gencfeatures | transform

Темы

Автоматизированное проектирование элементов для классификации

Представлен в R2021a

Документация

описать

Синтаксис

Описание

Примеры

Создание и проверка элементов

Входные аргументы

`Transformer` - Функциональный трансформатор
`FeatureTransformer` объект

`Index` - Характеристики для описания
числовой вектор | логический вектор | строковый массив | массив ячеек символьных векторов

Выходные аргументы

`Info` - Описания функций
стол

Алгоритмы

Преобразования элементов

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

Документация

описать

Синтаксис

Описание

Примеры

Создание и проверка элементов

Входные аргументы

Transformer - Функциональный трансформатор FeatureTransformer объект

Index - Характеристики для описания числовой вектор | логический вектор | строковый массив | массив ячеек символьных векторов

Выходные аргументы

Info - Описания функций стол

Алгоритмы

Преобразования элементов

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

`Transformer` - Функциональный трансформатор
`FeatureTransformer` объект

`Index` - Характеристики для описания
числовой вектор | логический вектор | строковый массив | массив ячеек символьных векторов

`Info` - Описания функций
стол