dummyvar

Создайте фиктивные переменные

Синтаксис

Описание

пример

D = dummyvar(group) возвращает матричный D содержа нули и единицы, столбцы которых являются фиктивными переменными для сгруппированных переменных в group. Каждый столбец group одна сгруппированная переменная, со значениями, указывающими на уровни категории. Строки group представляйте наблюдения через все переменные.

Примеры

свернуть все

Создайте вектор-столбец категориальных данных, задающих типы цвета.

Colors = {'Red';'Blue';'Green';'Red';'Green';'Blue'};
Colors = categorical(Colors);

Создайте фиктивные переменные для каждого типа цвета.

D = dummyvar(Colors)
D = 6×3

     0     0     1
     1     0     0
     0     1     0
     0     0     1
     0     1     0
     1     0     0

Столбцы в D соответствуйте уровням в Colors. Например, первый столбец dummyvar соответствует первому уровню, 'Blue', в Colors.

Отобразите уровни категории Colors.

categories(Colors)
ans = 3x1 cell
    {'Blue' }
    {'Green'}
    {'Red'  }

Создайте матричный group из данных, содержащих эффекты двух машин и трех операторов на процессе.

machine = [1 1 1 1 2 2 2 2]';
operator = [1 2 3 1 2 3 1 2]';
group = [machine operator]
group = 8×2

     1     1
     1     2
     1     3
     1     1
     2     2
     2     3
     2     1
     2     2

Создайте фиктивные переменные данных в group.

D = dummyvar(group)
D = 8×5

     1     0     1     0     0
     1     0     0     1     0
     1     0     0     0     1
     1     0     1     0     0
     0     1     0     1     0
     0     1     0     0     1
     0     1     1     0     0
     0     1     0     1     0

Первые два столбца D представляйте наблюдения за машиной 1 и машиной 2, соответственно. Остальные столбцы представляют наблюдения за этими тремя операторами.

Создайте массив ячеек телефонных типов и числовой вектор кодов области.

phone = {'mobile';'landline';'mobile';'mobile';'mobile';'landline';'landline'};
codes = [802 802 603 603 802 603 802]';

Поскольку данные о коде области имеют два уровня (а не 802 уровня, соответствующие целым числам 1:802), преобразуйте codes к категориальному вектору.

newcodes = categorical(codes);

Объедините phone и newcodes сгруппированные переменные в массив ячеек group.

group = {phone,newcodes};

Создайте фиктивные переменные для групп в group.

D = dummyvar(group)
D = 7×4

     1     0     0     1
     0     1     0     1
     1     0     1     0
     1     0     1     0
     1     0     0     1
     0     1     1     0
     0     1     0     1

Первые два столбца D соответствуйте телефонным типам, и последние два столбца соответствуют кодам области.

Входные параметры

свернуть все

Сгруппированные переменные в виде положительного целочисленного векторного или категориального представления вектор-столбца уровни в одной переменной, массив ячеек, содержащий одну или несколько сгруппированных переменных или положительное представление целочисленной матрицы уровни в нескольких переменных.

Если group категориальный вектор, затем группы и их порядок совпадают с выходом categories функционируйте применился к group. Если group числовой вектор, затем dummyvar принимает, что группами и их порядком является 1:max(group). В этом отношении, dummyvar обрабатывает числовую сгруппированную переменную по-другому по сравнению с grp2idx. Для получения информации о порядке групп в сгруппированных переменных смотрите Сгруппированные переменные.

Пример: [2 1 1 1 2 3 3 2]'

Пример: {Origin,Cylinders}

Типы данных: single | double | categorical | cell

Выходные аргументы

свернуть все

Фиктивные переменные, возвращенные как n-by-s числовая матрица, где n является количеством строк group и s является суммой количества уровней в каждом столбце group. Слева направо, столбцы D фиктивные переменные, созданные из первого столбца group, сопровождаемый фиктивными переменными создается из второго столбца group, и так далее.

Типы данных: single | double

Советы

  • Используйте фиктивные переменные в регрессионном анализе и Дисперсионном Анализе, чтобы указать на значения категориальных предикторов.

  • dummyvar обработки NaN значения и неопределенные категориальные уровни в group как недостающие данные и возвращает NaN значения в D.

  • Если столбец из единиц введен в матричном D, затем получившийся матричный X = [ones(size(D,1),1) D] имеет неполный ранг. Если group имеет несколько столбцов, затем матричный D самостоятельно имеет неполный ранг, потому что фиктивные переменные произвели из любого столбца group всегда суммируйте к столбцу из единиц. Регрессия и вычисления Дисперсионного Анализа часто решают эту проблему путем устранения одной фиктивной переменной (неявно установка коэффициентов для опущенных до нуля столбцов) от каждой группы фиктивных переменных, произведенных столбцом group.

  • Если group числовой вектор с уровнями, которые не соответствуют точно целым числам 1:max(group), сначала преобразуйте данные в категориальный вектор при помощи categorical. Можно затем передать результат dummyvar. Для примера смотрите, Создают Фиктивные Переменные из Нескольких Сгруппированных переменных.

Расширенные возможности

Представлено до R2006a

Для просмотра документации необходимо авторизоваться на сайте