Типы данных

Группирующие переменные, категориальные данные и массивы набора данных

Statistics and Machine Learning Toolbox™ обеспечивает два дополнительных типа данных. Работа с упорядоченными и неупорядоченными дискретными, нечисловыми данными с помощью nominal и типов данных ordinal. Сохраните несколько переменных, включая тех с различными типами данных, в отдельный объект с помощью типа данных массива dataset. Однако эти типы данных уникальны для Statistics and Machine Learning Toolbox. Для большей совместимости векторного произведения используйте categorical или типы данных table, соответственно, доступный в MATLAB®. Для получения дополнительной информации см. Создание категориальных массивов (MATLAB), Создайте и работа с Таблицами (MATLAB) или смотрите Tables и Categorical Arrays.

Функции

развернуть все

nominalМассивы для номинальных данных
ordinalМассивы для порядковых данных
dummyvarСоздайте фиктивные переменные
gplotmatrixМатрица графиков рассеивания группы
grp2idxСоздайте индексный вектор из группирующей переменной
gscatterГрафик поля точек группы
mat2datasetПреобразуйте матрицу в массив набора данных
cell2datasetПреобразуйте массив ячеек в массив набора данных
struct2datasetПреобразуйте массив структур в массив набора данных
table2datasetПреобразуйте таблицу в массив набора данных
dataset2cellПреобразуйте массив набора данных в массив ячеек
dataset2structПреобразуйте массив набора данных в структуру
dataset2tableПреобразуйте массив набора данных в таблицу
exportЗапишите массив набора данных в файл
ismissingНайдите элементы массива набора данных с отсутствующими значениями
joinОбъедините наблюдения

Классы

datasetМассивы для статистических данных

Темы

Категориальные данные

Номинальные и порядковые массивы

Номинальные и порядковые массивы хранят данные, которые имеют конечное множество дискретных уровней, которые могут или не могут иметь естественного порядка.

Преимущества Использования номинальных и порядковых массивов

Легко управляйте уровнями категории, выполните статистический анализ и уменьшайте требования к памяти.

Группировка переменных

Группирующие переменные являются служебными переменными, используемыми, чтобы сгруппировать или категоризировать наблюдения.

Фиктивные переменные индикатора

Фиктивные переменные индикатора позволяют вам адаптировать категориальные данные к использованию в регрессионном анализе.

Другие функции MATLAB, поддерживающие номинальные и порядковые массивы

Узнайте о функциях MATLAB, что поддерживают номинальные и порядковые массивы.

Создайте номинальные и порядковые массивы

Создайте номинальные и порядковые массивы с помощью nominal и ordinal, соответственно.

Категоризируйте числовые данные

Категоризируйте числовые данные в категориальный порядковый массив с помощью ordinal.

Измените подписи категорий

Измените метки для уровней категории в номинальных или порядковых массивах с помощью setlabels.

Добавьте и пропустите уровни категории

Добавьте и исключите уровни из номинального или порядкового массива.

Объедините уровни категории

Объедините категории в номинальном или порядковом массиве с помощью mergelevels.

Переупорядочьте уровни категории

Переупорядочьте уровни категории в номинальных или порядковых массивах с помощью reorderlevels.

Сортировка порядковых массивов

Определите порядок сортировки для порядковых массивов.

Отобразите на графике данные, сгруппированные по категориям

Отобразите на графике данные, сгруппированные уровнями категориальной переменной.

Итоговая статистика, сгруппированная по категориям

Вычислите итоговую статистику, сгруппированную уровнями категориальной переменной.

Протестируйте различия между средствами категории

Протестируйте на существенные различия между категорией средние значения (группы) использовать t - тест, двухсторонняя АНОВА (дисперсионный анализ) и АНОКОВА (ковариационный анализ) анализ.

Индексируйте и ищите Используя номинальные и порядковые массивы

Индексируйте и ищите данные его категорией или группу.

Регрессия с категориальными ковариантами

Выполните регрессию с категориальными ковариантами с помощью категориальных массивов и fitlm.

Массивы набора данных

Массивы набора данных

Массивы набора данных хранят данные с неоднородными типами.

Создайте массив набора данных из переменных рабочей области

Создайте массив набора данных из числового массива или неоднородных переменных, существующих в рабочем пространстве MATLAB.

Создайте массив набора данных из файла

Создайте массив набора данных из содержимого разграниченного вкладкой или разделенного от запятой текста или файла Excel.

Добавьте и удалите наблюдения

Добавьте и удалите наблюдения в массиве набора данных.

Добавьте и Удаление переменных

Добавьте и удалите переменные в массиве набора данных.

Доступ к данным в переменных типа массив набора данных

Работа с переменными типа массив набора данных и их данными.

Выберите Subsets of Observations

Выберите наблюдение или подмножество наблюдений от массива набора данных.

Сортировка наблюдений в массивах набора данных

Сортировка наблюдений (строки) в массиве набора данных с помощью командной строки.

Объедините массивы набора данных

Объедините массивы набора данных с помощью join.

Сложите или распакуйте массивы набора данных

Переформатируйте массивы набора данных с помощью stack и unstack.

Очистка грязных и пропущенных данных

Найдите, уберите и удалите наблюдения с недостающими данными в массиве набора данных.

Вычисления на массивах набора данных

Выполните вычисления на массивах набора данных, включая усреднение и суммирование с группирующей переменной.

Экспортируйте массивы набора данных

Экспортируйте массив набора данных от рабочего пространства MATLAB до текста или файла электронной таблицы.

Массивы набора данных в редакторе переменных

Редактор переменных MATLAB обеспечивает удобный интерфейс для просмотра, изменения и графического вывода массивов набора данных

Индексируйте и ищите массивы набора данных

Изучите много способов индексировать в массивы набора данных.

Регрессия Используя массивы набора данных

Этот пример показывает, как выполнить линейные и пошаговые регрессионные анализы с помощью массивов набора данных.