Типы данных

Сгруппированные переменные, категориальные данные и массивы набора данных

Statistics and Machine Learning Toolbox™ обеспечивает два дополнительных типа данных. Работа с упорядоченными и неупорядоченными дискретными, нечисловыми данными с помощью nominal и ordinal типы данных. Сохраните несколько переменных, включая тех с различными типами данных, в отдельный объект с помощью dataset тип данных массива. Однако эти типы данных уникальны для Statistics and Machine Learning Toolbox. Для большей совместимости векторного произведения используйте categorical или table типы данных, соответственно, доступный в MATLAB®. Для получения дополнительной информации см. Создание категориальных массивов, Составьте Таблицы и Данные о Присвоении Им, или смотрите Tables и Categorical Arrays.

Функции

развернуть все

nominal(Не Рекомендуемый) Массивы для номинальных данных
ordinal(Не Рекомендуемый) Массивы для порядковых данных
dummyvarСоздайте фиктивные переменные
onehotencodeЗакодируйте метки данных в одногорячие векторы
onehotdecodeДекодируйте векторы вероятности в метки класса
gplotmatrixМатрица точечных графиков по группам
grp2idxСоздайте вектор индекса из сгруппированной переменной
gscatterТочечный график по группам
mat2dataset(Не Рекомендуемый), Преобразуют матрицу в массив набора данных
cell2dataset(Не Рекомендуемый), Преобразуют массив ячеек в массив набора данных
struct2dataset(Не Рекомендуемый), Преобразуют массив структур в массив набора данных
table2dataset(Не Рекомендуемый), преобразовывают таблицу в массив набора данных
dataset2cell(Не Рекомендуемый) Преобразовать массив набора данных в массив ячеек
dataset2struct(Не Рекомендуемый) Преобразовать массив набора данных в структуру
dataset2tableПреобразуйте массив набора данных в таблицу
export(Не Рекомендуемый) Записать массив набора данных в файл
ismissing(Не Рекомендуемый) Найти элементы массива набора данных с отсутствующими значениями
join(Не Рекомендуемый) объединение наблюдений массивов данных

Классы

dataset(Не Рекомендуемый) Массивы для статистических данных

Темы

Категориальные данные

Номинальные и порядковые массивы

Номинальные и порядковые массивы хранят данные, которые имеют конечное множество дискретных уровней, которые могут или не могут иметь естественного порядка.

Преимущества Использования номинальных и порядковых массивов

Легко управляйте уровнями категории, выполните статистический анализ и уменьшайте требования к памяти.

Группировка переменных

Сгруппированные переменные являются служебными переменными, используемыми, чтобы сгруппировать или категоризировать наблюдения.

Фиктивные переменные

Фиктивные переменные позволяют вам адаптировать категориальные данные к использованию в классификации и регрессионному анализу.

Другие функции MATLAB, поддерживающие номинальные и порядковые массивы

Узнайте о функциях MATLAB, что поддерживают номинальные и порядковые массивы.

Создайте номинальные и порядковые массивы

Создайте номинальные и порядковые массивы с помощью nominal и ordinal, соответственно.

Категоризируйте числовые данные

Категоризируйте числовые данные в категориальный порядковый массив с помощью ordinal.

Измените подписи категорий

Измените метки для уровней категории в номинальном или порядковом использовании массивов setlabels.

Добавьте и пропустите уровни категории

Добавьте и исключите уровни из номинального или порядкового массива.

Объедините уровни категории

Объедините категории в номинальном или порядковом использовании массивов mergelevels.

Переупорядочьте уровни категории

Переупорядочьте уровни категории в номинальном или порядковом использовании массивов reorderlevels.

Сортировка порядковых массивов

Определите порядок сортировки для порядковых массивов.

Отобразите на графике данные, сгруппированные по категориям

Отобразите на графике данные, сгруппированные уровнями категориальной переменной.

Итоговая статистика, сгруппированная по категориям

Вычислите итоговую статистику, сгруппированную уровнями категориальной переменной.

Протестируйте различия между средними значениями категории

Протестируйте на существенные различия между категорией средние значения (группы) использовать t - тест, двухсторонний Дисперсионный Анализ (дисперсионный анализ) и АНОКОВА (ковариационный анализ) анализ.

Индексируйте и ищите Используя номинальные и порядковые массивы

Индексируйте и ищите данные его категорией или группу.

Линейная регрессия с категориальными ковариантами

Выполните регрессию с категориальными ковариантами с помощью категориальных массивов и fitlm.

Массивы набора данных

Массивы набора данных

Массивы набора данных хранят данные с неоднородными типами.

Создайте массив набора данных из переменных рабочей области

Создайте массив набора данных из числового массива или неоднородных переменных, существующих в рабочем пространстве MATLAB.

Создайте массив набора данных из файла

Создайте массив набора данных из содержимого разграниченного вкладкой или разделенного от запятой текста или файла Excel.

Добавьте и удалите наблюдения

Добавьте и удалите наблюдения в массиве набора данных.

Добавьте и Удаление переменных

Добавьте и удалите переменные в массиве набора данных.

Доступ к данным в переменных типа массив набора данных

Работа с переменными типа массив набора данных и их данными.

Выберите Subsets of Observations

Выберите наблюдение или подмножество наблюдений от массива набора данных.

Сортировка наблюдений в массивах набора данных

Сортировка наблюдений (строки) в массиве набора данных с помощью командной строки.

Объедините массивы набора данных

Объедините массивы набора данных с помощью join.

Сложите или распакуйте массивы набора данных

Переформатируйте массивы набора данных с помощью stack и unstack.

Очистка грязных и пропущенных данных

Найдите, уберите и удалите наблюдения с недостающими данными в массиве набора данных.

Вычисления на массивах набора данных

Выполните вычисления на массивах набора данных, включая усреднение и суммирование со сгруппированной переменной.

Экспортируйте массивы набора данных

Экспортируйте массив набора данных от рабочего пространства MATLAB до текста или файла электронной таблицы.

Массивы набора данных в редакторе переменных

Редактор переменных MATLAB обеспечивает удобный интерфейс для просмотра, изменения и графического вывода массивов набора данных.

Индексируйте и ищите массивы набора данных

Изучите много способов индексировать в массивы набора данных.

Регрессия Используя массивы набора данных

В этом примере показано, как выполнить линейный и исследования ступенчатой регрессии с помощью массивов набора данных.