Предварительная обработка данных

Очистка данных, сглаживание, группировка

Наборы данных могут потребовать предварительной обработки для обеспечения точного, эффективный, или содержательного анализа. Очистка данных обращается к методам для поиска, удаления и замены плохих или отсутствующих данных. Обнаружение локальных экстремальных значений и резких изменений может помочь идентифицировать значительные тренды данных. Сглаживание и удаление тренда являются процессами для удаления шумовых и линейных трендов от данных при масштабировании изменений границы данных. Методы группировки и биннинга являются методами, которые идентифицируют связи между переменными.

Функции

развернуть все

ismissingНайдите отсутствующие значения
rmmissingУдалите недостающие записи
fillmissingЗаполните отсутствующие значения
missingСоздайте отсутствующие значения
standardizeMissingВставьте стандартные отсутствующие значения
isoutlierНайдите выбросы в данных
filloutliersОбнаружьте и замените выбросы в данных
rmoutliersОбнаружьте и удалите выбросы в данных
movmadСкользящая медиана абсолютного отклонения
ischangeНайдите резкие изменения в данных
islocalminНайдите локальные минимумы
islocalmaxНайдите локальные максимумы
smoothdataСглаживайте шумные данные
movmeanСкользящее среднее значение
movmedianДвижущаяся медиана
detrendУдалите полиномиальный тренд
normalizeНормируйте данные
rescaleДиапазон шкалы элементов массива
discretizeСгруппировать данные в интервалы или категории
groupcountsКоличество элементов группы
groupsummaryВычисления сводных данных группы
grouptransformПреобразуйте группой
histcountsКоличества интервала гистограммы
histcounts2Количества интервала двумерной гистограммы
findgroupsНайдите группы и возвратите числа группы
splitapplyРазделите данные в группы и примените функцию
rowfunПримените функцию к строкам таблицы или расписания
varfunПримените функцию к переменным таблицы или расписания
accumarrayСоздайте массив с накоплением

Темы

Отсутствующие данные в MATLAB

Обработайте отсутствующие значения в наборах данных.

Очистка грязных и пропущенных данных в таблицах

Этот пример показывает, как найти, убрать, и удалить строки таблицы с недостающими данными.

Усреднение данных и определение выбросов

Устраните нежелательный шум или поведение в данных, и найдите, заполните и удалите выбросы.

Вычитание тренда из данных

Удаление линейного тренда из данных.

Группировка переменных для разделения данных

Можно использовать группирующие переменные, чтобы категоризировать переменные данных.

Разделение данных на группы и вычисление статистики

Этот пример показывает, как сгруппировать данные и применить функции статистики к каждой группе.

Разделение данных табличных переменных и применение функций

Этот пример показывает, как сгруппировать переменные данных и применить функции к каждой группе.