Предварительная обработка данных

Очистка данных, сглаживание, группировка

Наборы данных могут потребовать, чтобы методы предварительной обработки гарантировали точный, эффективный, или значимый анализ. Очистка данных обращается к методам для нахождения, удаления, и заменяющий плохо или недостающих данных. Обнаружение локального экстремального значения и резких изменений может помочь идентифицировать значительные тенденции данных. Сглаживание и detrending является процессами для удаления шумовых и линейных тенденций от данных при масштабировании изменений границы данных. Группировка и методы раскладывания является методами, которые идентифицируют отношения среди переменных данных.

Функции

развернуть все

ismissingНайдите отсутствующие значения
rmmissingУдалите недостающие записи
fillmissingЗаполните отсутствующие значения
пропавшие без вестиСоздайте отсутствующую стоимость
standardizeMissingВставьте стандартные отсутствующие значения
isoutlierНайдите выбросы в данных
filloutliersОбнаружьте и замените выбросы в данных
rmoutliersОбнаружьте и удалите выбросы в данных
movmadДвижущееся среднее абсолютное отклонение
ischangeНайдите резкие изменения в данных
islocalminНайдите локальные минимумы
islocalmaxНайдите локальные максимумы
smoothdataСглаживайте шумные данные
movmeanПеремещение среднего значения
movmedianДвижущаяся медиана
detrendУдалите линейные тенденции
normalizeНормализуйте данные
перешкалаДиапазон шкалы элементов массива
дискретизацияДанные группы в интервалы или категории
groupsummaryВычисления сводных данных группы
grouptransformПреобразование группой
histcountsКоличества интервала гистограммы
histcounts2Количества интервала двумерной гистограммы
findgroupsНайдите группы и возвратите числа группы
splitapplyРазделите данные в группы и примените функцию
rowfunПримените функцию к строкам таблицы или расписания
varfunПримените функцию к переменным таблицы или расписания
accumarrayСоздайте массив с накоплением

Темы

Пропавшие без вести данных в MATLAB

Обработайте отсутствующие значения в наборах данных.

Очистка грязных и пропущенных данных в таблицах

Этот пример показывает, как найти, убрать, и удалить строки таблицы с недостающими данными.

Усреднение данных и определение выбросов

Устраните нежелательный шум или поведение в данных, и найдите, заполните и удалите выбросы.

Вычитание тренда из данных

Удаление линейных тенденций из данных.

Группировка переменных для разделения данных

Можно использовать группирующиеся переменные, чтобы категоризировать переменные данных.

Разделение данных в группы и вычисляет статистику

Этот пример показывает, как сгруппировать данные и применить функции статистики к каждой группе.

Разделение табличных переменных данных и применение функций

Этот пример показывает, как сгруппировать переменные данных и применить функции к каждой группе.

Была ли эта тема полезной?