Данные могут потребовать, чтобы методы предварительной обработки гарантировали точный, эффективный, или значимый анализ. Очистка данных обращается к методам для поиска, удаления и замены плохих или отсутствующих данных. Обнаружение локальных экстремальных значений и резких изменений может помочь идентифицировать значительные тренды данных. Сглаживание и удаление тренда являются процессами для удаления шумовых и полиномиальных трендов из данных при масштабировании изменений границы данных. Методы группировки и биннинга идентифицируют характеристики данных группами.
Clean Missing Data | Найдите, заполните или удалите недостающие данные в Live Editor |
Clean Outlier Data | Найдите, заполните или удалите выбросы в Live Editor |
Compute by Group | Обобщите, преобразуйте, или фильтр по группе |
Find Change Points | Найдите резкие изменения в данных в Live Editor |
Find Local Extrema | Найдите локальные максимумы и минимумы в Live Editor |
Normalize Data | Сосредоточьте и масштабируйте данные в Live Editor |
Smooth Data | Сглаженные зашумленные данные в Live Editor |
Remove Trends | Удалите полиномиальный тренд из данных в Live Editor |
Очистка грязных и пропущенных данных в таблицах
В этом примере показано, как найти, уберите и удалите строки таблицы с недостающими данными.
Удаление линейного тренда из данных.
Группировка переменных для разделения данных
Можно использовать сгруппированные переменные, чтобы категоризировать переменные данных.
Разделение данных на группы и вычисление статистики
В этом примере показано, как сгруппировать данные и применяться, статистика функционирует каждой группе.
Разделение данных табличных переменных и применение функций
В этом примере показано, как сгруппировать переменные данных и применить функции к каждой группе.