Функция является эффективной, когда она ясно разделяет группы данных различными метками условной переменной. Diagnostic Feature Designer предоставляет различные возможности функции, но самые эффективные функции зависят от ваших данных и систем, и подготавливает ваши данные, представляет.
Чтобы выполнить предварительную оценку того, насколько эффективный функция, можно оценить гистограмму функции. График гистограммы визуализирует разделение между помеченными группами. Для этого интервалы гистограммы распределение данных и использование окрашивают, чтобы идентифицировать группы метки в каждом интервале. Можно настроить гистограмму, чтобы улучшить визуализацию и информацию о подсветке в функциях интереса. Можно также просмотреть числовую информацию о разделении между распределениями группы.
Гистограммы позволяют вам получать ранний смысл эффективности функции. Чтобы выполнить более строгую количественную оценку с помощью специализированных статистических методов, используйте рейтинг, как описано в Ранжируют Признаки в, Исследуют Данные Ансамбля и Сравнивают Функции Используя Diagnostic Feature Designer. Оценивающие функцию расчеты независимы от выбора визуализации, который вы делаете во время анализа гистограммы.
Следующий рисунок показывает разделительную визуализацию. Эти примеры имеют размер относительно небольшой выборки, который преувеличивает различия.
В обоих графиках кодом условия с двумя состояниями является faultCode
. Значение 0 (синих) цветов указывает на здоровую систему, и значение 1 (оранжевый) указывает на неисправную систему. Гистограммы представляют фактор гребня и эксцесс Vibration
сигнал.
Гистограмма фактора гребня показывает что:
Все здоровые значения характеристики системы находятся в пределах области значений первого интервала.
Большинство значений неисправной системы попадает в остающиеся три интервала.
Первый интервал также содержит некоторые данные из неисправной системы, но сумма мала относительно здоровых системных данных.
Для этого случая гистограмма указывает, что функция фактора гребня различает здоровое и дефектное поведение хорошо, но не полностью.
В отличие от этого, гистограмма эксцесса показывает что:
Данные со значениями в области значений первого интервала являются всегда дефектными.
Данные в области значений других интервалов прибывают и из здоровых и из дефектных групп. Состояние отказа неоднозначно в этих областях.
От этих двух гистограмм можно вывести, что функция фактора гребня является более эффективной, чем функция эксцесса.
Приложение обеспечивает интерактивные инструменты для настройки гистограммы. Например, можно увеличить разрешение гистограммы путем изменения ширины интервала, изменения условной переменной, которая задает группы или изменение нормализации, которую применяет гистограмма. Для получения дополнительной информации о настройке гистограмм в приложении смотрите, Генерируют и Настраивают Гистограммы Функции.
Если ваша условная переменная имеет больше чем два состояния или классы, получившиеся гистограммы может быть более трудно интерпретировать самостоятельно из-за дополнительных цветовых комбинаций. Например, предположите, что ваш код отказа может представлять два независимых состояния отказа в дополнение к здоровому состоянию, fault1
и fault2
. Следующий рисунок показывает гистограммы, похожие на предыдущие гистограммы, но соответствие такой условной переменной с тремя классами.
Получите дополнительную информацию об эффективности функции путем просмотра числовых расстояний группы. Опция Show Group Distance вводит значение, KS statistic, для каждой комбинации классов условной переменной. Используя двухвыборочный критерий Колмогорова-Смирнова, статистическая величина KS указывает, как хорошо разделенный кумулятивные функции распределения распределений этих двух классов.
Следующая таблица показывает расстояния группы, соответствующие предыдущим гистограммам.
Статистическая величина KS указывает на разделение между каждым соединением faultCode
значения. Статистические диапазоны значений от 0 до 1, где 0 не разделение между распределениями, и 1, являются полным разделением.
Для гребня фактор показывают как с 2D классом faultCode
, дифференцирование между здоровым fault0
и дефектный fault1
данные сильны со статистической величиной KS 1. Дифференцирование также сильно между fault1
и fault2
данные. Однако дифференцирование между fault0
и fault2
данные относительно плохи.
Для функции эксцесса дифференцирование между парами во всех соединениях относительно плохо.
Для получения дополнительной информации о статистической величине KS смотрите kstest2
.
Сгенерировать набор гистограмм функции из таблицы функции:
Выберите таблицу функции в разделе Feature Tables браузера данных.
Кликните по значку Histogram в галерее графика.
Чтобы оптимизировать разделительную визуализацию, настройте гистограммы. Вкладка Histogram обеспечивает параметры, которые позволяют вам изменять гистограмму, чтобы улучшить интерпретацию.
По умолчанию приложение строит гистограммы для всех ваших функций и отображает их в противоположном алфавитном порядке. Если вы хотите фокусироваться на меньшем наборе функций, нажмите Select Features.
Можно сгруппировать данные в наборе гистограммы для любой условной переменной, которую вы импортировали. Эта условная переменная может указать на системное здоровье. Переменная сила также быть операционным условием, таким как температура или режим машины. Чтобы выбрать условную переменную, чтобы сгруппироваться цветовым кодом, выберите переменную из Group By.
Чтобы отобразить разделительное расстояние группы или Статистическую величину KS, которая была обсуждена в, Интерпретируют Гистограммы Функции для Условных переменных Мультикласса, нажимают Show Group Distance. Эта опция поднимает таблицу, вводящую разделительное значение группы для каждого соединения значений условной переменной. В окне выберите, какую функцию вы хотите исследовать.
По умолчанию приложение определяет размер интервала автоматически. Замените автоматизацию путем ввода различного значения для ширины интервала или выбора альтернативного метода раскладывания. Настройки интервала применяются ко всем гистограммам за таблицу функции.
Настройки интервала для ширины интервала, метода раскладывания и количества интервалов весьма зависимы. Алгоритм использует порядок очередности определить, что использовать:
Binning Method является драйвером по умолчанию для ширины интервала.
Спецификация Bin Width заменяет Метод Раскладывания.
Ширина интервала и независимый Bin Limits управляют количеством интервалов. Спецификация Number of Bins оказывает влияние только, когда нет никакой группировки данных.
По умолчанию Diagnostic Feature Designer использует автоматический алгоритм раскладывания, который возвращает интервалы с универсальной шириной интервала. Алгоритм выбирает, настройки интервала, чтобы покрыть данные располагаются и показывают базовую форму распределения. Чтобы изменить алгоритм раскладывания, выберите из меню Binning Method.
Для получения информации об алгоритмах раскладывания смотрите ‘BinMethod’
описание в histogram
.
Увеличьте разрешение своих данных путем определения ширины, которая является более узкой, чем какой ‘auto’
установка предусматривает функцию, которую вы исследуете. Например, следующая фигура повторяет более ранние гистограммы, показывающие разделение данных для двух кодовых обозначений отказа и двух функций. Для фактора гребня первый интервал смешал здоровые и ухудшенные данные.
Ширина интервала для функции Фактора Гребня 0.1. Если вы уменьшаете ширину интервала к 0,05, гистограмма изменяется как показано здесь.
Теперь здоровые данные о факторе гребня изолируются к первому интервалу, и остающиеся интервалы содержат только нездоровые данные. Однако вы потеряли разрешение по гистограмме эксцесса, потому что заданная ширина интервала применяется ко всем функциям.
Если вы интересуетесь только фрагментом распределения функции, используйте Bin Limits, чтобы исключить данные за пределами сферы интересов. Введите желаемые пределы в форму [lower upper]
. Этот выбор не влияет на статистическое вычисление KS в таблице расстояния группы.
Гистограммы по умолчанию используют вероятность для оси y с соответствующим диапазоном от 0 до 1 для всех функций. Просмотр нескольких гистограмм по той же шкале облегчает визуально сравнивать их. Выберите другие настройки оси из меню Normalization. Эти методы включают необработанные количества и статистические метрики, такие как CDF.
Diagnostic Feature Designer | histogram
| kstest2