Анализ Procrustes

Сравните знаменательные данные

Функция procrustes анализирует распределение набора использования форм анализ Procrustes. Этот метод анализа совпадает со знаменательными данными (геометрические местоположения, представляющие значительные функции в данной форме), чтобы вычислить лучшие сохраняющие форму Евклидовы преобразования. Эти преобразования минимизируют различия в местоположении между сравненными знаменательными данными.

Анализ Procrustes также полезен в сочетании с многомерным масштабированием. В Построении Карта Используя Многомерное Масштабирование там является наблюдением, что ориентация восстановленных точек произвольна. Два различных приложения многомерного масштабирования могли произвести восстановленные точки, которые очень похожи в принципе, но которые выглядят по-другому, потому что у них есть различные ориентации. Функция procrustes преобразовывает один набор точек, чтобы сделать их более сопоставимыми с другим.

Ввод данных

Функция procrustes берет две матрицы в качестве входа:

  • Целевая матрица формы X имеет размерность n × p, где n является количеством ориентиров в форме и p, является количеством измерений на ориентир.

  • Матрица формы сравнения Y имеет размерность n × q с qp. Если существует меньше измерений на ориентир для формы сравнения, чем целевая форма (q <p), функция добавляет столбцы нулей к Y, приводя к n × матрица p.

Уравнение, чтобы получить преобразованную форму, Z,

Z=bYT+c(1)

где:

  • b является масштабным коэффициентом, который простирается (b> 1) или уменьшения (b <1) точки.

  • T является ортогональным вращением и отражательной матрицей.

  • c является матрицей с постоянными значениями в каждом столбце, используемом, чтобы переключить точки.

Функция procrustes выбирает b, T и c, чтобы минимизировать расстояние между целевой формой X и преобразованной формой Z, как измерено критерием наименьших квадратов:

i=1nj=1p(XijZij)2

Предварительно обработайте данные для точных результатов

Анализ Procrustes является соответствующим, когда все размерности измерения p имеют подобные шкалы. Анализ был бы неточен, например, если бы столбцы Z имели различные шкалы:

  • Первый столбец измеряется в миллилитрах в пределах от 2 000 - 6 000.

  • Второй столбец измеряется в градусах Цельсия в пределах от 10 - 25.

  • Третий столбец измеряется в килограммах в пределах от 50 - 230.

В таких случаях стандартизируйте свои переменные:

  1. Вычитание демонстрационного среднего значения от каждой переменной.

  2. Деление каждой результирующей переменной ее демонстрационным стандартным отклонением.

Используйте функцию zscore, чтобы выполнить эту стандартизацию.

Смотрите также

Похожие темы