Анализ Простростей

Сравнение Landmark данных

procrustes функция анализирует распределение набора форм с помощью анализа Procrustes. Этот метод анализа совпадает с историческими данными (геометрические местоположения, представляющие значимые функции в заданной форме), чтобы вычислить лучшие сохраняющие форму евклидовы преобразования. Эти преобразования минимизируют различия в местоположении между сравненными историческими данными.

Анализ Procrustes также полезен в сочетании с многомерным масштабированием. В конструкции карты с использованием многомерного масштабирования существует наблюдение, что ориентация восстановленных точек является произвольной. Два различных применения многомерного масштабирования могут привести к восстановленным точкам, которые очень похожи в принципе, но выглядят по-разному, потому что они имеют различные ориентации. The procrustes функция преобразует один набор точек, чтобы сделать их более сопоставимыми с другим.

Вход данных

procrustes функция принимает за вход две матрицы:

  • Матрица целевой формы X имеет размерность n × p, где n количество ориентиров в форме и p количество измерений на один ориентир.

  • Матрица формы сравнения Y имеет размерность n × q с qp. Если на один ориентир для формы сравнения приходится меньше измерений, чем на целевую форму (q <p), функция добавляет столбцы нулей к Y, получая n × p матрица.

Уравнение для получения преобразованной формы, Z, является

Z=bYT+c(1)

где:

  • b является масштабным коэффициентом, который растягивает (b > 1) или сжимает (b < 1) точки.

  • T - ортогональная матрица поворота и отражения.

  • c является матрицей с постоянными значениями в каждом столбце, используемой для сдвига точек.

The procrustes функция выбирает b, T, и c, чтобы минимизировать расстояние между целевой формой X и преобразованной формой Z, как измеряется критерием наименьших квадратов:

i=1nj=1p(XijZij)2

Предварительная обработка данных для точных результатов

Анализ Procrustes подходит, когда все p размерности измерений имеют сходные шкалы. Анализ был бы неточным, например, если бы столбцы Z имели различные шкалы:

  • Первый столбец измеряют в миллилитрах в диапазоне от 2000 до 6000.

  • Второй столбец измеряется в степенях Цельсия от 10 до 25.

  • Третий столбец измеряется в килограммах в диапазоне от 50 до 230.

В таких случаях стандартизируйте свои переменные:

  1. Вычитание среднего значения выборки из каждой переменной.

  2. Разделение каждой результирующей переменной на стандартное отклонение выборки.

Используйте zscore функция для выполнения этой стандартизации.

См. также

Похожие темы

Для просмотра документации необходимо авторизоваться на сайте