Многомерные данные часто включают большое количество измеряемых переменных, и иногда эти переменные перекрываются в том смысле, что их группы могут быть зависимыми. Например, в десятиборье каждый спортсмен соревнуется в 10 мероприятиях, но несколько из них можно рассматривать как события скорости, а другие - как события силы и т. д. Таким образом, вы можете думать о 10 баллах конкурента как в значительной степени зависящих от меньшего набора из трех или четырех типов спортивных способностей.
Факторный анализ - это способ подгонки модели к многомерным данным для оценки именно такого рода взаимозависимости. В модели факторного анализа измеренные переменные зависят от меньшего числа ненаблюдаемых (скрытых) факторов. Поскольку каждый фактор может влиять на несколько общих переменных, они известны как общие факторы. Предполагается, что каждая переменная зависит от линейной комбинации общих факторов, и коэффициенты известны как нагрузки. Каждая измеренная переменная также включает в себя компонент, обусловленный независимой случайной изменчивостью, известной как специфическая дисперсия, поскольку она специфична для одной переменной.
В частности, факторный анализ предполагает, что ковариационная матрица данных имеет форму
где Λ является матрицей нагрузок, а элементы диагональной матрицы Функция factoran подходит для модели факторного анализа с использованием максимального правдоподобия.