exponenta event banner

Географическая статистика для точек на сфере

Некоторые функции картографического Toolbox™ вычисляют базовые географические показатели для пространственного анализа и для фильтрации и обработки данных. Поскольку функции MATLAB ® могут вычислять такие статистические данные, как средства, медианы и отклонения, почему бы не использовать эти функции на панели инструментов? Прежде всего, классические статистические формулы обычно предполагают, что данные одномерны (и, часто, нормально распределены). Поскольку это не так для геопространственных данных, пространственные аналитики разработали статистические показатели, которые распространяют традиционную статистику на более высокие измерения .

Во-вторых, такие формулы обычно предполагают, что данные занимают двумерную декартову систему координат. Вычисление статистики для геопространственных данных с географическими координатами, как если бы она была в декартовой структуре, может дать статистически неподходящие результаты. Хотя это предположение иногда может давать разумные численные аппроксимации в небольших географических регионах, для больших областей это может привести к неправильным выводам из-за мер расстояния и предположений о площади, которые неуместны для сфер и сфероидов. Приложение Mapping Toolbox надлежащим образом вычисляет статистику для геопространственных данных, избегая этих потенциальных подводных камней.

Географические средства

Рассмотрим задачу вычисления среднего положения набора географических точек. Получение среднего арифметического широт и долгот с использованием стандарта MATLAB mean функция может показаться разумной, но это может дать вводящие в заблуждение результаты.

Возьмите две точки на одной широте, на расстоянии 180 ° друг от друга по долготе, например (30 ° N, 90 ° W) и (30 ° N, 90 ° E). Средняя широта равна (30 + 30 )/2 = 30, что кажется правильным. Аналогично, средняя долгота должна быть (90 + (-90) )/2 = 0. Однако, поскольку можно также выразить 90 ° W как 270 ° E, (90 + 270 )/2 = 180 также является допустимой средней долготой. Таким образом, существует два правильных ответа: простой меридиан и линия отсчета. Это демонстрирует, как сферичность Земли вносит тонкости в пространственную статистику.

Эта проблема еще более усложняется, когда некоторые точки находятся в разных широтах. Поскольку степень долготы на Полярном круге занимает гораздо меньшее расстояние, чем степень на экваторе, расстояние между точками, имеющими заданное различие в долготе, изменяется в зависимости от широты.

Является ли на самом деле 30 ° N правильной средней широтой в первом примере? Среднее положение двух точек должно быть равноудаленным от этих двух точек, а также должно минимизировать общее расстояние. Удовлетворяет ли (30 ° N, 0 °) этим критериям?

dist1 = distance(30,90,30,0)
dist1 =
	75.5225
dist2 = distance(30,-90,30,0)
dist2 =
	75.5225

Рассмотрим третий момент, (lat,lon), что также равноудалено от вышеуказанных двух точек, но на меньшем расстоянии:

dist1 = distance(30,90,lat,lon)
dist1 =
	60.0000
dist2 = distance(30,-90,lat,lon)
dist2 =
	60.0000

Что это за тайна? lat равно 90 ° N, и любоеlon сделаю. Северный полюс является истинным географическим средним для этих двух точек. Обратите внимание, что большая окружность, содержащая обе точки, проходит через Северный полюс (большая окружность представляет кратчайший путь между двумя точками на сфере).

Функция панели инструментов сопоставления meanm определяет среднее географическое для любого числа точек. Для этого используется трехмерное векторное сложение всех точек. Например, попробуйте выполнить следующие действия:

lats = [30 30];
longs = [-90 90];
[latbar,longbar] = meanm(lats,longs)
latbar =
	90
longbar =
	0

Это ответ, который вы теперь ожидаете. Это географическое среднее может привести к одной странности; если все векторы отменяют друг друга, среднее - это центр планеты. В этом случае возвращаемая средняя точка равна (NaN,NaN) и отображается предупреждение. Это явление очень маловероятно в реальных данных, но может быть легко сконструировано. Например, это происходит, когда все точки равномерно расположены вдоль большой окружности. Попробуйте взять среднее географическое (0 °, 0 °), (0 °, 120 °) и (0 °, 240 °), которые трисектируют экватор.

elats = [0 0 0];
elons = [60 120 240];
meanm(elats, elons)
ans =
         0  120.0000

Географическое стандартное отклонение

Как можно ожидать, декартово определение стандартного отклонения, предоставленное в стандартной функции MATLAB std также неуместно для географических данных, которые не проецируются или охватывают значительную часть планеты. В зависимости от цели, вы можете использовать отдельные географические отклонения для широты и долготы, обеспечиваемые функцией stdm, или одиночное стандартное расстояние, предусмотренное в stdist. Оба метода измеряют отклонение точек от среднего положения, рассчитанного по meanm.

Значение stdm

stdm функция обрабатывает отклонения широты и долготы отдельно.

[latstd,lonstd] = stdm(lat,lon)

Функция возвращает два отклонения, одно для широт и одно для долгот.

Отклонение широты - это простой расчет стандартного отклонения от средней широты (средней параллели), возвращаемой meanm. Это разумная мера для большинства случаев, так как на сфере, по крайней мере, степень широты всегда имеет одинаковую длину дуги.

Отклонение долготы - другое дело. Простые вычисления, основанные на угловом отклонении суммы квадратов от средней долготы (среднего меридиана), вводят в заблуждение. Длина дуги, представляемая степенью долготы в крайних широтах, значительно меньше, чем в низких широтах.

Термин «отклонение» используется для представления расстояния длины дуги вдоль параллели точки от заданного меридиана. Например, предполагая сферическую планету, уход градуса долготы на Экваторе является градусом длины дуги, но уход градуса долготы на широте 60 ° составляет половину градуса длины дуги. stdm функция вычисляет отклонение отклонения суммы квадратов от среднего меридиана.

Если требуется вывести на печать односигматические линии для stdm, линии latitude sigma являются параллелями. Однако линии долготы сигмы не являются меридианами; они представляют собой линии постоянного отхода от средней параллели.

Такая обработка отклонения имеет свои проблемы. Например, его зависимость от логики системы координат может привести к его разрушению вблизи полюсов. По этой причине стандартное расстояние, обеспечиваемое stdist часто является лучшей мерой отклонения. stdm обработка полезна для многих приложений, особенно когда данные не являются глобальными. Например, эти потенциальные трудности не будут представлять опасности для точек данных, ограничивающихся страной Мексика.

Значение stdist

Стандартное расстояние между географическими данными является мерой дисперсии данных с точки зрения их расстояния от географического среднего. Среди его преимуществ - его применимость в любой точке земного шара и его единая ценность:

dist = stdist(lat,lon)

Короче говоря, стандартное расстояние представляет собой среднее, норму или кубическую норму расстояний точек данных в большом круговом смысле от среднего положения. Вероятно, это более высокая мера по сравнению с двумя отклонениями, возвращенными stdm за исключением случаев, когда исследуется особенно широтно-или долготозависимый признак.

Связанные темы