Распространенная ошибка в применении двумерной статистики к географическим данным находится в игнорировании обработки равной области. Для данных об интервале часто необходимо статистически анализировать его. В Декартовой плоскости это легко сделано путем деления пробела в равные x-y квадраты. Географический эквивалент этого является к интервалу данными в равных квадратах долготы широты. Поскольку такие квадраты в высоких широтах покрывают меньшие области, чем их дубликаты низкой широты, наблюдения в этих областях являются underemphasized. Результатом могут быть заключения, которые смещаются к экватору.
Географическая функция гистограммы histr
позволяет вам отображать сгруппированные географические наблюдения. Функция histr
приводит к equirectangular раскладыванию. Каждый интервал имеет то же угловое измерение и в широте и в долготе с измерением по умолчанию 1 степени. Центральные широты и долготы интервалов возвращены, а также количество наблюдений на интервал:
[binlat,binlon,num] = histr(lats,lons)
Как ранее отмечено, эти equirectangular интервалы приводят к подсчету смещения к экватору. Вот отображение одной степени одним раскладыванием степени приблизительно 5 000 случайных точек данных в России. Относительный размер кругов указывает на количество наблюдений на интервал:
Это - фрагмент целой карты, отображенной в проекции Бонны равной области. Первый шаг в создании отображений данных без смещения области должен выбрать проекцию равной области. Пропорционально размерные символы являются результатом специализированной функции отображения scatterm
.
Можно устранить смещение области путем добавления четвертого выходного аргумента histr
, который будет использоваться, чтобы взвесить наблюдение каждого интервала областью того интервала:
[binlat,binlon,num,wnum] = histr(lats,lons)
Четвертый вывод является взвешенным количеством наблюдения. Количество наблюдения каждого интервала разделено на его нормированную область. Поэтому интервал высокой широты будет иметь больший взвешенный номер, чем интервал низкой широты с тем же количеством фактических наблюдений. Те же данные и интервалы выглядят очень отличающимися, когда они взвешиваются областью:
Заметьте, что существуют большие символы на север в этом отображении. Предыдущее отображение предположило, что данные были относительно равномерно распределены. Когда факторы равной области включены, ясно, что данные скашиваются на север. На самом деле используемые данные северные скошенный, но простой equirectangular обработка не пройдено, чтобы продемонстрировать это.
Функция histr
, поэтому, действительно предусматривает отображение взвешенных областью данных. Однако фактические используемые интервалы имеют переменные области. Помните, одна степень одним интервалом степени около полюса намного меньше, чем его дубликат около экватора.
Функция hista
предусматривает фактические интервалы равной области.
Сами фактические данные могут быть преобразованы в систему координат равной области для анализа с другими статистическими функциями. Легко преобразовать набор географических точек долготы широты к равной области x-y Декартова система координат. Функция grn2eqa
применяет то же преобразование, используемое в вычислении Равной области Цилиндрическая проекция:
[x,y] = grn2eqa(lat,lon)
Для каждого географического lat
- пары lon
, равная область x
- возвращен y
. Переменные x
и y
могут затем управляться под предположением равной области, с помощью множества двумерных статистических методов. Инструменты для такого анализа могут быть найдены в программном обеспечении Statistics and Machine Learning Toolbox™ и в другом месте. Результаты могут затем быть преобразованы назад в географические координаты с помощью функции eqa2grn
:
[lat,lon] = eqa2grn(x, y)
Помните, преобразовывая назад и вперед между системами, широта соответствует y, и долгота соответствует x.