Как создать карту ошибок для поддержки карты средней плотности ядра?

10

Я создал карту средней плотности ядра, запустив KDE для точек, расположенных в одном и том же пространственном экстенте. Например, скажем, у нас есть три точечных шейп-файла, представляющих сеянцы в трех разных лесных промежутках одинаковой формы и размера. Я запустил KDE для каждого шейп-файла точек. Выход из KDE затем были сложены на основе пространственной протяженности, чтобы вычислить среднее в растровом калькулятора Arc, например: Float(("KDE1"+"KDE2"+"KDE3")/3). Вот конечный продукт:

введите описание изображения здесь

Теперь я заинтересован в создании карты с изображением ошибки, связанной с усредненными значениями KDE. Я надеюсь использовать карту ошибок, чтобы визуально изобразить, сколько ошибок связано с горячими точками (например, является ли горячая точка SW полностью точками в одном зазоре?). Как мне создать карту ошибок, связанных с усредненными значениями KDE? Будет ли MSE самой подходящей мерой ошибки в этом случае?

Аарон
источник
3
Это очень интересный анализ. Что вы подразумеваете под "стандартной ошибкой"? Какое-то отклонение (различие) каждой карты плотности от «среднего» слоя?
Анализ ландшафта
@Landscape Analysis Сообщение отредактировано, чтобы адресовать комментарии. Да, я думаю, что оценка MSE может быть наиболее подходящей в этом случае. По сути, показывает, как каждый KDE отличается от среднего KDE. Я не уверен, как собрать все это вместе, используя ArcGIS и / или скрипты.
Аарон

Ответы:

8

Caveat

Стандартная ошибка - это полезный способ оценки неопределенности по выборочным данным, когда в данных нет систематической ошибки. Это предположение имеет сомнительную обоснованность в этом контексте, потому что (а) карты KDE локально будут иметь определенные ошибки, которые могут систематически сохраняться между слоями, и (б) потенциально огромный компонент неопределенности из-за выбора радиуса ядра (или «полосы пропускания»). ") не будет отражено вообще ни в одной данной коллекции этих карт.

Некоторые варианты

Тем не менее, изображать изменчивость среди набора связанных, размещенных («сложенных») карт - отличная идея - при условии, что вы помните только что описанные ограничения. Несколько мер локальной изменчивости были бы естественными в этой обстановке, в том числе:

  • Диапазон значений, выраженный либо аддитивно (максимум минус минимум) или мультипликативный (максимум делится на минимуме).

  • Дисперсия или стандартное отклонение значений. Мультипликативной версией этого будет дисперсия или стандартное отклонение логарифмов значений.

  • Надежная оценка дисперсии, такая как межквартильный диапазон (или отношение третьего к первому квартилю).

Во многих отношениях мультипликативные меры могут быть более подходящими для плотностей, потому что разница между (скажем) 100 и 101 деревьями на акр может быть несущественной, тогда как разница между 2 и 1 деревьями на акр может быть относительно важной. Оба демонстрируют одинаковый (аддитивный) диапазон 101-100 = 2-1 = 1, но их мультипликативные диапазоны 1,01 и 2,00 существенно различаются. (Обратите внимание, что мультипликативный диапазон всегда превышает 1, так что 2.00 в сто раз дальше от 1, чем 1.01).

вычисление

Вычисление этих мер требует некоторой формы местной статистики. Функциональность статистики ячеек в Spatial Analyst будет вычислять отклонения, диапазоны и стандартные отклонения. Местные квантили можно найти с рангом . Вместо суеты по поводу того, какие ряды использовать, выбирайте удобные рядом с квартилями. Чтобы найти их, пусть n будет числом сеток в стеке. Медиана имеет ранг (n + 1) / 2 - который может не быть целым числом, указывая, что его следует вычислять путем усреднения рангов n / 2 и n / 2 + 1, каждый из которых будет приближаться к медиане. Чтобы приблизить квартили, затем округлите (n + 1) / 2 до ближайшего целого числа, затем снова добавьте 1 и разделите на 2. Пусть это число будет r . использованиеr и n + 1 - r для рядов квартилей.

Например, если в стеке n = 6 сеток, (n + 1) / 2 округляется до 3 и (3 + 1) / 2 = 2 не требует округления. Используйте r = 2 и r = 6 + 1 - 2 = 5 для рангов. По сути, эта процедура возвращает второе самое низкое ( r = 2) и второе самое высокое ( r = 5) значение шести значений в каждой ячейке. Вы можете отобразить их разницу или соотношение.

Whuber
источник
2
Я полагаю, что коэффициент вариации будет полезен в этом контексте.
Джеффри Эванс
1
@jeffrey Спасибо, это тоже соображение. CV получается путем деления (локальной) сетки стандартного отклонения на (локальную) среднюю сетку. Я не упоминал об этом, но для таких мультипликативных сводок следует позаботиться о том, чтобы замаскировать области, где знаменатель (среднее или минимальное, в зависимости от обстоятельств) близок к нулю: результаты могут быть ненадежными и вероятными не будет отражать ничего, кроме числовой неточности и крошечных неточностей в приближении ядер.
whuber
@whuber, не могли бы вы уточнить пункт (а) в первом абзаце? Например, вы имеете в виду ошибки в методах сбора данных, которые могут сохраняться в каждом лесном промежутке (и, следовательно, систематически проявляться в каждом растре KDE), или ошибки, связанные с реализацией целевой функции?
MannyG
@whuber Прекрасные идеи вокруг - большое спасибо!
Аарон