Я очень плохо знаком с пространственной статистикой и смотрю много уроков,
Но я не совсем понимаю, почему вы должны предоставить модель вариограммы, когда кригите.
Я использую пакет gstat в R, и это пример, который они дают:
library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)
Кто-нибудь может объяснить в двух строчках, почему вы сначала должны предоставить vgm? А как вы устанавливаете параметры?
Заранее спасибо! Kasper
gstat
пакета R с теми же данными о мезе.krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)
оценивает локальные вариограммы. Например, у вас нет вариограммы по всему учебному пространству, но оцените новую модель для каждого местоположения, которое вы пытаетесь предсказать. Локальная модель затем захватывает только ближайшие 10 значений (поскольку вы не указываете максимальное расстояние, она всегда должна захватывать 10 значений, поэтомуnmin
должна быть лишней).Ответы:
Введение и резюме
Закон географии Тоблера утверждает
Кригинг принимает модель тех отношений, в которых
«Вещи» - это числовые значения в местах на поверхности Земли (или в космосе), обычно представляемые в виде евклидовой плоскости.
Предполагается, что эти числовые значения являются реализациями случайных величин.
«Связанный» выражается в терминах средних значений и ковариаций этих случайных величин.
(Коллекция случайных величин, связанных с точками в пространстве, называется «случайным процессом».) Вариограмма предоставляет информацию, необходимую для вычисления этих ковариаций.
Что такое кригинг
Кригинг определенно является предсказанием вещей в местах, где они не наблюдались. Чтобы сделать процесс прогнозирования математически управляемым, Кригинг ограничивает возможные формулы линейными функциями наблюдаемых значений. Это делает задачу конечной из определения того, какими должны быть коэффициенты. Их можно найти, потребовав, чтобы процедура прогнозирования имела определенные свойства. Интуитивно понятно, что отличным свойством является то, что различия между предиктором и истинным (но неизвестным) значением должны быть небольшими: то есть предиктор должен быть точным . Другое свойство, которое широко рекламируется, но более сомнительно, заключается в том, что в среднем предиктор должен равняться истинному значению: оно должно быть точным .
(Причина, по которой настаивать на идеальной точности сомнительна, но не обязательно плоха, заключается в том, что она обычно делает любую статистическую процедуру менее точной, то есть более изменчивой. При стрельбе по цели вы предпочитаете равномерно распределять попадания по оправы и редко ударяя по центру, или вы примете результаты, которые сфокусированы только рядом, но не точно на центре? Первый точный, но неточный, а второй неточный, но точный.)
Эти допущения и критерии - это значит, что ковариации являются подходящими способами количественной оценки родства, что линейный прогноз будет работать, и что предиктор должен быть как можно более точным при условии его абсолютной точности, - привести к системе уравнений, которая имеет Уникальное решение при условии, что ковариации были определены в последовательном порядке . Результирующий предиктор, таким образом, называется «BLUP»: лучший линейный несмещенный предиктор.
Где приходит вариограмма
Нахождение этих уравнений требует практической реализации только что описанной программы. Это делается путем записи ковариаций между предиктором и наблюдениями, которые рассматриваются как случайные величины. Алгебра ковариаций вызывают ковариации среди наблюдаемых значений , чтобы войти в Кригинге уравнений, тоже.
В этот момент мы заходим в тупик, потому что эти ковариации почти всегда неизвестны. В конце концов, в большинстве приложений мы наблюдали только одну реализацию каждой из случайных величин: а именно, наш набор данных, который составляет всего одно число в каждом отдельном месте. Введите вариограмму: эта математическая функция сообщает нам, какой должна быть ковариация между любыми двумя значениями. Он ограничен для обеспечения того, чтобы эти ковариации были «последовательными» (в том смысле, что они никогда не дадут набор ковариаций, которые математически невозможны: не все наборы числовых показателей «связанности» будут формировать фактические ковариационные матрицы ). Вот почему вариограмма необходима для кригинга.
Ссылки
Поскольку на немедленный вопрос был дан ответ, я остановлюсь здесь. Заинтересованные читатели могут узнать, как оценивают и интерпретируют вариограммы, обратившись к хорошим текстам, таким как «Журналистика и Хейбрегтс» « Горная геостатистика» (1978) или « Прикладная геостатистика» Исаакса и Шриваставы (1989). (Обратите внимание , что процесс оценки вводит два объекта под названием «вариограммы»: эмпирическая вариограмма на основе данных и модель вариограммы, установленная на нем все ссылки на «вариограмму» в этом ответе есть модели призыва к..
vgm
В этом вопросе возвращает компьютерное представление модельной вариограммы.) Для более современного подхода, в котором оценка вариограммы и Кригинг соответствующим образом комбинируются, см. Diggle &Модель на основе геостатистики (2007) (которая также является расширенным руководством дляR
пакетовGeoR
иGeoRglm
).Комментарии
Кстати, независимо от того, используете ли вы Кригинг для прогнозирования или какой-либо другой алгоритм, количественная характеристика родства, предоставляемая вариограммой, полезна для оценки любой процедуры прогнозирования. Обратите внимание, что все методы пространственной интерполяции являются предикторами с этой точки зрения, и многие из них являются линейными предикторами, такими как IDW (обратное взвешенное расстояние). Вариограмму можно использовать для оценки среднего значения и дисперсии (стандартного отклонения) любого из методов интерполяции. Таким образом, он имеет применимость далеко за пределами его использования в Kriging.
источник