Как работает Kriging Interpolation?

10

Я работаю над проблемой, в которой мне нужно использовать Кригинг, чтобы предсказать значение некоторых переменных на основе некоторых окружающих переменных. Я хочу реализовать его код самостоятельно. Итак, я просмотрел слишком много документов, чтобы понять, как это работает, но я был так растерян. Как правило, я понимаю, что это средневзвешенное значение, но я не мог полностью понять процесс вычисления веса, а затем предсказать значение переменной.

Может ли кто-нибудь объяснить мне в простых терминах математические аспекты этого метода интерполяции и как он работает?

Dania
источник
3
Реализация кода - это отличный инструмент обучения, но его нельзя рекомендовать для работы над актуальными проблемами. К тому времени, как вы получите код, написанный, отлаженный и протестированный, вы обнаружите, что он требует на порядок больше усилий для предоставления дополнительных инструментов для анализа пространственных исследовательских данных, вариографии, перекрестной проверки вариограммы, поиска окрестностей и пост-анализа. обработка кригед-результатов. Разумным и эффективным компромиссом было бы начать с рабочего кода, такого как GSLib или GeoRGLM , и изменить его.
whuber
Большое спасибо, это отличная идея, но я также хочу понять математический аспект Кригинга, есть ли у вас ресурс, который объясняет это ясно в простых терминах? Спасибо.
Дания

Ответы:

15

Этот ответ состоит из вводного раздела, который я недавно написал для статьи, описывающей (скромное) пространственно-временное расширение «Универсального Кригинга» (Великобритания), которое само по себе является скромным обобщением «Обычного Кригинга». Он состоит из трех подразделов: теория дает статистическую модель и предположения; Оценка кратко рассматривает оценку параметра наименьших квадратов; и Прогнозирование показывает, как кригинг вписывается в структуру Обобщенных наименьших квадратов (GLS). Я приложил усилия, чтобы принять нотацию, знакомую статистикам, особенно посетителям этого сайта, и использовать концепции, которые хорошо объяснены здесь.

Подводя итог, можно сказать , что кригинг - это лучшее линейное непредвзятое прогнозирование (BLUP) случайного поля. Это означает, что прогнозируемое значение в любом месте выборки получается как линейная комбинация значений и ковариат, наблюдаемых в местах выборки. Там (неизвестное, случайное) значение имеет предполагаемую корреляцию со значениями выборки (и значения выборки соотносятся между собой). Эта корреляционная информация легко переводится в дисперсию прогноза. Каждый выбирает коэффициенты в линейной комбинации («веса Кригинга»), которые делают эту дисперсию настолько малой, насколько это возможно, при условии нулевого смещения в прогнозе. Подробности следуют.


теория

Великобритания включает в себя две процедуры - одну из оценки, а другую - прогнозирования, которые выполняются в контексте модели GLS для области исследования. В GLS модель предполагает , что выборка данных являются результатом случайных отклонений вокруг тренда , и что эти отклонения связаны между собой . Тренд подразумевается в общем смысле значения, которое может быть определено линейной комбинацией p неизвестных коэффициентов (параметров) β = ( β 1 , β 2 , , βZя, (язнак равно1,2,,,,,N)п . (В этом посте штрих ' обозначает транспонирование матрицы, а все векторы считаются векторами столбцов.)βзнак равно(β1,β2,...,βп)''

В любом месте в пределах области изучения имеется набор числовых атрибутов называемых «независимыми переменными» или «ковариатами». (Обычно y 1 = 1 является «постоянным членом», y 2 и y 3 могут быть пространственными координатами, а дополнительные y iYзнак равно(Y1,Y2,...,Yп)'Y1знак равно1Y2Y3Yяможет представлять пространственную информацию, а также другую вспомогательную информацию, которая доступна во всех местах в исследуемой области, например, пористость водоносного горизонта или расстояние до насосной скважины.) В каждом местоположении данных , в дополнение к его ковариатам y i = ( y i 1 , y i 2 , , y i p ) , ассоциированное наблюдение z i считается реализацией случайной величины Z i . В противоположность этому , у яяYязнак равно(Yя1,Yя2,...,Yяп)'ZяZяYясчитаются значениями, определяемыми или характеризующими точки или небольшие области, представленные наблюдениями (данные «поддерживают»). не считаются реализациями случайных величин и должны быть связаны со свойствами любого из Z I .YяZя

Линейная комбинация выражает ожидаемое значение Z i в терминах параметров β , который представляет собой Значение тренда в месте я . Процесс оценки использует данные , чтобы найти значения р I , которые представляют собой неизвестные параметры р I

Е[Zя]знак равноY'яβзнак равноYя1β1+Yя2β2++Yяпβп
Zяβяβ^яβятогда как процесс прогнозирования использует данные в местоположениях чтобы вычислить значение в местоположении без выборки, которое здесь индексируется как i = 0 . Цели оценки являются фиксированными ( то есть неслучайными) параметрами, тогда как цель прогнозирования является случайной, поскольку значение z 0 включает в себя случайные колебания вокруг его тренда y 0 β . Как правило, прогнозы делаются для нескольких местоположений, используя одни и те же данные, меняя местоположение 0язнак равно1,2,...,Nязнак равно0Z0Y0'β0, Например, часто делаются прогнозы для отображения поверхности вдоль регулярной сетки точек, подходящих для контурирования.

Предварительный расчет

Классический кригинг предполагает, что случайные флуктуации имеют ожидаемые значения нуля, и их ковариации известны. Запишите ковариацию между Z i и Z j как c i j . Используя эту ковариацию, оценка выполняется с использованием GLS. Ее решение заключается в следующем: β = Н г , Н = ( Y ' С - 1 У ) - 1 Y ' С - 1 , где г = ( г 1ZяZяZJсяJ

β^знак равноЧАСZ, ЧАСзнак равно(Y'С-1Y)-1Y'С-1
- n -вектор наблюдений, Y = ( y i j ) («матрица проектирования») - этоматрица n by p , строки которой представляют собой векторы y i , 1 i n , а C = ( c i j ) -ковариационная матрица n- by- n, которая предполагается обратимой (Draper & Smith (1981), раздел 2.11). Zзнак равно(Z1,Z2,...,ZN)NYзнак равно(YяJ)NпYя',1яNСзнак равно(сяJ)NN от п матрицы H , которая проецирует данные г на параметр оценки р , называется «матрица шлема»Формулировка р как применение матрицы шлема к даннымявном виде показываеткак оценки параметров линейно зависят от данных. Ковариации C = ( c i j ) классически вычисляются с использованием вариограммы, которая дает ковариацию с точки зрения местоположения данных, хотя не имеет значения, как на самом деле рассчитывается ковариация.пNЧАСZβ^β^Сзнак равно(сяJ)

прогнозирование

Великобритания аналогично предсказывает с помощью линейной комбинации данных г 0 = λ 1 г 1 + λ 2 г 2 + + λ п г п = λ ' г . Λ я называю «Кригинг веса» для предсказания г 0 . Великобритания выполняет это предсказание z 0 , удовлетворяя двум критериям. Во-первых, прогноз должен быть непредвзятым, что выражается в требовании линейной комбинации случайных величин.Z0

Z^0знак равноλ1Z1+λ2Z2++λNZNзнак равноλ'Z,
λяZ0Z0 равен Z 0 в среднем: 0 = E [ Z 0 - Z 0 ] = E [ λ ' Z - Z 0 ] . Это ожидание принято для совместного n + 1 -вариантного распределения Z 0 и Z = ( Z 1 , Z 2 , , Z n )ZяZ0
0знак равноЕ[Z^0-Z0]знак равноЕ[λ'Z-Z0],
N+1Z0Zзнак равно(Z1,Z2,...,ZN), Линейность ожидания вместе с предположением тренда (1) подразумевает:
0знак равноЕ[λ'Z-Z0]знак равноλ'Е[Z]-Е[Z0]знак равноλ'(Yβ)-Y'0βзнак равно(λ'Y-Y'0)βзнак равноβ'(Y'λ-Y0)

β

Y^'λзнак равноY0,

λZ^0-Z0

Вaр(Z^0-Z0)знак равноЕ[(Z^0-Z0)2]знак равноЕ[(λ'Z-Z0)2]знак равнос00-2λ'с0+λ'Сλ
с0знак равно(с01,с02,...,с0N)'Z0Zя, я1с00Z0

λпμY^'λзнак равноY0N+п

(СYY'0)(λμ)знак равно(с0Y0)
0пп1NNλ
λзнак равноЧАС'Y0+С-1(1-YЧАС)с0,

(Читатели, знакомые с множественной регрессией, могут посчитать полезным сравнить это решение с ковариационным решением обыкновенных уравнений наименьших квадратов , который выглядит практически точно так же, но без множителей Лагранжа.)

λ[ЧАС'Y0]Z0Z^0

Whuber
источник
1
Большое вам спасибо, это именно то, что я ищу. Вы решили эту проблему для меня, теперь я понимаю Кригинг. Я очень ценю вашу помощь, большое спасибо.
Дания
Y^'
Y'знак равно(YJя)пNYя,1яN