Я работаю над проблемой, в которой мне нужно использовать Кригинг, чтобы предсказать значение некоторых переменных на основе некоторых окружающих переменных. Я хочу реализовать его код самостоятельно. Итак, я просмотрел слишком много документов, чтобы понять, как это работает, но я был так растерян. Как правило, я понимаю, что это средневзвешенное значение, но я не мог полностью понять процесс вычисления веса, а затем предсказать значение переменной.
Может ли кто-нибудь объяснить мне в простых терминах математические аспекты этого метода интерполяции и как он работает?
spatial
interpolation
kriging
Dania
источник
источник
Ответы:
Этот ответ состоит из вводного раздела, который я недавно написал для статьи, описывающей (скромное) пространственно-временное расширение «Универсального Кригинга» (Великобритания), которое само по себе является скромным обобщением «Обычного Кригинга». Он состоит из трех подразделов: теория дает статистическую модель и предположения; Оценка кратко рассматривает оценку параметра наименьших квадратов; и Прогнозирование показывает, как кригинг вписывается в структуру Обобщенных наименьших квадратов (GLS). Я приложил усилия, чтобы принять нотацию, знакомую статистикам, особенно посетителям этого сайта, и использовать концепции, которые хорошо объяснены здесь.
Подводя итог, можно сказать , что кригинг - это лучшее линейное непредвзятое прогнозирование (BLUP) случайного поля. Это означает, что прогнозируемое значение в любом месте выборки получается как линейная комбинация значений и ковариат, наблюдаемых в местах выборки. Там (неизвестное, случайное) значение имеет предполагаемую корреляцию со значениями выборки (и значения выборки соотносятся между собой). Эта корреляционная информация легко переводится в дисперсию прогноза. Каждый выбирает коэффициенты в линейной комбинации («веса Кригинга»), которые делают эту дисперсию настолько малой, насколько это возможно, при условии нулевого смещения в прогнозе. Подробности следуют.
теория
Великобритания включает в себя две процедуры - одну из оценки, а другую - прогнозирования, которые выполняются в контексте модели GLS для области исследования. В GLS модель предполагает , что выборка данных являются результатом случайных отклонений вокруг тренда , и что эти отклонения связаны между собой . Тренд подразумевается в общем смысле значения, которое может быть определено линейной комбинацией p неизвестных коэффициентов (параметров) β = ( β 1 , β 2 , … , βzi, (i=1,2,...,n) p . (В этом посте штрих ' обозначает транспонирование матрицы, а все векторы считаются векторами столбцов.)β=(β1,β2,…,βp)′ ′
В любом месте в пределах области изучения имеется набор числовых атрибутов называемых «независимыми переменными» или «ковариатами». (Обычно y 1 = 1 является «постоянным членом», y 2 и y 3 могут быть пространственными координатами, а дополнительные y iy=(y1,y2,…,yp)′ y1=1 y2 y3 Yя может представлять пространственную информацию, а также другую вспомогательную информацию, которая доступна во всех местах в исследуемой области, например, пористость водоносного горизонта или расстояние до насосной скважины.) В каждом местоположении данных , в дополнение к его ковариатам y i = ( y i 1 , y i 2 , … , y i p ) ′ , ассоциированное наблюдение z i считается реализацией случайной величины Z i . В противоположность этому , у яя Yя= ( уя 1, уя 2, ... , уя п)' Zя Zя Yя считаются значениями, определяемыми или характеризующими точки или небольшие области, представленные наблюдениями (данные «поддерживают»). не считаются реализациями случайных величин и должны быть связаны со свойствами любого из Z I .Yя Zя
Линейная комбинация выражает ожидаемое значение Z i в терминах параметров β , который представляет собой Значение тренда в месте я . Процесс оценки использует данные , чтобы найти значения р I , которые представляют собой неизвестные параметры р I
Предварительный расчет
Классический кригинг предполагает, что случайные флуктуации имеют ожидаемые значения нуля, и их ковариации известны. Запишите ковариацию между Z i и Z j как c i j . Используя эту ковариацию, оценка выполняется с использованием GLS. Ее решение заключается в следующем: β = Н г , Н = ( Y ' С - 1 У ) - 1 Y ' С - 1 , где г = ( г 1Zя Zя ZJ ся ж
прогнозирование
Великобритания аналогично предсказывает с помощью линейной комбинации данных г 0 = λ 1 г 1 + λ 2 г 2 + ⋯ + λ п г п = λ ' г . Λ я называю «Кригинг веса» для предсказания г 0 . Великобритания выполняет это предсказание z 0 , удовлетворяя двум критериям. Во-первых, прогноз должен быть непредвзятым, что выражается в требовании линейной комбинации случайных величин.Z0
(Читатели, знакомые с множественной регрессией, могут посчитать полезным сравнить это решение с ковариационным решением обыкновенных уравнений наименьших квадратов , который выглядит практически точно так же, но без множителей Лагранжа.)
источник