Билинейная интерполяция точечных данных на растре в Python?

12

У меня есть растр, с которым я бы хотел провести точечную интерполяцию. Вот где я нахожусь:

from osgeo import gdal
from numpy import array

# Read raster
source = gdal.Open('my_raster.tif')
nx, ny = source.RasterXSize, source.RasterYSize
gt = source.GetGeoTransform()
band_array = source.GetRasterBand(1).ReadAsArray()
# Close raster
source = None

# Compute mid-point grid spacings
ax = array([gt[0] + ix*gt[1] + gt[1]/2.0 for ix in range(nx)])
ay = array([gt[3] + iy*gt[5] + gt[5]/2.0 for iy in range(ny)])

До сих пор я пробовал функцию SciPy interp2d :

from scipy import interpolate
bilinterp = interpolate.interp2d(ax, ay, band_array, kind='linear')

однако я получаю ошибку памяти в моей 32-битной системе Windows с растром 317 × 301:

Traceback (most recent call last):
  File "<interactive input>", line 1, in <module>
  File "C:\Python25\Lib\site-packages\scipy\interpolate\interpolate.py", line 125, in __init__
    self.tck = fitpack.bisplrep(self.x, self.y, self.z, kx=kx, ky=ky, s=0.)
  File "C:\Python25\Lib\site-packages\scipy\interpolate\fitpack.py", line 873, in bisplrep
tx,ty,nxest,nyest,wrk,lwrk1,lwrk2)
MemoryError

Я признаю, я не очень уверен в этой функции SciPy, так как параметры bounds_errorили fill_valueне работают так, как задокументировано. Я не понимаю, почему у меня должна быть ошибка памяти, поскольку мой растр 317 × 301, и билинейный алгоритм не должен быть сложным.

Кто-нибудь сталкивался с хорошим алгоритмом билинейной интерполяции, предпочтительно на Python, возможно, с учетом NumPy? Любые советы или советы?


(Примечание: алгоритм интерполяции ближайшего соседа прост:

from numpy import argmin, NAN

def nearest_neighbor(px, py, no_data=NAN):
    '''Nearest Neighbor point at (px, py) on band_array
    example: nearest_neighbor(2790501.920, 6338905.159)'''
    ix = int(round((px - (gt[0] + gt[1]/2.0))/gt[1]))
    iy = int(round((py - (gt[3] + gt[5]/2.0))/gt[5]))
    if (ix < 0) or (iy < 0) or (ix > nx - 1) or (iy > ny - 1):
        return no_data
    else:
        return band_array[iy, ix]

... но я предпочитаю билинейные методы интерполяции)

Майк Т
источник
1
Может быть, вы получаете, MemoryErrorпотому что NumPy пытается получить доступ за пределами вашего band_array? Вы должны проверить axи ay.
OLT
1
ax, ay может иметь проблемы, если сетка вообще вращается. Возможно, лучше преобразовать точки интерполяции в точки в координаты пикселей или данных. Кроме того, если с ними возникнут проблемы, то вы можете выйти за рамки группы.
Дэйв Икс
Правильные, повернутые сетки требуют преобразования в пространство сетки, а затем обратно в пространство координат. Это требует обратного коэффициента аффинного преобразования в gt.
Майк Т

Ответы:

7

Я перевел приведенную ниже формулу (из Википедии ) на язык Python, чтобы получить следующий алгоритм, который, похоже, работает.

from numpy import floor, NAN

def bilinear(px, py, no_data=NAN):
    '''Bilinear interpolated point at (px, py) on band_array
    example: bilinear(2790501.920, 6338905.159)'''
    ny, nx = band_array.shape
    # Half raster cell widths
    hx = gt[1]/2.0
    hy = gt[5]/2.0
    # Calculate raster lower bound indices from point
    fx = (px - (gt[0] + hx))/gt[1]
    fy = (py - (gt[3] + hy))/gt[5]
    ix1 = int(floor(fx))
    iy1 = int(floor(fy))
    # Special case where point is on upper bounds
    if fx == float(nx - 1):
        ix1 -= 1
    if fy == float(ny - 1):
        iy1 -= 1
    # Upper bound indices on raster
    ix2 = ix1 + 1
    iy2 = iy1 + 1
    # Test array bounds to ensure point is within raster midpoints
    if (ix1 < 0) or (iy1 < 0) or (ix2 > nx - 1) or (iy2 > ny - 1):
        return no_data
    # Calculate differences from point to bounding raster midpoints
    dx1 = px - (gt[0] + ix1*gt[1] + hx)
    dy1 = py - (gt[3] + iy1*gt[5] + hy)
    dx2 = (gt[0] + ix2*gt[1] + hx) - px
    dy2 = (gt[3] + iy2*gt[5] + hy) - py
    # Use the differences to weigh the four raster values
    div = gt[1]*gt[5]
    return (band_array[iy1,ix1]*dx2*dy2/div +
            band_array[iy1,ix2]*dx1*dy2/div +
            band_array[iy2,ix1]*dx2*dy1/div +
            band_array[iy2,ix2]*dx1*dy1/div)

Обратите внимание, что результат будет возвращен с явно более высокой точностью, чем исходные данные, поскольку он классифицируется с повышением до dtype('float64')типа данных NumPy . Вы можете использовать возвращаемое значение с, .astype(band_array.dtype)чтобы сделать тип выходных данных таким же, как у входного массива.

билинейная интерполяционная формула

Майк Т
источник
3

Я попробовал это локально с похожими результатами, но я на 64-битной платформе, поэтому он не достиг предела памяти. Возможно, вместо этого попробуйте интерполировать небольшие фрагменты массива за раз, как в этом примере .

Вы также можете просто сделать это с GDAL, из командной строки это будет:

gdalwarp -ts $XSIZE*2 0 -r bilinear input.tif interp.tif

Чтобы сделать эквивалентную операцию в Python, используйте ReprojectImage () :

mem_drv = gdal.GetDriverByName('MEM')
dest = mem_drv.Create('', nx, ny, 1)

resample_by = 2
dt = (gt[0], gt[1] * resample_by, gt[2], gt[3], gt[4], gt[5] * resample_by)
dest.setGeoTransform(dt)

resampling_method = gdal.GRA_Bilinear    
res = gdal.ReprojectImage(source, dest, None, None, resampling_method)

# then, write the result to a file of your choice...    
SCW
источник
Мои точечные данные, которые я хотел бы интерполировать, не располагаются регулярно, поэтому я не могу использовать встроенную ReprojectImageтехнику GDAL .
Майк Т
1

У меня была точная проблема в прошлом, и я никогда не решал ее с помощью interpolate.interp2d. Я имел успех, используя scipy.ndimage.map_coordinates . Попробуйте следующее:

scipy.ndimage.map_coordinates (band_array, [ax, ay]], order = 1)

Кажется, это дает тот же результат, что и билинейный.

Мэтью Снейп
источник
Это меня немного смутило, так как я не уверен, как используются исходные растровые координаты (вместо использования пиксельных координат). Я вижу, что это "векторизация", чтобы решить многие моменты.
Майк Т
Согласен, я не совсем понимаю Сципи. Ваше решение для клева намного лучше.
Мэтью Снейп
0

scipy.interpolate.interp2d () отлично работает с более современным scipy. Я думаю, что старые версии предполагают нерегулярные сетки и не используют преимущества обычных сеток. Я получаю ту же ошибку, что и вы со Сципи. версия = 0.11.0, но на scipy. Версия = 0.14.0, она успешно работает на некоторых моделях 1600x1600.

Спасибо за подсказки в вашем вопросе.

#!/usr/bin/env python

from osgeo import gdal
from numpy import array
import argparse

parser = argparse.ArgumentParser()
parser.add_argument("filename",help='raster file from which to interpolate a (1/3,1/3) point from from')
args = parser.parse_args()

# Read raster
source = gdal.Open(args.filename)
nx, ny = source.RasterXSize, source.RasterYSize
gt = source.GetGeoTransform()
band_array = source.GetRasterBand(1).ReadAsArray()
# Close raster
source = None

# Compute mid-point grid spacings
ax = array([gt[0] + ix*gt[1] + gt[1]/2.0 for ix in range(nx)])
ay = array([gt[3] + iy*gt[5] + gt[5]/2.0 for iy in range(ny)])

from scipy import interpolate
bilinterp = interpolate.interp2d(ax, ay, band_array, kind='linear')

x1 = gt[0] + gt[1]*nx/3
y1 = gt[3] + gt[5]*ny/3.

print(nx, ny, x1,y1,bilinterp(x1,y1))

####################################

$ time ./interp2dTesting.py test.tif 
(1600, 1600, -76.322, 30.70889, array([-8609.27777778]))

real    0m4.086s
user    0m0.590s
sys 0m0.252s
Дэйв Икс
источник