Наложение пространственного многоугольника на сетку и проверка, в каких координатах элемента сетки находятся определенные координаты, с помощью R [closed]

32

Как можно использовать R для

  1. разбить шейп-файл на 200-метровые квадраты / суб-полигоны,
  2. нанесите эту сетку (включая идентификационные номера для каждого квадрата) на исходную карту ниже, и
  3. оценить, в каком квадрате расположены конкретные географические координаты .

Я новичок в ГИС, и это, возможно, основной вопрос, но я не нашел учебника о том, как это сделать в R.

На данный момент я загружаю шейп-файл из Нью-Йорка и строю некоторые примерные географические координаты.

Я ищу пример (код R), как это с данными ниже.

# Load packages 
library(maptools)

# Download shapefile for NYC
# OLD URL (no longer working)
# shpurl <- "http://www.nyc.gov/html/dcp/download/bytes/nybb_13a.zip"
shpurl <- "https://www1.nyc.gov/assets/planning/download/zip/data-maps/open-data/nybb_13a.zip"

tmp    <- tempfile(fileext=".zip")
download.file(shpurl, destfile=tmp)
files <- unzip(tmp, exdir=getwd())

# Load & plot shapefile
shp <- readShapePoly(files[grep(".shp$", files)])
plot(shp)

# Define coordinates 
points_of_interest <- data.frame(y=c(919500, 959500, 1019500, 1049500, 1029500, 989500), 
                 x =c(130600, 150600, 180600, 198000, 248000, 218000),
                 id  =c("A"), stringsAsFactors=F)

# Plot coordinates
points(points_of_interest$y, points_of_interest$x, pch=19, col="red")

введите описание изображения здесь

majom
источник
См. Также stackoverflow.com/q/17801398/287948
Питер Краусс

Ответы:

36

Вот пример использования SpatialGridобъекта:

### read shapefile
library("rgdal")
shp <- readOGR("nybb_13a", "nybb")

proj4string(shp)  # units us-ft
# [1] "+proj=lcc +lat_1=40.66666666666666 +lat_2=41.03333333333333 
# +lat_0=40.16666666666666 +lon_0=-74 +x_0=300000 +y_0=0 +datum=NAD83
# +units=us-ft +no_defs +ellps=GRS80 +towgs84=0,0,0"

### define coordinates and convert to SpatialPointsDataFrame
poi <- data.frame(x=c(919500, 959500, 1019500, 1049500, 1029500, 989500),
                  y=c(130600, 150600, 180600, 198000, 248000, 218000),
                  id="A", stringsAsFactors=F)
coordinates(poi) <- ~ x + y
proj4string(poi) <- proj4string(shp)

### define SpatialGrid object
bb <- bbox(shp)
cs <- c(3.28084, 3.28084)*6000  # cell size 6km x 6km (for illustration)
                                # 1 ft = 3.28084 m
cc <- bb[, 1] + (cs/2)  # cell offset
cd <- ceiling(diff(t(bb))/cs)  # number of cells per direction
grd <- GridTopology(cellcentre.offset=cc, cellsize=cs, cells.dim=cd)
grd
# cellcentre.offset 923018 129964
# cellsize           19685  19685
# cells.dim              8      8

sp_grd <- SpatialGridDataFrame(grd,
                               data=data.frame(id=1:prod(cd)),
                               proj4string=CRS(proj4string(shp)))
summary(sp_grd)
# Object of class SpatialGridDataFrame
# Coordinates:
#      min     max
# x 913175 1070655
# y 120122  277602
# Is projected: TRUE
# ...

Теперь вы можете использовать реализованный overметод для получения идентификаторов ячеек:

over(poi, sp_grd)
#   id
# 1 57
# 2 51
# 3 38
# 4 39
# 5 14
# 6 28

Чтобы построить шейп-файл и сетку с идентификаторами ячеек:

library("lattice")
spplot(sp_grd, "id",
       panel = function(...) {
         panel.gridplot(..., border="black")
         sp.polygons(shp)
         sp.points(poi, cex=1.5)
         panel.text(...)
       })

spplot1

или без цвета / цветовой ключ:

library("lattice")
spplot(sp_grd, "id", colorkey=FALSE,
       panel = function(...) {
         panel.gridplot(..., border="black", col.regions="white")
         sp.polygons(shp)
         sp.points(poi, cex=1.5)
         panel.text(..., col="red")
       })

spplot2

система охлаждения реактора
источник
Это похоже на ответ для меня, но в случае, если вы ищете что-то другое. Попробуйте тэг r в stackoverflow stackoverflow.com/search?q=R+tag
Брэд Несом
@rcs этот код выглядит так же, как я пытаюсь сделать, но мой шейп-файл находится в другой проекции: есть proj4string (DK_reg1) [1] "+proj=longlat +datum=WGS84 +no_defs +ellps=WGS84 +towgs84=0,0,0" ли у кого-нибудь какие-либо предложения о том, как разбить этот шейп-файл этой проекции на 1000 ячеек сетки одинакового размера? а затем случайным образом выбрать 100 из них и выделить их?
Я Дель Торо
9

Представленный в вопросе набор данных Нью-Йорк больше не доступен для скачивания. Я использую набор данных nc из пакета sf, чтобы продемонстрировать решение с использованием пакета sf:

library(sf)
library(ggplot2)

# read nc polygon data and transform to UTM 
nc <- st_read(system.file('shape/nc.shp', package = 'sf')) %>%
  st_transform(32617)

# random sample of 5 points
pts <- st_sample(nc, size = 5) %>% st_sf

# create 50km grid - here you can substitute 200 for 50000
grid_50 <- st_make_grid(nc, cellsize = c(50000, 50000)) %>% 
  st_sf(grid_id = 1:length(.))

# create labels for each grid_id
grid_lab <- st_centroid(grid_50) %>% cbind(st_coordinates(.))

# view the sampled points, polygons and grid
ggplot() +
  geom_sf(data = nc, fill = 'white', lwd = 0.05) +
  geom_sf(data = pts, color = 'red', size = 1.7) + 
  geom_sf(data = grid_50, fill = 'transparent', lwd = 0.3) +
  geom_text(data = grid_lab, aes(x = X, y = Y, label = grid_id), size = 2) +
  coord_sf(datum = NA)  +
  labs(x = "") +
  labs(y = "")

# which grid square is each point in?
pts %>% st_join(grid_50, join = st_intersects) %>% as.data.frame

#>   grid_id                 geometry
#> 1      55 POINT (359040.7 3925435)
#> 2      96   POINT (717024 4007464)
#> 3      91 POINT (478906.6 4037308)
#> 4      40 POINT (449671.6 3901418)
#> 5      30 POINT (808971.4 3830231)

введите описание изображения здесь

sebdalgarno
источник
Спасибо. Я обновил ссылку в своем вопросе, чтобы исправить изменения на их веб-странице. Теперь это должно работать снова.
Маж
Мне действительно нужно начать использовать sfпакет. Это круто!
Филиппордо
Есть ли простой способ построить только ячейки сетки, которые пересекаются с многоугольником состояния?
Philiporlando
st_intersection (grid_50, nc) должен это сделать
sebdalgarno
Есть ли способ повторить то же самое, но точки в центре каждой сетки, поэтому сетка рисуется с широтой / длиной как центром сетки @sebdalgarno
Виджей Рамеш
2

Если вы не смотрели на растровый пакет R, у него есть инструменты для преобразования в / из векторных ГИС-объектов, поэтому вы должны иметь возможность: а) создать растр (сетку) с ячейками 200x200 м и б) преобразовать его в набор полигонов с логический идентификатор какой-то. Оттуда я бы посмотрел на пакет sp, чтобы помочь с пересечением точек и многоугольной сетки. Эта http://cran.r-project.org/web/packages/sp/vignettes/over.pdf страница может стать хорошим началом. Бродя по документам sp package, вы можете начать с SpatialGrid-класса и просто полностью пропустить растровую часть.

cokrzys
источник
-1

«ГИС-юниверс» сложен и имеет много стандартов, которым ваши данные должны соответствовать. Все «ГИС инструменты» взаимодействуют по ГИС-стандартам . Все «серьезные ГИС-данные» сегодня (2014) хранятся в базе данных .

Лучший способ «использовать R» в контексте ГИС с другими инструментами FOSS встроен в SQL. Лучшими инструментами являются PostgreSQL 9.X (см. PL / R ) и PostGIS .


Вы отвечаете:

  • Чтобы импортировать / экспортировать файлы форм: используйте shp2pgsqlиpgsql2shp .
  • Для того, чтобы «разбить файл формы в 200 метровых квадратах / суб-многоугольники»: см ST_SnapToGrid(), ST_AsRaster()и т.д. Нам нужно лучше понять , ваши потребности , чтобы выразить в «рецепт».
  • Вы говорите, что нужны "географические координаты расположены" .. возможно, ST_Centroid()из квадратов (?) ... Вы можете выразить "более математически", чтобы я понял.

... Возможно, вам не нужно какое-либо растровое преобразование, только матрица точек, отобранных для повторения.


Примитивный способ - использовать R без PL / R в обычном внешнем компиляторе: только конвертировать полигоны и экспортировать как фигуру или как WKT (см. ST_AsText), Затем конвертировать данные с помощью awk или другого фильтра в формат R.

Питер Краусс
источник
1
Спасибо за вашу помощь. Тем не менее, я бы предпочел решение, которое полностью зависит от R и существующих пакетов. Когда я могу разбить файл формы на 200 м * 200 м подполигонов, я могу проверить, point.in.polygonкакие координаты находятся в каких полигонах. Моя проблема состоит в том, чтобы разбить оригинальный шейп-файл на эти суб-полигоны.
май