Как составить сетку неравномерно выбранных категориальных данных?

10

Я ищу метод для построения сетки категориальных данных. Я извлек из морских карт и полевых таблиц набор точек, определяющих характер поверхности дна океана. Эти данные являются категориальными, а не числовыми, и они не регулярно или даже случайным образом. Морские карты создаются для помощи в навигации и закреплении; они не созданы, чтобы наносить на карту среду обитания. Таким образом, больше зондирований производится вблизи берега, где относительно небольшие глубины могут представлять опасность для судоходства и где суда должны быть на якоре. Вдали от берега, где глубина более чем достаточна для навигации, а постановка на якорь нецелесообразна, зондирование производится гораздо реже.

Кто-нибудь еще пытался создавать карты подложек с сеткой из морских карт?

Я посмотрел на полигоны Тиссена (Ворного), но концентрация зондирований вдоль берегов приводит к тонким «сотам» вдоль берега, крупным полигонам в море и между длинными многоугольными пирогами, простирающимися далеко от берега. Сетка с использованием ближайшего соседа дает практически тот же результат.

Мне нужен способ ограничить влияние мелких прибрежных точек - способ ограничить эти длинные многоугольники в форме пирога. В более глубоких водах я не ожидаю, что природа дна будет продолжением придонного дна. Я начал думать в двух направлениях - оба использовали глубину. Одним из них является взвешивание выбора «ближайшего» соседа с использованием разницы в глубине между ячейкой сетки и соседними точками. Другим является отмена выбора соседних точек, которые отличаются от заданного допуска более чем по глубине. Или, возможно, вместо заранее заданного допуска, я мог бы ограничить диапазоны глубины, а затем ограничить выбор соседних точек теми, которые находятся в том же диапазоне глубины или в интервале.

Любые мысли о том, как реализовать любой из этих двух вариантов?

После разговоров с коллегами на других форумах я рассмотрел несколько других подходов. Первый включает в себя использование барьера - контура глубиной 100 м - для ограничения влияния прибрежных данных. Проблема с этим подходом состоит в том, что любая из процедур интерполяции ESRI, которые могут использовать барьеры, предназначена для работы с непрерывными данными, а не с прерывистыми данными. Я мог бы использовать барьеры, чтобы разбить точки на мелкие прибрежные и более глубокие точки, прежде чем создавать полигоны Тиссена. Тем не менее, я ожидаю безудержных краевых эффектов, так как ArcGIS создает полигоны Thiessen для прямоугольных областей, а не для сложных областей.

Второй подход, предложенный несколькими коллегами, был кригингом. Первоначально я отклонил криг из-под контроля, потому что я только рассматривал это для непрерывных данных. Проблема с кригингом заключается в том, что он также не предназначен для категориальных данных. Теперь я смотрю на кокригирование с глубиной и природой поверхности, но любой тип кригинга будет включать использование целочисленных числовых кодов для природы поверхности. После этого результирующие числовые коды с плавающей запятой должны быть сокращены до исходного целочисленного кодирования. Не красиво

Кто-нибудь может предложить другие линии для подражания? (Возможно, можно использовать анализ местности. Например, склоны, более крутые, чем угол естественного откоса, не могут быть отложениями. Я ищу что-то более простое и, во всяком случае, у меня нет данных с достаточным пространственным разрешением.)

С Уважением,

Дуг Гриник
источник

Ответы:

4

Подход кригинга, должным образом реализованный, является многообещающим.

В качестве отправной точки рассмотрим «обобщенные линейные геостатистические модели», описанные Дигглом и Рибейро в « Геостатистике на основе моделей» (Springer 2007). Основная идея привлекательна и гибка: пространственный случайный процесс (пространственно непрерывный ) определяет различные вероятности категорий. Один использует наблюдаемые категории в нерегулярных точках, чтобы вывести статистические свойства этого базового процесса, включая его пространственную корреляционную структуру (вариограмму). Затем Кригинг создает поверхность вероятности, соответствующую наблюдениям. В этот момент вы можете выполнять геостатистическое моделирование или создавать карты, связанные с вероятностями (например, карты категорий максимальной вероятности).

Это звучит изощренно, и это так. Тем не менее, обсуждение Диггла и Рибейро довольно доступно - хотя оно математическое и предполагает некоторые знания статистики, оно также не сильно зависит от него - и большинство их методов реализованы в описываемых ими R-пакетахgeoR и geoRGLM. На самом деле, справедливо рассматривать эту книгу как руководство для этих пакетов.

Как свидетельствуют другие потоки на этом сайте, интерфейс R относительно легко взаимодействует с данными ГИС (включая шейп-файл и различные растровые форматы), поэтому это не проблема.

Whuber
источник