Математическое определение асимптотики заполнения

10

Я пишу статью, в которой используется асимптотика заполнения, и один из моих рецензентов попросил меня дать строгое математическое определение того, что такое асимптотика заполнения (т. Е. С математическими символами и обозначениями).

Похоже, я не могу найти ничего в литературе и надеялся, что кто-то может либо указать мне в сторону некоторых, либо дать мне самописное определение.

Если вы не знакомы с асимптотикой заполнения (также называемой асимптотикой с фиксированной областью), они следующие: Асимптотика заполнения основана на наблюдениях, которые становятся все более плотными в некоторой фиксированной и ограниченной области с увеличением их числа.

Иными словами, асимптотика заполнения - это то, где больше данных собирается путем более плотной выборки в фиксированной области.

Я уже смотрел на Stein 1999 и Cressie 1993, но ничего «математически» там не было.


Вот цитата из моей статьи.

Следовательно, важно признать тип асимптотики, с которой мы имеем дело. В нашем случае асимптотики, с которыми мы имеем дело, основаны на наблюдениях, которые становятся все более плотными в некоторой фиксированной и ограниченной области с увеличением их числа. Эти типы асимптотики известны как асимптотика с фиксированной областью (Stein, 1999) или асимптотика заполнения (Cressie, 1993). Асимптотика заполнения, где больше данных собирается путем более плотной выборки в фиксированной области, сыграет ключевую роль в разработке аргумента для ...

Важно отметить, что я собираю свои наблюдения с использованием латинского гиперкуба.

Вот что говорит книга Кресси об асимптотике заполнения. введите описание изображения здесь


источник
Раздел 5.8, Асимптотика заполнения , первого (1991) издания книги Кресси ясен. Хотя это не дает определения в математической нотации, пример (асимптотики, которая «более деликатна, чем заполнение») явно приводится на две страницы позже с использованием математической нотации. Не могли бы вы процитировать собственное описание «асимптотики заполнения»?
whuber
@whuber Я добавил цитату к первоначальному вопросу
Спасибо. Эта цитата не представляется достаточно конкретной. Как именно вы делаете выборку фиксированного домена? Примером (предложенным Cressie) является выборка одной точки, а затем, навсегда после, выборка в кластере вокруг другой точки. Это, вероятно, будет иметь асимптотику, отличную от выборки с гомогенным пуассоновским процессом, например.
whuber
@whuber Я использую образцы латинского гиперкуба.
Пожалуйста, включите эту информацию в свой вопрос, потому что это важно для ответа.
whuber

Ответы:

0

Определение асимптотики заполнения не особенно полезно (технически, если домен остается фиксированным и размер выборки увеличивается, то есть асимптотика заполнения. Но рассмотрим случай, когда вы производите выборку по трансекту от 0 до 1, беря одну выборку из 0,1 / 2, другая выборка в 1 / 2,3 / 4, другая в интервале 3/4, 7/8 и т. Д. Вы сможете много говорить о значениях в 1, но не сможете сказать много в другом месте.)

Чтобы получить типичный результат в асимптотике заполнения, вам нужен дизайн со свойствами, такими как: для всех субрегионов области , для любого вероятность появления выборки в субрегионе приближается к 1 как . Такой образец плотный в домене.ϵϵ>0n

Иногда заполнение не дается явно, дается только дизайн. Например, в статье Лахири («О непоследовательности оценок на основе пространственных данных при асимптотике заполнения») он описывает конструкцию, которая по сути представляет собой «дрожащую» сетку (некоторая случайность как небольшой уровень, но обычно основанная на выборке в гипер прямоугольном субрегионы), которая асимптотически плотна в фиксированной области. Он получает результат (общий для задач заполнения), что большинство параметров вариограммы оцениваются непоследовательно.

Лахири, Ли и Кресси (Об асимптотическом распределении и асимптотической эффективности наименьших квадратов оценок параметров пространственной вариограммы, J.StatPlanInf 2002, том 103, с. 65-85) аналогичным образом рассматривают сетки заполнения, которые систематически становятся более близко расположенными, опять же, давая плотный образец.

(Общий результат для плотных выборок состоит в том, что, поскольку асимптотика заполнения действительно является единственной реализацией пространственного процесса, единственным параметром истинной вариограммы (суперпопуляции), которую можно последовательно оценить, является наклон в нуле, но прогнозы становятся все более хорошими. )

AlaskaRon
источник
Вы знаете, как доказать это утверждение? «для всех субрегионов области ϵ, для любого ϵ> 0 вероятность появления выборки в субрегионе приближается к 1 при n → ∞. Такая выборка плотна в области».
Это почти определение «плотный». Плотная последовательность имеет предельную точку во всех местах. Поэтому, если вы выберете какое-либо место в регионе и любой диск радиуса вокруг него, поскольку этот диск является субрегионом, вы в конечном итоге получите в нем наблюдение. (ПРИМЕЧАНИЕ: я предполагаю, что домен представляет собой некоторый разумный многоугольник, а не некоторую патологическую топологическую странность ...) Обратите внимание, что многие процессы дают плотные последовательности, включая пространственные процессы Пуассона (с интенсивностью> 0 везде), эргодические последовательности, простые случайные выборки и сетки. ϵ
АляскаРон
Знаете ли вы о каких-либо работах, в которых говорится, что латинские гиперкубы асимптотически плотны?
4

Давайте начнем с определения выборки из латинского гиперкуба, чтобы прояснить ситуацию и установить нотацию. Тогда мы можем определить асимптотику заполнения.

LHS

Латинский гиперкуб Выборка из коробки выполняется путем деления каждого измерения на части равной длины , тем самым его на ячеекB=[l1,u1)×[l2,u2)×[ld,ud)RdN1δi(N)=(uili)/NNd

cN(i1,i2,,id)=[l1+i1δ1(N),l1+(i1+1)δ1(N))×[ld+idδd(N),ld+(id+1)δd(N)),

где для каждого индекса .0ij<Nj

Выборка происходит, сначала выбирая таких ячеек равномерно, независимо и без замена из коллекции всех таких клеток таким образом, чтобыNS={cN(i11,,id1),,cN(i1N,,idN)}

{ij1,ij2,,ijN}={1,2,,N}, j=1,2,,d.

(Это - мерное обобщение - мерной ситуации , когда «есть только один образец в каждой строке и в каждом столбце.») Каждый из клеток в затем дискретизируется на месте , выбранном равномерно и независимо друг от друга среди всех точек в ячейке, производя набор из упорядоченных пар значений (местоположение, наблюдение).d2NSN

X(N)={(Z1N,Y1N),,(ZNN,YNN)}

Заполнение асимптотики

Предположительно, некоторая процедура применяется к каждому Латинской гиперкуба образца размера в виде фиксированной коробки , что дает оценку для каждого . Это приводит к последовательностиtNX(N)NBtN(X(N))N

t1(X(1)),t2(X(2)),,tN(X(N)),

случайных величин. Заполнение асимптотики относится к поведению этой последовательности, когда растет без ограничений.N

Whuber
источник