Я пишу статью, в которой используется асимптотика заполнения, и один из моих рецензентов попросил меня дать строгое математическое определение того, что такое асимптотика заполнения (т. Е. С математическими символами и обозначениями).
Похоже, я не могу найти ничего в литературе и надеялся, что кто-то может либо указать мне в сторону некоторых, либо дать мне самописное определение.
Если вы не знакомы с асимптотикой заполнения (также называемой асимптотикой с фиксированной областью), они следующие: Асимптотика заполнения основана на наблюдениях, которые становятся все более плотными в некоторой фиксированной и ограниченной области с увеличением их числа.
Иными словами, асимптотика заполнения - это то, где больше данных собирается путем более плотной выборки в фиксированной области.
Я уже смотрел на Stein 1999 и Cressie 1993, но ничего «математически» там не было.
Вот цитата из моей статьи.
Следовательно, важно признать тип асимптотики, с которой мы имеем дело. В нашем случае асимптотики, с которыми мы имеем дело, основаны на наблюдениях, которые становятся все более плотными в некоторой фиксированной и ограниченной области с увеличением их числа. Эти типы асимптотики известны как асимптотика с фиксированной областью (Stein, 1999) или асимптотика заполнения (Cressie, 1993). Асимптотика заполнения, где больше данных собирается путем более плотной выборки в фиксированной области, сыграет ключевую роль в разработке аргумента для ...
Важно отметить, что я собираю свои наблюдения с использованием латинского гиперкуба.
Ответы:
Определение асимптотики заполнения не особенно полезно (технически, если домен остается фиксированным и размер выборки увеличивается, то есть асимптотика заполнения. Но рассмотрим случай, когда вы производите выборку по трансекту от 0 до 1, беря одну выборку из 0,1 / 2, другая выборка в 1 / 2,3 / 4, другая в интервале 3/4, 7/8 и т. Д. Вы сможете много говорить о значениях в 1, но не сможете сказать много в другом месте.)
Чтобы получить типичный результат в асимптотике заполнения, вам нужен дизайн со свойствами, такими как: для всех субрегионов области , для любого вероятность появления выборки в субрегионе приближается к 1 как . Такой образец плотный в домене.ϵ ϵ>0 n→∞
Иногда заполнение не дается явно, дается только дизайн. Например, в статье Лахири («О непоследовательности оценок на основе пространственных данных при асимптотике заполнения») он описывает конструкцию, которая по сути представляет собой «дрожащую» сетку (некоторая случайность как небольшой уровень, но обычно основанная на выборке в гипер прямоугольном субрегионы), которая асимптотически плотна в фиксированной области. Он получает результат (общий для задач заполнения), что большинство параметров вариограммы оцениваются непоследовательно.
Лахири, Ли и Кресси (Об асимптотическом распределении и асимптотической эффективности наименьших квадратов оценок параметров пространственной вариограммы, J.StatPlanInf 2002, том 103, с. 65-85) аналогичным образом рассматривают сетки заполнения, которые систематически становятся более близко расположенными, опять же, давая плотный образец.
(Общий результат для плотных выборок состоит в том, что, поскольку асимптотика заполнения действительно является единственной реализацией пространственного процесса, единственным параметром истинной вариограммы (суперпопуляции), которую можно последовательно оценить, является наклон в нуле, но прогнозы становятся все более хорошими. )
источник
Давайте начнем с определения выборки из латинского гиперкуба, чтобы прояснить ситуацию и установить нотацию. Тогда мы можем определить асимптотику заполнения.
LHS
Латинский гиперкуб Выборка из коробки выполняется путем деления каждого измерения на части равной длины , тем самым его на ячеекB=[l1,u1)×[l2,u2)×⋯[ld,ud)⊂Rd N≥1 δi(N)=(ui−li)/N Nd
где для каждого индекса .0≤ij<N j
Выборка происходит, сначала выбирая таких ячеек равномерно, независимо и без замена из коллекции всех таких клеток таким образом, чтобыN S={cN(i11,…,i1d),…,cN(iN1,…,iNd)}
(Это - мерное обобщение - мерной ситуации , когда «есть только один образец в каждой строке и в каждом столбце.») Каждый из клеток в затем дискретизируется на месте , выбранном равномерно и независимо друг от друга среди всех точек в ячейке, производя набор из упорядоченных пар значений (местоположение, наблюдение).d 2 N S N
Заполнение асимптотики
Предположительно, некоторая процедура применяется к каждому Латинской гиперкуба образца размера в виде фиксированной коробки , что дает оценку для каждого . Это приводит к последовательностиtN X(N) N B tN(X(N)) N
случайных величин. Заполнение асимптотики относится к поведению этой последовательности, когда растет без ограничений.N
источник