Как построить квадраты для точечных процессов, которые сильно различаются по частоте?

9

Я хочу выполнить анализ числа квадратов для нескольких точечных процессов (или одного отмеченного точечного процесса), чтобы затем применить некоторые методы уменьшения размерности.

Метки не распределяются одинаково, то есть некоторые метки появляются довольно часто, а некоторые довольно редко. Таким образом, я не могу просто разделить свое 2D-пространство на регулярную сетку, потому что более частые метки будут «перегружать» меньшие частые, маскируя их внешний вид.

Таким образом, я попытался построить свою сетку таким образом, чтобы в каждой ячейке было не более N точек (чтобы сделать это, я просто делю каждую ячейку на четыре меньшие (и одинакового размера) ячейки, рекурсивно, пока ни одна ячейка не имеет больше N точек в Это).

Что вы думаете об этой технике "нормализации"? Есть ли стандартный способ сделать такие вещи?

Wookai
источник
1
Если вы используете обычную сетку, и более частые метки превосходят по численности реже, я не вижу, как это «сокрушает» и «маскирует» вещи. Не могли бы вы уточнить немного? Вы пытаетесь заменить содержимое каждого квадрата только самой обычной меткой или чем-то в этом роде?
Уэйн

Ответы:

1

Я использовал анализ квадрата только на регулярных сетках. Это было полезно в отношении цели, которая заключалась в сравнении дисперсии данных выборки с известным процессом, например, случайным. Поэтому обычная сетка работала хорошо.
Метод, который вы разработали и описали, не обязательно считается квадратом. Например, в методе скользящего среднего, одним из вариантов является подсчет количества соседей для процесса, т. Е. Усреднение, которое просто выполняется путем поиска внутри круга (в 2D) или сферы (в 3D). Ваш метод выглядит аналогично с немного другим использованием этих выбранных образцов.

разработчик
источник