Генерировать равномерный шум из шара с p-нормой ( )

Я пытаюсь написать функцию, которая генерирует равномерно распределенный шум, который исходит от шара с p-нормой измерений: $n$

| | x | |_{p} \leq r

$\begin{equation} ||x||_p \leq r \end{equation}$

Я нашел возможные решения для кругов ( ) ( http://mathworld.wolfram.com/DiskPointPicking.html ), однако у меня возникли проблемы с расширением этого для различных значений . $p = 2$ $p$

Я попытался сделать это, просто рисуя случайную выборку из равномерного распределения и перерисовывая ее, когда она не соответствует заданному ограничению. Однако, помимо того, что это уродливое решение, оно также становится вычислительно неосуществимым для больших размеров.

simulation noise Тэке де Хаан
источник

Ответ можно найти здесь для сферы с n измерениями, используя евклидово расстояние (p = 2) math.stackexchange.com/questions/87230/… Однако я все еще не уверен, как использовать это для различных p-норм, могу ли я просто изменить используемое евклидово расстояние в другом отношении к расстоянию?

Таеке де Хаан,

Есть много документов, но большинство из них находятся за

платным доступом

«Однородный» по отношению к какой объемной метрике? В конце концов, если вы используете ball, почему евклидов объем будет интересен?

p

$p$

whuber

@whuber Честно говоря, я не уверен, что это точно не указано в задании, но я бы ожидал в p-norm, поскольку в этом случае любая другая метрика кажется произвольной.

Таеке де Хаан

Проблема возникает из задания машинного обучения; «Это проблема классификации двух классов в 204 измерениях. Небольшой помеченный обучающий набор имеет размер 50 выборок на класс. Немаркированные данные предоставляют 20 000 дополнительных выборок. Однако эти выборки подверглись некоторому повреждению. Единственная дополнительная информация, которую мы имеем относительно этого искажения, состоит в том, что это аддитивный равномерный шум, и что шум исходит от шара с фиксированной p-нормой, , где и и радиус неизвестны. " Мне нужно получить наименьшую частоту появления ошибок на немаркированных данных.

| | x | |_{p} \leq r

$||x||_p \leq r$

p

$p$

r

$r$

Таеке де Хаан

Ответы:

Я нашел полное решение в документе, предложенном kjetil b halvorsen ( https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=758215 ). Честно говоря, мне сложно понять математику, но возможный алгоритм довольно прост. если у нас есть измерений, радиус и норма чем: $n$ $r$ $p$

1) сгенерировать независимых случайных вещественных скаляров , где - обобщенное гауссово распределение (с другой степенью в показатель вместо просто ) $n$ $\varepsilon_i = \bar{G}(1/p, p)$ $\bar{G}(\mu, \sigma^2)$ $e^{−|x|^p}$ $p=2$

2) построить вектор из компонентов , где - независимые случайные знаки $x$ $s_i * \varepsilon_i$ $s_i$

3) Генерация , где - случайная величина, равномерно распределенная в интервале [0, 1]. $z = w^{1/n}$ $w$

4) вернуть $y = r z \frac{x}{||x||_p}$

Тэке де Хаан
источник

Для полноты, не могли бы вы сказать, что такое в вашем ответе?

G

$G$

Стефан Лоран

Это было обновлено

Taeke de Haan

G - обобщенное распределение Гаусса (с другой степенью в степени

вместо просто

). Это сделает распределение для вектора

, составленного из нескольких независимых обобщенных гауссовых распределенных переменных

, который является произведением одиночных PDF-файлов, зависимым от p-нормы.

e^{- | x |^{p}}

$e^{-|x|^p}$

p = 2

$p=2$

x

$\mathbf{x}$

x_{i}

$x_i$

е (Икс) α е^{- | Икс |_{п}^{п}}

$f(\mathbf{x}) \propto e^{-\vert \mathbf{x} \vert_p^p}$

Sextus Empiricus

@MartijnWeterings Большое спасибо, оно было обновлено.

Таеке де Хаан,

Спасибо. Для информации, есть сэмплер этого дистрибутива в пакете R pgnorm .

Стефан Лоран

Использование однородно распределенных многомерных переменных

Taeke предоставляет ссылку на статью, которую текст ниже делает более интуитивно понятным, объясняя конкретно 2-нормальные и 1-нормальные случаи.

$\Vert x \Vert_2 \leq r$

направление образца

Вы можете использовать этот результат http://mathworld.wolfram.com/HyperspherePointPicking.html

Многомерная гауссовская распределенная переменная (с единичной ковариационной матрицей) зависит только от расстояния или суммы квадратов. $X$

f (X_{1}, X_{2}, . . ., X_{n}) = \prod_{1 \leq i \leq n} \frac{1}{\sqrt{2 π}} e^{\frac{1}{2} x_{i}^{2}} = \frac{1}{\sqrt{2 π}} e^{\frac{1}{2} \sum_{1 \leq i \leq n} x_{i}^{2}}

$f(X_1,X_2,...,X_n) = \prod_{1\leq i \leq n} \frac{1}{\sqrt{2\pi}}e^{\frac{1}{2}x_i^2} = \frac{1}{\sqrt{2\pi}}e^{\frac{1}{2}\sum_{1 \leq i \leq n} x_i^2}$

Таким образом, равномерно распределен по поверхности n-мерной гиперсферы. $\frac{X}{\Vert X \Vert_2}$

расстояние образца

Для завершения вам нужно только сэмплировать расстояние, чтобы изменить однородное распределение на сфере на однородное распределение в шаре. (что более или менее похоже на ваш связанный пример для выбора точки диска)

Если бы вы просто выбрали как равномерное распределение, то у вас была бы относительно более высокая плотность вблизи центра (объем масштабируется как поэтому часть точек окажется в объеме , который является более плотным рядом с центром и не будет означать равномерное распределение) $r$ $r^n$ $r$ $r^n$

Если вместо этого вы используете корень переменной, выбранной из равномерного распределения, то вы получите четное распределение. $n$

1-норма $\Vert x \Vert_1 \leq r$

направление

В этом случае вы выбираете из распределения Лапласа вместо распределения Гаусса и делите на 1-норму. равномерно распределена на п-мерный 1-норма сферы. $X$ $\frac{X}{\vert X \vert_1}$

У меня нет формальных доказательств, просто интуиция

^{(поскольку pdf не зависит от позиции, можно ожидать, что любая бесконечно малая область / объем с одинаковой 1-нормой будет иметь одинаковую вероятность а когда вы свернете ее на единичную поверхность, то же самое ) $f(x) dV$ $f(x) dA$}

но тестирование с симуляциями выглядит хорошо.

library(rmutil)
x <- abs(rlaplace(20000))
y <- abs(rlaplace(20000))
z <- abs(rlaplace(20000))
rn <- abs(x)+abs(y)+abs(z)

xi <- (x/rn)
yi <- (y/rn)
zi <- (z/rn)
plot(sqrt(0.5)*(xi-yi),
     sqrt((0.5-0.5*(xi+yi))^2+zi^2),
     pc=21,bg=rgb(0,0,0,0.02), col=rgb(0,0,0,0),cex=1)

расстояние

Расстояние становится таким же, как в случае с 2-мя нормами (объем все еще масштабируется как ). $r^n$

p-норма $\Vert x \Vert_p \leq r$

В этом случае, если вы хотите следовать тому же принципу, вам нужно будет выбрать из распределений с помощью (я предполагаю). Это обобщенные нормальные распределения и, вероятно, они относятся к распределению упомянутому Тэке. $f(x) \propto e^{\vert x \vert^p}$ $G()$

Секст Эмпирик
источник

Не могли бы вы уточнить, как вы пришли к выводу, что единичные векторы распределены равномерно? Кстати, я полагаю , вы хотите взять е корень.

p

$p$

whuber

n

$n$

r

$r$

p

$p$

z = w^{1 / n}

$z = w^{1/n}$

w

$w$

y = r z \frac{x}{| | x | |_{p}}

$y = r z \frac{x}{||x||_p}$