Почему проблема беспорядка неразрешима для больших выборок?

13

Предположим, у нас есть множество точек y={y1,y2,,yN} . Каждая точка yi генерируется с использованием распределения

p(yi|x)=12N(x,1)+12N(0,10).
Чтобы получить апостериор дляxмы пишем
p(x|y)p(y|x)p(x)=p(x)i=1Np(yi|x).
Согласно статье Минки ораспространении ожиданий,нам нужно2Nвычислений, чтобы получить апостериорный , и, таким образом, проблема становится неразрешимой при больших размерах образца Н . Однако я не могу понять, зачем нам нужно такое количество вычислений в этом случае, потому что для одиночного y i вероятность имеет вид p ( y i | x ) = 1p(x|y)Nyi
p(yi|x)=122π(exp{12(yix)2}+110exp{120yi2}).

Используя эту формулу, мы получаем апостериорное простое умножение , поэтому нам нужно только N операций, и, таким образом, мы можем точно решить эту проблему для больших размеров выборки.p(yi|x)N

Я провожу численный эксперимент для сравнения, действительно ли я получаю один и тот же апостериор, если вычисляю каждый член отдельно и если я использую произведение плотностей для каждого . Постеры одинаковые. Видишь, где я не прав? Может кто-нибудь объяснить мне, почему нам нужно 2 N операций для вычисления апостериорного значения для данного x и выборки y ?yiвведите описание изображения здесь2Nxy

Алексей Зайцев
источник
Одна операция на триместр и терминов, поэтому нам нужно O ( N ) операций. Кроме того, я снова просматриваю статью Минки и главу Бишопа о приближенном выводе. Оба предполагают, что мы хотим оценить и получить апостериорное значение для x . NO(N)x
Алексей Зайцев
Могу ли я правильно понять , что ваши «s являются одномерными? Если это так, вы можете решить эту проблему в O ( n log ( n ) ), который считается поддающимся обработке независимо от nyiO(nlog(n))n
user603
1
@ Алексей После перечитывания этого абзаца, я думаю, что автор не упоминает операций. Он просто указывает, что «состояние веры для х представляет собой смесь 2 N гауссиан» . 2Nx2N
1
@ Procrastinator, согласно статье, мы хотим использовать пропаганду веры, но не можем ее использовать, потому что нам нужно продолжить смесь гауссиан. Тогда возникает вопрос: почему мы хотим использовать BP? Другой вопрос возникает в случае, если мы прочитаем главу 10.7.1 в PRML Бишопа или посмотрим видеолекцию Минки . После этого ответ не так ясен. 2N
Алексей Зайцев
1
@ Алексей, я думаю, что логика здесь другая. Автор описывает, что происходит, если вы используете пропаганду веры, чтобы подчеркнуть некоторые трудности с ней, когда велико, и затем продвигаете его «пропаганду ожидания». Он упоминает, что распространение веры требует использования смеси 2 N гауссиан для состояния веры для хN2Nx что усложняется, когда большое. Нет упоминания о количестве требуемых операций, но о сложности состояния веры для x . Nx

Ответы:

4

Вы правы, что газета говорит не то, что нужно. Вы, конечно, можете оценить последующее распределение в известном месте, используя O ( n ) операции. Проблема в том, когда вы хотите вычислить моменты задних. Для точного вычисления среднего среднего значения x потребуется 2 N операций. Это проблема, которую газета пытается решить.xO(n)x2N

Том Минка
источник
2

yip(yi|x)1wpc(y)yxw

Пусть - переменная индикатора, указывающая, что образец i был взят из распределения беспорядка; таким образом, если это 0, это указывает, что выборка была взята из p ( y | x ) . Очевидно, что если образец был взят из распределения беспорядка, его значение не имеет значения для оценки x .cii0p(y|x)x

Проблема заключается в наличии возможных совместных состояний для этих индикаторных переменных.2N

Дейв
источник
cix2N
c
cici
2N
O(n)O(2n) complexity.
Alexey Zaytsev