Каковы некоторые методы для отбора двух коррелированных случайных величин:
если их распределение вероятностей параметризовано (например, логарифмически нормальное)
если они имеют непараметрические распределения.
Данные представляют собой два временных ряда, для которых мы можем вычислить ненулевые коэффициенты корреляции. Мы хотим смоделировать эти данные в будущем, предполагая, что историческая корреляция и временной ряд CDF постоянны.
Для случая (2) 1-D аналогом будет создание CDF и выборка из него. Думаю, я мог бы построить 2-D CDF и сделать то же самое. Однако мне интересно, есть ли способ приблизиться, используя отдельные одномерные CDF и каким-то образом связывая выборки.
Благодарность!
Ответы:
Я думаю, что вы ищете, это связка. У вас есть два маргинальных распределения (указанных в параметрических или эмпирических файлах cdf), и теперь вы хотите указать зависимость между ними. Для двумерного случая есть все виды выборов, но основной рецепт тот же. Я буду использовать гауссову связку для простоты интерпретации.
Вуаля! Попробуйте это для некоторых простых случаев, и посмотрите на маргинальные гистограммы и диаграммы рассеяния, это весело.
Хотя нет гарантии, что это подходит для вашего конкретного приложения (в частности, вам может потребоваться заменить гауссову связку на копулу), но это должно помочь вам начать работу. Хорошим справочником по моделированию связок является Nelsen (1999), Введение в связки , но в Интернете есть и несколько довольно хороших представлений.
источник
Третий популярный метод - (NORTA) NORmal To Anything ; генерировать коррелированные нормальные вариации, превращать их в единообразные случайные вариации путем оценки их соответствующих cdf-файлов, а затем использовать эти «новые» единообразные случайные вариации в качестве источника случайности при генерации отрисовок из нового распределения.
Помимо подхода связок (целый класс методов), упомянутого в другом посте, вы также можете выбрать из распределения максимального сцепления, которое по духу сходно с подходом связок. Вы указываете маргинальные распределения и выборку из максимальной связи. Это достигается двумя шагами принятия-отказа, как описано здесь Пьером Джейкобом . Предположительно, этот метод может быть расширен до более высоких измерений, чем 2, но может оказаться более сложным для достижения. Обратите внимание, что максимальная связь будет вызывать корреляцию, которая зависит от значений параметров маргиналов, см. Этот пост в качестве хорошего примера этого в ответе Сианя на мой вопрос.
Если вы готовы принять приблизительные (в большинстве случаев) выборки, то методы MCMC также являются возможностью выборки из многомерных распределений.
Кроме того, вы можете использовать методы принятия-отклонения, но обычно трудно найти доминирующую плотность для выборки и оценить отношение ее к желаемой плотности.
Это все дополнительные методы, которые я могу придумать, но, возможно, я пропустил пару.
источник