Читая статью «Прогнозирование в масштабе» (инструмент прогнозирования FBProphet, см. Https://peerj.com/preprints/3190.pdf ), я натолкнулся на термин «разреженный априор». Авторы объясняют, что они использовали такой «разреженный априор» при моделировании вектора отклонений скорости от некоторой скалярной скорости , которая является модельным параметром в модели логистического роста.
Поскольку они утверждают, что , правильно ли я понимаю, что «разреженный» относится к элементам, несущим вектор, близким к нулю, если параметр был малым? Я в замешательстве, потому что я думал, что все векторные элементы должны быть параметрами регрессии, но их определение таким образом оставляет параметры и как параметры свободной модели, не так ли?
Кроме того, используется ли распределение Лапласа для генерации предыдущего общего? Я не понимаю, почему это предпочтительнее, чем нормальное распределение.
источник
Ответы:
Разреженные данные - это данные со многими нулями. Здесь авторы, по-видимому, называют априор разреженным, поскольку он выбирает нули. Это довольно очевидно, если вы посмотрите на форму распределения Лапласа (он же двойная экспонента), пик которого равен нулю.
(источник изображения Tibshirani, 1996)
По этой причине април Лапласа часто используется как надежный априор , имеющий регуляризующий эффект. С учетом вышесказанного, приоритет Лапласа является популярным выбором, но если вам нужны действительно редкие решения, могут быть и лучшие варианты, как описано Van Erp et al (2019).
Van Erp S., Oberski DL & Mulder J. (2019). Приоритеты усадки для Байесовской регрессии. Журнал математической психологии, 89 , 31-50. DOI: 10.1016 / j.jmp.2018.12.004
источник