Это может также пойти вниз, как самые глупые вопросы, когда-либо задаваемые на этом форуме, но, получив здравые и содержательные ответы на предыдущий вопрос, я подумал, что снова протяну свою удачу.
В течение некоторого времени я был очень озадачен важностью статистического распределения, особенно в части, касающейся доходности активов и, более конкретно, распределения активов.
Мой конкретный вопрос заключается в следующем: предположим, у меня есть 20-летние данные о ежемесячной доходности S & P 500, почему я должен предполагать определенный тип распределения (т. Е. Нормальный / полет Джонсона / Леви и т. Д.) Для моего решения о распределении активов, когда я могу просто просто принять решение о распределении активов на основе исторических данных, которые у меня есть?
источник
Ответы:
Использование предполагаемого распределения (т. Е. Параметрический анализ) уменьшит вычислительные затраты вашего метода. Я предполагаю, что вы хотели бы выполнить задачу регрессии или классификации. Это означает, что в какой-то момент вы собираетесь оценить распределение некоторых данных. Непараметрические методы полезны, когда данные не соответствуют хорошо изученному распределению, но для их вычисления обычно требуется больше времени или больше памяти.
Кроме того, если данные генерируются процессом, который соответствует распределению, так как они являются средним числом некоторых равномерно случайных процессов, то использование этого распределения имеет больше смысла. В случае усреднения набора равномерной переменной правильным распределением, вероятно, является распределение Гаусса.
источник
Дополнение ответа Джеймса : параметрические модели также (обычно) требуют меньшего количества выборок, чтобы иметь хорошую подгонку: это может увеличить их мощность обобщения: то есть, они могут лучше предсказывать новые данные, даже будучи ошибочными. Конечно, это зависит от ситуации, моделей и размеров выборки.
источник