Проще говоря: есть ли различия в байесовском и частом подходах к исследовательскому анализу данных?
Я не знаю присущих методов EDA, поскольку гистограмма - это гистограмма, диаграмма рассеяния - это диаграмма рассеяния и т. Д., А также я не нашел примеров различий в том, как преподается или преподносится EDA (игнорируя особенно теоретическую статью А. Гельмана) , Наконец, я посмотрел на CRAN, арбитр всех примененных вещей: я не нашел пакетов, приспособленных к байесовскому подходу. Тем не менее, я думал, что у CV может быть несколько человек, которые могли бы пролить свет на это.
Почему должны быть различия?
Для начинающих:
- При определении соответствующих предыдущих дистрибутивов не следует ли исследовать это визуально?
- При обобщении данных и предложении использовать частую или байесовскую модель, разве EDA не должно предлагать, в каком направлении идти?
- Два подхода имеют очень четкие различия в том, как работать с моделями смесей. Идентификация того, что образец, вероятно, происходит из смеси популяций, является сложной задачей и напрямую связана с методологией, используемой для оценки параметров смеси.
- Оба подхода включают в себя стохастические модели, и выбор модели определяется пониманием данных. Более сложные данные или более сложные модели требуют больше времени в EDA. При таких различиях между стохастическими моделями или генерирующими процессами существуют различия в деятельности EDA, поэтому не должно ли быть различий, возникающих из разных стохастических подходов?
Примечание 1: Меня не интересует философия обоих «лагерей» - я только хочу устранить любые пробелы в моем инструментарии и методах EDA.
источник
Я думаю, что EDA поможет вам построить модель, сделать некоторые предположения и (при необходимости) обновить модель и ее предположения. Я выбираю прагматический подход для подбора и оценки моделей.
источник