Есть ли различия в байесовских и частых подходах к EDA?

14

Проще говоря: есть ли различия в байесовском и частом подходах к исследовательскому анализу данных?

Я не знаю присущих методов EDA, поскольку гистограмма - это гистограмма, диаграмма рассеяния - это диаграмма рассеяния и т. Д., А также я не нашел примеров различий в том, как преподается или преподносится EDA (игнорируя особенно теоретическую статью А. Гельмана) , Наконец, я посмотрел на CRAN, арбитр всех примененных вещей: я не нашел пакетов, приспособленных к байесовскому подходу. Тем не менее, я думал, что у CV может быть несколько человек, которые могли бы пролить свет на это.

Почему должны быть различия?

Для начинающих:

  1. При определении соответствующих предыдущих дистрибутивов не следует ли исследовать это визуально?
  2. При обобщении данных и предложении использовать частую или байесовскую модель, разве EDA не должно предлагать, в каком направлении идти?
  3. Два подхода имеют очень четкие различия в том, как работать с моделями смесей. Идентификация того, что образец, вероятно, происходит из смеси популяций, является сложной задачей и напрямую связана с методологией, используемой для оценки параметров смеси.
  4. Оба подхода включают в себя стохастические модели, и выбор модели определяется пониманием данных. Более сложные данные или более сложные модели требуют больше времени в EDA. При таких различиях между стохастическими моделями или генерирующими процессами существуют различия в деятельности EDA, поэтому не должно ли быть различий, возникающих из разных стохастических подходов?

Примечание 1: Меня не интересует философия обоих «лагерей» - я только хочу устранить любые пробелы в моем инструментарии и методах EDA.

Итератор
источник

Ответы:

17

На мой взгляд, Bayes vs частик о формальном выводе, а исследовательский анализ данных - ни то, ни другое.

Конечно, когда дело доходит до оценки модели / анализа пригодности и анализа чувствительности, в которой я бы классифицировал ваши пункты (1), (3) и (4), будут различия в том, как действовать дальше, но это потому, что природа различий между методами анализа и вычислений, а не в философии.

Что касается вашего (2), я, как правило, не рассматриваю результаты EDA как указание на байесовский или частый подход, скорее, я думаю, что это была цель исследования, которая имела наибольшее значение.

Лично для меня EDA (плюс глубокий самоанализ) укажет мне на модель, и если бы я смог найти естественный подход к частым исследованиям, который достаточно хорошо ответил бы на научный вопрос, я бы согласился с этим, но если бы по характеру ситуации Ни один частый метод не сработает хорошо, и если бы существовал разумный предварительный подход, я бы использовал Байес.

Карл
источник
(+1) Очень хорошо сказано - особенно, «EDA (плюс глубокий самоанализ)
укажет
+1 тоже. EDA на самом деле не о выборе перспективы, а о понимании ваших данных для принятия более обоснованных решений.
Fomite
+1 За хороший ответ. К сожалению, я думаю, что первоначальный вопрос был неправильно понят. Я не спрашивал об использовании EDA для выбора между байесовской или частой моделями. Мне нужно пересмотреть, как я это сформулировал, если кажется, что несколько человек имеют одинаковое недопонимание.
Итератор
@ Итератор Я понимаю, что ваш главный вопрос таков: есть ли различия между подходами байесовцев и частологов к EDA? Мой ответ на это: нет; EDA не является ни частым, ни байесовским.
Карл
3
Я думаю, что мое определение «исследовательского анализа данных» более узкое, чем у вас. На мой взгляд, весь хороший анализ данных связан с разведкой. Что отличает «исследовательский анализ данных», так это отсутствие модели или каких-либо усилий для формального вывода.
Карл
0

Я думаю, что EDA поможет вам построить модель, сделать некоторые предположения и (при необходимости) обновить модель и ее предположения. Я выбираю прагматический подход для подбора и оценки моделей.

hbaghishani
источник