Вопросы с тегом «inference»

173

Я работаю с небольшим набором данных (21 наблюдение) и имею следующий нормальный график QQ в R: Видя, что сюжет не поддерживает нормальность, что я могу сделать вывод о базовом распределении? Мне кажется, что распределение, более искаженное вправо, было бы лучше, верно? Кроме того, какие еще выводы...

r data-visualization inference qq-plot

92

Кто такие байесовцы?

Когда кто-то начинает интересоваться статистикой, дихотомия «Частый» и «Байесовский» вскоре становится обычным явлением (а кто вообще не читал « Сигнал и шум» Нейта Сильвера ?). В беседах и вводных курсах точка зрения является чрезвычайно частой ( MLE , значения), но есть небольшая часть времени,...

bayesian mathematical-statistics inference bayes frequentist

81

Понимание «дисперсии» интуитивно

Какой самый простой и понятный способ объяснить кому-либо понятие дисперсии? Что это означает интуитивно? Если кто-то должен объяснить это своему ребенку, как он поступит? Это концепция, которую мне сложно сформулировать, особенно когда она связана с риском. Я понимаю это математически и тоже могу...

distributions variance standard-deviation inference intuition

64

Что является хорошим, убедительным примером, в котором p-значения полезны?

Мой вопрос в названии говорит сам за себя, но я хотел бы дать ему некоторый контекст. Ранее на этой неделе ASA опубликовала заявление « о p-значениях: контекст, процесс и цель », в котором изложены различные распространенные заблуждения о p-значении и содержится настоятельная рекомендация не...

hypothesis-testing bayesian p-value inference frequentist

58

Двухсторонние тесты ... Я просто не уверен. В чем смысл?

Следующий отрывок из записи: В чем различия между односторонним и двусторонним тестами? , на сайте помощи статистики UCLA. ... рассмотреть последствия пропуска эффекта в другом направлении. Представьте, что вы разработали новый препарат, который, по вашему мнению, является улучшением по сравнению с...

hypothesis-testing statistical-significance inference

44

Проверка равенства коэффициентов двух разных регрессий

Это кажется основной проблемой, но я только что понял, что на самом деле не знаю, как проверить равенство коэффициентов двух разных регрессий. Может кто-нибудь пролить некоторый свет на это? Более формально, предположим, что я запустил следующие две регрессии: и где относится к матрице...

hypothesis-testing inference

44

Почему кто-то использует байесовский подход с «неинформативным» неподобающим предшествующим вместо классического подхода?

Если интерес представляет собой просто оценка параметров модели (точечная и / или интервальная оценка) и предшествующая информация не является надежной, слабой (я знаю, что это немного расплывчато, но я пытаюсь создать сценарий, в котором выбор до этого сложно) ... Почему кто-то решил использовать...

bayesian inference prior likelihood information

40

Эмпирическое правило для количества образцов начальной загрузки

Интересно, знает ли кто-нибудь какие-либо общие практические правила относительно количества выборок начальной загрузки, которые следует использовать, основываясь на характеристиках данных (количество наблюдений и т. Д.) И / или включенных...

bootstrap inference monte-carlo

37

Вариационный вывод по сравнению с MCMC: когда выбрать один из других?

Я думаю, что я получил общее представление о VI и MCMC, включая различные разновидности MCMC, такие как выборка Гиббса, Metropolis Hastings и т. Д. Эта статья представляет собой прекрасное изложение обоих методов. У меня есть следующие вопросы: Если я хочу сделать байесовский вывод, почему я выбрал...

machine-learning bayesian mcmc variational-bayes approximate-inference

33

Что такое основной аргумент и почему он не был принят?

Одним из поздних вкладов Р.А. Фишера были опорные интервалы и опорные принципиальные аргументы . Этот подход, однако, далеко не так популярен, как частые или байесовские принципиальные аргументы. Что такое опорный аргумент и почему он не был...

inference philosophical fiducial

32

Почему базовое тестирование гипотез фокусируется на среднем, а не на медиане?

На базовых курсах по статистике для студентов (обычно?) Обучают проверке гипотез для среднего населения. Почему основное внимание уделяется среднему значению, а не срединному значению? Я предполагаю, что из-за центральной предельной теоремы легче проверить среднее значение, но я бы хотел прочитать...

hypothesis-testing mean inference median

31

Выполнение статистического теста после визуализации данных - выемка данных?

Я предложу этот вопрос на примере. Предположим, у меня есть набор данных, такой как набор данных по ценам на жилье в Бостоне, в котором у меня есть непрерывные и категориальные переменные. Здесь у нас есть переменная «качество», от 1 до 10, и цена продажи. Я могу разделить данные на дома «низкого»,...

hypothesis-testing data-visualization p-value dataset inference

31

Приспосабливая укоренившиеся представления значений p

Иногда в отчеты я включаю заявление об отказе от p-значений и другую логическую статистику, которую я предоставил. Я говорю, что, поскольку выборка не была случайной, такая статистика не будет строго применяться. Моя конкретная формулировка обычно приводится в сноске: «В то время как, строго...

inference p-value

30

Вывод против оценки?

Каковы различия между «выводом» и «оценкой» в контексте машинного обучения ? Как новичок, я чувствую , что мы заключаем случайные величины и оценку параметров модели. Правильно ли это понимание? Если нет, то какие именно различия, и когда я должен использовать какие? Кроме того, какой из них...

machine-learning inference terminology

29

Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

28

Зачем нам нужна многомерная регрессия (в отличие от группы одномерных регрессий)?

Я только что просмотрел эту замечательную книгу: « Прикладной многомерный статистический анализ» Джонсона и Вихерна . Ирония в том, что я до сих пор не могу понять мотивацию использования многомерных (регрессионных) моделей вместо отдельных одномерных (регрессионных) моделей. Я просмотрел статьи 1...

regression multiple-regression inference multivariate-regression

28

Что если ваша случайная выборка явно не репрезентативна?

Что делать, если вы берете случайную выборку и видите, что она явно не репрезентативна, как в недавнем вопросе . Например, что, если предполагается, что распределение населения симметрично относительно 0, а выборка, которую вы выбираете случайным образом, имеет несбалансированные положительные и...

sampling experiment-design inference sample

28

Какие факторы делают задние распределения трудно поддающимися лечению?

В байесовской статистике часто упоминается, что апостериорное распределение трудноразрешимо, и поэтому необходимо применять приблизительный вывод. Какие факторы вызывают эту...

bayesian approximation inference

27

Должны ли мы учитывать множественные корректировки сравнений при использовании доверительных интервалов?

Предположим, у нас есть сценарий множественного сравнения, такой как постфакторный вывод по парной статистике, или, например, множественная регрессия, где мы делаем в общей сложности сравнений. Предположим также, что мы хотели бы поддержать вывод в этих кратных числах, используя доверительные...

confidence-interval multiple-comparisons inference

23

Что означает «фидуциарный» (в контексте статистики)?

Когда я Google для "fisher" "fiducial" ... Я уверен, что получаю много хитов, но все те, за которыми я следовал, совершенно за пределами моего понимания. Все эти хиты, похоже, имеют одну общую черту: все они написаны для статистиков, которые тщательно изучили теорию, практику, историю и знания...

bayesian inference terminology fiducial ronald-fisher