Вопросы с тегом «inference»

Делать выводы о параметрах населения из выборочных данных. См. Https://en.wikipedia.org/wiki/Inference и https://en.wikipedia.org/wiki/Statistical_inference

173
Как интерпретировать сюжет QQ

Я работаю с небольшим набором данных (21 наблюдение) и имею следующий нормальный график QQ в R: Видя, что сюжет не поддерживает нормальность, что я могу сделать вывод о базовом распределении? Мне кажется, что распределение, более искаженное вправо, было бы лучше, верно? Кроме того, какие еще выводы...

92
Кто такие байесовцы?

Когда кто-то начинает интересоваться статистикой, дихотомия «Частый» и «Байесовский» вскоре становится обычным явлением (а кто вообще не читал « Сигнал и шум» Нейта Сильвера ?). В беседах и вводных курсах точка зрения является чрезвычайно частой ( MLE , значения), но есть небольшая часть времени,...

81
Понимание «дисперсии» интуитивно

Какой самый простой и понятный способ объяснить кому-либо понятие дисперсии? Что это означает интуитивно? Если кто-то должен объяснить это своему ребенку, как он поступит? Это концепция, которую мне сложно сформулировать, особенно когда она связана с риском. Я понимаю это математически и тоже могу...

64
Что является хорошим, убедительным примером, в котором p-значения полезны?

Мой вопрос в названии говорит сам за себя, но я хотел бы дать ему некоторый контекст. Ранее на этой неделе ASA опубликовала заявление « о p-значениях: контекст, процесс и цель », в котором изложены различные распространенные заблуждения о p-значении и содержится настоятельная рекомендация не...

58
Двухсторонние тесты ... Я просто не уверен. В чем смысл?

Следующий отрывок из записи: В чем различия между односторонним и двусторонним тестами? , на сайте помощи статистики UCLA. ... рассмотреть последствия пропуска эффекта в другом направлении. Представьте, что вы разработали новый препарат, который, по вашему мнению, является улучшением по сравнению с...

44
Проверка равенства коэффициентов двух разных регрессий

Это кажется основной проблемой, но я только что понял, что на самом деле не знаю, как проверить равенство коэффициентов двух разных регрессий. Может кто-нибудь пролить некоторый свет на это? Более формально, предположим, что я запустил следующие две регрессии: и где относится к матрице...

44
Почему кто-то использует байесовский подход с «неинформативным» неподобающим предшествующим вместо классического подхода?

Если интерес представляет собой просто оценка параметров модели (точечная и / или интервальная оценка) и предшествующая информация не является надежной, слабой (я знаю, что это немного расплывчато, но я пытаюсь создать сценарий, в котором выбор до этого сложно) ... Почему кто-то решил использовать...

40
Эмпирическое правило для количества образцов начальной загрузки

Интересно, знает ли кто-нибудь какие-либо общие практические правила относительно количества выборок начальной загрузки, которые следует использовать, основываясь на характеристиках данных (количество наблюдений и т. Д.) И / или включенных...

37
Вариационный вывод по сравнению с MCMC: когда выбрать один из других?

Я думаю, что я получил общее представление о VI и MCMC, включая различные разновидности MCMC, такие как выборка Гиббса, Metropolis Hastings и т. Д. Эта статья представляет собой прекрасное изложение обоих методов. У меня есть следующие вопросы: Если я хочу сделать байесовский вывод, почему я выбрал...

33
Что такое основной аргумент и почему он не был принят?

Одним из поздних вкладов Р.А. Фишера были опорные интервалы и опорные принципиальные аргументы . Этот подход, однако, далеко не так популярен, как частые или байесовские принципиальные аргументы. Что такое опорный аргумент и почему он не был...

32
Почему базовое тестирование гипотез фокусируется на среднем, а не на медиане?

На базовых курсах по статистике для студентов (обычно?) Обучают проверке гипотез для среднего населения. Почему основное внимание уделяется среднему значению, а не срединному значению? Я предполагаю, что из-за центральной предельной теоремы легче проверить среднее значение, но я бы хотел прочитать...

31
Выполнение статистического теста после визуализации данных - выемка данных?

Я предложу этот вопрос на примере. Предположим, у меня есть набор данных, такой как набор данных по ценам на жилье в Бостоне, в котором у меня есть непрерывные и категориальные переменные. Здесь у нас есть переменная «качество», от 1 до 10, и цена продажи. Я могу разделить данные на дома «низкого»,...

31
Приспосабливая укоренившиеся представления значений p

Иногда в отчеты я включаю заявление об отказе от p-значений и другую логическую статистику, которую я предоставил. Я говорю, что, поскольку выборка не была случайной, такая статистика не будет строго применяться. Моя конкретная формулировка обычно приводится в сноске: «В то время как, строго...

30
Вывод против оценки?

Каковы различия между «выводом» и «оценкой» в контексте машинного обучения ? Как новичок, я чувствую , что мы заключаем случайные величины и оценку параметров модели. Правильно ли это понимание? Если нет, то какие именно различия, и когда я должен использовать какие? Кроме того, какой из них...

29
Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

28
Зачем нам нужна многомерная регрессия (в отличие от группы одномерных регрессий)?

Я только что просмотрел эту замечательную книгу: « Прикладной многомерный статистический анализ» Джонсона и Вихерна . Ирония в том, что я до сих пор не могу понять мотивацию использования многомерных (регрессионных) моделей вместо отдельных одномерных (регрессионных) моделей. Я просмотрел статьи 1...

28
Что если ваша случайная выборка явно не репрезентативна?

Что делать, если вы берете случайную выборку и видите, что она явно не репрезентативна, как в недавнем вопросе . Например, что, если предполагается, что распределение населения симметрично относительно 0, а выборка, которую вы выбираете случайным образом, имеет несбалансированные положительные и...

27
Должны ли мы учитывать множественные корректировки сравнений при использовании доверительных интервалов?

Предположим, у нас есть сценарий множественного сравнения, такой как постфакторный вывод по парной статистике, или, например, множественная регрессия, где мы делаем в общей сложности сравнений. Предположим также, что мы хотели бы поддержать вывод в этих кратных числах, используя доверительные...

23
Что означает «фидуциарный» (в контексте статистики)?

Когда я Google для "fisher" "fiducial" ... Я уверен, что получаю много хитов, но все те, за которыми я следовал, совершенно за пределами моего понимания. Все эти хиты, похоже, имеют одну общую черту: все они написаны для статистиков, которые тщательно изучили теорию, практику, историю и знания...