Вопросы с тегом «sampling»

Создание выборок из хорошо определенной популяции с использованием вероятностного метода и / или создание случайных чисел из указанного распределения. Поскольку этот тег неоднозначен, пожалуйста, рассмотрите [выборку из опроса] для первого и [Монте-Карло] или [симуляцию] для второго. При возникновении вопросов, касающихся создания случайных выборок из известных дистрибутивов, рассмотрите возможность использования тега [random-generation].

228
Почему 95% доверительный интервал (КИ) не подразумевает 95% вероятности удержания среднего значения?

Похоже, что из-за различных связанных с этим вопросов существует консенсус, что «95%» часть того, что мы называем «95% доверительный интервал», относится к тому факту, что если бы мы точно повторяли наши процедуры выборки и вычисления CI много раз 95% рассчитанных таким образом КИ будут содержать...

75
Методы передискретизации / моделирования: Монте-Карло, начальная загрузка, джекнифинг, перекрестная проверка, рандомизированные тесты и тесты перестановки

Я пытаюсь понять разницу между различными методами передискретизации (симуляция Монте-Карло, параметрическая начальная загрузка, непараметрическая начальная загрузка, джекнифинг, перекрестная проверка, рандомизационные тесты и тесты перестановок) и их реализацией в моем собственном контексте с...

55
Центральная предельная теорема для выборочных медиан

Если я вычислю медиану достаточно большого числа наблюдений, взятых из одного и того же распределения, будет ли в центральной предельной теореме аппроксимация распределения медиан приближаться к нормальному? Насколько я понимаю, это верно для большого количества образцов, но верно ли это для...

54
Актуальна ли выборка во время «больших данных»?

Или тем более "будет"? Большие данные делают статистику и релевантные знания еще более важными, но, похоже, не соответствуют теории выборки. Я видел эту шумиху вокруг «Больших данных» и не могу не задаться вопросом, «почему», я бы хотел все проанализировать ? Разве не было причины, по которой...

47
Статистический вывод, когда выборка «является» населением

Представьте, что вы должны составлять отчеты о количестве кандидатов, которые ежегодно сдают данный тест. Кажется довольно сложным сделать вывод о наблюдаемом проценте успеха, например, для более широкой популяции из-за специфики целевой популяции. Таким образом, вы можете считать, что эти данные...

36
Как сделать выборку из нормального распределения с известным средним и дисперсией, используя обычный язык программирования?

У меня никогда не было курса по статистике, поэтому я надеюсь, что задаю вопрос здесь. Предположим, у меня есть только две данные, описывающие нормальное распределение: среднее и дисперсия . Я хочу использовать компьютер для случайной выборки из этого дистрибутива, чтобы я уважал эти две...

36
В чем разница между метрополисом Гастингсом, Гиббсом, Важностью и Отбором?

Я пытался изучить методы MCMC и наткнулся на выборку Metropolis Hastings, Gibbs, Важность и Отклонение. Хотя некоторые из этих различий очевидны, т. Е. То, как Гиббс является особым случаем Метрополиса Гастингса, когда у нас есть полные условия, другие менее очевидны, например, когда мы хотим...

35
Почему увеличение размера выборки уменьшает дисперсию (выборку)?

Большая фотография: Я пытаюсь понять, как увеличение размера выборки увеличивает мощность эксперимента. Слайды моего лектора объясняют это картиной из 2 нормальных распределений, одно для нулевой гипотезы и одно для альтернативной гипотезы и порога принятия решения c между ними. Они утверждают, что...

34
Можете ли вы тренировать алгоритмы машинного обучения, используя CV / Bootstrap?

Этот вопрос может быть слишком открытым, чтобы получить окончательный ответ, но, надеюсь, нет. Алгоритмы машинного обучения, такие как SVM, GBM, Random Forest и т. Д., Как правило, имеют некоторые свободные параметры, которые, помимо некоторых правил большого пальца, необходимо настраивать для...

33
Является ли выборочная ковариационная матрица всегда симметричной и положительно определенной?

При вычислении ковариационной матрицы образца гарантируется ли получение симметричной и положительно определенной матрицы? В настоящее время моя задача имеет выборку из 4600 векторов наблюдения и 24...

32
Почему политические опросы имеют такой большой размер выборки?

Когда я смотрел новости, я заметил, что опросы Гэллапа по таким вещам, как президентские выборы, имеют [я предполагаю случайный] выборочный размер более 1000. Из того, что я помню из статистики колледжа, было то, что размер выборки 30 был «значительно большим». Было сделано впечатление, что размер...

30
Стратегии обучения распределению выборки

Версия tl; dr Какие успешные стратегии вы используете для обучения распределению выборки (например, среднего значения выборки) на начальном уровне бакалавриата? Фон В сентябре я буду преподавать вводный курс статистики для студентов второго курса по общественным наукам (в основном, по политологии и...

29
Насколько хорошо самозагрузка аппроксимирует выборочное распределение оценки?

Недавно изучив начальную загрузку, у меня возник концептуальный вопрос, который до сих пор меня удивляет: У вас есть население, и вы хотите знать атрибут населения, то есть , где я использую для представления населения. Это может означать, например, население. Обычно вы не можете получить все...

29
R: Случайный лес, выбрасывающий NaN / Inf в ошибке «вызова сторонней функции», несмотря на отсутствие NaN в наборе данных [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Я использую каретку, чтобы запустить перекрестный проверенный случайный лес по набору данных. Переменная...

29
Зачем использовать стратифицированную перекрестную проверку? Почему это не наносит ущерба дисперсии?

Мне сказали, что полезно использовать стратифицированную перекрестную проверку, особенно когда классы ответов не сбалансированы. Если одна из целей перекрестной проверки состоит в том, чтобы помочь учесть случайность нашей исходной выборки обучающих данных, то, безусловно, создание одинакового...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

28
Что если ваша случайная выборка явно не репрезентативна?

Что делать, если вы берете случайную выборку и видите, что она явно не репрезентативна, как в недавнем вопросе . Например, что, если предполагается, что распределение населения симметрично относительно 0, а выборка, которую вы выбираете случайным образом, имеет несбалансированные положительные и...

28
Как называется статистическая ошибка, из-за которой результаты предыдущих бросков монет влияют на представления о последующих бросках монет?

Как все мы знаем, если вы подбрасываете монету с равным шансом посадки голов, как и с хвостами, то если вы подбрасываете монету много раз, половину времени вы получите головы, а половину - хвосты. Обсуждая это с другом, они сказали, что если вы перевернете монету 1000 раз, и, скажем, первые 100...

28
Что означает «независимые наблюдения»?

Я пытаюсь понять, что означает предположение о независимых наблюдениях . Некоторые определения: «Два события независимы тогда и только тогда, когда ». ( Словарь статистических терминов )P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) «возникновение одного события не меняет вероятность...

27
Вероятность не нарисовать слово из пакета букв в скрэббл

Предположим, у вас была сумка с плитками, на каждой из которых была буква. Есть тайлы с буквой 'A', с 'B' и т. Д., И плитки с «подстановочными знаками» (у нас есть ). Предположим, у вас был словарь с конечным числом слов. Вы выбираете плиток из сумки без замены. Как бы вы вычислили (или оценили)...