Вопросы с тегом «sampling»

11

Я знаю, как создать последовательность со средним значением . Например, в Matlab, если я хочу сгенерировать последовательность длиной , это:0 ± 1 10000± 1±1\pm 1000± 1±1\pm 1100001000010000 2*(rand(1, 10000, 1)<=.5)-1 Тем не менее, как создать последовательность со средним значением , то есть с...

distributions sampling random-generation

11

Подгонка многоуровневых моделей к сложным данным обследования в R

Я ищу совет о том, как анализировать сложные данные опросов с помощью многоуровневых моделей в R. Я использовал этот surveyпакет для взвешивания неравных вероятностей выбора в одноуровневых моделях, но этот пакет не имеет функций для многоуровневого моделирования. lme4Пакет отлично подходит для...

r mixed-model weighted-sampling cluster-sample

11

Выборка Гиббса для модели Изинга

Домашнее задание: Рассмотрим 1-ую модель Изинга. Пусть . это либо -1, либо +1x=(x1,...xd)x=(x1,...xd)x = (x_1,...x_d)xixix_i π(x)∝e∑39i=1xixi+1π(x)∝e∑i=139xixi+1\pi(x) \propto e^{\sum_{i=1}^{39}x_ix_{i+1}} Разработайте алгоритм выборки Гиббса, чтобы генерировать выборки приблизительно из целевого...

self-study sampling mcmc gibbs

11

Что если вероятности не равны в «.632 Правиле»?

Этот вопрос вытекает из вопроса о «.632 Правиле». Я пишу с особым вниманием к ответу / примечанию пользователя 603 в той степени, в которой это упрощает вопросы. Этот ответ начинается с выборки размера с заменой из различных элементов в коллекции (вызов) it N. Вероятность того, что выборка...

probability sampling

11

Почему желательно иметь низкую автокорреляцию в MCMC?

Я продолжаю читать о необходимости проверки автокорреляции в MCMC. Почему важно, чтобы автокорреляция была низкой? Что это измеряет в контексте

sampling autocorrelation mcmc

11

Подходит ли начальная загрузка для этих непрерывных данных?

Я полный новичок :) Я делаю исследование с размером выборки 10 000 человек из примерно 745 000 человек. Каждый образец представляет «процентное сходство». Подавляющее большинство выборок составляет около 97% -98%, но некоторые составляют от 60% до 90%, то есть распределение сильно искажено. Около...

bootstrap sample-size resampling

11

Как получить выборку Гиббса?

Я на самом деле стесняюсь спросить об этом, потому что боюсь, что меня будут перенаправлять на другие вопросы или на Википедию о выборке Гиббса, но у меня нет ощущения, что они описывают то, что под рукой. При заданной условной вероятности :...

sampling mcmc gibbs

11

Методика начальной загрузки. Зачем пересчитывать «с заменой» вместо случайной подвыборки?

Метод начальной загрузки получил широкое распространение в последние годы, я также часто его использую, особенно потому, что обоснование довольно интуитивно понятно. Но это одна вещь, которую я не понимаю. Почему Efron решил выполнить повторную выборку с заменой, а не просто субсэмплирование путем...

bootstrap resampling subsampling

11

Латинская Асимптотика Выборки Гиперкуба

Я пытаюсь построить доказательство для проблемы, над которой я работаю, и одно из допущений, которые я делаю, состоит в том, что множество точек, из которых я беру выборку, плотно по всему пространству. Практически я использую выборку из латинского гиперкуба, чтобы получить свои баллы во всем...

sampling asymptotics latin-square latin-hypercube

10

Хороший текст для пересчета?

Может ли группа рекомендовать хороший вводный текст / ресурс по применяемым методам повторной выборки? В частности, меня интересуют альтернативы классическим параметрическим тестам (например, t-тестам, ANOVA, ANCOVA) для сравнения групп, когда такие предположения, как нормальность, явно нарушаются....

references bootstrap resampling

10

Как сделать репрезентативную выборку из большого общего набора данных?

Каковы статистические методы для создания выборочного набора, который является репрезентативным для всего населения (с известным уровнем достоверности)? Также, Как проверить, соответствует ли образец общему набору данных? Возможно ли это без разбора всего набора данных (который может быть...

sampling sample-size validation

10

Что такое выборка случайной величины?

Случайная величина определяется как измеримой функции от одной - алгебры с основной мерой на другой - алгебры .σ ( Ω 1 , F 1 ) P σ ( Ω 2 , F 2 )XXXσσ\sigma(Ω1,F1)(Ω1,F1)(\Omega_1, \mathcal F_1)PPPσσ\sigma(Ω2,F2)(Ω2,F2)(\Omega_2, \mathcal F_2) Как мы говорим о выборке этой случайной величины? Мы...

sampling random-variable simulation

10

Сравнивая 0/10 к 0/20

При обсуждении показателей достижения результатов, есть ли способ показать, что 0 из 20 попыток "хуже", чем 0 из 10

probability sampling

10

Почему Anova () и drop1 () предоставили разные ответы для GLMM?

У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние...

r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

10

Гауссово распределение с моментами высшего порядка

Для гауссовского распределения с неизвестным средним и дисперсией достаточная статистика в стандартной экспоненциальной форме семейства . У меня есть распределение , которое имеет Т ( х ) = ( х , х 2 , . . . , Х 2 Н )T( х ) = ( х , х2)T(Икс)знак равно(Икс,Икс2)T(x)=(x,x^2)T( х ) = ( х , х2, . , , ,...

normal-distribution sampling exponential-family

10

Как выбрать размеры набора для обучения, перекрестной проверки и тестирования для данных небольшого размера?

Предположим, у меня небольшой размер выборки, например, N = 100, и два класса. Как выбрать размеры обучения, перекрестной проверки и тестового набора для машинного обучения? Я бы интуитивно выбрал Размер тренировочного набора 50 Размер набора для перекрестной проверки 25, и Размер теста как 25. Но,...

machine-learning sampling svm cross-validation sample-size

10

Распределение по отсортированным спискам

Скажем, у нас есть упорядоченный список товаров [a, b, c, ... x, y, z, ...] Я ищу семейство дистрибутивов с поддержкой в списке выше, управляемых некоторым параметром альфа, чтобы: При альфа = 0 он присваивает вероятность 1 первому элементу, a выше, а 0 остальным. То есть, если мы сделаем выборку...

distributions sampling discrete-data

10

Ссылка на рассказ о сэмплировании из телефонной книги

Сегодня я говорил с кем-то о выборке и смутно помню историю о каком-то очень уважаемом статистике, который рекомендует систематическую выборку из телефонной книги в конкретном судебном деле. Я помню историю, в которой судья говорил что-то вроде: «Я не знаю много о статистике, но я знаю, что выборка...

sampling references history

10

Является ли выборка на основе цепей Маркова «лучшей» для выборки Монте-Карло? Существуют ли альтернативные схемы?

Марковская цепь Монте-Карло - это метод, основанный на цепях Маркова, который позволяет нам получать выборки (в условиях Монте-Карло) из нестандартных распределений, из которых мы не можем напрямую брать выборки. Мой вопрос заключается в том, почему цепь Маркова является «современной» для отбора...

sampling mcmc monte-carlo markov-chain stochastic-approximation

10

Рандомизация неслучайной выборки

Я всегда немного удивлен, увидев психологическую рекламу для участия в экспериментальных исследованиях. Конечно, люди, которые отвечают на эти рекламные объявления, не отбираются случайным образом и, следовательно, являются самостоятельным отбором населения. Поскольку известно, что рандомизация...

sampling psychology random-allocation