Вопросы с тегом «sampling»

10

Должен ли я загружаться на уровне кластера или на индивидуальном уровне?

У меня есть модель выживания с пациентами, размещенными в больницах, которая включает случайный эффект для больниц. Случайный эффект имеет гамма-распределение, и я пытаюсь сообщить о «значимости» этого термина в легко понятной шкале. Я нашел следующие ссылки, в которых используется Медианное...

10

Как я могу получить значение случайно из оценки плотности ядра?

У меня есть некоторые наблюдения, и я хочу повторить выборку на основе этих наблюдений. Здесь я рассматриваю непараметрическую модель, в частности, я использую сглаживание ядра для оценки CDF из ограниченных наблюдений. Затем я рисую значения случайным образом из полученного CDF. Ниже приведен мой...

sampling matlab kernel-smoothing density-estimation

10

Как выбрать размеры набора для обучения, перекрестной проверки и тестирования для данных небольшого размера?

Предположим, у меня небольшой размер выборки, например, N = 100, и два класса. Как выбрать размеры обучения, перекрестной проверки и тестового набора для машинного обучения? Я бы интуитивно выбрал Размер тренировочного набора 50 Размер набора для перекрестной проверки 25, и Размер теста как 25. Но,...

machine-learning sampling svm cross-validation sample-size

10

Ссылка на рассказ о сэмплировании из телефонной книги

Сегодня я говорил с кем-то о выборке и смутно помню историю о каком-то очень уважаемом статистике, который рекомендует систематическую выборку из телефонной книги в конкретном судебном деле. Я помню историю, в которой судья говорил что-то вроде: «Я не знаю много о статистике, но я знаю, что выборка...

sampling references history

10

Является ли выборка на основе цепей Маркова «лучшей» для выборки Монте-Карло? Существуют ли альтернативные схемы?

Марковская цепь Монте-Карло - это метод, основанный на цепях Маркова, который позволяет нам получать выборки (в условиях Монте-Карло) из нестандартных распределений, из которых мы не можем напрямую брать выборки. Мой вопрос заключается в том, почему цепь Маркова является «современной» для отбора...

sampling mcmc monte-carlo markov-chain stochastic-approximation

10

Рандомизация неслучайной выборки

Я всегда немного удивлен, увидев психологическую рекламу для участия в экспериментальных исследованиях. Конечно, люди, которые отвечают на эти рекламные объявления, не отбираются случайным образом и, следовательно, являются самостоятельным отбором населения. Поскольку известно, что рандомизация...

sampling psychology random-allocation

10

Как сделать выборку из дискретного распределения по неотрицательным целым числам?

У меня есть следующее дискретное распределение, где - известные константы:α,βα,β\alpha,\beta p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,…p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,… p(x;\alpha,\beta) = \frac{\text{Beta}(\alpha+1, \beta+x)}{\text{Beta}(\alpha,\beta)} \;\;\;\;\text{for } x =...

sampling mcmc computational-statistics importance-sampling rejection-sampling

10

Предотвращение сбоя выборки по важности по Парето (PSIS-LOO)

Недавно я начал использовать перекрестную проверку сглаживания важности по Парето (PSIS-LOO), описанную в следующих статьях: Vehtari, A. & Gelman, A. (2015). Парето сгладил важность выборки. Препринт arXiv ( ссылка ). Вехтари А., Гельман А. и Габри Дж. (2016). Практическая оценка байесовской...

machine-learning cross-validation mcmc pareto-distribution importance-sampling

10

Что такое выборка случайной величины?

Случайная величина определяется как измеримой функции от одной - алгебры с основной мерой на другой - алгебры .σ ( Ω 1 , F 1 ) P σ ( Ω 2 , F 2 )XXXσσ\sigma(Ω1,F1)(Ω1,F1)(\Omega_1, \mathcal F_1)PPPσσ\sigma(Ω2,F2)(Ω2,F2)(\Omega_2, \mathcal F_2) Как мы говорим о выборке этой случайной величины? Мы...

sampling random-variable simulation

10

Распределение по отсортированным спискам

Скажем, у нас есть упорядоченный список товаров [a, b, c, ... x, y, z, ...] Я ищу семейство дистрибутивов с поддержкой в списке выше, управляемых некоторым параметром альфа, чтобы: При альфа = 0 он присваивает вероятность 1 первому элементу, a выше, а 0 остальным. То есть, если мы сделаем выборку...

distributions sampling discrete-data

10

Сравнивая 0/10 к 0/20

При обсуждении показателей достижения результатов, есть ли способ показать, что 0 из 20 попыток "хуже", чем 0 из 10

probability sampling

9

Как повторно сэмплировать временной ряд XTS в R?

У меня нерегулярно разнесенный XTSвременной ряд (со POSIXctзначениями в качестве типа индекса). Как я могу построить новый временной ряд, выбранный, скажем, с 10-минутным интервалом, но с каждым моментом выборки, выровненным по времени раунда (13:00:00, 13:10:00, 13:20:00, ...) , Если момент...

r time-series sampling unevenly-spaced-time-series

9

Рекомендовать ссылки на взвешивание выборки

Давайте нацелимся на вводный уровень, некоторые статьи и некоторые учебники. Applied более полезен, в том числе R-код - это здорово.

sampling references survey-weights survey-sampling

9

Показатели приемки для Метрополис-Гастингс с равномерным распределением кандидатов

При использовании алгоритма Метрополис-Гастингс с равномерным распределением кандидатов, какова причина того, что показатели приемлемости составляют около 20%? Мое мышление таково: если истинные (или близкие к истинным) значения параметров обнаружены, то новый набор значений параметров-кандидатов...

bayesian estimation sampling mcmc

9

Как я могу смоделировать микроданные переписи для небольших районов, используя 1% выборку микроданных в большом масштабе, и агрегировать статистику в масштабе небольших районов?

Я хотел бы выполнить многомерный анализ на индивидуальном уровне на небольших уровнях географической агрегации (районы сбора данных переписи населения Австралии). Очевидно, что перепись недоступна на этих небольших уровнях агрегирования по причинам конфиденциальности, поэтому я изучаю другие...

distributions sampling simulation spatial census

9

Можно ли пропустить данные из исследований, потому что они не значимы?

Я встречал это предложение, читая статью на sciencemag.org . В конце были включены ответы только от 7600 исследователей в 12 странах, потому что остальные данные не считались статистически значимыми. Это правильный способ исследования? Оставить результаты, потому что они не считались статистически...

statistical-significance sampling outliers theory

9

Как сравнить наблюдаемые и ожидаемые события?

Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот моих четырех событий (18) я могу рассчитать ожидаемые частоты...

r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

9

Как сделать выборку, когда вы не знаете распределение

Я довольно плохо знаком со статистикой (несколько курсов Uni-уровня для начинающих), и мне было интересно узнать о выборках из неизвестных дистрибутивов. В частности, если вы понятия не имеете о базовом дистрибутиве, есть ли способ «гарантировать», что вы получите репрезентативную выборку? Пример...

distributions estimation sampling sample-size algorithms

9

Обратная выборка CDF для смешанного распределения

Вне контекста короткая версия Пусть будет случайной величиной с CDF yyyF(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = 0 y > 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times \text{CDF}_{\text{log-normal}}(\cdot; \mu, \sigma) & y >...

r distributions sampling simulation copula

9

Рисование образцов из многомерного нормального распределения с учетом квадратичных ограничений

Я хотел бы эффективно рисовать образцы из условии, что .x∈Rdx∈Rdx \in \mathbb{R}^dN(μ,Σ)N(μ,Σ)\mathcal{N}(\mu, \Sigma)||x||2=1||x||2=1||x||_2 =

distributions normal-distribution sampling multivariate-normal importance-sampling