Вопросы с тегом «probability»

14
Могу ли я использовать моменты распространения для выборки распределения?

Я замечаю в статистике / методах машинного обучения, распределение часто аппроксимируется гауссианом, а затем этот гауссиан используется для выборки. Они начинают с вычисления первых двух моментов распределения и используют их для оценки μμ\mu и σ2σ2\sigma^2 . Затем они могут выбрать из этого...

14
Оценка численности населения по частоте выборки дубликатов и уникальных

Есть веб-сервис, где я могу запросить информацию о случайном предмете. Для каждого запроса каждый элемент имеет равные шансы на возврат. Я могу продолжать запрашивать предметы и записывать количество дубликатов и уникальных. Как я могу использовать эти данные для оценки общего количества...

14
Программное обеспечение (или веб-приложения) для обучения детей статистике или вероятности?

Я бы хотел (в далеком будущем) научить детей статистике. В этом отношении я был бы рад узнать о программном обеспечении (очевидно, я склоняюсь к FOSS) или веб-приложениям, которые помогают объяснить статистические / вероятностные идеи детям (или взрослым в этом отношении). Это может быть...

14
Ссылки, которые оправдывают использование гауссовых смесей

Модели гауссовых смесей (GMM) привлекательны, потому что с ними просто работать как в аналитическом, так и на практическом плане, и они способны моделировать некоторые экзотические распределения без особых сложностей. Есть несколько аналитических свойств, которые мы должны ожидать, которые в целом...

14
Как рассчитать вероятность, связанную с нелепо большими Z-показателями?

Пакеты программ для обнаружения сетевых мотивов могут возвращать чрезвычайно высокие Z-оценки (самый высокий показатель, который я видел, составляет 600 000+, но Z-оценки более 100 встречаются довольно часто). Я планирую показать, что эти Z-оценки являются поддельными. Огромные Z-оценки...

14
Центральная предельная теорема против закона больших чисел

Центральная предельная теорема утверждает, что среднее значение iid-переменных, когда переходит в бесконечность, становится нормально распределенным.NNN Это поднимает два вопроса: Можем ли мы вывести из этого закон больших чисел? Если закон больших чисел гласит, что среднее значение выборки...

14
Линейная комбинация двух зависимых многомерных нормальных случайных величин

Предположим, что у нас есть два вектора случайных величин, оба являются нормальными, то есть и Y ∼ N ( μ Y , Σ Y ) . Нас интересует распределение их линейной комбинации Z = A X + B Y + C , где A и B - матрицы, C - вектор. Если X и Y независимы, Z ∼ NX∼N(μX,ΣX)X∼N(μX,ΣX)X \sim N(\mu_X,...

14
Дивергенция Дженсена Шеннона - Дивергенция Кульбака-Лейблера?

Я знаю, что дивергенция KL не является симметричной, и ее нельзя строго рассматривать как метрику. Если да, то почему он используется, когда JS Divergence удовлетворяет требуемым свойствам метрики? Существуют ли сценарии, в которых может использоваться дивергенция KL, но не дивергенция JS или...

14
Более важная статистика: «выжили 90% всех женщин» или «90% всех выживших были женщинами»?

Рассмотрим следующие утверждения в отношении Титаника: Предположение 1: Только мужчины и женщины были на корабле Предположение 2: было большое количество мужчин и женщин Утверждение 1: 90 процентов всех женщин выжили Утверждение 2: 90 процентов всех, кто выжил, были женщины Первое указывает на то,...

14
Оптимальный программный пакет для байесовского анализа

Мне было интересно, какой пакет статистических программ вы, ребята, порекомендуете для выполнения байесовского вывода. Например, я знаю, что вы можете запускать openBUGS или winBUGS как автономные или вы также можете вызывать их из R. Но R также имеет несколько своих собственных пакетов (MCMCPack,...

14
Вероятность того, что нулевая гипотеза верна

Таким образом, это может быть общий вопрос, но я никогда не нашел удовлетворительного ответа. Как вы определяете вероятность того, что нулевая гипотеза верна (или ложна)? Допустим, вы даете студентам две разные версии теста и хотите узнать, были ли версии эквивалентны. Вы выполняете t-тест, и он...

14
Где находится бомба: как оценить вероятность, исходя из общего количества строк и столбцов?

Этот вопрос вдохновлен мини-игрой от Pokemon Soulsilver: Представьте, что в этой области 5х6 спрятано 15 бомб (РЕДАКТИРОВАТЬ: максимум 1 бомба / клетка): Теперь, как бы вы оценили вероятность найти бомбу на определенном поле, учитывая итоги строки / столбца? Если вы посмотрите на столбец 5 (всего...

14
Практический пример для MCMC

Я читал несколько лекций, связанных с MCMC. Тем не менее, я не нашел хороший пример того, как он используется. Может ли кто-нибудь дать мне конкретный пример. Все, что я вижу, это то, что они управляют цепью Маркова и говорят, что ее стационарное распределение является желаемым распределением. Я...

14
ГАМ против проигрыша против сплайнов

Контекст : Я хочу , чтобы нарисовать линию в диаграмме рассеяния , что не появляется параметрическими, поэтому я использую geom_smooth()в ggplotв R. Он автоматически возвращает geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use...

14
Азиатский случай дискриминации Палантира: как рассчитывались вероятности?

Я читал эту статью о деле Палантира, где Министерство труда обвиняет их в дискриминации азиатов. Кто-нибудь знает, откуда они взяли эти оценки вероятности? Я не получаю 1/741 в пункте (а). (a) На должность инженера по контролю качества из группы из более чем 730 квалифицированных кандидатов,...

14
Почему число непрерывных равномерных переменных в (0,1), необходимое для того, чтобы их сумма превышала единицу, имеет среднее значение

Суммируем поток случайных величин: ; пусть будет числом слагаемых, которое нам нужно, чтобы сумма превысила единицу, т. е. - наименьшее число, такое, чтоY YXi∼iidU(0,1)Xi∼iidU(0,1)X_i \overset{iid}\sim \mathcal{U}(0,1)YYYYYY X1+X2+⋯+XY>1.X1+X2+⋯+XY>1.X_1 + X_2 + \dots + X_Y > 1. Почему...

14
Предвзятость в выборе жюри?

Друг представляет клиента по апелляции после уголовного процесса, в ходе которого выясняется, что выбор присяжных был расистским. Жюри состояло из 30 человек в 4 расовых группах. Обвинение использовало императивные вызовы, чтобы исключить 10 из этих людей из пула. Количество людей и количество...

14
Распределение свертки квадратов нормальных и хи-квадрат переменных?

Следующая проблема возникла недавно при анализе данных. Если случайная величина X следует нормальному распределению, а Y следует распределению χ2nχn2\chi^2_n (с n dof), как распределяется Z=X2+Y2Z=X2+Y2Z = X^2 + Y^2 ? До сих пор я придумал ПРВ Y2Y2Y^2 :...

14
Если

Вопрос Если являются IID, то вычислите , где .X1,⋯,Xn∼N(μ,1)X1,⋯,Xn∼N(μ,1)X_1,\cdots,X_n \sim \mathcal{N}(\mu, 1)E(X1∣T)E(X1∣T)\mathbb{E}\left( X_1 \mid T \right)T=∑iXiT=∑iXiT = \sum_i X_i Попытка : пожалуйста, проверьте правильность приведенного ниже. Пусть говорят, мы возьмем сумму этих условных...

14
Вывод прогноза логистической регрессии

Я создал логистическую регрессию, используя следующий код: full.model.f = lm(Ft_45 ~ ., LOG_D) base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg) step(base.model.f, scope=list(upper=full.model.f, lower=~1), direction="forward", trace=FALSE) Затем я использовал выходные данные для создания...