Я знаю, что сумма гауссианов является гауссовой. Итак, чем же отличается смесь гауссов? Я имею в виду, смесь гауссианов - это просто сумма гауссиан (где каждый гауссиан умножается на соответствующий коэффициент смешения),...
Я знаю, что сумма гауссианов является гауссовой. Итак, чем же отличается смесь гауссов? Я имею в виду, смесь гауссианов - это просто сумма гауссиан (где каждый гауссиан умножается на соответствующий коэффициент смешения),...
Я воспроизводлю результаты с нуля в разделе 4.2.1 Предельная вероятность из вывода Гиббса Сиддхартха Чиб Журнал Американской Статистической Ассоциации, Vol. 90, No. 432. (Dec., 1995), pp. 1313-1321. Это смесь модели нормалей с известным числом компонентов. f ( x ∣ w , μ , σ 2 ) = n ∏ i = 1 k ∑ j =...
У меня есть информация о распределении антропометрических размеров (таких как размах плеч) для детей разных возрастов. Для каждого возраста и измерения у меня есть среднее стандартное отклонение. (У меня также есть восемь квантилей, но я не думаю, что смогу получить от них то, что хочу.) Для...
Предположим, у меня есть смесь конечного числа гауссиан с известными весами, средними и стандартными отклонениями. Средства не равны. Конечно, можно рассчитать среднее и стандартное отклонение смеси, поскольку моменты представляют собой средневзвешенные значения моментов компонентов. Смесь не...
Кажется, есть несколько вариантов для работы с моделями гауссовых смесей (GMM) в Python. На первый взгляд есть как минимум: PyMix - http://www.pymix.org/pymix/index.php Инструменты для моделирования смесей PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/, которая является частью...
Я провожу быстрое моделирование для сравнения различных методов кластеризации, и в настоящее время попадаю в ловушку, пытаясь оценить кластерные решения. Мне известны различные метрики проверки (многие из них содержатся в cluster.stats () в R), но я предполагаю, что они лучше всего используются,...
Пакет R mclustиспользует BIC в качестве критерия выбора модели кластера. Насколько я понимаю, модель с самым низким BIC следует выбирать среди других моделей (если вы заботитесь только о BIC). Однако, когда значения BIC все отрицательные, по Mclustумолчанию используется модель с самым высоким...
mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...
Фон: я биостатист, в настоящее время борюсь с набором данных о клеточной экспрессии. В ходе исследования некоторые пептиды подвергались воздействию множества клеток, собранных группами от различных доноров. Клетки либо экспрессируют определенные биомаркеры в ответ, либо нет. Частота ответов затем...
Таким образом, получение «идеи» об оптимальном количестве кластеров в k-средних хорошо документировано. Я нашел статью о том, как сделать это в гауссовых смесях, но не уверен, что меня это убедило, я не очень хорошо понимаю. Есть ли ... более мягкий способ сделать...
Предположим, я хочу сделать выборку из непрерывного распределения . Если у меня есть выражение в видерp(x)p(x)p(x)ppp p(x)=∑i=1∞aifi(x)p(x)=∑i=1∞aifi(x)p(x) = \sum_{i=1}^\infty a_i f_i(x) где и f_i - это распределения, из которых можно легко брать выборки, тогда я могу легко сгенерировать выборки...
Предположим, у вас есть журналы веб-сервера. В этих журналах у вас есть кортежи такого типа: user1, timestamp1 user1, timestamp2 user1, timestamp3 user2, timestamp4 user1, timestamp5 ... Эти временные метки представляют, например, клики пользователей. Теперь, мы user1будем посещать сайт несколько...
Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...
Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...
Проблема Я хочу соответствовать модельным параметрам простой 2-гауссовой смеси населения. Учитывая всю шумиху вокруг байесовских методов, я хочу понять, является ли для этой проблемы байесовский вывод лучшим инструментом, чем традиционные методы подбора. Пока MCMC работает очень плохо в этом...
Я работаю над большим количеством статистических моделей, таких как скрытые марковские модели и модели гауссовой смеси. Я вижу, что для обучения хороших моделей в каждом из этих случаев требуется большой (> 20000 предложений для НММ) объем данных, который берется из аналогичных сред в качестве...
Я использую скрытый анализ классов для кластеризации выборки наблюдений на основе набора двоичных переменных. Я использую R и пакет poLCA. В LCA необходимо указать количество кластеров, которые вы хотите найти. На практике люди обычно запускают несколько моделей, каждая из которых задает разное...
Я изучаю модель гауссовой смеси и сам задаю этот вопрос. Предположим, что базовые данные генерируются из смеси гауссовского распределения и у каждого из них есть средний вектор \ mu_k \ in \ mathbb {R} ^ p , где 1 \ leq k \ leq K, и каждый из них имеет одинаковое ко дисперсионная матрица \ Sigma и...
Я пытаюсь реализовать модель гауссовой смеси со стохастическим вариационным выводом, следуя этой статье . Это программа гауссовой смеси. Согласно статье, полный алгоритм стохастического вариационного вывода: И я все еще очень запутался в методе масштабирования до GMM. Во-первых, я думал, что...
Я новичок в использовании GMM. Я не смог найти подходящей помощи онлайн. Может ли кто-нибудь предоставить мне правильный ресурс "Как решить, подходит ли использование GMM для моей проблемы?" или в случае проблем классификации "Как решить, должен ли я использовать классификацию SVM или классификацию...