Вопросы с тегом «distributions»

11

Как проверить, соответствуют ли мои данные журналу нормального распределения?

Я хотел бы проверить, соответствуют Rли мои данные нормальному логарифму или парето. Как я мог это сделать? Возможно, это ks.testможет помочь мне, но как я могу получить параметры αα\alpha и kkk для распределения Парето для моих...

11

Когда наименьшие квадраты будут плохой идеей?

Если у меня есть модель регрессии: где и ,Y= Хβ+ εY=Xβ+ε Y = X\beta + \varepsilon V [ε]=Id∈ Rn × nV[ε]=Id∈Rn×n\mathbb{V}[\varepsilon] = Id \in \mathcal{R} ^{n \times n}E [ε]=(0,…,0)E[ε]=(0,…,0)\mathbb{E}[\varepsilon]=(0, \ldots , 0) когда использование , обычного метода наименьших квадратов , будет...

regression distributions least-squares

11

Существуют ли какие-либо распределения, кроме Коши, для которых среднее арифметическое выборки следует тому же распределению?

Если следует распределению Коши, то также следует точно тому же распределению, что и ; увидеть эту тему .Y = ˉ X = 1XXXXY=X¯=1n∑ni=1XiY=X¯=1n∑i=1nXiY = \bar{X} = \frac{1}{n} \sum_{i=1}^n X_iXXX У этого свойства есть имя? Есть ли другие дистрибутивы, для которых это правда? РЕДАКТИРОВАТЬ Еще один...

distributions expected-value central-limit-theorem cauchy

11

Распределение для процентных данных

У меня есть вопрос о правильном распределении, используемом для создания модели с моими данными. Я провел инвентаризацию леса на 50 участков, каждый из которых имеет размеры 20 х 50 м. Для каждого участка я подсчитал процент деревьев, которые затеняют землю. Каждый участок имеет одно значение в...

distributions binomial gamma-distribution

11

Что подразумевается под категориальным распределением?

Является ли этот отдельный тип распределения (например, Биномиальный, Бернулли, Мультомиальный) или любым распределением может быть представлен таким способом. Может кто-нибудь прояснить на простом...

probability distributions

11

Что такое распределение логов?

Я читаю учебник по машинному обучению (Data Mining by Witten, et al., 2011) и наткнулся на этот отрывок: ... Кроме того, могут использоваться разные дистрибутивы. Хотя нормальное распределение обычно является хорошим выбором для числовых атрибутов, оно не подходит для атрибутов, которые имеют...

machine-learning distributions

11

Что такое функция канонического связывания для Tweedie GLM?

Я только что познакомился с дистрибутивом Tweedie (см. Это или это ), но мне трудно найти, что такое функция link для обобщенной линейной модели Tweedie.

distributions generalized-linear-model tweedie-distribution

11

Интуитивно понятно, почему кросс-энтропия является мерой расстояния двух распределений вероятности?

Для двух дискретных распределений и перекрестная энтропия определяется какpppqqq H(p,q)=−∑xp(x)logq(x).H(p,q)=−∑xp(x)log⁡q(x),H(p,q)=-\sum_x p(x)\log q(x). Интересно, почему это будет интуитивно понятная мера расстояния между двумя распределениями вероятностей? Я вижу, что - энтропия , которая...

probability distributions cross-entropy

11

Как выбрать наилучшее соответствие без чрезмерных данных? Моделирование бимодального распределения с N нормальными функциями и т. Д.

У меня есть явно бимодальное распределение значений, которое я стараюсь соответствовать. Данные могут хорошо соответствовать либо 2 нормальным функциям (бимодальным), либо 3 нормальным функциям. Кроме того, существует вероятная физическая причина для сопоставления данных с 3. Чем больше параметров...

distributions normal-distribution model-selection overfitting

11

Разделить данные на N равных групп

У меня есть датафрейм, который содержит значения в 4 столбцах: Например: ID, price, click count,rating Я хотел бы «разбить» этот фрейм данных на N разных групп, где каждая группа будет иметь одинаковое количество строк с одинаковым распределением цены, количества кликов и атрибутов рейтингов. Любой...

r distributions

11

Сумма независимых логнормальных случайных величин оказывается логнормальной?

Я пытаюсь понять, почему сумма двух (или более) логнормальных случайных величин приближается к логнормальному распределению при увеличении количества наблюдений. Я посмотрел онлайн и не нашел никаких результатов, касающихся этого. Ясно, что если и Y являются независимыми логнормальными переменными,...

distributions lognormal convolution sum

11

Сколько дистрибутивов в GLM?

Я определил несколько мест в учебниках, где GLM описан с 5 распределениями (а именно: гамма, гауссовский, биномиальный, обратный гауссовский и пуассоновский). Это также иллюстрируется в функции семьи в R. Иногда я сталкиваюсь с ссылками на GLM, где включены дополнительные дистрибутивы ( пример )....

r probability distributions generalized-linear-model

11

Визуализировать двумерное биномиальное распределение

Вопрос: как выглядит двумерное биномиальное распределение в трехмерном пространстве? Ниже приведена конкретная функция, которую я хотел бы визуализировать для различных значений параметров; а именно , и .nnnp1p1p_{1}p2p2p_{2}...

probability data-visualization binomial discrete-data distributions

11

Успех испытаний Бернулли с разными вероятностями

Если проводится 20 независимых испытаний Бернулли, каждое с различной вероятностью успеха и, следовательно, неудачи. Какова вероятность того, что именно n из 20 испытаний было успешным? Есть ли лучший способ вычисления этих вероятностей, чем просто суммировать комбинации вероятностей успеха и...

probability distributions bernoulli-distribution poisson-binomial

11

Измерьте равномерность распределения по дням недели

У меня похожая проблема с вопросом, заданным здесь: Как измерить неоднородность распределения? У меня есть набор распределения вероятностей по дням недели. Я хочу измерить, насколько близко каждое распределение к (1 / 7,1 / 7, ..., 1/7). В данный момент я использую ответ на вышеуказанный вопрос;...

probability distributions random-variable uniform measurement

11

Понимание бета-конъюгата перед байесовским выводом о частоте

Ниже приведен отрывок из «Болстадского введения в байесовскую статистику» . Для всех вас, экспертов, это может быть тривиально, но я не понимаю, как автор приходит к выводу, что нам не нужно делать какую-либо интеграцию для вычисления апостериорной вероятности для некоторого значения . Я понимаю...

distributions bayesian beta-distribution conjugate-prior

11

Как создать последовательность

Я знаю, как создать последовательность со средним значением . Например, в Matlab, если я хочу сгенерировать последовательность длиной , это:0 ± 1 10000± 1±1\pm 1000± 1±1\pm 1100001000010000 2*(rand(1, 10000, 1)<=.5)-1 Тем не менее, как создать последовательность со средним значением , то есть с...

distributions sampling random-generation

10

Что такое медиана нецентрального t-распределения?

Какова медиана нецентрального t-распределения с нецентральным параметром ? Это может быть безнадежным вопросом, потому что CDF выглядит как бесконечная сумма, и я не могу найти никакой информации об обратной функции CDF.δ≠0δ≠0\delta \ne...

distributions median non-central t-distribution

10

Как распределяется ошибка вокруг данных логистического роста?

В экологии мы часто используем уравнение логистического роста: Nt=KN0ertK+N0ert−1Nt=KN0ertK+N0ert−1 N_t = \frac{ K N_0 e^{rt} }{K + N_0 e^{rt-1}} или Nt=KN0N0+(K−N0)e−rtNt=KN0N0+(K−N0)e−rt N_t = \frac{ K N_0}{N_0 + (K -N_0)e^{-rt}} где - пропускная способность (достигнута максимальная плотность), -...

r distributions pdf ecology

10

R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

r regression categorical-data regression-coefficients categorical-encoding machine-learning random-forest anova spss r self-study bootstrap monte-carlo r multiple-regression partitioning neural-networks normalization machine-learning svm kernel-trick self-study survival cox-model repeated-measures survey likert correlation variance sampling meta-analysis anova independence sample assumptions bayesian covariance r regression time-series mathematical-statistics graphical-model machine-learning linear-model kernel-trick linear-algebra self-study moments function correlation spss probability confidence-interval sampling mean population r generalized-linear-model prediction offset data-visualization clustering sas cart binning sas logistic causality regression self-study standard-error r distributions r regression time-series multiple-regression python chi-squared independence sample clustering data-mining rapidminer probability stochastic-processes clustering binary-data dimensionality-reduction svd correspondence-analysis data-visualization excel c# hypothesis-testing econometrics survey rating composite regression least-squares mcmc markov-process kullback-leibler convergence predictive-models r regression anova confidence-interval survival cox-model hazard normal-distribution autoregressive mixed-model r mixed-model sas hypothesis-testing mediation interaction