Вопросы с тегом «distributions»

11
Как проверить, соответствуют ли мои данные журналу нормального распределения?

Я хотел бы проверить, соответствуют Rли мои данные нормальному логарифму или парето. Как я мог это сделать? Возможно, это ks.testможет помочь мне, но как я могу получить параметры αα\alpha и kkk для распределения Парето для моих...

11
Когда наименьшие квадраты будут плохой идеей?

Если у меня есть модель регрессии: где и ,Y= Хβ+ εY=Xβ+ε Y = X\beta + \varepsilon V [ε]=Id∈ Rn × nV[ε]=Id∈Rn×n\mathbb{V}[\varepsilon] = Id \in \mathcal{R} ^{n \times n}E [ε]=(0,…,0)E[ε]=(0,…,0)\mathbb{E}[\varepsilon]=(0, \ldots , 0) когда использование , обычного метода наименьших квадратов , будет...

11
Существуют ли какие-либо распределения, кроме Коши, для которых среднее арифметическое выборки следует тому же распределению?

Если следует распределению Коши, то также следует точно тому же распределению, что и ; увидеть эту тему .Y = ˉ X = 1XXXXY=X¯=1n∑ni=1XiY=X¯=1n∑i=1nXiY = \bar{X} = \frac{1}{n} \sum_{i=1}^n X_iXXX У этого свойства есть имя? Есть ли другие дистрибутивы, для которых это правда? РЕДАКТИРОВАТЬ Еще один...

11
Распределение для процентных данных

У меня есть вопрос о правильном распределении, используемом для создания модели с моими данными. Я провел инвентаризацию леса на 50 участков, каждый из которых имеет размеры 20 х 50 м. Для каждого участка я подсчитал процент деревьев, которые затеняют землю. Каждый участок имеет одно значение в...

11
Что подразумевается под категориальным распределением?

Является ли этот отдельный тип распределения (например, Биномиальный, Бернулли, Мультомиальный) или любым распределением может быть представлен таким способом. Может кто-нибудь прояснить на простом...

11
Что такое распределение логов?

Я читаю учебник по машинному обучению (Data Mining by Witten, et al., 2011) и наткнулся на этот отрывок: ... Кроме того, могут использоваться разные дистрибутивы. Хотя нормальное распределение обычно является хорошим выбором для числовых атрибутов, оно не подходит для атрибутов, которые имеют...

11
Интуитивно понятно, почему кросс-энтропия является мерой расстояния двух распределений вероятности?

Для двух дискретных распределений и перекрестная энтропия определяется какpppqqq H(p,q)=−∑xp(x)logq(x).H(p,q)=−∑xp(x)log⁡q(x),H(p,q)=-\sum_x p(x)\log q(x). Интересно, почему это будет интуитивно понятная мера расстояния между двумя распределениями вероятностей? Я вижу, что - энтропия , которая...

11
Как выбрать наилучшее соответствие без чрезмерных данных? Моделирование бимодального распределения с N нормальными функциями и т. Д.

У меня есть явно бимодальное распределение значений, которое я стараюсь соответствовать. Данные могут хорошо соответствовать либо 2 нормальным функциям (бимодальным), либо 3 нормальным функциям. Кроме того, существует вероятная физическая причина для сопоставления данных с 3. Чем больше параметров...

11
Разделить данные на N равных групп

У меня есть датафрейм, который содержит значения в 4 столбцах: Например: ID, price, click count,rating Я хотел бы «разбить» этот фрейм данных на N разных групп, где каждая группа будет иметь одинаковое количество строк с одинаковым распределением цены, количества кликов и атрибутов рейтингов. Любой...

11
Сумма независимых логнормальных случайных величин оказывается логнормальной?

Я пытаюсь понять, почему сумма двух (или более) логнормальных случайных величин приближается к логнормальному распределению при увеличении количества наблюдений. Я посмотрел онлайн и не нашел никаких результатов, касающихся этого. Ясно, что если и Y являются независимыми логнормальными переменными,...

11
Сколько дистрибутивов в GLM?

Я определил несколько мест в учебниках, где GLM описан с 5 распределениями (а именно: гамма, гауссовский, биномиальный, обратный гауссовский и пуассоновский). Это также иллюстрируется в функции семьи в R. Иногда я сталкиваюсь с ссылками на GLM, где включены дополнительные дистрибутивы ( пример )....

11
Визуализировать двумерное биномиальное распределение

Вопрос: как выглядит двумерное биномиальное распределение в трехмерном пространстве? Ниже приведена конкретная функция, которую я хотел бы визуализировать для различных значений параметров; а именно , и .nnnp1p1p_{1}p2p2p_{2}...

11
Успех испытаний Бернулли с разными вероятностями

Если проводится 20 независимых испытаний Бернулли, каждое с различной вероятностью успеха и, следовательно, неудачи. Какова вероятность того, что именно n из 20 испытаний было успешным? Есть ли лучший способ вычисления этих вероятностей, чем просто суммировать комбинации вероятностей успеха и...

11
Измерьте равномерность распределения по дням недели

У меня похожая проблема с вопросом, заданным здесь: Как измерить неоднородность распределения? У меня есть набор распределения вероятностей по дням недели. Я хочу измерить, насколько близко каждое распределение к (1 / 7,1 / 7, ..., 1/7). В данный момент я использую ответ на вышеуказанный вопрос;...

11
Понимание бета-конъюгата перед байесовским выводом о частоте

Ниже приведен отрывок из «Болстадского введения в байесовскую статистику» . Для всех вас, экспертов, это может быть тривиально, но я не понимаю, как автор приходит к выводу, что нам не нужно делать какую-либо интеграцию для вычисления апостериорной вероятности для некоторого значения . Я понимаю...

11
Как создать последовательность

Я знаю, как создать последовательность со средним значением . Например, в Matlab, если я хочу сгенерировать последовательность длиной , это:0 ± 1 10000± 1±1\pm 1000± 1±1\pm 1100001000010000 2*(rand(1, 10000, 1)<=.5)-1 Тем не менее, как создать последовательность со средним значением , то есть с...

10
Что такое медиана нецентрального t-распределения?

Какова медиана нецентрального t-распределения с нецентральным параметром ? Это может быть безнадежным вопросом, потому что CDF выглядит как бесконечная сумма, и я не могу найти никакой информации об обратной функции CDF.δ≠0δ≠0\delta \ne...

10
Как распределяется ошибка вокруг данных логистического роста?

В экологии мы часто используем уравнение логистического роста: Nt=KN0ertK+N0ert−1Nt=KN0ertK+N0ert−1 N_t = \frac{ K N_0 e^{rt} }{K + N_0 e^{rt-1}} или Nt=KN0N0+(K−N0)e−rtNt=KN0N0+(K−N0)e−rt N_t = \frac{ K N_0}{N_0 + (K -N_0)e^{-rt}} где - пропускная способность (достигнута максимальная плотность), -...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...