Статистика и большие данные

9
Модель случайных эффектов, обрабатывающая избыточность

Я пытаюсь иметь дело с анализом времени на событие, используя повторяющиеся двоичные результаты. Предположим, что время до события измеряется днями, но на данный момент мы делим время на недели. Я хочу приблизить оценку Каплана-Мейера (но учесть ковариаты), используя повторяющиеся двоичные...

9
Среднее абсолютное отклонение меньше стандартного отклонения для

Я хочу сравнить среднее абсолютное отклонение со стандартным отклонением в общем случае с этим определением: MA D = 1n - 1Σ1N| Икся- μ | ,SD = ∑N1( хя- μ )2n - 1-----------√MAD=1n−1∑1n|xi−μ|,SD=∑1n(xi−μ)2n−1MAD = \frac{1}{n-1}\sum_1^n|x_i - \mu|, \qquad SD = \sqrt{\frac{\sum_1^n(x_i-\mu)^2}{n-1}}...

8
Как провести корреляционный анализ пива и подгузников

У меня есть данные, которые эквивалентны: shopper_1 = ['beer', 'eggs', 'water',...] shopper_2 = ['diapers', 'beer',...] ... Я хотел бы провести некоторый анализ этого набора данных, чтобы получить корреляционную матрицу, которая имела бы значение, аналогичное следующему: если вы купили x, вы,...

8
Могу ли я установить смешанную модель с объектами, которые имеют только 1 наблюдение?

У меня есть очень большой набор данных, где я повторял измерения в течение определенного времени для отдельных мест. Некоторые местоположения могут иметь 10 точек данных, а некоторые местоположения имеют только 1 точку данных. Я подхожу к смешанной модели и использую локации в качестве случайных...

8
Как измерить количество людей на картине из толпы?

Предыстория : Израиль (и Ближний Восток в целом) полон протестов. Мне любопытно, когда мне дают картину, чтобы оценить, сколько людей на этой картине (часто изображение большой толпы). Какое моделирование может предложить какое-то решение этой проблемы? (и, конечно, это может быть сделано с любым...

8
Могу ли я подвыбор большого набора данных на каждой итерации MCMC?

Проблема: я хочу выполнить выборку Гиббса, чтобы вывести некоторую апостериорную часть по большому набору данных. К сожалению, моя модель не очень проста, поэтому выборка слишком медленная. Я бы рассмотрел вариационные или параллельные подходы, но прежде чем идти так далеко ... Вопрос: Я хотел бы...

8
Разница между наивными байесовскими и рекуррентными нейронными сетями (LSTM)

Я хочу провести анализ настроений над текстом, прочитал несколько статей, некоторые из них используют «Наивный байесовский», а другие - «Рекуррентную нейронную сеть (LSTM)» , с другой стороны, я видел библиотеку python для анализа настроений, которая это нлтк. Он использует "Наивный байесовский",...

8
Почему этот набор данных не имеет ковариации?

Мое понимание того, как работает ковариация, заключается в том, что коррелированные данные должны иметь несколько высокую ковариацию. Я сталкивался с ситуацией, когда мои данные выглядят коррелированными (как показано на диаграмме рассеяния), но ковариация близка к нулю. Как ковариация данных может...

8
Нормальное распределение

Есть проблема статистики, я, к сожалению, понятия не имею, с чего начать (я учусь самостоятельно, поэтому я не могу никого спросить, если я чего-то не понимаю. Вопрос в том X,YX,YX,Y iidN(a,b2);a=0;b2=6;var(X2+Y2)=?N(a,b2);a=0;b2=6;var(X2+Y2)=?N(a,b^2); a=0; b^2=6;...

8
Червь и Apple Ожидаемая стоимость

Яблоко расположено в вершине AAA пятиугольника ABCDEABCDEABCDE , и червь находится две вершины в стороне, по крайней CCC . Каждый день червь ползет с равной вероятностью к одной из двух смежных вершин. Таким образом , после того, как один день червь при вершине BBB или DDD , каждый из которых с...