Статистика и большие данные

9
VC размер прямоугольника

Книга Этема Альпайдина «Введение в машинное обучение» утверждает, что размер VC прямоугольника, ориентированного по оси, равен 4. Но как прямоугольник может разрушить набор из четырех коллинеарных точек с чередующимися положительными и отрицательными точками ?? Может кто-нибудь объяснить и доказать...

9
Как интерпретировать дисперсию случайного эффекта в обобщенной линейной смешанной модели

В логистической обобщенной линейной смешанной модели (семейство = бином) я не знаю, как интерпретировать дисперсию случайных эффектов: Random effects: Groups Name Variance Std.Dev. HOSPITAL (Intercept) 0.4295 0.6554 Number of obs: 2275, groups: HOSPITAL, 14 Как мне интерпретировать этот числовой...

9
Интересный вывод R в квадрате

Несколько лет назад я обнаружил эту идентичность путем экспериментов, играя с данными и преобразованиями. После объяснения этому моему профессору статистики он пришел в следующий класс с одностраничным доказательством с использованием векторной и матричной записи. К сожалению, я потерял бумагу,...

9
Создать симметричную положительно определенную матрицу с заранее заданным шаблоном разреженности

Я пытаюсь сгенерировать корреляционную матрицу (симметричный psd) с заранее заданной разреженной структурой (указанной графом на узлах). Узлы, которые связаны в графе, имеют корреляцию , все остальные равны 0, а диагональ равна 1.р × рп×пp\times pппpρ∼U(0,1)ρ~U(0,1)\rho \sim U(0,1) Я пытался...

9
скорректированное отношение шансов против отношения шансов

В многомерном регрессионном анализе кажется, что люди используют разные определения скорректированных коэффициентов шансов. Не могли бы вы уточнить для меня, что такое скорректированное ИЛИ и чем оно отличается от не скорректированного ИЛИ ?...

9
Как проверить медиану населения?

У меня есть образец 250 единиц. Распределение асимметрично. Я хочу проверить гипотезу о том, что медиана популяции отличается от 3,5, поэтому я думаю, что тест с одной выборкой будет уместным. Я знаю, что критерий ранга Уилкоксона не подходит, потому что распределение не симметрично. Подходит ли...

9
Доверительный интервал для среднего эффекта лечения от веса оценки склонности?

Я пытаюсь оценить средний эффект лечения по данным наблюдений, используя весовые коэффициенты склонности (особенно IPTW). Я думаю, что я правильно рассчитываю ATE, но я не знаю, как рассчитать доверительный интервал ATE, принимая во внимание весовые коэффициенты обратной склонности. Вот уравнение,...

9
Оцените массу фруктов в сумке из только связанных итогов?

Преподаватель в моем университете задал такой вопрос (не для домашней работы, так как урок закончился, а меня там не было). Я не могу понять, как подойти к нему. Речь идет о 2 пакетиках, каждый из которых содержит ассортимент разных видов фруктов: Первая сумка содержит следующие случайно выбранные...

9
Решение к упражнению 2.2a.16 «Надежная статистика: подход, основанный на функциях влияния»

На странице 180 Робастной статистики: подход, основанный на функциях влияния, можно найти следующий вопрос: 16: Показать, что для инвариантных по местоположению оценок всегда . Найдите соответствующую верхнюю границу для точки развала конечной выборки , причем в случае, когда нечетно или...

9
Ожидание на произведения высших порядков нормальных распределений

У меня есть две нормально распределенные переменные и X 2 со средним нулем и ковариационной матрицей Σ . Я заинтересован в попытке вычислить значение E [ X 2 1 X 2 2 ] в терминах записей Σ .Икс1Икс1X_1Икс2Икс2X_2ΣΣ\SigmaЕ[ X21Икс22]Е[Икс12Икс22]E[X_1^2 X_2^2]ΣΣ\Sigma Я использовал закон полной...

9
Как рассчитать функцию правдоподобия

Срок службы трех электронных компонентов: и . Случайные величины были смоделированы как случайная выборка размера 3 из экспоненциального распределения с параметром . Функция правдоподобия, дляХ 3 = 2,1 & thetas ; & thetas ; > 0X1=3,X2=1.5,X1=3,X2=1.5,X_{1} = 3, X_{2} =...

9
Подгонка гетероскедастической обобщенной линейной модели для биномиальных ответов

У меня есть данные из следующего экспериментального плана: мои наблюдения - это подсчет числа успехов ( K) из соответствующего числа испытаний ( N), измеренных для двух групп, каждая из которых состоит из Iиндивидуумов, из Tобработок, где в каждой такой комбинации факторов есть Rповторения , Таким...

9
ML оценка экспоненциального распределения (с цензурой данных)

В Survival Analysis вы предполагаете, что время выживания rv распределено экспоненциально. Учитывая теперь , что у меня есть х 1 , ... , х п «результаты» н.о.р. с.в. X я . Только некоторая часть этих результатов фактически «полностью реализована», то есть остальные наблюдения все еще...

9
Удаление выбросов из данных - максимальное количество выбросов, которые вы можете удалить?

У меня есть несколько выбросов в моих данных, и я хотел исключить их, чтобы увидеть, изменит ли это результаты. По вашему мнению, каким максимальным количеством выбросов следует ограничиться? Спасибо!...

9
Насколько справедливо использовать слово «прогнозировать» для (логистической) регрессии?

Я понимаю, что даже регрессия не дает причинности. Он может дать только связь между переменной y и переменными x и, возможно, направление. Я прав? Я часто встречал фразы, похожие на «x предсказывает y», даже в большинстве учебников курса и на различных страницах курса в Интернете. И вы часто...

9
Как переставить 2D данные, чтобы получить заданную корреляцию?

У меня есть следующий простой набор данных с двумя непрерывными переменными; то есть: d = data.frame(x=runif(100,0,100),y = runif(100,0,100)) plot(d$x,d$y) abline(lm(y~x,d), col="red") cor(d$x,d$y) # = 0.2135273 Мне нужно переставить данные таким образом, чтобы корреляция между переменными...

9
Вычислить квантиль суммы распределений из определенных квантилей

Давайте предположим , что NNN независимых случайных величин X1,...,XNX1,...,XNX_1, ..., X_N для которых квантили на некотором конкретном уровне αα\alpha известны посредством оценки по данным: α=P(X1<q1)α=P(X1<q1)\alpha = P(X_1 < q_1) , ..., α=P(XN<qN)α=P(XN<qN)\alpha = P(X_N < q_N) ....

9
Генератор случайных чисел Mathematica отклоняется от биномиальной вероятности?

Итак, допустим, вы подбрасываете монету 10 раз и называете это «событием». Если вы запустите 1000000 из этих «событий», какова доля событий с головами от 0,4 до 0,6? Биноминальная вероятность предполагает, что это будет около 0,65, но мой код Mathematica говорит мне о 0,24 Вот мой синтаксис:...