Вопросы с тегом «proportion»

Пропорция - это доля некоторой суммы, которая имеет определенный вид, либо (i) как счет одного типа вещей из общего количества, либо (ii) как компонент непрерывной переменной.

78
Пример: регрессия LASSO с использованием glmnet для двоичного результата

Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91,...

52
Какова связь между тестом хи-квадрат и тестом равных пропорций?

Предположим, что у меня есть три популяции с четырьмя взаимоисключающими характеристиками. Я беру случайные выборки из каждой популяции и строю кросс-таблицу или таблицу частот для характеристик, которые я измеряю. Правильно ли я сказал, что: Если я хотел проверить, существует ли какая-либо связь...

23
Биномиальный тест с двумя пропорциями выборки в R (и некоторые странные p-значения)

Я пытаюсь решить следующий вопрос: Игрок A выиграл 17 из 25 игр, а игрок B выиграл 8 из 20 - есть ли значительная разница между обоими соотношениями? В R приходит на ум следующее: > prop.test(c(17,8),c(25,20),correct=FALSE) 2-sample test for equality of proportions without continuity correction...

22
Безопасное определение размера образца для A / B-тестирования

Я - инженер-программист, желающий создать инструмент A / B-тестирования . У меня нет основательной статистики, но за последние несколько дней я немного читал. Я следую методологии, описанной здесь, и суммирую соответствующие пункты ниже. Этот инструмент позволит дизайнерам и экспертам по доменам...

22
Парадокс средней стоимости - как это называется?

У меня есть набор данных. Скажите наблюдений и переменные:3101010333 obs A B C 1 0 0 1 2 0 1 0 3 1 0 1 4 1 1 0 5 1 0 1 6 1 0 0 7 1 1 0 8 0 0 1 9 0 1 1 10 0 1 1 Скажем, это клиентов, которые купили ( ) или нет ( ) в каждой категории . Там их , поэтому эти покупателей покупают в среднем по товарным...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

15
На каком уровне тест математически идентичен тесту пропорций?

ФОН: Пропустите безопасно - это здесь для справки, и чтобы узаконить вопрос. Открытие этой статьи гласит: «Знаменитый критерий непредвиденных обстоятельств Карла Пирсона по хи-квадрату получен из другой статистики, называемой z-статистикой, основанной на нормальном распределении. Можно показать,...

13
Можно ли использовать квадрат Чи для сравнения пропорций?

Я читал, что тест хи-квадрат полезен, чтобы увидеть, значительно ли образец отличается от набора ожидаемых значений. Например, вот таблица результатов опроса относительно любимых цветов людей (всего n = 15 + 13 + 10 + 17 = 55 респондентов): red,blue,green,yellow 15,13,10,17 Тест хи-квадрат может...

13
Интерпретация пропорций, суммирующих единицу, как независимых переменных в линейной регрессии

Я знаком с понятием категориальных переменных и соответствующим фиктивным кодированием переменных, которое позволяет нам соответствовать одному уровню в качестве базовой линии, чтобы избежать коллинеарности. Я также знаком с тем, как интерпретировать оценки параметров из таких моделей:...

12
Использование lm для 2-пробы

Некоторое время я использовал линейные модели для проведения тестов пропорции 2 образцов, но понял, что это может быть не совсем правильно. Похоже, что использование обобщенной линейной модели с биномиальной связью семейство + тождественность дает в точности результаты пула для 2-выборочной...

12
Каков наиболее подходящий способ преобразования пропорций, когда они являются независимой переменной?

Я думал, что понял эту проблему, но теперь я не так уверен, и я хотел бы проверить с другими, прежде чем продолжить. У меня есть две переменные, Xи Y. Yявляется отношением, и оно не ограничено 0 и 1 и обычно нормально распределено. Xявляется пропорцией, и он ограничен 0 и 1 (он работает от 0,0 до...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Клоппер-Пирсон для нематематиков

Мне было интересно, если кто-нибудь может объяснить мне интуицию за пределами Клоппера-Пирсона CI для пропорций. Насколько я знаю, каждый CI включает в себя дисперсию. Однако для пропорций, даже если моя пропорция равна 0 или 1 (0% или 100%), CI Клоппера-Пирсона можно рассчитать. Я попытался...

12
-test В.С. -test для сравнения шансов подхватить простуду в 2 -х группах

Я только что прочитал в довольно уважаемом (популярном) научном журнале (немецкий PM, 02/2013, с.36) об интересном эксперименте (к сожалению, без источника). Это привлекло мое внимание, потому что интуитивно я сомневался в значимости результата, но предоставленной информации было достаточно для...

12
В чем разница между «пропорциями счета» и «непрерывными пропорциями»?

В комментарии к другому вопросу было уточнено, была ли обсуждаемая тема «пропорции подсчета» или «непрерывные пропорции», и в последующем указывалось, что различие было критической информацией (к теме логистической / биномиальной и бета-регрессии). В чем различие между ними и где это различие имеет...

11
Подгонка биномиального GLMM (glmer) к переменной отклика, которая является пропорцией или долей

Я надеюсь, что кто-то может помочь с тем, что я считаю относительно простым вопросом, и я думаю, что знаю ответ, но без подтверждения он стал тем, в чем я просто не могу быть уверен. У меня есть данные подсчета в качестве переменной ответа, и я хочу измерить, как эта переменная изменяется при...

10
Почему нельзя делать корреляцию Пирсона по данным о пропорциях?

Онлайн модуль, который я изучаю, утверждает, что никогда не следует использовать корреляцию Пирсона с данными о пропорциях. Почему бы нет? Или, если это иногда хорошо или всегда хорошо,...

10
Почему доля выборки также не имеет биномиального распределения

В биномиальной установке случайная величина X, которая дает количество успехов, распределяется биномиально. Пропорция выборки может быть рассчитана как где - размер вашей выборки. В моем учебнике говорится, чтоИксNИксN\frac{X}{n}NNn Эта пропорция не имеет биномиального распределения однако,...

10
Почему стандартная ошибка пропорции, для данного n, наибольшая для 0.5?

Стандартная ошибка пропорции будет наибольшей, которая может быть для данного N, когда рассматриваемая пропорция составляет 0,5, и становится меньше, чем дальше пропорция от 0,5. Я могу понять, почему это так, когда я смотрю на уравнение для стандартной ошибки пропорции, но я не могу объяснить это...

10
Почему Anova () и drop1 () предоставили разные ответы для GLMM?

У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние...