Вопросы с тегом «categorical-data»

10
Как интерпретировать тест Кохрана-Мантеля-Хензеля?

Я проверяю независимость двух переменных, A и B, стратифицированных по C. A и B являются двоичными переменными, а C является категориальным (5 значений). Выполняя точный тест Фишера для A и B (все слои объединены), я получаю: ## (B) ## (A) FALSE TRUE ## FALSE 1841 85 ## TRUE 915 74 OR: 1.75 (1.25...

10
Должны ли типы данных (номинальные / порядковые / интервалы / отношения) действительно рассматриваться как типы переменных?

Так, например, вот определения, которые я получаю из стандартных учебников Переменная - характеристика популяции или выборки. ех. Цена акции или оценки на тест Данные - фактические наблюдаемые значения Итак, для отчета из двух столбцов [Имя | Income] имена столбцов будут переменными и фактическими...

10
Как называется эта диаграмма?

Может кто-нибудь сказать мне, как называется этот тип диаграммы (если есть)? Также кто-нибудь может предложить какие-нибудь инструменты, пусть и простые, для построения такой диаграммы?...

10
Зачем делать преобразование WOE категориальных предикторов в логистической регрессии?

Когда полезно преобразование весовых доказательств (WOE) категориальных переменных? Пример можно увидеть в трансформации WOE (Таким образом, для ответа , & категорического предиктора с категориями & из испытаний в й категории этого предиктора, WOE для й категории определяется какk y j n j j...

10
Каковы опасности расчета корреляций Пирсона (вместо тетрахорических) для бинарных переменных в факторном анализе?

Я занимаюсь исследованиями в области образовательных игр, и некоторые из моих текущих проектов включают использование данных из BoardGameGeek (BGG) и VideoGameGeek (VGG) для изучения взаимосвязей между элементами дизайна игр (т. Е. «Набор во Второй мировой войне», «включает в себя бросание...

10
Как статистически доказать, имеет ли столбец категориальные данные или не использует Python

У меня есть фрейм данных в Python, где мне нужно найти все категориальные переменные. Проверка типа столбца не всегда работает, потому что intтип также может быть категоричным. Поэтому я ищу помощь в поиске правильного метода проверки гипотез, чтобы определить, является ли столбец категоричным или...

10
Почему следует избегать биннинга любой ценой?

Итак, я прочитал несколько постов о том, почему всегда следует избегать биннинга. Популярной ссылкой для этого утверждения является эта ссылка . Основным препятствием является то, что точки биннинга (или точки отсечения) являются довольно произвольными, а также в результате потери информации, и что...

9
Как я могу использовать оптимальное масштабирование для масштабирования порядковой категориальной переменной?

В ответе на этот вопрос о трактовке категориальных данных как непрерывного оптимального масштабирования было упомянуто. Как работает этот метод и как он...

9
Коррекция непрерывности Yates для 2 x 2 таблиц сопряженности

Я хотел бы собрать информацию от людей в этой области о корректировке непрерывности Йейтса для таблиц 2 x 2. В статье в Википедии упоминается, что она может слишком далеко отрегулироваться и поэтому используется только в ограниченном смысле. Родственный пост здесь не предлагает гораздо более...

9
Могут ли случайные эффекты применяться только к категориальным переменным?

Эти вопросы могут показаться глупыми, но ... верно ли, что случайные эффекты могут применяться только к категориальным переменным (таким как индивидуальный идентификатор, идентификатор популяции, ...), например, скажем, является категориальной переменной:xixix_i β x iyiyiy_i ~βxiβxi\beta_{x_i} N o...

9
Лучшие практики при обработке данных о дальности как непрерывных

Я смотрю на то, связано ли изобилие с размером. Размер (конечно) непрерывен, однако, численность записывается в таком масштабе, что A = 0-10 B = 11-25 C = 26-50 D = 51-100 E = 101-250 F = 251-500 G = 501-1000 H = 1001-2500 I = 2501-5000 J = 5001-10,000 etc... А через Q ... 17 уровней. Я думал, что...

9
Как реализовать фиктивную переменную, используя n-1 переменные?

Если у меня есть переменная с 4 уровнями, теоретически мне нужно использовать 3 фиктивные переменные. На практике, как это на самом деле осуществляется? Я использую 0-3, я использую 1-3 и оставляю 4 пустыми? Какие-либо предложения? ПРИМЕЧАНИЕ: я собираюсь работать в R. ОБНОВЛЕНИЕ: Что случилось бы,...

9
Как вписать модель Брэдли – Терри – Люса в R без сложной формулы?

Модель Брэдли – Терри – Люса (BTL) утверждает, что , где - вероятность того, что объект j будет оценен как «лучший», тяжелее, и т. д., чем объект i , и \ delta_i , и \ delta_j являются параметрами.pji=logit−1(δj−δi)pji=logit−1(δj−δi)p_{ji} = logit^{-1}(\delta_j -...

9
Как измерить корреляцию между категориальной переменной? [Дубликат]

На этот вопрос уже есть ответ здесь : корреляция между категориальными переменными (1 ответ) Закрыто 6 месяцев назад . Я знаю, что мы можем использовать Спирмена для измерения корреляции между числовыми переменными. Но как измерить корреляцию между категориальными...

9
Параметрический, полупараметрический и непараметрический бутстрап для смешанных моделей

Следующие прививки взяты из этой статьи . Я новичок в начальной загрузке и пытаюсь реализовать параметрическую, полупараметрическую и непараметрическую загрузку начальной загрузки для линейной смешанной модели с R bootпакетом. Код R Вот мой Rкод: library(SASmixed) library(lme4) library(boot)...

9
Корреляция между категориями между категориальными номинальными переменными

У меня есть набор данных с двумя категориальными номинальными переменными (обе с 5 категориями). Я хотел бы знать, если (и как) я могу определить потенциальные корреляции между категориями из этих двух переменных. Другими словами, показывают ли, например, результаты категории в переменной 1 сильную...

9
Как вы строите взаимодействие между фактором и непрерывным ковариатом?

Я хотел бы нарисовать на том же графике взаимодействие между моим постоянным предиктором и моим категорическим модератором. Я знаю, как это сделать, когда оба категориальны ( взаимодействие факторов ), но на самом деле не знаю, как это сделать, когда один непрерывен, а другой...

9
Метод опроса по личным вопросам

Мой друг-статистик рассказал мне об интересной методике, используемой для получения честных ответов на опросы, посвященные деликатным вопросам. Я вспоминаю общую суть метода, но мне интересно, знает ли кто-нибудь подробности и упоминается ли он где-нибудь. История состояла в том, что АМА во Флориде...

9
Разработать статистический тест для различения двух продуктов

У меня есть набор данных из опроса клиентов, я хочу развернуть статистический тест, чтобы увидеть, есть ли разница в значении между продуктом 1 и продуктом 2. Вот набор данных отзывов клиентов. Оценка от очень плохой, плохой, хорошо, хорошо, до очень хорошо. customer product1 product2 1 very good...

9
Почему столбец пересечения в model.matrix заменяет первый фактор?

Я пытаюсь преобразовать столбец фактора в фиктивные переменные: str(cards$pointsBin) # Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ... labels <- model.matrix(~ pointsBin, data=cards) head(labels) # (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300...