Вопросы с тегом «continuous-data»

Случайная переменная называется непрерывной, если ее набор возможных значений неисчислим, а вероятность того, что она примет какое-либо конкретное значение, равна нулю ( для каждого действительного числа ). Случайная переменная является непрерывной тогда и только тогда, когда ее совокупная функция распределения вероятностей является непрерывной функцией. Икс X P ( X = х ) = 0 P(X=x)=0 Икс x

123
Корреляции с неупорядоченными категориальными переменными

У меня есть датафрейм со многими наблюдениями и многими переменными. Некоторые из них являются категориальными (неупорядоченными), а другие числовыми. Я ищу ассоциации между этими переменными. Я был в состоянии вычислить корреляцию для числовых переменных (корреляция Спирмена), но: Я не знаю, как...

78
Пример: регрессия LASSO с использованием glmnet для двоичного результата

Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91,...

78
В чем выгода разделения непрерывной переменной-предиктора?

Мне интересно, каково значение брать непрерывную переменную предиктора и разбивать ее (например, на квинтили), прежде чем использовать ее в модели. Мне кажется, что при биннинге переменной мы теряем информацию. Это просто для того, чтобы мы могли моделировать нелинейные эффекты? Если бы мы...

77
Корреляция между номинальной (IV) и непрерывной (DV) переменной

У меня есть номинальная переменная (разные темы разговора, закодированные как topic0 = 0 и т. Д.) И ряд масштабных переменных (DV), таких как продолжительность разговора. Как я могу получить корреляции между номинальными и масштабными...

57
Имеет ли смысл когда-либо рассматривать категориальные данные как непрерывные?

Отвечая на этот вопрос о дискретных и непрерывных данных, я уверенно утверждал, что редко имеет смысл рассматривать категориальные данные как непрерывные. На первый взгляд это кажется само собой разумеющимся, но интуиция часто является плохим руководством для статистики, или, по крайней мере, моим....

33
Кластеризация набора данных с дискретными и непрерывными переменными

У меня есть набор данных X, который имеет 10 измерений, 4 из которых являются дискретными значениями. Фактически, эти 4 дискретные переменные являются порядковыми, то есть более высокое значение подразумевает более высокую / лучшую семантику. 2 из этих дискретных переменных являются категориальными...

26
Прогнозирование с использованием как непрерывных, так и категориальных функций

Некоторые методы прогнозирующего моделирования больше предназначены для обработки непрерывных предикторов, а другие - для обработки категориальных или дискретных переменных. Конечно, существуют методы преобразования одного типа в другой (дискретизация, фиктивные переменные и т. Д.). Однако...

24
Непрерывное обобщение отрицательного биномиального распределения

Отрицательное биномиальное (NB) распределение определяется на неотрицательных целых числах и имеет функцию вероятности массыИмеет ли смысл рассматривать непрерывное распределение на неотрицательных вещественных числах, определенных той же формулой (заменив k \ in \ mathbb N_0 на x \ in \ mathbb R _...

22
Когда мы должны дискретизировать / bin непрерывные независимые переменные / функции, а когда нет?

Когда мы должны дискретизировать / bin независимые переменные / функции, а когда нет? Мои попытки ответить на вопрос: В общем, мы не должны bin, потому что binning потеряет информацию. Биннинг на самом деле увеличивает степень свободы модели, поэтому после биннинга возможна чрезмерная подгонка....

18
Равномерная случайная величина как сумма двух случайных величин

Взято из Гриммета и Штирзакера : Покажите, что это не может быть случай, когда где равномерно распределены по [0,1], а и независимы и одинаково распределены. Вы не должны считать , что X и Y являются непрерывными переменными.U = X + Y U=X+YU=X+YU UUX XXYYY Простое доказательство от противного...

17
Как выбрать между ANOVA и ANCOVA в разработанном эксперименте?

Я провожу эксперимент, который имеет следующее: DV: потребление среза (непрерывное или может быть категоричным) IV: здоровое сообщение, нездоровое сообщение, отсутствие сообщения (контроль) (3 группы, в которых люди назначаются случайным образом - категорично) Это манипулируемое сообщение о...

14
Всегда ли неправильно переходить от непрерывных данных к категориальным?

Когда я читал о том, как настроить ваши данные, я часто сталкивался с тем, что преобразование некоторых непрерывных данных в категориальные данные не является хорошей идеей, поскольку вы можете сделать неправильный вывод, если пороговые значения плохо определены. Тем не менее, в настоящее время у...

14
Вычислительно эффективная оценка многомерного режима

Короткая версия: Какой наиболее эффективный в вычислительном отношении метод оценки режима многомерного набора данных, взятого из непрерывного распределения? Длинная версия: у меня есть набор данных, который мне нужен для оценки режима. Режим не совпадает со средним или медианой. Пример показан...

14
Как правильно оценить корреляцию между порядковым и непрерывным переменным?

Я хотел бы оценить соотношение между: Порядковая переменная: испытуемых просят оценить предпочтение 6 видов фруктов по шкале от 1 до 5 (от очень отвратительных до очень вкусных). В среднем предметы используют только 3 балла. Непрерывная переменная: одним и тем же субъектам предлагается быстро...

12
Условная вероятность непрерывной переменной

Предположим, что случайная величина следует непрерывному равномерному распределению с параметрами 0 и 10 (т. Е. )U ∼ U ( 0 , 10 )UUUU∼ U ( 0 , 10 )U∼U(0,10)U \sim \rm{U}(0,10) Теперь давайте обозначим A событие, когда = 5, а B событие, когда равно или 6. Согласно моему пониманию, оба события имеют...

12
Коэффициент корреляции для недихотомической номинальной переменной и порядковой или числовой переменной

Я уже прочитал все страницы на этом сайте, пытаясь найти ответ на мою проблему, но, похоже, никто не подходит мне ... Сначала я объясню вам, с какими данными я работаю ... Допустим, у меня есть вектор-массив с несколькими названиями городов, по одному для каждого из 300 пользователей. У меня также...

12
Могу ли я использовать множественную регрессию, когда у меня смешаны категориальные и непрерывные предикторы?

Похоже, вы можете использовать кодирование для одной категориальной переменной, но у меня есть две категориальные и одна непрерывная переменная предиктора. Могу ли я использовать множественную регрессию для этого в SPSS и если да, то как?...