Вопросы с тегом «data-transformation»

13
Как обобщить категориальные данные?

Я боролся со следующей проблемой, надеюсь, она проста для статистиков (я программист, немного знакомый со статистикой). Мне нужно обобщить ответы на опрос (для руководства). В опросе содержится более 100 вопросов, сгруппированных по разным областям (от 5 до 10 вопросов на область). Все ответы...

13
Экспресс-ответы в исходных единицах, в преобразованных Бокс-Коксом данных

Для некоторых измерений результаты анализа соответствующим образом представлены в преобразованной шкале. Однако в большинстве случаев желательно представлять результаты в исходной шкале измерений (в противном случае ваша работа более или менее бесполезна). Например, в случае данных, преобразованных...

13
Преобразование крайне искаженных распределений

Предположим, что у меня есть переменная, распределение которой искажено положительно в очень высокой степени, так что взятия бревна будет недостаточно, чтобы привести его в диапазон асимметрии для нормального распределения. Какие у меня варианты на данный момент? Что я могу сделать, чтобы...

13
центрирование и масштабирование фиктивных переменных

У меня есть набор данных, который содержит как категориальные переменные, так и непрерывные переменные. Мне посоветовали преобразовать категориальные переменные как двоичные переменные для каждого уровня (т. Е. A_level1: {0,1}, A_level2: {0,1}) - я думаю, некоторые назвали это «фиктивными...

12
Критерии выбора «лучшей» модели в скрытой марковской модели

У меня есть набор данных временного ряда, к которому я пытаюсь подогнать скрытую марковскую модель (HMM), чтобы оценить количество скрытых состояний в данных. Мой псевдокод для этого следующий: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states =...

12
Подсказки, что проблема хорошо подходит для линейной регрессии

Я изучаю линейную регрессию, используя Введение в анализ линейной регрессии Монтгомери, Пека и Вайнинга . Я хотел бы выбрать проект анализа данных. У меня наивная мысль, что линейная регрессия подходит только тогда, когда подозревают, что существуют линейные функциональные отношения между...

12
Как преобразовать лептокуротическое распределение в нормальное состояние?

Предположим, у меня есть лептокуртическая переменная, которую я хотел бы преобразовать в нормальное состояние. Какие преобразования могут выполнить эту задачу? Мне хорошо известно, что преобразование данных может быть не всегда желательным, но в качестве академической цели, предположим, что я хочу...

12
Являются ли нормально распределенные X и Y более вероятными в результате нормально распределенных остатков?

Здесь обсуждается неправильное толкование предположения о нормальности в линейной регрессии (что «нормальность» относится к X и / или Y, а не к остаткам), и автор спрашивает, возможно ли иметь ненормально распределенные X и Y и все еще имеют нормально распределенные остатки. Мой вопрос: нормально...

12
Зачем использовать зарегистрированные переменные?

Возможно, это очень простой вопрос, но я, похоже, не смог найти на него убедительного ответа. Я надеюсь здесь, я могу. В настоящее время я читаю статьи в качестве подготовки к моей собственной магистерской диссертации. В настоящее время я читаю статью, в которой исследуется связь между твитами и...

12
Есть

Мой коллега хочет проанализировать некоторые данные после преобразования переменной ответа, подняв ее до степени (то естьу0,125).1818\frac18Y0,125y0.125y^{0.125} Мне неудобно с этим, но я не могу понять, почему. Я не могу придумать никакого механистического обоснования для этого преобразования....

12
Что делать, если некоторые моменты времени имеют сильно искаженные отклики, а некоторые нет при повторном измерении?

Как правило, когда встречаются непрерывные, но искаженные показатели результата в продольном дизайне (скажем, с одним эффектом между субъектами), общий подход заключается в преобразовании результата в нормальность. Если ситуация экстремальная, например, с усеченными наблюдениями, можно подумать и...

12
Каков наиболее подходящий способ преобразования пропорций, когда они являются независимой переменной?

Я думал, что понял эту проблему, но теперь я не так уверен, и я хотел бы проверить с другими, прежде чем продолжить. У меня есть две переменные, Xи Y. Yявляется отношением, и оно не ограничено 0 и 1 и обычно нормально распределено. Xявляется пропорцией, и он ограничен 0 и 1 (он работает от 0,0 до...

12
Модели временных рядов с разницей в журналах лучше, чем темпы роста?

Часто я вижу, что авторы оценивают модель «логарифмической разницы», например log(yt)−log(yt−1)=log(yt/yt−1)=α+βxtlog⁡(yt)−log⁡(yt−1)=log⁡(yt/yt−1)=α+βxt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Я согласен, что уместно соотносить с процентным изменением тогда как - это .y t...

11
Работа с регрессией необычно ограниченной переменной ответа

Я пытаюсь смоделировать переменную ответа, теоретически ограниченную между -225 и +225. Переменная - это общая оценка, которую субъекты получают, играя в игру. Хотя теоретически это возможно для предметов +225. Несмотря на это, потому что счет зависел не только от действий субъектов, но и от...

11
Преобразование, чтобы изменить перекос, не влияя на эксцесс?

Мне любопытно, есть ли преобразование, которое изменяет перекос случайной величины, не влияя на эксцесс. Это было бы аналогично тому, как аффинное преобразование RV влияет на среднее значение и дисперсию, но не на перекос и эксцесс (отчасти потому, что перекос и эксцесс определяется как...

11
Являются ли эти формулы для преобразования P, LSD, MSD, HSD, CI в SE точной или завышенной / консервативной оценкой ?

Фон Я провожу метаанализ, который включает ранее опубликованные данные. Часто о различиях между обработками сообщают с помощью значений Р, наименее значимых различий (ЛСД) и других статистических данных, но они не дают прямой оценки дисперсии. В контексте модели, которую я использую, переоценка...

11
Преобразование непрерывных переменных для логистической регрессии

У меня есть большие данные опроса, двоичная переменная результата и много объясняющих переменных, включая двоичные и непрерывные. Я строю наборы моделей (экспериментирую как с GLM, так и со смешанным GLM) и использую теоретико-информационные подходы для выбора топ-модели. Я тщательно изучил...

11
Проблема преобразования из фактора в числовую переменную в R [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 7 лет назад . Я хотел бы преобразовать факторную переменную в числовую, но as.numericне имеет ожидаемого эффекта....

11
Обратно преобразованные доверительные интервалы

Столкнувшись с этим обсуждением, я поднимаю вопрос о конвенциях с обратным преобразованием доверительных интервалов. В соответствии с этой статьей номинальное покрытие обратного преобразования КИ для среднего значения логнормальной случайной величины составляет:...