Вопросы с тегом «data-transformation»

11
Работа с регрессией необычно ограниченной переменной ответа

Я пытаюсь смоделировать переменную ответа, теоретически ограниченную между -225 и +225. Переменная - это общая оценка, которую субъекты получают, играя в игру. Хотя теоретически это возможно для предметов +225. Несмотря на это, потому что счет зависел не только от действий субъектов, но и от...

11
Обратно преобразованные доверительные интервалы

Столкнувшись с этим обсуждением, я поднимаю вопрос о конвенциях с обратным преобразованием доверительных интервалов. В соответствии с этой статьей номинальное покрытие обратного преобразования КИ для среднего значения логнормальной случайной величины составляет:...

11
Тест Бартлетта против теста Левена

В настоящее время я пытаюсь устранить нарушения в предположениях ANOVA. Я использовал Шапиро-Уилка для проверки нормальности и баловался как с тестом Левена, так и с тестом Бартлетта на дисперсионное равенство. С тех пор журнал преобразовал мои данные, чтобы попытаться исправить неравные...

11
Кластеризация очень искаженных, подсчитываемых данных: есть ли какие-либо предложения (трансформировать и т.д.)

Основная проблема Вот моя основная проблема: я пытаюсь кластеризовать набор данных, содержащий некоторые очень искаженные переменные со счетчиками. Переменные содержат много нулей и поэтому не очень информативны для моей процедуры кластеризации, которая, вероятно, будет алгоритмом k-средних....

10
Почему мы не можем использовать

Представьте, что у нас есть модель линейной регрессии с зависимой переменной . Мы находим его . Теперь мы делаем другую регрессию, но на этот раз для , и аналогично находим ее . Мне сказали, что я не могу сравнить оба чтобы увидеть, какая модель лучше подходит. Это почему? Причиной для меня было...

10
Можно ли напрямую читать столбцы CSV как категориальные данные?

Мне нужно проанализировать с помощью R данные медицинского обследования (с более 100 кодированными столбцами), которое приходит в CSV. Я буду использовать погремушку для некоторого начального анализа, но за кадром это все еще R. Если я читаю файл .csv () , столбцы с числовыми кодами рассматриваются...

10
Какие другие нормализующие преобразования обычно используются помимо общих, таких как квадратный корень, лог и т. Д.?

При анализе результатов тестов (например, в области образования или психологии) общие методы анализа часто предполагают, что данные обычно распределяются. Однако, возможно, чаще, чем нет, баллы имеют тенденцию иногда сильно отличаться от нормальных. Я знаком с некоторыми основными нормализующими...

10
Когда следует преобразовывать переменные предиктора при выполнении множественной регрессии?

В настоящее время я беру свой первый примененный класс линейной регрессии на уровне выпускника, и я борюсь с преобразованиями предикторных переменных в множественной линейной регрессии. Текст, который я использую, Катнер и др. «Прикладные линейные статистические модели», похоже, не охватывает...

10
Как интерпретировать логарифмически преобразованные коэффициенты в линейной регрессии?

Моя ситуация такова: У меня есть 1 непрерывная зависимая и 1 непрерывная предикторная переменная, которую я логарифмически преобразовал, чтобы нормализовать их остатки для простой линейной регрессии. Буду признателен за любую помощь в том, как я могу связать эти преобразованные переменные с их...

10
Линейная модель Гетероскедастичность

У меня есть следующая линейная модель: журнал( Y+ 1 )log⁡(Y+1)\log(Y + 1) > summary(Y) Min. :-0.0005647 1st Qu.: 0.0001066 Median : 0.0003060 Mean : 0.0004617 3rd Qu.: 0.0006333 Max. : 0.0105730 NA's :30.0000000 Как я могу преобразовать переменные, чтобы улучшить ошибку и дисперсию предсказания,...

10
Как выбрать лучшее преобразование для достижения линейности?

Я хочу сделать множественную линейную регрессию, а затем предсказать новые значения с небольшой экстраполяцией. У меня есть переменная ответа в диапазоне от -2 до +7 и три предиктора (диапазоны от +10 до +200). Распределение почти нормальное. Но отношения между ответом и предикторами не являются...

10
Я регистрирую преобразованную зависимую переменную, могу ли я использовать нормальное распределение GLM с функцией ссылки LOG?

У меня есть вопрос, касающийся обобщенных линейных моделей (GLM). Моя зависимая переменная (DV) непрерывна и не является нормальной. Таким образом, я лог преобразовал это (все еще не нормальный, но улучшил это). Я хочу связать DV с двумя категориальными переменными и одной непрерывной...

10
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

10
Как повторное взвешивание данных о разнообразии Американского Сообщества повлияет на погрешность?

Справочная информация. В настоящее время моя организация сравнивает свои статистические данные о разнообразии рабочей силы (например,% инвалидов,% женщин,% ветеранов) с общей доступностью рабочей силы для этих групп на основе обследования американского сообщества (проект обследования Бюро переписи...

10
Преобразовать распределение Пуассона в нормальное распределение

Прежде всего, я имею опыт работы в области компьютерных наук, но сейчас я пытаюсь научить себя основам статистики. У меня есть некоторые данные, которые я думаю, имеет распределение Пуассона У меня есть два вопроса: Это распределение Пуассона? Во-вторых, возможно ли преобразовать это в нормальное...

10
Регрессия с обратной независимой переменной

Предположим, у меня есть вектор зависимых переменных и вектор независимой переменной. Когда отображается на графике , я вижу, что между ними существует линейная зависимость (восходящая тенденция). Теперь это также означает, что между и существует линейная тенденция к снижению...

10
Почему бы не преобразовать в лог все переменные, которые не представляют основного интереса?

В книгах и дискуссиях часто утверждается, что при возникновении проблем (из которых есть несколько) с предиктором, log-transformimg это возможно. Теперь я понимаю, что это зависит от распределений, и нормальность в предикторах не является предположением о регрессии; но преобразование журнала делает...

9
Нормальное распределение и монотонные преобразования

Я слышал, что многие количества, которые встречаются в природе, обычно распределяются. Обычно это оправдано с использованием центральной предельной теоремы, которая гласит, что при усреднении большого числа случайных величин iid вы получаете нормальное распределение. Так, например, признак, который...

9
Параметрический, полупараметрический и непараметрический бутстрап для смешанных моделей

Следующие прививки взяты из этой статьи . Я новичок в начальной загрузке и пытаюсь реализовать параметрическую, полупараметрическую и непараметрическую загрузку начальной загрузки для линейной смешанной модели с R bootпакетом. Код R Вот мой Rкод: library(SASmixed) library(lme4) library(boot)...

9
Коробка Кокса Преобразования для регрессии

Я пытаюсь согласовать линейную модель с некоторыми данными только одним предиктором (скажем, (x, y)). Данные таковы, что для малых значений x значения y обеспечивают плотное прилегание к прямой линии, однако при увеличении значений x значения y становятся более изменчивыми. Вот пример таких данных...