Вопросы с тегом «data-transformation»

26
Когда регистрировать преобразование временного ряда перед установкой модели ARIMA

Ранее я использовал прогноз Pro для прогнозирования одномерных временных рядов, но переключаю свой рабочий процесс на R. Пакет прогноза для R содержит много полезных функций, но он не выполняет никаких преобразований данных перед запуском auto. .arima (). В некоторых случаях прогноз Pro решает...

26
Преобразование переменных для множественной регрессии в R

Я пытаюсь выполнить множественную регрессию в R. Однако моя зависимая переменная имеет следующий график: Вот матрица диаграммы рассеяния со всеми моими переменными ( WARэто зависимая переменная): Я знаю, что мне нужно выполнить преобразование для этой переменной (и, возможно, независимых...

25
Например, почему пол обычно кодируется 0/1, а не 1/2?

Я понимаю логику кодирования для анализа данных. Мой вопрос ниже касается использования определенного кода. Есть ли причина, по которой пол часто кодируется как 0 для женщин и 1 для мужчин? Почему эта кодировка считается «стандартной»? Сравните это с Женский = 1 и Мужской = 2. Есть ли проблема с...

25
Как смоделировать это распределение нечетной формы (почти наоборот-J)

Моя зависимая переменная, показанная ниже, не подходит ни под какой дистрибутив, который я знаю. Линейная регрессия приводит к несколько ненормальным отклонениям в правильном направлении, которые странным образом относятся к предсказанному Y (2-й график). Какие-либо предложения для преобразований...

24
Почему силовые или логарифмические преобразования не преподаются в машинном обучении?

Машинное обучение (ML) активно использует методы линейной и логистической регрессии. Он также опирается на особенность инженерных методов ( feature transform, kernel, и т.д.). Почему нет ничего о variable transformation(например power transformation) , упомянутые в ML? (Например, я никогда не...

22
Примеры расширенного регрессионного моделирования

Я ищу расширенное тематическое исследование линейной регрессии, иллюстрирующее шаги, необходимые для моделирования сложных, множественных нелинейных отношений с использованием GLM или OLS. На удивление трудно найти ресурсы, выходящие за рамки базовых школьных примеров: большинство книг, которые я...

20
Выбор метода сезонного разложения

Сезонная корректировка является решающим этапом предварительной обработки данных для дальнейших исследований. Исследователь, однако, имеет несколько вариантов сезонного разложения по трендовому циклу. Наиболее распространенными (судя по количеству ссылок в эмпирической литературе) конкурентными...

20
Трансформация для увеличения эксцесса и асимметрии нормального течения

Я работаю над алгоритмом, который основан на том факте, что наблюдения s обычно распределяются, и я хотел бы проверить надежность алгоритма в этом предположении эмпирически.YYY Чтобы сделать это, я искал последовательность преобразований , которые постепенно разрушают нормальности . Например, если...

20
Как интерпретировать коэффициенты регрессии, когда ответ был преобразован 4-м корнем?

Я использую четвертое 1/4преобразование степени root ( ) в моей переменной ответа в результате гетероскедастичности. Но сейчас я не знаю, как интерпретировать мои коэффициенты регрессии. Я предполагаю, что мне понадобится взять коэффициенты до четвертой степени при обратном преобразовании (см. Ниже...

20
Изменение масштаба переменной на 0-100

Я построил индекс социального капитала с использованием методики PCA. Этот индекс содержит значения как положительные, так и отрицательные. Я хочу преобразовать / преобразовать этот индекс в масштаб 0-100, чтобы его было легко интерпретировать. Пожалуйста, предложите мне самый простой способ...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

20
От равномерного распределения к экспоненциальному распределению и наоборот

Вероятно , это тривиальный вопрос, но мой поиск был бесплодном до сих пор, в том числе этой статьи в Википедии , и «Compendium распределений» документ . Если имеет равномерное распределение, означает ли это, что следует экспоненциальному распределению?e XXXXeXeXe^X Аналогично, если следует...

20
Преобразование данных пропорции: когда квадратного корня арксинуса недостаточно

Есть ли (более сильная?) Альтернатива квадратному корню арксин для преобразования процент / пропорция? В наборе данных, над которым я сейчас работаю, заметная гетероскедастичность сохраняется после того, как я применяю это преобразование, то есть график зависимости остатков от подгоночных значений...

19
Расчет стандартной ошибки после лог-преобразования

Рассмотрим случайный набор чисел, которые обычно распределяются: x <- rnorm(n=1000, mean=10) Нам бы хотелось знать среднее и стандартную ошибку на среднем, поэтому мы делаем следующее: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03...

19
Является ли преобразование журнала допустимым методом для t-тестирования ненормальных данных?

В рецензии на статью авторы утверждают: «Непрерывные переменные результата, демонстрирующие искаженное распределение, были преобразованы с использованием натуральных логарифмов перед проведением t-тестов для удовлетворения предварительных условий нормальности». Является ли это приемлемым способом...

18
Что означает «нормализация» и как проверить, что выборка или распределение нормализованы?

У меня есть вопрос, в котором он просит проверить, нормализовано ли равномерное распределение ( Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) ). С одной стороны, что означает для любого распределения быть нормализованным? И второе: как нам проверить, нормализовано ли распределение? Я понимаю, вычисляя...

18
Как выполнить изометрическое логарифмическое преобразование

У меня есть данные о поведении при движении (время, проведенное во сне, сидячий образ жизни и выполнение физических упражнений), которое составляет приблизительно 24 (как в часах в день). Я хочу создать переменную, которая фиксирует относительное время, затрачиваемое на каждое из этих поведений, -...

18
По какой причине преобразование журналов используется с искаженными дистрибутивами?

Я однажды слышал, что логарифмическое преобразование является наиболее популярным для правосторонних распределений в линейной регрессии или квантильной регрессии Я хотел бы знать, есть ли причина, лежащая в основе этого утверждения? Почему преобразование журналов подходит для правильного...

17
Сравнение AIC модели и ее лог-преобразованной версии

Суть моего вопроса заключается в следующем: Пусть Y∈RnY∈RnY \in \mathbb{R}^n быть многомерной нормальной случайной величиной со средним и ковариационной матрицей . Пусть , то есть . Как сравнить AIC модели, подходящей для наблюдаемых реализаций с моделью, подходящей для наблюдаемых реализаций Z...

17
«Нормализующие» переменные для SVD / PCA

Предположим, у нас есть NNN измеримых переменных (a1,a2,…,aN)(a1,a2,...,aN)(a_1, a_2, \ldots, a_N) , мы выполняем ряд измерений M>NM>NM > N , а затем хотим выполнить разложение по сингулярным значениям результатов, чтобы найти оси наибольшей дисперсии для MMM точек в NNN мерном пространстве....