Вопросы с тегом «smoothing»

Методы сглаживания в анализе данных, такие как сплайны или сглаживания ядра, также сглаживают регрессию, например lowess.

78
Пример: регрессия LASSO с использованием glmnet для двоичного результата

Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91,...

47
Как правильно использовать корреляцию Пирсона с временными рядами

У меня есть 2 временных ряда (оба гладких), которые я хотел бы взаимно коррелировать, чтобы увидеть, насколько они коррелированы. Я намерен использовать коэффициент корреляции Пирсона. Это уместно? Мой второй вопрос - я могу выбрать 2 временных ряда так, как мне нравится. т.е. я могу выбрать,...

36
Хорошие методы для графиков плотности неотрицательных переменных в R?

plot(density(rexp(100)) Очевидно, что вся плотность слева от нуля представляет собой смещение. Я хочу обобщить некоторые данные для статистиков, и я хочу избежать вопросов о том, почему неотрицательные данные имеют плотность слева от нуля. Графики для проверки рандомизации; Я хочу показать...

29
Выбор пропускной способности для оценки плотности ядра

Для однофакторных оценок плотности ядра (KDE) я использую правило Сильвермана для вычисления :часчасh 0,9 мин ( с д, яQ R / 1,34 ) × n- 0,20.9мин(sd,яQр/1,34)×N-0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} Каковы стандартные правила для многомерного KDE (при условии...

28
В «Наивном байесовском», зачем беспокоиться о сглаживании Лапласа, когда в тестовом наборе есть неизвестные слова?

Я читал сегодня наивную байесовскую классификацию. Я прочитал под заголовком Оценка параметров с добавлением сглаживания 1 : Пусть ccc ссылается на класс (например, Positive или Negative), а указывает на токен или слово.www Оценка максимального правдоподобия для...

25
«Оценка плотности ядра» - это свертка чего?

Я пытаюсь получить лучшее понимание оценки плотности ядра. Использование определения из Википедии: https://en.wikipedia.org/wiki/Kernel_density_esvaluation#Definition ечас^( х ) = 1NΣNя = 1Кчас( х - хя)= 1н чΣNя = 1К( х - хячас)ечас^(Икс)знак равно1NΣязнак равно1NКчас(Икс-Икся)знак равно1NчасΣязнак...

24
Можете ли вы объяснить оценку плотности окна (ядра) Parzen с точки зрения непрофессионала?

Оценка плотности окна Парцена описывается как p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) где - количество элементов в векторе, - вектор, - плотность вероятности , - размерность окна Парзена, а - оконная функция.x...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

18
Если ядро ​​Епанечникова теоретически оптимально при оценке плотности ядра, почему оно не используется чаще?

Я читал (например, здесь ), что ядро ​​Епанечникова является оптимальным, по крайней мере в теоретическом смысле, при оценке плотности ядра. Если это правда, то почему гауссиан появляется так часто, как ядро ​​по умолчанию, или во многих случаях единственное ядро, в библиотеках оценки...

18
Сглаживание - когда его использовать, а когда нет?

В блоге Уильяма Бриггса есть довольно старая запись, в которой рассматриваются подводные камни сглаживания данных и передачи сглаженных данных в анализ. Ключевой аргумент, а именно: Если в момент безумия вы сглаживаете данные временных рядов и используете их в качестве входных данных для других...

17
Если переменные ширины ядра часто хороши для регрессии ядра, почему они вообще не хороши для оценки плотности ядра?

Этот вопрос вызван обсуждением в другом месте . Переменные ядра часто используются в локальной регрессии. Например, loess широко используется и работает как сглаживающая регрессия, и основан на ядре переменной ширины, который адаптируется к разреженности данных. С другой стороны, считается, что...

16
ETS () функция, как избежать прогноза не в соответствии с историческими данными?

Я работаю над алгоритмом в R для автоматизации расчета ежемесячного прогноза. Я использую, среди прочего, функцию ets () из пакета прогноза для расчета прогноза. Это работает очень хорошо. К сожалению, для какого-то определенного временного ряда результат, который я получаю, странный. Пожалуйста,...

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

15
Площадь под «pdf» в оценке плотности ядра в R

Я пытаюсь использовать функцию плотности в R для оценки плотности ядра. У меня возникли некоторые трудности при интерпретации результатов и сравнении различных наборов данных, так как кажется, что площадь под кривой не обязательно равна 1. Для любой функции плотности вероятности (pdf) нам нужно...

15
В сглаживании Кнезера-Нея, как обрабатываются невидимые слова?

Из того, что я видел, формула сглаживания Кнезера-Ней (второго порядка) так или иначе задается как P2KN(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn)PKN2(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn) \begin{align} P^2_{KN}(w_n|w_{n-1}) &= \frac{\max \left\{...

14
Существует ли оптимальная пропускная способность для оценки плотности ядра производных?

Мне нужно оценить функцию плотности на основе набора наблюдений, используя оценщик плотности ядра. Основываясь на том же наборе наблюдений, мне также нужно оценить первую и вторую производные плотности, используя производные оценки плотности ядра. Пропускная способность, безусловно, будет иметь...

14
Когда фильтр Калмана даст лучшие результаты, чем простая скользящая средняя?

Недавно я применил фильтр Калмана на простом примере измерения положения частиц со случайной скоростью и ускорением. Я обнаружил, что фильтр Калмана работает хорошо, но потом спросил себя, в чем разница между этим и просто скользящим средним? Я обнаружил, что если я использовал окно из примерно 10...

14
Сглаживание данных временных рядов

Я создаю приложение для Android, которое записывает данные акселерометра во время сна, чтобы анализировать тенденции сна и, по желанию, будить пользователя в нужное время во время легкого сна. Я уже построил компонент, который собирает и хранит данные, а также сигнализацию. Мне все еще нужно...