Вопросы с тегом «modeling»

20
Указание модели разницы в различиях с несколькими периодами времени

Когда я оцениваю модель разности различий с двумя периодами времени, эквивалентная модель регрессии а. Yist=α+γs∗Treatment+λdt+δ∗(Treatment∗dt)+ϵistYist=α+γs∗Treatment+λdt+δ∗(Treatment∗dt)+ϵistY_{ist} = \alpha +\gamma_s*Treatment + \lambda d_t + \delta*(Treatment*d_t)+ \epsilon_{ist} где...

19
Каково мнение сообщества о Четвертом квадранте?

Нассим Талеб, известный (или позорный) Черный лебедь , развил концепцию и разработал то, что он называет «картой границ статистики» . Его основной аргумент заключается в том, что существует один вид решения проблемы, когда использование любой статистической модели вредно. Это могут быть любые...

19
Методология прогнозирования VAR

Я строю модель VAR для прогнозирования цены актива и хотел бы знать, является ли мой метод статистически обоснованным, актуальны ли тесты, которые я включил, и нужно ли больше для обеспечения надежного прогноза на основе моих входных переменных. Ниже приведен мой текущий процесс проверки...

19
Как предсказать, когда произойдет следующее событие, основываясь на времени предыдущих событий?

Я учусь в старших классах и работаю над проектом по программированию, но у меня нет большого опыта в области статистики и моделирования данных, кроме курса по статистике в старших классах, поэтому я немного растерялся. По сути, у меня есть достаточно большой список (предположим, он достаточно...

18
Могу ли я просто удалить одну из двух переменных-предикторов, которые имеют высокую линейную корреляцию?

Используя коэффициент корреляции Пирсона, у меня есть несколько переменных, которые сильно коррелированы ( и для 2 пар переменных, которые есть в моей модели).ρ = 0,978ρзнак равно0,978\rho = 0.978ρ = 0,989ρзнак равно0,989\rho = 0.989 Причина , некоторые из переменных имеют высокую корреляцию потому...

18
Распределение, которое описывает разницу между отрицательными биномиальными распределенными переменными?

Skellam Распределение описывает разницу между двумя переменными , которые имеют распределение Пуассона. Существует ли подобное распределение, которое описывает разницу между переменными, которые следуют отрицательным биномиальным распределениям? Мои данные получены с помощью процесса Пуассона, но...

17
Свойства логистических регрессий

Мы работаем с некоторыми логистическими регрессиями, и мы поняли, что средняя оценочная вероятность всегда равна доле вероятностей в выборке; то есть среднее значение подгонянных значений равно среднему значению по выборке. Кто-нибудь может объяснить мне причину или дать ссылку, где я могу найти...

17
Пуассоновская регрессия с большими данными: неправильно ли менять единицу измерения?

Из-за факториала в распределении Пуассона становится непрактичным оценивать модели Пуассона (например, с использованием максимальной вероятности), когда наблюдения велики. Так, например, если я пытаюсь оценить модель для объяснения количества самоубийств в конкретном году (доступны только годовые...

17
Какова связь между R-квадратом и р-значением в регрессии?

tl; dr - для регрессии OLS, более высокий R-квадрат также подразумевает более высокое P-значение? В частности, для одной объясняющей переменной (Y = a + bX + e), но было бы также интересно узнать для n нескольких объясняющих переменных (Y = a + b1X + ... bnX + e). Контекст - я выполняю регрессию...

16
Почему искаженные данные не предпочтительны для моделирования?

В большинстве случаев, когда люди говорят о преобразованиях переменных (как для предикторов, так и для переменных ответа), они обсуждают способы обработки асимметрии данных (например, преобразование журнала, преобразование Бокса и Кокса и т. Д.). Я не могу понять, почему устранение асимметрии...

16
Подходящие модели в R, где коэффициенты подчиняются линейным ограничениям

Как определить формульную формулу в R, когда доступно одно (или несколько) точных линейных ограничений, связывающих коэффициенты. В качестве примера, скажем, что вы знаете, что b1 = 2 * b0 в простой модели линейной регрессии....

15
Либо квадратичный, либо член взаимодействия важен в изоляции, но ни один из них не вместе

В рамках задания мне нужно было дополнить модель двумя переменными предикторами. Затем мне пришлось нарисовать график остатков моделей по отношению к одному из включенных предикторов и внести изменения на основе этого. График показал криволинейную тенденцию, и поэтому я включил квадратный термин...

15
Что хорошего хорошего распределения степеней свободы в распределении?

Я хочу использовать при распределении для моделирования доходности активов с коротким интервалом в байесовской модели. Я хотел бы оценить обе степени свободы (наряду с другими параметрами в моей модели) для распределения. Я знаю, что доходность активов совершенно ненормальная, но я не знаю слишком...

15
Какой алгоритм статистической классификации может предсказать истину / ложь для последовательности входных данных?

Учитывая последовательность входов, мне нужно определить, обладает ли эта последовательность определенным желаемым свойством. Свойство может быть только истинным или ложным, то есть существует только два возможных класса, к которым может принадлежать последовательность. Точная связь между...

15
Когда прекратить дорабатывать модель?

Я изучал статистику из многих книг за последние 3 года, и благодаря этому сайту я многому научился. Тем не менее, один фундаментальный вопрос все еще остается без ответа для меня. У него может быть очень простой или очень сложный ответ, но я точно знаю, что это требует некоторого глубокого...

15
Какое распределение использовать для моделирования времени до прибытия поезда?

Я пытаюсь смоделировать некоторые данные о времени прибытия поезда. Я хотел бы использовать дистрибутив, который фиксирует «чем дольше я жду, тем больше вероятность того, что поезд появится» . Похоже, что такой дистрибутив должен выглядеть как CDF, так что P (Train Train Up | Ожидал 60 минут)...

15
Какая кривая (или модель) должна соответствовать моим процентным данным?

Я пытаюсь создать фигуру, которая показывает связь между вирусными копиями и освещением генома (GCC). Вот как выглядят мои данные: Сначала я только построил линейную регрессию, но мои руководители сказали мне, что это неправильно, и попробовал сигмоидальную кривую. Поэтому я сделал это с помощью...

15
Что именно строит статистическую модель?

Что именно строит статистическую модель? В наши дни, когда я подаю заявку на исследовательскую работу или консультационную работу, часто появляется термин «построение модели» или «моделирование». Термин звучит круто, но к чему именно они относятся? Как вы строите свою модель? Я посмотрел прогнозное...

15
В поисках хорошей вводной обработки мета-анализа

Коллега (не статистик) сталкивался с метаанализом в статьях, которые он просматривает для медицинских журналов, и ищет хорошее начальное лечение, чтобы он мог самообразоваться. Любые рекомендации? Избранное? Книги, монографии, нетехнические обзорные статьи - все будет хорошо. (Да, он знаком со...

15
Моделирование распределения Пуассона с избыточной дисперсией

У меня есть набор данных, который я ожидаю, чтобы следовать распределению Пуассона, но он разбросан примерно в 3 раза. В настоящее время я моделирую эту избыточную дисперсию, используя что-то вроде следующего кода в R. ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med)...