Как проверить, влияет ли «предыдущее состояние» на «последующее состояние» в R

10

Представьте себе ситуацию: у нас есть исторические записи (20 лет) о трех шахтах. Увеличивает ли присутствие серебра вероятность обнаружения золота в следующем году? Как проверить такой вопрос?


введите описание изображения здесь

Вот пример данных:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)

Ladislav Naďo
источник
1
Вы можете быть заинтересованы в расчете матриц перехода .
Энди W
Привет @AndyW! Спасибо за комментарий. Я знаком с пакетом переходных матриц: makkovchain - markovchainFit (). Могу ли я использовать значения вероятностей из матрицы перехода в качестве p-значений? Есть ли способ проверить гипотезу: «Существуют« серебряно-золотые »отношения». (р-значение = хх)?
Ладислав Naďo
1
Вероятности перехода @LadislavNado нельзя интерпретировать как p-значения (они ничего не говорят вам об отклонении любого H0), см. Stats.stackexchange.com/questions/31/… для получения дополнительной информации о p-значениях.
Тим
1
Я вижу проблему с тем, как вы извлекли свои данные. Рассмотрите ваш сценарий «серебро: нет» и «золото: да», вы также должны считать свои последовательные прогоны «золота», поскольку это соответствует логическим критериям.
1
С поправкой на одну ячейку от 1 до 14 модель изменяется на: Коэффициенты: Estimate Std. Значение ошибки z Pr (> | z |) (Перехват) -1.2528 0.8018 -1.562 0.118 as.factor (c (0, 1)) 1 0,3655 0,8624 0,424 0,672

Ответы:

4

Моя лучшая попытка: ... использование матриц перехода, предложенных @AndyW, вероятно, не то решение, которое я ищу (основываясь на комментарии @Tim). Поэтому я попробовал другой подход. Я нашел эту ссылку, которая имеет дело с тем, как сделать логистическую регрессию, где переменная ответа y и переменная предиктора x являются двоичными .

В соответствии с примером я должен создать таблицу 2 × 2 на основе моих данных:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

Как я извлек значения: введите описание изображения здесь

И построить модель:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

Это хорошее решение? Означает ли значение р (0,673), что присутствие серебра не увеличивает вероятность обнаружения золота?

Ladislav Naďo
источник
Как вы создали эти хорошие графики? Tikz?
shadowtalker
Привет @ssdecontrol! Графики были сделаны вручную в Inkscape.
Ладислав Naďo
Да, это достойная интерпретация. Кроме того, если вы просто посмотрите на строки таблицы 2х2, в верхней строке (серебро: да) у вас есть 9 коробок, в 2 из которых было золото, так что вероятность серебра в следующем году для золота равна 2/9 = 0,222. В нижнем ряду (серебро: нет) у вас есть 48 коробок, 14 из которых имели золото в следующем году, поэтому, учитывая отсутствие серебра, вероятность золота равна 14 / (14 + 34) = 0,292. Учитывая все это, похоже, что серебро снижает ваши шансы найти золото, хотя по вашим значениям р не "статистически значимо".
Грегор Томас
Также помните о своем кодировании, с yes = c(2, 14), no = c(7, 34)которого вы начинаете , что означает, что вы поставили Silver: да, во-первых. Таким образом, когда вы делаете as.factor(c(0, 1))0 соответствует серебру: да, это ваш контрольный уровень и, следовательно, ваш перехват. Значение 0.67 p соответствует небольшому положительному увеличению, которое вы получаете при вероятности обнаружения перемещения золота из серебра: да в серебро: нет.
Грегор Томас
Один последний комментарий: вы которые с помощью матрицы перехода. Ваша матрица 2, 7, 14, 34 является переходной матрицей.
Грегор Томас