Представьте себе ситуацию: у нас есть исторические записи (20 лет) о трех шахтах. Увеличивает ли присутствие серебра вероятность обнаружения золота в следующем году? Как проверить такой вопрос?
Вот пример данных:
mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
"rock","rock","rock","rock","silver","rock","rock",
"rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
"silver","gold","gold","gold","gold","gold","rock",
"silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
"rock","silver","rock","rock","rock","rock","silver",
"gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)
r
time-series
hypothesis-testing
stochastic-processes
Ladislav Naďo
источник
источник
Ответы:
Моя лучшая попытка: ... использование матриц перехода, предложенных @AndyW, вероятно, не то решение, которое я ищу (основываясь на комментарии @Tim). Поэтому я попробовал другой подход. Я нашел эту ссылку, которая имеет дело с тем, как сделать логистическую регрессию, где переменная ответа y и переменная предиктора x являются двоичными .
В соответствии с примером я должен создать таблицу 2 × 2 на основе моих данных:
Как я извлек значения:
И построить модель:
Это хорошее решение? Означает ли значение р (0,673), что присутствие серебра не увеличивает вероятность обнаружения золота?
источник
yes = c(2, 14), no = c(7, 34)
которого вы начинаете , что означает, что вы поставили Silver: да, во-первых. Таким образом, когда вы делаетеas.factor(c(0, 1))
0 соответствует серебру: да, это ваш контрольный уровень и, следовательно, ваш перехват. Значение 0.67 p соответствует небольшому положительному увеличению, которое вы получаете при вероятности обнаружения перемещения золота из серебра: да в серебро: нет.