ANOVA с фиксированными эффектами (или его эквивалент линейной регрессии) предоставляет мощное семейство методов для анализа этих данных. Чтобы проиллюстрировать это, вот набор данных, согласующийся с графиками среднего HC за вечер (один график на цвет):
| Color
Day | B G R | Total
-------+---------------------------------+----------
1 | 117 176 91 | 384
2 | 208 193 156 | 557
3 | 287 218 257 | 762
4 | 256 267 271 | 794
5 | 169 143 163 | 475
6 | 166 163 163 | 492
7 | 237 214 279 | 730
8 | 588 455 457 | 1,500
9 | 443 428 397 | 1,268
10 | 464 408 441 | 1,313
11 | 470 473 464 | 1,407
12 | 171 185 196 | 552
-------+---------------------------------+----------
Total | 3,576 3,323 3,335 | 10,234
ANOVA count
против day
и color
производит эту таблицу:
Number of obs = 36 R-squared = 0.9656
Root MSE = 31.301 Adj R-squared = 0.9454
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 605936.611 13 46610.5085 47.57 0.0000
|
day | 602541.222 11 54776.4747 55.91 0.0000
colorcode | 3395.38889 2 1697.69444 1.73 0.2001
|
Residual | 21554.6111 22 979.755051
-----------+----------------------------------------------------
Total | 627491.222 35 17928.3206
Значение model
р, равное 0,0000, показывает, что подгонка очень значительна. Значение day
р 0,0000 также очень важно: вы можете обнаруживать ежедневные изменения. Тем не менее, значение color
(семестр) p, равное 0.2001, не следует считать значимым: вы не можете обнаружить систематическое различие между тремя семестрами, даже после учета ежедневных изменений.
HSD- тест Тьюки («достоверная значимая разница») выявляет следующие значимые изменения (среди прочих) в ежедневных средних значениях (независимо от семестра) на уровне 0,05:
1 increases to 2, 3
3 and 4 decrease to 5
5, 6, and 7 increase to 8,9,10,11
8, 9, 10, and 11 decrease to 12.
Это подтверждает то, что глаз видит на графиках.
Поскольку графики прыгают совсем немного, нет способа обнаружить повседневные корреляции (последовательные корреляции), что является целым моментом анализа временных рядов. Другими словами, не беспокойтесь о методах временных рядов: здесь недостаточно данных, чтобы обеспечить более глубокое понимание.
Нужно всегда удивляться, насколько можно верить результатам любого статистического анализа. Различные методы диагностики гетероскедастичности (такие как тест Бреуша-Пагана ) не показывают ничего плохого. Остатки выглядят не совсем нормально - они сгруппированы в некоторые группы - поэтому все значения p должны быть взяты с крошкой соли. Тем не менее они, по-видимому, обеспечивают разумное руководство и помогают количественно оценить смысл данных, которые мы можем получить, глядя на графики.
Вы можете провести параллельный анализ дневных минимумов или дневных максимумов. Обязательно начните с аналогичного графика в качестве руководства и проверьте статистический вывод.
Сара, возьмите свои 36 чисел (12 значений за цикл; 3 цикла) и создайте регрессионную модель с 11 показателями, отражающими возможный эффект недели, а затем определите все необходимые серии интервенций (импульсы, сдвиги уровней), необходимые для визуализации среднее значение остатков должно быть 0,0 везде или, по крайней мере, статистически значимо не отличаться от 0,0. Например, если вы определяете сдвиг уровня в периоде 13, это может указывать на статистически значимую разницу между средним значением первого семестра, то есть первыми 12 значениями, и средним значением последних двух семестров (последние 24 значения). Вы могли бы сделать вывод или проверить гипотезу об отсутствии недели эффекта семестра. В этом отношении вам может пригодиться хороший пакет временных рядов. В противном случае вам может понадобиться найти кого-то, кто предоставит помощь в этой аналитической области.
источник