Повторные измерения с течением времени с небольшим

14

Мне дали данные для анализа исследования, изучающего влияние лечения на уровни железа в четыре разных момента времени (до лечения, день лечения закончился, через 4 недели после лечения и через 2-4 месяца после лечения). Контрольной группы нет. Они хотят увидеть, наблюдается ли значительное повышение уровня железа в каждой из 3 временных точек после лечения до уровня до лечения (базовый уровень). Одиннадцать пациентов имели базовые уровни, но только 8 пациентов имели полные данные для всех 4 временных точек ( = 11, 10, 9 и 8 для каждой временной точки). Были измерены не только уровни железа, но и два других лабораторных измерения в каждый момент времени для сравнения с исходным уровнем.N

У меня есть несколько вопросов о том, как это проанализировать. Сначала я подумал, что для анализа этих данных подойдет RM ANOVA, но меня беспокоит небольшой размер выборки, потеря данных и ненормальное распределение данных. Затем я подумал о том, чтобы сравнить каждую меру после лечения с базовой линией, используя тесты Уилкоксона со знаком, но потом я столкнулся с проблемой множественных сравнений. Тем не менее, я прочитал некоторую литературу, которая преуменьшает необходимость проведения нескольких сравнений. Итак, в целом, я имею дело с небольшими размерами выборки, неполными данными и множественными сравнениями (и нужно ли это или нет).

Я надеюсь, что все это имело смысл. Я новичок в CrossValidated и был направлен сюда коллегой, чтобы учиться у опытных статистиков, поэтому я буду признателен за любой совет! Благодарность!


Отредактировано, чтобы добавить необработанные данные из комментария:

Всего четыре момента времени и переменная результата непрерывна. Например, результаты в каждый момент времени выглядят примерно так:

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]
msturm17
источник
1
Если вы добавите воспроизводимый пример (или необработанные данные), это будет полезно.
Ладислав Naďo
Переменная результата является непрерывной. Например, результаты в каждый момент времени выглядят примерно так: Базовые уровни n = 11: [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]. 1-й пост n = 10 [167, 200, 45, 132,., 245, 199, 177, 134, 298, 111]. 2-й пост n = 9 [75, 43, 23, 98, 87,., 300,., 118, 202, 156]. 3-й уровень поста n = 8 [23, 34, 98, 112,., 200,., 156, 54, 18,.]. Всего четыре момента времени.
msturm17

Ответы:

5

Я переосмыслил вашу проблему и нашел тест Фридмана, который является непараметрической версией одностороннего ANOVA с повторными измерениями .

Я надеюсь, что у вас есть некоторые базовые навыки R.

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

Выполнить тест Фридмана ...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

а затем найдите, между какими группами существует разница, с помощью непараметрического специального теста . Здесь у вас есть все возможные сравнения.

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

Как видите, только базовая линия (первая временная точка) статистически отличается от других.

Я надеюсь, что это поможет вам.

Ladislav Naďo
источник
1
Ладислав, это отличный ответ на этот вопрос. Это очень тщательно и полно. Единственная проблема, которую я вижу, состоит в том, что ANOVA Крускала-Уоллиса также предполагают независимость наблюдений, так что на каждом уровне независимой переменной есть разные субъекты, которых в данном случае у нас нет, поскольку мы следуем одному и тому же пациенты в 4 временных точках. Есть ли у вас какие-либо мнения по этому поводу или какие-либо другие методы для решения этой проблемы? Спасибо!
Мэтт Райхенбах
Я удалил свой комментарий выше. Я наконец нашел лучший тест. Наслаждайтесь !
Ладислав Naďo
Это не мой первоначальный вопрос, @ msturm17, придется принять ваш ответ, хотя я дал вам награду!
Мэтт Райхенбах
Спасибо вам, Ладислав, за то, что нашли время тщательно ответить на мой вопрос!
msturm17
2

Если вы не знаете распределение отдельных изменений во времени, вы не можете приблизить его к распределению различий между пациентами. Например, если у вас есть 10 пациентов с соответствующими уровнями железа (510 520, ..., 600) до лечения и (520 530, ..., 610) после лечения, ANOVA Крускала-Уоллиса (или любой другой подобный алгоритм) будет требовать что нет существенного изменения уровня железа.

ИМХО, без контрольной группы лучшее, что вы можете сделать, - это подсчитать, сколько пациентов повысили свой уровень железа и сколько его снизили, и проверить значимость этого.

Тем не менее, если KW ANOVA говорит вам, что существует значительный уровень железа, это так (нет ложных срабатываний).

user31264
источник
1
Yay без ложных срабатываний! Хаха, спасибо за твой ответ. Как вы предлагаете, чтобы мы «проверили значимость этого» в отношении подсчета, сколько пациентов повысили уровень железа и сколько снизили его? Благодарность!
Мэтт Райхенбах
2
mnp=2(m+n)k=0m(m+nk)
Спасибо! Это был еще один интересный способ взглянуть на мой вопрос и понять, как он применяется к моим данным.
msturm17