Мне дали данные для анализа исследования, изучающего влияние лечения на уровни железа в четыре разных момента времени (до лечения, день лечения закончился, через 4 недели после лечения и через 2-4 месяца после лечения). Контрольной группы нет. Они хотят увидеть, наблюдается ли значительное повышение уровня железа в каждой из 3 временных точек после лечения до уровня до лечения (базовый уровень). Одиннадцать пациентов имели базовые уровни, но только 8 пациентов имели полные данные для всех 4 временных точек ( = 11, 10, 9 и 8 для каждой временной точки). Были измерены не только уровни железа, но и два других лабораторных измерения в каждый момент времени для сравнения с исходным уровнем.
У меня есть несколько вопросов о том, как это проанализировать. Сначала я подумал, что для анализа этих данных подойдет RM ANOVA, но меня беспокоит небольшой размер выборки, потеря данных и ненормальное распределение данных. Затем я подумал о том, чтобы сравнить каждую меру после лечения с базовой линией, используя тесты Уилкоксона со знаком, но потом я столкнулся с проблемой множественных сравнений. Тем не менее, я прочитал некоторую литературу, которая преуменьшает необходимость проведения нескольких сравнений. Итак, в целом, я имею дело с небольшими размерами выборки, неполными данными и множественными сравнениями (и нужно ли это или нет).
Я надеюсь, что все это имело смысл. Я новичок в CrossValidated и был направлен сюда коллегой, чтобы учиться у опытных статистиков, поэтому я буду признателен за любой совет! Благодарность!
Отредактировано, чтобы добавить необработанные данные из комментария:
Всего четыре момента времени и переменная результата непрерывна. Например, результаты в каждый момент времени выглядят примерно так:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]
Ответы:
Я переосмыслил вашу проблему и нашел тест Фридмана, который является непараметрической версией одностороннего ANOVA с повторными измерениями .
Я надеюсь, что у вас есть некоторые базовые навыки
R
.Выполнить тест Фридмана ...
а затем найдите, между какими группами существует разница, с помощью непараметрического специального теста . Здесь у вас есть все возможные сравнения.
Как видите, только базовая линия (первая временная точка) статистически отличается от других.
Я надеюсь, что это поможет вам.
источник
Если вы не знаете распределение отдельных изменений во времени, вы не можете приблизить его к распределению различий между пациентами. Например, если у вас есть 10 пациентов с соответствующими уровнями железа (510 520, ..., 600) до лечения и (520 530, ..., 610) после лечения, ANOVA Крускала-Уоллиса (или любой другой подобный алгоритм) будет требовать что нет существенного изменения уровня железа.
ИМХО, без контрольной группы лучшее, что вы можете сделать, - это подсчитать, сколько пациентов повысили свой уровень железа и сколько его снизили, и проверить значимость этого.
Тем не менее, если KW ANOVA говорит вам, что существует значительный уровень железа, это так (нет ложных срабатываний).
источник