Могу ли я использовать парный t-критерий, когда образцы обычно распределяются, но их различие отсутствует?

12

У меня есть данные из эксперимента, в котором я применил два разных метода лечения в одинаковых начальных условиях, и в качестве результата я получил целое число от 0 до 500 в каждом случае. Я хочу использовать парный критерий Стьюдента, чтобы определить, значительно ли отличаются эффекты, вызванные этими двумя процедурами. Результаты для каждой группы лечения обычно распределены, но разница между каждой парой обычно не распределена (асимметричный + один длинный хвост).

Могу ли я использовать парный t-критерий в этом случае, или предположение о нормальности нарушено, что означает, что я должен использовать какой-либо непараметрический критерий?

Джон Дусетт
источник
Эксперимент основан на симуляции. Я могу установить начальные условия симуляции по своему усмотрению. Таким образом, для каждой пары я начинаю с одинаковых начальных условий и применяю два разных алгоритма.
Джон Дусетт
Из того, что вы описываете, звучит как независимые группы. Применяли ли вы оба метода лечения для каждого случая или есть какое-то другое соответствие? Какова взаимосвязь между условиями? Ваша формулировка странная ... Вы имеете в виду, что у вас есть одно значение в хвосте, делающее его асимметричным?
Джон
Думая об этом дальше, я менее уверен, что они зависимы, но, возможно, вы можете пролить свет на это. Аналогичная корреляция в реальном мире была бы такой: у меня есть человек. Лечение проводится, и проводится измерение. Затем я отменяю время и вместо этого назначаю лечение двум. Измерение снова проводится. Мне кажется, что эти меры следует считать взаимосвязанными. Возможно, они не должны?
Джон Дусетт
Кроме того , с ненормальностью, распределением является одновременно асимметричным и имеет один длинный хвост (с несколькими отклоняющихся значениями). Удаление некоторых выбросов не сделает его нормальным.
Джон Дусетт
3
Если одномерные распределения являются нормальными и независимыми, то распределение разностей должно быть нормальным. Отсутствие нормальности демонстрирует зависимость между двумя распределениями. Зависимость - это не просто зависимость: должно быть что-то еще.
whuber

Ответы:

13

Парный t-тест только анализирует список парных различий и предполагает, что выборка значений случайным образом выбирается из гауссовой совокупности. Если это предположение грубо нарушается, парный t-тест недействителен. Распределение, из которого значения «до» и «после» являются выборками, не имеет значения - только совокупность различий выбирается из вопросов.

Харви Мотульский
источник
Итак, скажем, если я проанализировал нелинейную модель и сгенерировал y_observed во время = i. Могу ли я сделать парный t-тест, который сравнивает каждое наблюдаемое с фактическим значением в момент времени i? Давайте также предположим, что у меня есть данные наблюдений за 100 временных интервалов, и прогнозирую мои числа на те же интервалы
dassouki