Исследователь желает провести комбинированный анализ нескольких наборов данных. В некоторых наборах данных имеются парные наблюдения для лечения A и B. В других есть непарные данные A и / или B. Я ищу ссылку для адаптации t-критерия или критерия отношения правдоподобия для таких частично спаренных данных. Я готов (на данный момент) предполагать нормальность с равной дисперсией и то, что совокупные средние значения для A одинаковы для каждого исследования (и аналогично для B).
hypothesis-testing
t-test
paired-data
change-scores
Фрэнк Харрелл
источник
источник
Ответы:
Го и Юань предлагают альтернативный метод, называемый оптимальным объединенным t-тестом, основанный на объединенном t-тесте Самави и Фогеля.
Ссылка на ссылку: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.865.734&rep=rep1&type=pdf
Отлично читал с несколькими вариантами для этой ситуации.
Новое в комментировании, поэтому, пожалуйста, дайте мне знать, если мне нужно добавить что-нибудь еще.
источник
Что ж, если бы вы знали дисперсии в непарном и парном (которые, как правило, были бы значительно меньше), оптимальные веса для двух оценок различий в группах означали бы наличие весов, обратно пропорциональных дисперсии отдельного человека. оценки разницы в средствах.
[Правка: получается, что когда оцениваются отклонения, это называется оценкой Грейбилла-Дила. Там было довольно много статей об этом. Вот один]
Необходимость оценки дисперсии вызывает некоторую трудность (результирующее соотношение оценок дисперсии равно F, и я думаю, что полученные веса имеют бета-распределение, а результирующая статистика является довольно сложной), но, поскольку вы рассматриваете возможность начальной загрузки, это может быть меньше проблем.
Альтернативная возможность, которая может быть лучше в некотором смысле (или, по крайней мере, немного более устойчивой к ненормальности, так как мы играем с коэффициентами дисперсии) с очень малой потерей эффективности в норме, состоит в том, чтобы основывать комбинированную оценку отклонения парные и непарные ранговые тесты - в каждом случае своего рода оценка Ходжеса-Лемана, в непарном случае на основе медиан парных различий между выборками и в парном случае от медиан парных средних средних парных различий. Опять же, линейная комбинация двух взвешенных по минимальной дисперсии весов будет пропорциональна инверсиям дисперсий. В этом случае я бы, вероятно, склонялся к перестановке (/ randomization), а не к начальной загрузке - но в зависимости от того, как вы реализуете свою начальную загрузку, они могут оказаться в одном месте.
В любом случае вы можете захотеть повысить достоверность своих отклонений / уменьшить соотношение отклонений. Попадание в правильное положение по весу - это хорошо, но при нормальной работе вы потеряете очень мало эффективности, сделав его слегка устойчивым. ---
Некоторые дополнительные мысли, которые у меня не были достаточно четко разобраны в моей голове:
Эта проблема имеет явное сходство с проблемой Беренса-Фишера, но еще сложнее.
Если бы мы фиксировали веса, мы могли бы просто ударить в приближении типа Уэлча-Саттертвейта; структура проблемы одинакова.
Наша проблема заключается в том, что мы хотим оптимизировать весовые коэффициенты, что фактически означает, что весовые коэффициенты не являются фиксированными - и, действительно, имеет тенденцию максимизировать статистику (по крайней мере приблизительно и более близко в больших выборках, поскольку любой набор весовых коэффициентов является случайной величиной, оценивающей одинаковую величину). числитель, и мы пытаемся свести к минимуму знаменатель; два не являются независимыми).
Я ожидаю, что это ухудшит приближение хи-квадрат и почти наверняка еще больше повлияет на df приближения.
[Если эта проблема выполнима, может также оказаться хорошим эмпирическое правило, которое скажет: «Вы можете сделать почти так же хорошо, если вы используете только парные данные при этих наборах обстоятельств, только непарные при этих других наборах В остальных условиях эта схема с фиксированным весом обычно очень близка к оптимальной », но я не буду задерживать дыхание в ожидании этого шанса. Такое правило принятия решений, несомненно, будет иметь некоторое влияние на истинное значение в каждом случае, но если этот эффект не будет таким большим, такое практическое правило даст людям простой способ использовать существующее устаревшее программное обеспечение, поэтому может быть желательно попытаться определить такое правило для пользователей в такой ситуации.]
---
Изменить: Примечание для себя - нужно вернуться и заполнить детали работы над тестами «перекрывающихся образцов», особенно t-тестами перекрывающихся образцов
---
Мне приходит в голову, что тест рандомизации должен работать нормально -
где данные спарены, вы случайным образом переключаете метки группы в пары
если данные непарные, но предполагается, что они имеют общее распределение (под нулевым значением), вы переставляете групповые назначения
Теперь вы можете основывать веса на двух сдвиговых оценках на основе относительных дисперсионных оценок (вес1= 1 / (1+ V1v2) ), вычислите взвешенную оценку сдвига каждой рандомизированной выборки и посмотрите, где выборка вписывается в распределение рандомизации.
(Добавлено намного позже)
Возможно актуальная статья:
Деррик Б., Русс Б., Тохер Д. и Уайт П. (2017),
«Статистика испытаний для сравнения средств для двух выборок, включающих как парные, так и независимые наблюдения»,
журнал «Современные прикладные статистические методы» , май Вып. 16, № 1, 137-157.
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm
источник
Вот несколько мыслей. Я просто прихожу к выводу Грега Сноу, что эта проблема имеет явное сходство с проблемой Беренса-Фишера . Чтобы избежать рукопожатия, я сначала ввожу некоторые обозначения и формализую гипотезы.
каждое наблюдение представляет собой сумму эффекта пациента и эффекта лечения. Соответствующие случайные величины
Now we have three groups of observations, theXi (size n ), the XAi (size nA ) and the XBi (size nB ). The means are
The next natural step is to consider
Now basically we are stuck. The three sums of squares give estimations ofσ2 with n−1 df, σ2P+σ2 with nA−1 df and nB−1 df respectively. The last two can be combined to give an estimation of (1nA+1nB)(σ2P+σ2) with nA+nB−2 df. The variance of Y is the sum of two terms, each of which can be estimated, but the recombination is not doable, just as in Behrens Fisher problem.
At this point I think one may plug-in any solution proposed to Behrens Fisher problem to get a solution to your problem.
источник
My first thought was a mixed effects model, but that has already been discussed so I won't say any more on that.
My other thought is that if it were theoretically possible that you could have measured paired data on all subjects but due to cost, errors, or another reason you don't have all the pairs, then you could treat the unmeasured effect for the unpaired subjects as missing data and use tools like the EM algorithm or Multiple Imputation (missing at random seems reasonable unless the reason a subject was only measured under 1 treatment was related to what their outcome would be under the other treatment).
It may be even simpler to just fit a bivariate normal to the data using maximum likelihood (with the likelihood factored based on the available data per subject), then do a likelihood ratio test comparing the distribution with the means equal vs. different means.
It has been a long time since my theory classes, so I don't know how these compare on optimality.
источник
maybe mixed modelling with patient as random effect could be a way. With mixed modelling the correlation structure in the paired case and the partial missings in the unpaired case could be accounted for.
источник
gls
функцию R вnlme4
пакете.Один из методов, предложенных в работе Хани М. Самави и Роберта Фогеля (Журнал прикладной статистики, 2013), состоит из взвешенной комбинации Т-баллов из независимых и зависимых выборок таким образом, что новый Т-балл равен
гдеD представляет образцы парных различий, взятых из коррелированных данных. По сути, новый T-балл представляет собой взвешенную комбинацию непарного T-балла с новым сроком коррекции.γ представляет долю независимых образцов. когдаγ равен 1, тест эквивалентен двум выборочным t-тестам, тогда как, если он равен нулю, это парный t-тест.
источник