У меня есть набор данных, в котором я проверяю наличие значительных различий между тремя популяциями в отношении примерно 50 различных переменных. Я делаю это, используя тесты Крускала-Уоллиса, с одной стороны, и тесты отношения правдоподобия для вложенных моделей GLM (с заполнением и без учета в качестве независимой переменной), с другой.
В результате у меня есть список значений Крускала-Уоллиса, одной стороны, и то, что я думаю, являются значениями хи-квадрат из сравнений LRT, с другой.
Мне нужно сделать некоторую форму множественной коррекции тестирования, поскольку существует более 50 различных тестов, и FDR Бенджамини-Хохберга кажется наиболее разумным выбором.
Тем не менее, переменные, вероятно, не являются независимыми, так как несколько «кланов» из них коррелируют. Тогда возникает вопрос: как я могу определить, соответствует ли набор основных статистических данных для моих -значений требованиям положительной зависимости, которые необходимы для того, чтобы процедура Бенджамини-Хохберга все еще была связана с FDR?
В статье Бенджамини-Хохберга-Екутиели 2001 года говорится, что условие PRDS выполняется для многомерного нормального и изученного распределения. Как насчет моего критерия отношения правдоподобия значений хи-квадрат для сравнения моделей? Как насчет значений, которые я имею для тестов Крускала-Уоллиса?
Я могу использовать коррекцию FDR в худшем случае Бенджамини-Хохберга-Екутиели, которая не предполагает ничего о зависимости, но я думаю, что она может быть слишком консервативной в этом случае и пропустить некоторые соответствующие сигналы.
PRDS является достаточным, но не обязательным условием для BH, чтобы контролировать FDR. Я бы посоветовал вам использовать его, а также использовать процедуру Бенджамини-Екутиели для общей зависимости. Если разница в выводах велика, попробуйте продемонстрировать, что BH контролирует FDR в вашей конкретной установке, используя перестановки или методы на основе повторной выборки, которые сохраняют вашу структуру зависимости.
источник