Я отправил это в mathoverflow, и никто не отвечает:
Метод Шеффе для выявления статистически значимых контрастов широко известен. Контраст среди средств , из популяций является линейной комбинацией , в котором , и скалярное кратное контрастности - это, по сути, один и тот же контраст, поэтому можно сказать, что набор контрастов является проективным пространством. Метод Шеффе проверяет нулевую гипотезу, которая говорит, что все контрасты среди этих популяций равны , и, учитывая уровень значимости , отклоняет нулевую гипотезу с вероятностью i = 1 , … , r r ∑ r i = 1 c i μ i ∑ r i =0αучитывая, что нулевая гипотеза верна. И если нулевая гипотеза отклоняется, Шеффе указывает, что его тест говорит нам, что контрасты значительно отличаются от (я не уверен, что статья в Википедии, на которую я ссылался, указывает на это ).
Я хотел бы знать, можно ли сделать что-то подобное в другой ситуации. Рассмотрим простую модель линейной регрессии , где , .ε i ∼ i . я . д . N ( 0 , σ 2 ) i
Нулевая гипотеза, которую я хочу рассмотреть, касается другого рода контраста. Он говорит, что нет подмножества такого, что для и для , где . Если подмножество задано заранее, то это делает обычное тестирование из двух выборок , но мы хотим что-то, что учитывает все подмножества и удерживает вероятность отклонения истинной нулевой гипотезы.E ( Y i ) = α 1 + β x i i ∈ A E ( Y i ) = α 2 + β x i i ∉ A α 1 ≠ α 2 A t
Можно было бы понять это, если бы эффективность не была проблемой: найдите тест, который проходит все возможностей. Даже тогда это проблематично; два контраста не были бы независимыми. Я спросил об этом эксперта по обнаружению выбросов, и он просто сказал, что это комбинаторный кошмар. Затем я спросил, можно ли доказать, что не существует эффективного способа сделать это, возможно, путем уменьшения сложности проблемы NP. Он просто сказал, что держится подальше от NP-сложных проблем.
Итак: можно ли доказать, что эта проблема "сложная" или нет?
источник
Ответы:
Заметил, что пока никто не ответил на этот вопрос ...
источник