У меня есть набор данных, и . Я хотел бы проверить следующую гипотезу: есть пик ; то есть, когда увеличивается, сначала увеличивается, а затем уменьшается.
Моей первой идеей было подгонка и в зеркалке. То есть, если я обнаружу, что коэффициент до существенно положительный, а коэффициент до значительно отрицательный, я получу поддержку гипотезы. Однако это проверяет только один тип отношений (квадратичный) и может не обязательно отражать существование пика.
Затем я подумал о том, чтобы найти , такую область (отсортированных значений) , что находится между и , две другие области которые содержат как минимум столько же точек, что и , и что и значительно. Если гипотеза верна, мы должны ожидать много таких областей . Таким образом, если число b достаточно велико, гипотеза должна быть подтверждена.
Как вы думаете, я на правильном пути, чтобы найти подходящий тест для моей гипотезы? Или я изобрел колесо, и существует установленный метод для этой проблемы? Я буду очень признателен за ваш вклад.
ОБНОВИТЬ. Моя зависимая переменная это количество (неотрицательное целое число).
источник
Ответы:
Я тоже думал о сглаживающей идее. Но есть целая область, называемая методологией поверхности отклика, которая ищет пики в зашумленных данных (в первую очередь это касается использования локальных квадратичных подгонок к данным), и была известная статья, которую я помню с «Охотой на удар» в названии. Вот несколько ссылок на книги по методологии поверхности отклика. Книги Рэя Майера особенно хорошо написаны. Я попытаюсь найти бумагу для охоты на кочек.
Методология поверхности отклика: оптимизация процесса и продукта с использованием разработанных экспериментов
Методология поверхности отклика и смежные вопросы
Методология поверхности отклика
Эмпирическое моделирование и ответные поверхности
Хотя это не та статья, которую я искал, вот очень актуальная статья Джерри Фридмана и Ника Фишера, в которой рассматриваются эти идеи, применяемые к многомерным данным.
Вот статья с некоторыми онлайн-комментариями.
Надеюсь, вы по крайней мере оцените мой ответ. Я думаю, что ваши идеи хороши и находятся на правильном пути, но да, я действительно думаю, что вы, возможно, изобретаете колесо, и я надеюсь, что вы и другие посмотрите на эти прекрасные рекомендации.
источник
Даже если вы не ответили на мой вопрос, если мое предположение верно, вы ищете тест белого шума, который в частотной области показывает, что спектр плоский. Таким образом, можно использовать тест периодограммы Фишера, который в этой ссылке называется каппа Фишера. Смотрите ссылку.
http://www4.stat.ncsu.edu/~dickey/Spain/pdf_Notes/Spectral2.pdf
Тест Бартлетта также упоминается в ссылке. Теперь отвергнуть нулевую гипотезу - значит найти значительный пик на периодограмме. Это будет означать, что периодический компонент существует во временном ряду.
Поскольку тест находится в частотной области и включает ординаты периодограммы, ордината имеет распределение хи-квадрат 2 при нулевой гипотезе и является независимой. Это специальное распределение происходит только из-за преобразования в частотную область. Если бы x было временем, это не сработало бы во временной области или в общем случае распределение ys не было бы независимым хи-квадрат.
источник