Я решаю кубики Рубика как хобби. Я записываю время, которое потребовалось мне для решения куба с помощью некоторого программного обеспечения, и теперь у меня есть данные из тысяч решений. Данные в основном представляют собой длинный список чисел, представляющих время, которое заняло каждое последовательное решение (например, 22.11, 20.66, 21.00, 18.74, ...)
Время, необходимое для решения куба, естественно, несколько отличается от решения до решения, поэтому существуют хорошие и плохие решения.
Я хочу знать, становлюсь ли я "горячим" - хорошие ли решения приходят полосами. Например, если у меня только что было несколько хороших последовательных решений, более ли вероятно, что мое следующее решение будет хорошим?
Какой анализ будет уместным? Я могу подумать о некоторых конкретных вещах, которые нужно сделать, например, рассматривать решения как марковский процесс и видеть, насколько хорошо одно решение предсказывает следующее, и сравнивать со случайными данными, видеть, как долго самые длинные полосы последовательных решений ниже медианы для последнего 100 и сравнивают с тем, что можно было бы ожидать в случайных данных и т. Д. Я не уверен, насколько полезными будут эти тесты, и задаюсь вопросом, существуют ли какие-то хорошо разработанные подходы к решению этой проблемы.
источник
Несколько мыслей:
График распределения времени. Я предполагаю, что они будут искажены, так что некоторые времена решения будут действительно медленными. В этом случае вы можете рассмотреть журнал или другое преобразование времени решения.
Создайте точечный график испытаний по оси x и времени решения (или зарегистрируйте время решения по оси y). Это должно дать вам интуитивное понимание данных. Это может также выявить другие виды тенденций, помимо "горячей полосы".
Подумайте, есть ли эффект обучения с течением времени. С большинством головоломок вы быстрее учитесь. Сюжет должен помочь выяснить, так ли это. Такой эффект отличается от эффекта «горячей полосы». Это приведет к корреляции между испытаниями, потому что, когда вы впервые учитесь, медленные испытания будут происходить вместе с другими медленными испытаниями, и, по мере того, как вы будете становиться более опытными, более быстрые испытания будут сочетаться с более быстрыми испытаниями.
Рассмотрим ваше концептуальное определение «горячих полос». Например, это относится только к испытаниям, которые являются приблизительными по времени или о близости заказа. Допустим, во вторник вы быстро решили куб, а затем сделали перерыв, а в следующую пятницу вы решили его быстро. Это горячая полоса, или она считается только в том случае, если вы делаете это в тот же день?
Существуют ли другие эффекты, которые могут отличаться от эффекта горячей полосы? Например, время дня, когда вы решаете головоломку (например, усталость), степень, в которой вы действительно стараетесь? и т.п.
Как только альтернативные систематические эффекты будут поняты, вы можете разработать модель, которая включает в себя как можно больше из них. Вы можете построить остаток по оси Y и пробный по оси X. Затем вы можете увидеть, есть ли автокорреляции в остатках в модели. Эта автокорреляция обеспечит некоторые признаки горячих полос. Однако альтернативная интерпретация заключается в том, что есть некий систематический эффект, который вы не исключили.
источник
Рассчитайте коррелограмму для вашего процесса. Если ваш процесс является гауссовским (судя по вашему примеру), вы можете установить нижнюю / верхнюю границы (B) и проверить, значимы ли корреляции при данном лаге. Положительная автокорреляция при лаге 1 будет указывать на наличие «полос удачи».
источник