Каков будет правильный способ оценить / определить последовательность стрельбы игрока NBA в 3 очка? Например, у меня есть игрок, который стреляет 37% с 3-х точек и делает 200 попыток в течение всего года.
Я подумывал о том, чтобы взять скользящее среднее значение 3% от произвольного количества снимков (скажем, 20). Затем, используя эти средние значения, определите стандартное отклонение от среднего значения 37%. Использование скользящей выборки размером в 20 снимков позволяет с точностью до 5% в процентах снимков, но я обеспокоен тем, что использование слишком большого количества снимков не выявит несоответствия в производительности.
Есть ли лучший подход для определения согласованности?
do an analysis of runs
...Ответы:
Как сказал другой пользователь в комментариях выше, пробный тест - это способ анализа ваших съемочных данных. Это проверяет гипотезу, что элементы последовательности являются взаимно независимыми. Если гипотеза отвергнута, вы можете сказать, что стрельба игрока по 3 точкам противоречива.
Я также хотел бы указать вам на эту статью, поскольку она напрямую связана с вашим анализом.
источник
Я думаю, что пробный тест - это хорошая идея. Для меня, анализируя данные в «чанках», вы намереваетесь создать прокси или контролировать «горячие руки» в согласованности игроков. Существует огромное количество литературы по этому явлению. Одна из лучших статей была обсуждена Гельманом в его блоге в июле 2015 года. Заголовок его сообщения был: «Эй, угадай, что? Там действительно горячая рука!» ( http://andrewgelman.com/2015/07/09/hey-guess-what-there-really-is-a-hot-hand/ ). Документ, о котором сообщает Гельман, является опровержением большей части предыдущей литературы, поскольку в нем подробно описываются ошибки, допущенные в результате предыдущего анализа феномена горячих рук. Предыдущая работа была сосредоточена на общем, а не на условных вероятностях. Эта статья представляет новую последовательную вероятностную модель (см. Ссылку для ссылки).
Один хороший показатель согласованности, который должен контролировать различия, например, в количестве сделанных снимков, - это коэффициент вариации. CV представляет собой безразмерную масштабно-инвариантную меру изменчивости и рассчитывается путем деления стандартного отклонения на среднее. Проблема, которую он пытается решить, состоит в том, что стандартные отклонения выражаются в шкале измеряемой единицы, т. Е. Она не является инвариантной. Это означает, что метрики с высокими средними значениями также будут иметь более высокие отклонения стандартного отклонения, чем метрики с низкими средними значениями. Так, например, из-за различий в их средних значениях показатели изменчивости диастолического и систолического артериального давления не могут быть напрямую сопоставлены. Принимая CV, их изменчивость становится сопоставимой. То же самое относится ко многим другим показателям, таким как цены на акции,
Таким образом, CV можно рассчитать для многих метрик и типов шкал, исключая категориальную информацию и показатели с отрицательными значениями.
источник