Это определение для статистики в Википедии
Более формально, статистическая теория определяет статистику как функцию выборки, где сама функция не зависит от распределения выборки; то есть функция может быть задана до реализации данных. Термин статистика используется как для функции, так и для значения функции в данном образце.
Я думаю, что понимаю большую часть этого определения, однако ту часть - где функция не зависит от распределения выборки, я не смог разобраться.
Мое понимание статистики до сих пор
Образец представляет собой набор реализаций некоторого числа независимых одинаково распределенный (IID) , случайные величины с распределением F (10 реализаций рулона 20 односторонний справедливой кости, 100 реализаций 5 рулонов 6- ти односторонний справедливой кости, случайным образом собрать 100 человек из популяции).
Функция, чьей областью является этот набор, а диапазон которой является действительными числами (или, может быть, она может производить другие вещи, такие как вектор или другой математический объект ...), будет считаться статистикой .
Когда я думаю о примерах, значит, медиана, дисперсия имеют смысл в этом контексте. Они являются функцией множества реализаций (измерения артериального давления по случайной выборке). Я также вижу, как модель линейной регрессии можно считать статистикой - это не просто функция на множестве реализаций?
Где я запутался
Предполагая, что мое понимание сверху верное, я не смог понять, где функция не может быть независимой от распределения образца. Я пытался придумать пример, чтобы понять это, но не повезло. Любое понимание будет высоко ценится!
источник
Я интерпретирую это как высказывание о том, что вы должны решить, прежде чем увидеть данные, какую статистику вы собираетесь рассчитывать. Так, например, если вы собираетесь устранить выбросы, вы должны решить, прежде чем увидеть данные, которые представляют собой «выбросы». Если вы решите после просмотра данных, то ваша функция зависит от данных.
источник