У меня есть вопрос, в котором он просит проверить, нормализовано ли равномерное распределение ( ).
- С одной стороны, что означает для любого распределения быть нормализованным?
- И второе: как нам проверить, нормализовано ли распределение?
Я понимаю, вычисляя
мы получаем нормализованныеданные, но здесь мы просим проверить,нормализованолираспределение.
Ответы:
К сожалению, термины по-разному используются в разных областях, разными людьми в одной и той же области и т. Д., Поэтому я не уверен, насколько хорошо это можно ответить здесь для вас. Вы должны убедиться, что вы знаете определение, которое ваш инструктор / учебник использует для «нормализованного». Тем не менее, вот некоторые общие определения:
По центру: Стандартизировано: X - среднее
Здесь стоит признать, что все три из них являются линейными преобразованиями ; как таковые, они не меняют форму вашего дистрибутива . То есть иногда люди называют преобразование score «нормализующим» и считают, что из -за ассоциации z- scores с нормальным распределением это делало их данные нормально распределенными. Это не так (как замечает @Jeff, и как вы могли бы сказать, нанося на график ваши данные до и после). Если вам интересно, вы можете изменить форму своих данных, например, с помощью семейства преобразований Box-Cox .z z
Что касается того, как вы могли бы проверить эти преобразования, это зависит от того, что именно подразумевается под этим. Если они имеют в виду просто проверить, что код работает правильно, вы можете проверить средства, SD, минимумы и максимумы.
источник
Используя формулу, предоставленную вами для каждой оценки в вашей выборке, вы конвертируете их все в z-оценки .
Чтобы убедиться, что вы правильно вычислили все z-баллы, найдите новое среднее значение и стандартное отклонение для вашей выборки. Если среднее значение равно а стандартное отклонение равно0 , вы все сделали правильно.1
Цель этого состоит в том, чтобы поместить все в единицы относительно стандартного отклонения вашей выборки. Это может быть полезно для различных целей, таких как сравнение двух разных наборов данных, которые были оценены с использованием разных единиц (возможно, сантиметров и дюймов).
Важно не путать это с вопросом, является ли распределение нормальным , т. Е. Приближается ли оно к гауссову распределению .
источник
После консультации с ТП вопрос был задан:
источник