Определение «процентиля»

11

Сейчас я читаю заметку по биостатистике, написанную PMT Education, и замечаю следующие предложения в разделе 2.7:

Ребенок, рожденный на 50-м процентиле по массе, тяжелее, чем 50% детей.
Ребенок, рожденный на 25-м процентиле по массе, тяжелее, чем 75% детей.
Ребенок, родившийся на 75-м процентиле по массе, тяжелее, чем 25% детей.

Но, как я знаю, ребенок, рожденный с 25-го процентиля по массе, должен быть тяжелее, чем 25% детей. Есть ли в этой области специальное определение «процентиля», или я неправильно понимаю предложения как не носитель языка?

wwtian
источник
1
Ваше понимание верно. Особенно в биомедицине процентили дескрипторов следуют основной идее слева направо. В прошлом я работал с людьми из ВОЗ, говоря: « Ребенок, рожденный на 75-м процентиле по массе, тяжелее, чем 25% детей », вероятно, заставит их думать, что я статистически неграмотен.
usεr11852

Ответы:

17

Хотя определение процентилей, данное Стивеном Колассой , технически правильно в статистической теории (лучший вид правильного?), Это проблема, при которой на практике существуют большие различия - некоторые люди называют процентили с наивысшим процентилем как максимум, но другие переворачивают его так, чтобы максимальный процентиль был минимальным. В последнем случае люди иногда говорят о том, что кто-то находится в 5-м процентиле, когда они в верхних пяти процентах, а не в нижнихпять процентов. Иногда они говорят это явно (например, Джон Смит находится в верхнем 5-м процентиле для расстояния толкания ядра), но иногда они не будут четко указывать это. По этой причине всегда важно уточнить у читателя / докладчика, каким образом они определяют процентили. (При отсутствии какой-либо спецификации на обратное, им действительно следует использовать стандартное статистическое определение.)

Кроме того, я не согласен со Стивеном в одном пункте. Я сомневаюсь, что это опечатка. Скорее всего, автор документа просто говорит о процентилях во втором описанном мною смысле, который, хотя и не является технически правильным, тем не менее довольно распространен. Я на самом деле не рассматриваю это как «ошибку», а скорее как нестандартное использование термина, который простит, если он объяснен. Вот пример обратного использования «процентилей» в статье об уровнях дохода в Wall Street Journal . (Большинство случаев обращения процентов происходит в контексте обсуждения уровней богатства / дохода. Хотя это гораздо реже, чем технически правильное использование, это происходит достаточно часто, поэтому вам нужно быть осторожным, чтобы проверить значение.) Вотпоследующий вопрос, где я ищу примеры этой обратной практики.

Бен - Восстановить Монику
источник
4
Это интересно, но неправдоподобно: графики роста - это стандартные вещи. Я никогда не видел, чтобы определение процентилей там изменилось. См., Например, cdc.gov/growthcharts/who/boys_weight_head_circumference.htm таблицу ВОЗ. Таким образом, я бы посчитал ваше объяснение более правдоподобным, если бы вы могли продемонстрировать некоторые случаи обращенных процентилей в фактическом использовании (предпочтительно неким признанным авторитетом, а не просто, скажем, школьным учителем или веб-блогером).
whuber
2
Я согласен с @whuber. Я никогда не видел практики, на которую вы ссылаетесь. «Лучшие пять процентов» для обозначения кого-либо на уровне 95-го процентиля или выше, да, но «на 5-м процентиле» для обозначения того же человека, нет. У вас есть примеры такого использования?
Стефан Коласса
2
@Stephen: Ну, вы оба видели это хотя бы один раз, в цитируемом разделе вопроса. Так что это одно из доказательств в пользу существующей практики. Я не думаю, что это то, что вы можете увидеть в авторитетных источниках, именно потому, что эти источники имеют тенденцию проверять технический смысл. Тем не менее, я видел, что это изменение сделано неформально (возможно, по ошибке, но все еще достаточно часто, что важно проверить).
Бен - Восстановить Монику
2
При обсуждении богатства / дохода источники нередко ссылаются на верхний X% богатства / дохода, и в таких случаях они также нередко отбрасывают ссылку на вершину и просто говорят «1 % "или" 10% ". Вот пример статьи о «глобальном 1%», где вы должны прочитать три абзаца, прежде чем они укажут, что они говорят о верхнем 1%. Такое обращение к процентили довольно часто встречается при обсуждении состояния / дохода.
Бен - Восстановить Монику
2
@Ben: спасибо. (Кстати, если вы используете "@Stephan", а не "@Stephen", я буду уведомлен.) Я согласен с вашей точкой зрения. Тем не менее, я хотел бы отметить, что это использование обычно включает «1%», редко «1% процентиль ».
Стефан Коласса
16

Это просто опечатка в документе. Ваше понимание процентилей верно.

Стефан Коласса
источник
12
Для широкого определения "опечатка".
накопление
Далее в тексте говорится: « Высокий процентиль (например, 90-й или выше) может указывать на проблему со здоровьем. Это не опечатка - автор либо ошибается, либо по какой-то причине использует графики роста в обратном направлении.
JPhi1618
1
Или, хотя, по общему признанию, очень запутанно, окружающий контекст фрагмента оценивает вес в обратной шкале. Например, 90-й процентиль бегунов на 100 м занимает 100 м меньше времени, чем 90% бегунов. Окружающий контекст может сделать такое толкование более четким, например, если сосредоточить внимание на серьезности недостаточного веса: серьезность возрастает с уменьшением веса. Если серьезность является главной целью, имеет смысл отсортировать ее по степени серьезности (и, следовательно, обратно по весу); аналогично тому, как вы сортируете бегунов по производительности (и обратно по времени, затраченному на выполнение пробега).
Флатер