Почему демографы дают ставки на 100 000 человек?

10

Кажется универсальным, что демографическая статистика приводится в расчете на 100 000 населения в год. Например, число самоубийств, число убийств, год жизни с поправкой на инвалидность, этот список можно продолжить. Почему?

Если бы мы говорили о химии, частями на миллион (ppm) является обычным явлением. Почему акт подсчета людей смотрелся принципиально иначе. Число 100 000 не имеет основы в системе СИ, и, насколько я могу судить, оно вообще не имеет эмпирической основы, кроме слабого отношения к проценту. Подсчет на 100 000 может быть истолкован как милли-процент,%. Я думал, что это может получить некоторые стоны.

Это исторический артефакт? Или есть какой-то аргумент для защиты подразделения?

AlanSE
источник
4
Для показателей убийств 100 000 - это, по сути, наименьшее число, необходимое для того, чтобы не указывать уровень в десятичных числах.
Энди W
@Анди Ну, я согласен с этим и сам думал так же. Но это оставляет множество других со скоростью 1000 с, потому что независимо от того, как вы нарезаете это, диапазон демографической информации, представленной в формате, имеет разницу в несколько порядков. Другой аргумент, что 100 000 - это город среднего размера, кажется, очень четкая причина.
AlanSE
2
Я никогда не слышал, чтобы сценарий среднего размера города объяснял уровень преступности. Здесь, в США, UCR сообщает о показателях преступности для полицейских юрисдикций, округов, штатов, крупных регионов, сельских / городских районов и различных разбивок по размеру города или столичным статистическим районам. В городе, в котором я вырос, население составляло около 2000 человек. Должен ли я интерпретировать уровень преступности на 100 000 в моем родном городе, как если бы это был город размером 100 000 человек?
Энди У

Ответы:

11

Небольшое исследование показывает, во-первых, что демографы (и другие, такие как эпидемиологи, которые сообщают о показателях событий в человеческом населении) не «универсально» используют 100 000 в качестве знаменателя. Действительно, поиск в Google «демография 100000» или связанные поиски, по-видимому, приводят к тому же количеству документов, использующих 1000 для знаменателя, как 100 000. Примером является Глоссарий демографических терминов справочного бюро по народонаселению , в котором постоянно используется 1000.

Просмотр работ ранних эпидемиологов и демографов показывает, что ранние (такие как Джон Граунт и Уильям Петти, авторы ранних лондонских законопроектов о смертности , 1662 г.) даже не нормализовали свою статистику: они сообщали необработанные подсчеты в пределах определенных административных единиц (например, город Лондон) в течение заданных периодов времени (например, один год или семь лет).

Эпидемиологический эпидемиолог Джон Сноу (1853) создал таблицы, нормализованные до 100 000, но обсудил показатели на 10 000. Это говорит о том, что знаменатель в таблицах был выбран в соответствии с количеством доступных значащих цифр и скорректирован таким образом, чтобы все записи были едиными.

Такие условные обозначения были распространены в математических таблицах, восходящих, по крайней мере, к книге логарифмов Джона Напира (ок. 1600), в которой ее значения выражались на 10 000 000 для достижения семизначной точности для значений в диапазоне . (Десятичная запись была, по-видимому, настолько недавней, что он чувствовал себя обязанным объяснить свою запись в книге!) Таким образом, можно ожидать, что типичные знаменатели были выбраны, чтобы отражать точность, с которой сообщаются данные, и избегать десятичных дробей.[0,1]

Современный пример последовательного использования масштабирования степенями десяти для достижения управляемых интегральных значений в наборах данных представлен классическим текстом Джона Тьюки , EDA (1977). Он подчеркивает, что аналитики данных должны свободно масштабировать (и, в более общем случае, нелинейно повторно выражать) данные, чтобы сделать их более подходящими для анализа и более удобными для управления.

Поэтому я сомневаюсь в предположениях, какими бы естественными и привлекательными они ни были, что знаменатель в 100 000 человек исторически возник с каким-либо конкретным человеческим масштабом, таким как «малый и средний город» (в котором до 20-го века в любом случае было бы менее 10 000 человек и далеко менее 100 000).

Whuber
источник
5

Кажется, я помню, что в курсе «География населения» несколько десятилетий назад наш преподаватель (профессор Бригетт Уолдорф, в настоящее время работающий в Университете Пердью) сказал [что-то вроде этого], что мы выражаем число случаев (например, смертей, рождений) на 100 000, потому что даже если есть только 30 или 50 случаев, нам не нужно прибегать к отвратительным процентам. Интуитивно понятнее большинству людей (хотя, вероятно, и не читателям этого уважаемого форума) сказать, что в нижней части Верхних выдр смертность от укусов змей среди мужчин в возрасте от 35 до 39 в 2010 году составила 13 на 100 000 жителей. Это просто позволяет сравнивать показатели по местам и группам (хотя и проценты тоже).

Хотя я не демограф, я никогда не слышал, чтобы кто-то ссылался на аргумент о городе среднего размера, хотя это звучит разумно. Просто за 20 лет работы с географами и связанными с ними учеными-социологами в качестве студента, аспиранта, а теперь и преподавателя я никогда не слышал такого конкретного объяснения по поводу размера города. До настоящего времени.

rabidotter
источник
3

Обычно мы пытаемся донести информацию до реальных людей, поэтому полезно использовать число, которое имеет смысл для людей. 100 000 человек - это размер маленького и среднего города, о котором легко думать.

Грег Сноу
источник
2
Имеет смысл, но у вас есть ссылка для этого?
whuber
-1

В действительности нет разумной или рациональной причины для перехода на 100 000.

Это просто изменение единиц измерения.

Большая проблема заключается в том, что большинство людей используют неправильный домен при 100%

Для этого просто нет веских причин.

Доктор ли
источник
Добро пожаловать в Stats.SE. Можете ли вы отредактировать свой пост и обосновать свои заявления? Было бы интересно, если бы вы могли предоставить некоторые ссылки, в частности, на ваше третье предложение. Пока вы это делаете, вы можете исправить опечатки в своем посте. Кстати, воспользуйтесь возможностью принять участие в туре ( stats.stackexchange.com/tour ), если вы еще этого не сделали. Смотрите также несколько советов по форматированию справки и запишите уравнения, используя LaTeX / MathJax .
Ertxiem - восстановить Monica