- Утверждение 1 (S1): «Один из 80 смертей вызван автомобильной аварией».
- Утверждение второе (S2): «Один из 80 человек погибает в результате автомобильной аварии».
Теперь я лично не вижу большой разницы между этими двумя утверждениями. При написании я бы посчитал их взаимозаменяемыми для непрофессионалов. Тем не менее, сейчас мне бросили вызов два человека, и я ищу какую-то дополнительную перспективу.
Моя стандартная интерпретация S2 такова: «Из 80 человек, случайно выбранных из популяции людей, мы ожидаем, что один из них погибнет в результате автомобильной аварии», - и я считаю это квалифицированное утверждение эквивалентным S1.
Мои вопросы следующие:
Q1) Действительно ли моя интерпретация по умолчанию эквивалентна Утверждению Один?
Q2) Необычно или безрассудно, чтобы это было моей интерпретацией по умолчанию?
Q3) Если вы думаете, что S1 и S2 различны, например, чтобы указать второе, когда один означает, что первое вводит в заблуждение / неверно, не могли бы вы предоставить полностью квалифицированную версию S2, которая эквивалентна?
Давайте отложим в сторону очевидное утверждение, что S1 конкретно не относится к человеческим жертвам, и предположим, что это понимается в контексте. Давайте также отложим любое обсуждение правдивости самого утверждения: оно должно быть иллюстративным.
Насколько я могу судить, разногласия, которые я слышал до сих пор, по-видимому, сосредоточены вокруг невыполнения различных толкований первого и второго утверждений.
Во-первых, мои претенденты, кажется, интерпретируют это как 1/80 * num_deaths = количество смертей, вызванных автомобильными авариями, но по какой-то причине по умолчанию используется другое толкование второго по типу "если у вас есть какой-либо набор 80 людей, один из них будет умереть в автомобильной аварии»(который, очевидно , не является эквивалентом требования). Я бы подумал, что, учитывая их интерпретацию S1, по умолчанию для S2 это будет выглядеть следующим образом: (1/80 * num_dead_people = количество людей, погибших в автомобильной аварии == количество смертей, вызванных автомобильной аварией). Я не уверен, почему расхождение в интерпретации (их значение по умолчанию для S2 является гораздо более сильным предположением), или если у них есть какой-то врожденный статистический смысл, которого мне на самом деле не хватает.
источник
Ответы:
Во-первых, моей первой интуитивной мыслью было: «S2 может быть таким же, как S1, только если уровень смертности в результате дорожно-транспортных происшествий останется постоянным, возможно, в течение десятилетий», что, конечно, не было бы хорошим допущением в последние десятилетия. Это уже намекает на то, что одна трудность связана с неявными / невысказанными временными допущениями.
Я бы сказал, что ваши заявления имеют форму
1 в опыта .x population event
На этапе S1 население является смертельным исходом, и подразумеваемая временная спецификация в настоящее время или «находится в достаточно большом [чтобы иметь достаточные числа случаев], но не слишком широкие временные рамки [чтобы иметь приблизительно постоянные характеристики автомобильной аварии] в настоящее время»
В S2 население - это люди. И другие, кажется, читают это не как «умирающие люди», а как «живые люди» (что, в конце концов, и делают люди чаще / дольше). Если вы читаете население как живущих людей, очевидно, что ни один из каждых 80 человек, живущих сейчас, не погибает «сейчас» в автомобильной аварии. Так что это читается как «когда они умирают [возможно, через десятилетия], причиной смерти является автомобильная авария».
Возьмите домой сообщение: всегда будьте осторожны, чтобы указать, кто является вашим населением и знаменателем фракций в целом. (У Герда Гигеренцера есть документы о том, что не указание знаменателя является основной причиной путаницы, особенно в статистике и информировании о рисках).
источник
Для меня «1 из 80 смертей ...» - безусловно, более ясное утверждение. Знаменатель в вашем «1 в 80» - это набор всех событий смерти, и это утверждение делает его явным.
Существует двусмысленность в формулировке «1 на 80 человек ...». Вы действительно имеете в виду «1 из 80 человек, которые умирают ...», но это утверждение так же легко можно интерпретировать как «1 из 80 человек, которые сейчас живы ...» или подобное.
Я полностью за то, чтобы быть явным о наборе ссылок в утверждениях вероятности или частоты, как это. Если вы говорите о доле смертей, то говорите «смерти», а не «люди».
источник
the 1/80 ratio does focus on the present time in particular
. Или я недоразумение?Это зависит от того, описываете ли вы или прогнозируете .
«1 из 80 человек погибнет в автомобильной аварии» - это прогноз. Из всех людей, живущих сегодня, когда-нибудь в течение оставшейся жизни, один из 80 умрет таким образом.
«1 из 80 смертей вызван автомобильной аварией» - это описание. Из всех людей, которые умерли в определенный период (например, во время вспомогательного исследования), 1 из 80 действительно погиб в автомобильной аварии.
Обратите внимание, что временное окно здесь неоднозначно. Одно предложение подразумевает, что смертельные случаи уже произошли; другое подразумевает, что они произойдут когда-нибудь. Одно предложение подразумевает, что ваше базовое население - это люди, которые умерли (и были живы до этого); другой подразумевает базовую популяцию людей, которые живы сегодня (и умрут в конце концов).
На самом деле это совершенно разные утверждения, и, вероятно, только один из них поддерживается вашими исходными данными.
С другой стороны, неоднозначность возникает из-за несоответствия между состоянием личности (которое происходит непрерывно) и событием умирания (которое происходит в определенный момент времени). Всякий раз, когда вы комбинируете вещи таким образом, вы получаете нечто неоднозначное. Вы можете мгновенно устранить неоднозначность, используя два события вместо одного состояния и одно событие; например, «из каждых 80 человек, которые рождаются, 1 погибает в автомобильной аварии».
источник
Эти два утверждения различаются из-за смещения выборки, потому что автомобильные аварии чаще происходят в молодом возрасте.
Давайте сделаем это более конкретным, изложив нереалистичный сценарий.
Рассмотрим два утверждения:
Покажем, что эти два утверждения не совпадают.
Давайте значительно упростим ситуацию и предположим, что все, кто родился, умрут от сердечного приступа в возрасте 80 лет или от автомобильной аварии в возрасте 40 лет. Далее, давайте предположим, что первое утверждение выше выполнено, и что мы находимся в устойчивом состоянии населения, поэтому смертность балансирует рождаемость Тогда будет три популяции людей, все одинаково большие.
Эти три группы населения должны быть одинаково большими, потому что число людей, умирающих в автомобильных авариях (от первой группы населения выше), и число людей, умирающих от сердечных приступов (от третьей группы населения выше), равны.
Таким образом, в этом случае только одна треть всех людей, живущих сегодня, погибнет в автомобильной аварии, поэтому два утверждения не совпадают.
В реальной жизни у меня сложилось впечатление, что автомобильные аварии происходят в значительно более молодом возрасте, чем большинство других причин смерти. Если это так, между цифрами в вашем утверждении один и два будет существенная разница.
Если вы изменили второе утверждение
тогда в предположении стационарного населения эти два утверждения будут эквивалентны. Но, конечно же, в реальном мире у нас нет постоянного населения, и аналогичный (хотя и более сложный) аргумент показывает, что для растущей или сокращающейся популяции смещение выборки по-прежнему делает эти два утверждения различными.
источник
Нет.
Допустим, у нас 800 человек. 400 погибло: 5 от автомобильной аварии, остальные 395 забыли дышать. S1 теперь верно: 5/400 = 1/80. S2 неверно: 5/800! = 1/80.
Проблема в том, что технически S2 является неоднозначным, потому что он не указывает, сколько смертей было в общей сложности, в то время как S1 делает. С другой стороны, у S1 есть еще одна часть информации (общее количество смертей) и на одну меньшую часть информации (общее количество людей). Взятые по номиналу, они описывают различные соотношения.
Я на самом деле не согласен с вашей интерпретацией, но я думаю, что это не имеет значения. Вероятно, контекст сделает очевидным, что имеется в виду.
Вы можете спросить, где вы можете встретить людей, которые не умирают. С одной стороны, мы могли бы работать со статистическим набором данных, который отслеживает людей только в течение 5 лет, так что те, которые еще живы в конце исследования, следует игнорировать, поскольку неизвестно, от чего они умрут. Кроме того, причина смерти может быть неизвестна, и в этом случае вы не можете назначить его на автомобили или не автомобили.
«Один из 80 человек, которые умирают, делает это в результате автомобильной аварии». что составляет перефразировку S1.
источник
Я согласен, что ваша интерпретация второго утверждения соответствует первому утверждению. Я также согласен, что это совершенно разумная интерпретация второго утверждения. При этом второе утверждение гораздо более неоднозначно.
Второе утверждение также можно интерпретировать как:
Вторая и третья интерпретации, приведенные выше, могут быть достаточно близки для непрофессионалов, но первая существенно отличается.
источник
Основное различие заключается в том, что эти два утверждения относятся к разным группам людей и разным временным рамкам.
«Один из 80 смертей вызван автомобильной аварией», по-видимому, относится к доле смертей в некоторый довольно ограниченный период времени (скажем, один год). Поскольку доля населения, использующего автомобили, и показатели безопасности автомобилей значительно изменились с течением времени, утверждение не имеет никакого смысла, если вы не укажете, к какому временному интервалу оно относится. (Как нелепый пример, это было бы совершенно неправильно для 1919 года, учитывая уровень владения автомобилем и использования в общей численности населения в то время). Обратите внимание, что «доля населения, использующего автомобили» в вышеприведенном тексте, на самом деле является ошибкой - это должна быть «доля людей, которые умрут в ближайшем будущем, используя автомобили».
«Один из 80 человек умирает в результате автомобильной аварии», по-видимому, относится ко всем людям, живущим в настоящее время в каком-либо регионе, и их возможной причине смерти в некое неизвестное будущее время. Поскольку распространенность и безопасность автомобильных поездок почти наверняка изменится в течение их жизненных циклов (скажем, в течение следующих 100 лет для сегодняшних новорожденных), это утверждение очень отличается от первого.
источник
A1) Предполагая, что все умирают, и принимая во внимание достаточно малый период времени, в течение которого проводились измерения, да, ваша интерпретация S2 соответствует S1.
A2) Да, ваша интерпретация S2 безрассудна. S2 можно интерпретировать как «1 из 80 человек, погибших в автомобильных авариях», что явно не эквивалентно S1. Поэтому использование S2 может вызвать путаницу.
Ваша интерпретация 1 в 80 является разумным, хотя, и другая интерпретация (1 в любом 80) очень необычно. «1 в N из U - это P» является очень распространенным сокращением для «с учетом предиката, P и N случайных выборок x из юниверса U ожидаемое число выборок, такое что P (x) истинно, приблизительно равно 1» ,
A3) Если все люди, 1 из 80 погибнет в результате автомобильной аварии.
источник
Да, это неправильно, и ни одна из фраз не кажется достаточной, чтобы последовательно передать желаемое значение
Говоря в качестве непрофессионала, если ваша цель - миряне, я бы определенно рекомендовал размещать их на https://english.stackexchange.com/ , а не здесь - ваш вопрос потребовал от меня нескольких прочтений, чтобы распутать то, что S1 & S2 интуитивно значит для меня. против того, что ты хотел сказать.
Для записи, мои интерпретации каждого утверждения:
(S1) - на 80 смертей, 1 смерть в автомобильной аварии
(S2) - на 80 человек в автомобильной аварии, 1 смерть
Чтобы передать ваше значение, я бы, вероятно, использовал модифицированный S2: «Один из 80 человек погибнет в автомобильной аварии».
Это все еще содержит некоторую двусмысленность, но сохраняет подобную краткость.
источник