У меня есть вопрос о том, что мой учитель статистики сказал о следующей проблеме. Мой вопрос даже не о появлении парадокса Симпсона в этой ситуации. Мой вопрос просто о том, что мой профессор настаивает на том, что A) и D) являются правильными ответами вместо A) и F). Он сказал:
«Поскольку вероятность успеха для операций типа E настолько низка, мы можем заключить, что они трудны и не просто редки. Следовательно, у Мерси, вероятно, лучшее оборудование / врачи по сравнению с Хоуп».
Я не понимаю, как он мог сделать статистический вывод, что Мерси делает «более сложные операции». У милосердия, очевидно, лучший показатель успеха при операциях типа E, но почему это означает, что они делают «более сложные операции». Я думаю, что меня волнует формулировка этой проблемы, и профессор не сдвигается с места. Может кто-нибудь объяснить, почему я не прав или как я могу объяснить это профессору?
В вашем городе есть две больницы под названием «Милосердие и Надежда». Вы должны выбрать один из них, чтобы пройти операцию. Вы решаете основывать свое решение на успехе их хирургических бригад. К счастью, в соответствии с новым планом медицинского обслуживания больницы предоставляют данные об успешности своих операций, разбитых на пять основных категорий операций. Предположим, вы получаете следующие данные для двух больниц:
Mercy Hospital
Type A B C D E All
Operations 359 1836 299 2086 149 4729
Successful 292 1449 179 434 13 2366
Hope Hospital
Type A B C D E All
Operations 88 514 222 86 45 955
Successful 70 391 113 12 2 588
Вы замечаете, что во всех видах операций Mercy имеет более высокий показатель успешности, чем Hope, но Hope имеет самый высокий общий показатель успеха. Какую больницу вы бы выбрали и почему (выберите два ответа)?
А) Милосердие; так как я хотел бы выполнить определенную операцию, я хочу, чтобы больница имела лучший показатель успеха для этой операции.
Б) Надежда; поскольку они выполняют меньше операций во всех категориях, они не «счастливы», как Мерси.
В) Надежда; это пример парадокса Симпсона, и мы всегда должны выбирать «очевидный» вывод.
Г) милосердие; Глядя на колонку E, Мерси явно делает более сложные операции, и, вероятно, это лучшая больница.
Е) Надежда; у этого есть лучший общий показатель успеха.
F) Милосердие; это пример парадокса Симпсона, и мы всегда должны выбирать противоположность «очевидного» заключения.
Ответы:
Я думаю, что A и E не очень хорошая комбинация, потому что A говорит, что вы должны выбрать Mercy, а E говорит, что вы должны выбрать Hope.
A и D обладают тем преимуществом, что отстаивают один и тот же выбор. Но давайте рассмотрим линию рассуждений в D более подробно, так как это кажется путаницей. Вероятность успеха хирургических операций следует одинаковому порядку в обеих больницах, при этом тип A наиболее вероятен, а тип E наименее вероятен. Если мы свернемся (то есть проигнорируем) больницы, мы увидим, что предельная вероятность успеха операций:
Поскольку E с гораздо меньшей вероятностью будет успешным, разумно представить, что это более сложно (хотя в реальном мире существуют и другие возможности). Мы можем расширить эту линию мышления и на другие четыре типа. Теперь давайте посмотрим, какая доля всех операций в больнице каждого типа:
Здесь мы замечаем, что Хоуп, как правило, делает больше легких операций АС (и особенно Б и С), и меньше таких тяжелых операций, как Д. Э, довольно редко встречается в обеих больницах, но, как ни крути, Хоуп на самом деле делает более высокий процент. Тем не менее, эффект парадокса Симпсона будет в основном управляться здесь BD (на самом деле это не столбец E, как предлагается вариант ответа D).
Парадокс Симпсона возникает потому, что операции различаются по сложности (в целом), а также потому, что N отличаются. Это разные базовые ставки различных типов операций, что делает это нелогичным. То, что происходит, было бы легко увидеть, если бы обе больницы выполняли одинаковое количество операций каждого типа. Мы можем сделать это, просто вычислив вероятности успеха и умножив на 100; это регулирует для разных частот:
Теперь, потому что обе больницы сделали 100 из каждой операции (всего 500), ответ очевиден: милосердие - лучшая больница.
источник
Ни один из ответов не является абсолютно безосновательным. Но они ВСЕ предполагают значительные внешние знания и не могут быть точными на основании статистики.
A, B, D и E требуют предположений о факторах, побуждающих пациентов выбирать одну больницу из другой; процесс, с помощью которого врачи и пациенты подобраны, степень, в которой показатели успеха связаны с конкретными классами операций в сравнении с общими факторами, такими как ОИТ, и так далее.
В реальном мире мы могли бы на законных основаниях учитывать множество альтернативных факторов, таких как поставщики платежей, которые официально принимает больница, социально-экономические показатели и показатели ожирения в районе, будь то учебная больница (в этом случае показатель успеха падает, когда прибывают новые стажеры, и мы приходится учитывать месячный микс) и так далее.
Очевидно, что мы можем и действительно делать разумные предположения об этих факторах, но без конкретного решения или исключения их из проблемы невозможно сказать, является ли ответ «правильным» или нет.
источник
@ Gung дал очень подробный ответ, но есть еще одна причина, почему D - правильный ответ на вопрос: лучшие больницы делают больше сложных операций, потому что они лучше. То есть, если человек попадает в Больницу Хоуп для операции Е (самая сложная), он может отправить его в Мерси, потому что в Хоуп не знают, как это сделать.
Это даже происходит в реальном мире, когда самые сложные случаи отправляются в более крупные или более специализированные больницы.
источник