Я не знаю, только ли это я, но я очень скептически отношусь к статистике в целом. Я могу понять это в играх в кости, в покер и т. Д. Очень маленькие, простые, в основном автономные повторяющиеся игры - это хорошо. Например, приземление монеты на своем краю достаточно мало, чтобы принять вероятность того, что приземляющиеся головы или хвосты составляют ~ 50%.
Играть в покер на $ 10 с целью выиграть 95% - это хорошо. Но что, если все ваши сбережения и многое другое зависит от того, выиграете вы или нет? Как мне поможет знание о том, что вы выиграете в 95% случаев в такой ситуации? Ожидаемая стоимость не очень помогает там.
Другие примеры включают опасную для жизни операцию. Как это помогает узнать, что выживаемость составляет 51%, а выживаемость - 99% с учетом существующих данных? В обоих случаях я не думаю, что для меня будет иметь значение то, что говорит мне доктор, и я бы пошел на это. Если фактические данные составляют 75%, он мог бы также сказать мне (исключая этику и закон), что есть шанс выживания на 99,9999%, поэтому я чувствую себя лучше. Другими словами, существующие данные не имеют значения, кроме как биномиально. Даже тогда, не имеет значения, есть ли коэффициент выживания 99,9999%, если я в конечном итоге умираю от этого.
Также вероятность землетрясения. Не имеет значения, произошло ли сильное землетрясение каждые х (где х> 100) лет в среднем. Я понятия не имею, случится ли когда-нибудь землетрясение в моей жизни. Так почему же это даже полезная информация?
Менее серьезный пример, скажем, 100% мест, где я был, которые я люблю, находятся в Америке, равнодушны к 100% мест, где я был в Европе, и ненавижу 100% мест, которые у меня есть. был в Азии. Теперь, это ни в коем случае не означает, что я не найду места, которое я люблю в Азии в своей следующей поездке, или ненавижу в Европе, или равнодушного в Америке, просто по той самой природе, что статистика не охватывает всю информацию, которую я ну, и я, вероятно, никогда не смогу собрать всю необходимую мне информацию, даже если бы я путешествовал более чем на x% всех этих континентов. Просто потому, что на 1-х% тех континентов, где я не был, есть неизвестные. (Не стесняйтесь заменить 100% любым другим процентом).
Я понимаю, что нет никакого способа грубой силы всем и что вы должны полагаться на статистику во многих ситуациях, но как мы можем верить, что статистика полезна в нашей ситуации с одним выстрелом, особенно когда статистика в основном не экстраполирует на посторонние события?
Любые идеи, чтобы преодолеть мой скептицизм статистики?
источник
Ответы:
Во-первых, я думаю, что вы можете ввести в заблуждение «статистику», означающую набор цифр или других фактов, описывающих группу или ситуацию, и «статистику», означающую науку об использовании данных и информации для понимания мира перед лицом изменчивости (другие могут быть в состоянии улучшить мои определения). Статистики используют оба значения этого слова, поэтому неудивительно, когда люди смешивают их.
Статистика (наука) - это много о выборе стратегий и выборе лучшей стратегии, даже если мы применяем ее только один раз. Иногда, когда я (и другие) учу вероятности, мы используем классическую задачу Монти Холла (3 двери, 2 козы, 1 машина), чтобы мотивировать ее, и мы показываем, как мы можем оценить вероятности, играя в игру кучу раз (не за призы). ) и мы видим, что стратегия «переключения» выигрывает 2/3 времени, а стратегия «пребывания» - только 1/3 времени. Теперь, если бы у нас была возможность сыграть в игру один раз, мы бы знали кое-что о том, какая стратегия дает больше шансов на победу.
Пример операции аналогичен, у вас будет операция только (или не будет), но вы не хотите знать, какая стратегия приносит пользу большему количеству людей? Если ваш выбор - операция с вероятностью более 0% выживаемости или без операции и 0% выживаемости, тогда да, есть небольшая разница между хирургией, имеющей 51% выживаемости и 99,9% выживаемости. Но что, если есть и другие варианты, вы можете выбрать между хирургическим вмешательством, бездействием (с 25% выживанием) или изменением диеты и упражнениями с 75% выживанием (но требующим усилий с вашей стороны), нет Вас волнует, если вариант хирургии имеет выживаемость 51% против 99%?
Также подумайте о докторе, он будет делать больше, чем просто ваша операция. Если хирургия имеет выживаемость 99,9%, то у него нет оснований рассматривать альтернативы, но если она выживает только на 51%, тогда, хотя сегодня это может быть лучшим выбором, он должен искать другие альтернативы, которые увеличивают эту выживаемость. Да, даже при выживании на 90% он потеряет некоторых пациентов, но какая стратегия дает ему лучший шанс спасти большинство пациентов?
Этим утром я пристегнул ремень безопасности во время вождения (моя обычная стратегия), но не попал в аварию, так что моя стратегия была пустой тратой времени? Если бы я знал, когда попаду в аварию, я мог бы сэкономить время, надевая только ремень безопасности в тех случаях, а не в других. Но я не знаю, когда я попаду в аварию, поэтому я буду придерживаться своей стратегии пристегивания ремней безопасности, потому что я верю, что это даст мне наилучший шанс, если я когда-нибудь попаду в аварию, даже если это означает потерю времени. и усилия в большом проценте (мы надеемся, в 100%) случаев, когда нет несчастных случаев.
источник
Тот факт, что вы не используете статистику в своей повседневной жизни, не означает, что поле не оказывает на вас непосредственного влияния. Когда вы находитесь у врача, и они рекомендуют одно лечение по сравнению с другим, вы можете поспорить, что за этой рекомендацией было много клинических испытаний, которые использовали статистику для интерпретации результатов своих экспериментов.
Оказывается, концепция ожидаемой стоимости также очень полезна, даже если вы не используете эту концепцию лично. Ваш пример ставок на ваши сбережения не учитывает, насколько вы неблагоприятны для риска. Другие ситуации могут оказаться менее рискованными, или если нет катастрофических результатов. Бизнес, финансы, актуарный контекст и другие примеры тому. Возможно, вы выдаете полис страхования жилья - тогда внезапное знание вероятности землетрясения, произошедшего в течение определенного периода времени, имеет большое значение.
В конце концов, статистика - отличный способ справиться с неопределенностью. В своем последнем примере вы составили некоторые данные о местах, которые вам нравятся, и заявили, что статистика скажет, что вы никогда не найдете в Азии места, которое вам нравится. Это просто неправильно. Конечно, эти данные заставят вас поверить, что в Азии менее вероятно, что у вас есть место, которое вам понравится, но вы можете установить свое прежнее убеждение на то, что вам нравится, и статистика покажет вам, как обновить свое убеждение с учетом новых данных. Кроме того, это позволяет вам изменить свое убеждение принципиальным образом, что позволит вам действовать рационально в присутствии неопределенности.
источник
Мир стохастический, а не детерминированный. Если бы это было детерминистическим, физики управляли бы миром, а статистики были бы без работы. Но реальность такова, что статистики востребованы практически во всех дисциплинах. Это не означает, что для физики и других наук нет места, но статистика работает рука об руку с наукой и является основой для многих научных открытий.
Достаточно болтовни и вплоть до специфики. Последние 17 лет я работал в медицинской промышленности, сначала в медицинских устройствах, затем в фармацевтике, а теперь в общих медицинских исследованиях. Лекарства и медицинские приборы, которые улучшают качество жизни и часто спасают или продлевают жизнь, регулярно разрабатываются и утверждаются в этой стране и во всем мире. В США одобрение требует доказательств безопасности и эффективности, прежде чем FDA разрешит продавать лекарство или медицинское устройство. Доказательства FDA поступают из клинических испытаний поэтапно. Все клинические испытания требуют достоверного статистического дизайна и методов анализа. Ничто не идеально. Наркотики хорошо работают для некоторых людей, в то время как другие могут не реагировать или иметь побочные эффекты (плохие реакции, которые могут вызвать болезнь или смерть). Испытания отделяют неэффективные лекарства от эффективных. Большинство лекарств терпят неудачу, и часто существует десятилетний цикл от ранней стадии разработки до конца фазы III с одобрением и маркетингом в конце испытания. Затем применяется постмаркетинговый надзор, который также требует статистики, чтобы убедиться, что препарат работает достаточно хорошо для населения в целом. Иногда общая популяция, для которой одобрен препарат, является менее строгой группой, чем пациенты, которые имели право на участие в клинических испытаниях. Поэтому иногда наркотики оказываются опасными и их вытаскивают с рынка. Статистика помогает во всех аспектах безопасности лекарств. Затем применяется постмаркетинговый надзор, который также требует статистики, чтобы убедиться, что препарат работает достаточно хорошо для населения в целом. Иногда общая популяция, для которой одобрен препарат, является менее строгой группой, чем пациенты, которые имели право на участие в клинических испытаниях. Поэтому иногда наркотики оказываются опасными и их вытаскивают с рынка. Статистика помогает во всех аспектах безопасности лекарств. Затем применяется постмаркетинговый надзор, который также требует статистики, чтобы убедиться, что препарат работает достаточно хорошо для населения в целом. Иногда общая популяция, для которой одобрен препарат, является менее строгой группой, чем пациенты, которые имели право на участие в клинических испытаниях. Поэтому иногда наркотики оказываются опасными и их вытаскивают с рынка. Статистика помогает во всех аспектах безопасности лекарств.
Статистика не идеальна. Мы живем с некоторыми ошибками из-за случайности и неопределенности. Но это контролируется, и наша жизнь улучшается, а ошибки уменьшаются по сравнению с тем, чем они были бы, если бы статистическая наука не участвовала.
источник
Я сам сомневаюсь в полезности вероятности и статистики, когда дело доходит до принятия решения об одном событии. По моему мнению, знание вероятности, реальной или предполагаемой, чрезвычайно важно, когда целью является оценка результатов выборок, будь то одно событие, повторенное несколько раз, или выборка, полученная из определенной группы населения. Короче говоря, зная вероятность, имеет больше смысла для казино, которое на основе расчетов вероятности может установить правила, гарантирующие, что он выиграет в долгосрочной перспективе (после многих игр), а не для игрока, который притворяется, что играет один раз, поэтому он победит или проиграет (это результаты, если эксперимент проводится один раз). Это также важно для генералов, которые планируют отправить своих солдат в бой с риском (вероятностью) потерять 10% из них, но не для определенного солдата (скажем, Джона), который только умрет или выживет. Подобных примеров в реальной жизни очень много.
Я хочу подчеркнуть, что вероятности и статистика не только полезны в реальной жизни, но, точнее, они являются инструментом для всех современных научных исследований и правил принятия решений. Однако неверно утверждать, что рациональность подразумевает, что для оценки результата полагается на вероятность одного события без намерения или возможности его повторения. Тенденция вероятности повлиять на решение определенного человека, основанная на его или его степени неприятия риска, очевидно, субъективна. Предотвращенный риск и любитель риска имеют разные отношения (решения) к одной и той же лотерее (одна и та же ожидаемая ценность).
источник
Короче говоря, вероятность - это уникальное обобщение обычной истинной / ложной логики на степени убежденности между 0 и 1. Это так называемая логическая байесовская интерпретация вероятности, созданная Р. Т. Коксом и позже защищаемая Э. Т. Джейнс.
Кроме того, при слабых допущениях можно показать, что правильный способ упорядочить неопределенные результаты по предпочтениям - это упорядочить их по ожидаемой полезности, при этом ожидаемое значение принимается относительно распределения вероятностей по результатам.
См. Роберт Клемен, «Принятие жестких решений», для ознакомления и ознакомления с прикладным анализом решений, основанным на байесовской вероятности и ожидаемой полезности.
Вы абсолютно правы, если скептически относитесь к обычной статистике по частоте; по замыслу его изобретателей (Р. А. Фишер, Дж. Нейман, Э. Пирсон) оно ограничено повторяющимися событиями. Но многие повседневные проблемы не связаны с повторяющимися событиями. Что делать? Типичный подход - это некоторая комбинация вбивания квадратных колышков в круглые отверстия и перемещения ворот. Стыдно, правда.
источник
Я скептически отношусь к статистике по следующим причинам.
Я убежден, что никто, не имеющий ученой степени в области статистики, понятия не имеет, что он делает. Unf. миллионы людей по всему миру проводят исследования, не имея ученой степени в области статистики. Я был студентом по математике в колледже Университета Мэриленда, Парк. Я взял 4 400 уроков по математике. Все, что делали учителя, это научили вас, как правильно вычислять вещи. Никто не учил меня, как осмысливать что-либо или делать какой-либо статистический анализ, кроме проверки гипотез, которая не имеет смысла по двум причинам.
1. Для каждого теста на гипотезы, которому меня учили, мне приходилось делать предположения заранее. Никто не учил меня, с каких предположений я должен был начать. 2. Значения P не имеют смысла логически. Степень бакалавра в области статистики может научить вас, что значение на самом деле является. Тем не менее, я убежден, что ни один студент не знает, как его использовать. Определение бакалавриата предполагает вероятность чего-то, что зависит от правильности гипотезы. Логично, что определение не имеет никакого смысла вообще. Еще хуже, никто никогда не говорил мне, откуда такая вероятность. Я на самом деле написал почти весь мой математический отдел (более 200 человек), если кто-нибудь может дать мне ответ. Самыми популярными и единственными ответами были: «Нужно было бы предположить, что вероятность ошибок равна вероятности» (Когда я спрашивал людей, как это было сделано, они все отвечали мне ».
То же самое произошло, когда я гуглил значение значимости ap. Это приводит меня к выводу ...
Даже вздох. Многие преподаватели математики и статистики не имеют ни малейшего представления о том, какова логика статистики. Я не ожидаю, что люди будут иметь глубокие знания. Однако у меня такое ощущение, что даже вздохнул. % исследователей и преподавателей не понимают какой-либо логики, лежащей в основе статистики.
Статистическая ошибка - это не то же самое, что фактическая ошибка. Поскольку людям нравится использовать статистику для получения оценок для огромных вещей, людям нравится использовать статистическую ошибку, чтобы «замаскировать» тот факт, что они понятия не имеют, что такое фактическая ошибка.
Люди используют небольшие выборки для больших групп населения, потому что статистическая теория говорит им, что они могут. На одном из моих курсов в колледже я узнал, что людям нравится использовать данные, которые были оценены примерно 30 школами страны, чтобы показать, что в школах по всей стране мало случаев насилия. Есть около 100 000 школ. Это звучит безумно. Целое популярное движение основано на 30 школах по всей стране.
Людям нравится делать бремя доказывания статистическим. Босс Хиггса так и не был обнаружен. Это было обнаружено статистически, но это ничего не значит. То, что обнаруживается чисто статистически, бесполезно, потому что никто не знает точности статистики.
Людям нравится использовать статистику для принятия важных решений. Статистику можно использовать в качестве ориентира, но никто не знает, насколько она точна. Тот факт, что проблема кажется невозможной для решения, не означает, что статистика является следующей лучшей вещью. Тот факт, что тестирование ДНК основано на статистике, вызывает у меня озноб. Могу ли я получить смертную казнь только из-за статистики? Может ли убийца быть освобожден из тюрьмы Соли из-за статистики?
Я считаю, что статистика может быть полезной, но только если она не используется в качестве заключения. Я считаю, что статистика может сказать нам, каковы некоторые из возможностей. Тогда логика, а не статистическая логика должна использоваться, чтобы доказать, какая возможность (ы) является правильной.
источник