Это своего рода открытый вопрос, но я хочу быть ясным. При достаточной численности населения вы могли бы чему-то научиться (это открытая часть), но что бы вы ни узнали о своем населении, когда это когда-либо применимо к члену населения?
Из того, что я понимаю в статистике, это никогда не применимо к одному члену населения, однако часто я нахожу себя в дискуссии, где другой человек говорит: «Я читал, что у 10% населения мира есть это заболевание» и продолжаю сделать вывод, что каждый десятый человек в комнате имеет эту болезнь.
Я понимаю, что десять человек в этой комнате - недостаточно большая выборка, чтобы статистика соответствовала действительности, но, видимо, многие из них - нет.
Тогда есть вещь о достаточно больших выборках. Вам нужно только исследовать достаточно большое население, чтобы получить достоверную статистику. Это, правда, не пропорционально сложности статистики? Если я измеряю что-то очень редкое, не значит ли это, что мне нужна гораздо большая выборка, чтобы определить релевантность такой статистики?
Дело в том, что я действительно подвергаю сомнению действительность любой газеты или статьи, когда статистика задействована, так, как она используется для укрепления доверия.
Это немного фона.
Вернемся к вопросу, каким образом вы НЕ можете или НЕ можете использовать статистику для формирования аргумента . Я отрицал вопрос, потому что я хотел бы узнать больше о распространенных заблуждениях относительно статистики.
Ответы:
Чтобы сделать выводы о группе, основанной на населении, группа должна быть представительной для населения и независимой. Другие обсуждали это, поэтому я не буду останавливаться на этом материале.
Еще одна вещь, которую следует учитывать, - неинтуитивность вероятностей. Давайте предположим, что у нас есть группа из 10 человек, которые являются независимыми и репрезентативными для населения (случайная выборка), и что мы знаем, что в популяции 10% имеют определенную характеристику. Поэтому у каждого из 10 человек есть 10% -ный шанс иметь характеристику. Распространенным предположением является то, что достаточно точно, что по крайней мере 1 будет иметь характеристику. Но это простая биноминальная проблема, мы можем вычислить вероятность того, что ни один из 10 не обладает характеристикой, она составляет около 35% (сходится к 1 / е для большей группы / меньшей вероятности), что намного выше, чем может предположить большинство людей. Существует также 26% вероятность того, что 2 или более человек имеют эту характеристику.
источник
Если люди в комнате не являются случайной выборкой населения мира, любые выводы, основанные на статистических данных о населении мира, будут весьма подозрительными. Каждый пятый человек в мире - китаец, но никто из моих пятерых детей не ...
источник
Чтобы обратиться к перерасходу статистики к маленьким выборкам, я рекомендую противостоять известным шуткам («Я так взволнован, моя мама снова беременна, и мой брат и сестра будут китайцами». «Почему?» «Я читал, что каждый четвертый ребенок это китайский. ").
На самом деле, я рекомендую шутки, чтобы устранить всевозможные заблуждения в статистике, см. Http://xkcd.com/552/ для корреляции и причинно-следственной связи.
Проблема с газетными статьями редко заключается в том, что они относятся к редкому явлению.
Парадокс Симпсонов приходит на ум в качестве примера, что статистика редко может использоваться без анализа причин.
источник
Есть интересная статья Мэри Грей о злоупотреблении статистикой в судебных делах и тому подобное ...
Грей, Мэри У .; Статистика и Закон. Математика Магнето 56 (1983), № 2, 67–81
источник
Когда дело доходит до логики и здравого смысла, будьте осторожны, эти два редки. В определенных «дискуссиях» вы можете что-то распознать ...... смысл аргумента - аргумент.
http://www.wired.com/wiredscience/2011/05/the-sad-reason-we-reason/
источник
Статистический анализ или статистические данные?
Я думаю, что этот пример в вашем вопросе относится к статистическим данным: «Я читал, что 10% населения мира имеют эту болезнь». Другими словами, в этом примере кто-то использует цифры, чтобы помочь передать количество более эффективно, чем просто сказать «много людей».
Я думаю, что ответ на ваш вопрос скрыт в мотивации оратора, почему она использует цифры. Это может быть для того, чтобы лучше передать какое-то понятие, или для демонстрации авторитета, или для ослепления слушателя. Хорошая вещь о том, чтобы указывать числа вместо того, чтобы говорить «очень большие», состоит в том, что люди могут опровергать число. Посмотрите идею Поппера об опровержении.
источник
источник
Неправда. Это зависит от приложения.
Пример: ядерный распад в физике. Скорость распада, определяет вероятность распада каждого ядра . Вы берете любое ядро, и оно будет иметь точно такую же вероятность распада, которую вы установили экспериментальным путем на образце.
источник