Почему 600 из 1000 убедительнее, чем 6 из 10?

41

Взгляните на этот отрывок из «Руководства по обучению», Palgrave, 2012, Стеллы Коттрелл, стр. 155:

Процентное внимание Обратите внимание, когда проценты даны.
Предположим, вместо этого приведенное выше утверждение гласит:

60% людей предпочитали апельсины; 40% сказали, что предпочитают яблоки.

Это выглядит убедительно: числовые величины даны. Но есть разница между 60% и 40% значительным ? Здесь нам нужно знать, сколько людей спросили. Если спросить 1000 человек, из которых 600 предпочитают апельсины, число будет убедительным. Однако, если спросить только 10 человек, 60% просто означает, что 6 человек предпочитают апельсины. «60%» звучит убедительно, а «6 из 10» - нет. Как ответственный читатель, вы должны следить за процентами, используемыми для того, чтобы недостаточное количество данных выглядело впечатляюще.

Как называется эта характеристика в статистике? Я хотел бы прочитать больше об этом.

Juya
источник
38
размер выборки имеет значение
Аксакал
36
Я выбираю двух случайных людей, оба они мужчины, и поэтому я делаю вывод, что 100% американцев - мужчины. Убедить?
Кейси
2
Это принцип «Не сравнивайте яблоки с апельсинами»
волки
2
Чтобы подойти к этому вопросу под другим углом, вы можете изучить литературу об эффекте кадрирования. Однако это пример когнитивной предвзятости и психологическая, а не статистическая тема.
Larx
2
Вы можете представить разницу в 1, насколько это повлияет на расчетное количество. 7/10 намного дальше относительно 6/10, чем 601/1000 от 600/1000.
mathreadler

Ответы:

54

Я хотел бы привести еще один интуитивный пример.

Предположим, я говорю вам, что могу предсказать исход любого броска монеты. Вы не верите и хотите проверить мои способности.

Вы проверили 5 раз, и я все понял правильно. Вы верите, что у меня есть особые способности? Возможно, нет. Потому что я могу получить их все случайно. ( В частности, предположим , что монета является справедливой монеты, и каждый эксперимент не зависит, то я могу получить все права с , не сверхдержава. Знакомства Shufflepants в ссылку на шутку об этом).0.550.03

С другой стороны, если вы проверяли меня много раз, то вряд ли я смогу получить его случайно. Например, если вы тестировали раз, вероятность того, что я все правильно составляет .0,5 10001000.51000


Статистическая концепция называется статистической силой, из Википейды

Сила теста бинарной гипотезы заключается в вероятности того, что тест правильно отвергает нулевую гипотезу (H0), когда альтернативная гипотеза (H1) верна.

Возвращаясь к примеру о сверхдержаве при подбрасывании монет, по сути, вы хотите запустить проверку гипотез.

  • Нулевая гипотеза (H0): у меня нет сверхдержавы
  • Альтернативная гипотеза (H1): у меня есть супер сила

Теперь, как вы можете видеть в числовом примере (проверьте меня 5 раз против 100 раз), статистическая мощность зависит от размера выборки.

Больше читать здесь . (более технический и основанный на t-тесте).

Интерактивный инструмент для понимания статистической силы можно найти здесь . Обратите внимание, статистическая мощность изменяется с размером выборки!

введите описание изображения здесь

Haitao Du
источник
24
Обязательный XKCD
Shufflepants
5
Это на самом деле не отвечает на вопрос. Вопрос состоит из двух частей: «Почему [это] более убедительно…» и «Как эта характеристика называется в статистике?» Вы предоставили пример, который спрашивает читателя, убедили ли его больше в этом примере, но вы не объяснили феномен и не попытались объяснить, почему он более убедителен (просто полагаясь на интуитивные рассуждения читателя на одном примере). Кроме того, вы не затронули второй вопрос: если вы считаете, что у этого явления нет названия, то прямо укажите это.
Макьен
1
@Mayken Это просто попытка ответа. Это не самый лучший ответ, и это не полный ответ, но частичные или сократические ответы не являются основанием утверждать, что это вообще не ответ. Вопросы должны задавать один вопрос, и если они задают ряд вопросов, я думаю, что вполне разумно (если не идеально), чтобы ответить только на некоторые из них. Если вы чувствуете, что это плохой ответ, вы, безусловно, можете решать проблемы, которые вы видите как проблемы. [В этом отношении я не думаю, что также ответил на второй вопрос; Я только обсудил эффект; не каждое явление будет иметь явное название]
Glen_b
1
Я не могу помочь, но чувствую, что 100% - это особый случай, и этот ответ не поддерживает мою интуицию о том, что 600/1000 более убедительно, чем 6/10. Даже если мы примем это не как особый случай, это, по сути, просто решение проблемы с другим процентом.
NotThatGuy
2
@Juya это веб-инструмент, созданный кем-то. Вы можете попробовать это здесь
Haitao Du
29

Думайте об этом с точки зрения пропорций. Скажем, предпочтение апельсина - это успех, а предпочтение яблоку - неудача. Таким образом, ваш средний показатель успеха равен или в этом случае .6μ=# of sucessesn

Стандартная ошибка этой величины оценивается как . Для небольшого размера выборки (т. 10) стандартная ошибка составляет но для размера выборки 1000 стандартная ошибка составляет . Так что, как было отмечено в комментариях, «размер выборки имеет значение»..155.0155μ(1μ)n.155.0155

Райан Хонеа
источник
17

Эта концепция является следствием закона больших чисел . Из Википедии ,

Согласно закону, среднее значение результатов, полученных в ходе большого числа испытаний, должно быть близко к ожидаемому значению, и будет стремиться стать ближе к нему по мере выполнения большего количества испытаний.

Результаты от небольшой выборки могут быть дальше от ожидаемого значения, чем от большей выборки. Итак, как указано в вопросе, следует быть осторожным с результатами, рассчитанными на небольших выборках. Идея также хорошо объяснена в этом видео на YouTube .

Эван Фиббс
источник
5
Есть несколько известных теорем, известных в статистике как «законы больших чисел», но ни одна из них не делает утверждений, похожих на те, которые обсуждаются в этом вопросе. Как тогда вы устанавливаете связь?
whuber
3
Из википедии en.wikipedia.org/wiki/Law_of_large_numbers : «Согласно закону, среднее значение результатов, полученных в большом количестве испытаний, должно быть близко к ожидаемому значению, и будет иметь тенденцию становиться ближе по мере выполнения большего количества испытаний» , Результаты от небольшой выборки могут быть дальше от ожидаемого значения, чем от большей выборки. Итак, как указано в вопросе, следует быть осторожным с результатами, рассчитанными на небольших выборках.
Эван Фиббс
6
Это хорошее объяснение, спасибо. Хотя вы правы, написав, что нужно быть осторожным с тем, сколько нужно «большого количества судебных процессов», чтобы закон можно было доверять, приложение интуитивно понятно. Я хотел бы предположить, что ваше объяснение относится к вашему ответу, где оно будет более широко прочитано и оценено, а не похоронено в комментарии. Ответы только для ссылок (например, ваша ссылка на Youtube) без объяснения здесь не длятся.
whuber
6

Мы находимся в ситуации оценки количества популяции по количеству выборки. В этом случае мы используем выборочные пропорции для оценки пропорций населения, но этот принцип значительно более общий.

10101

Поскольку мы берем все большие и большие выборки (используя случайную выборку), средние значения выборки будут иметь тенденцию сходиться к среднему значению совокупности. (Это закон больших чисел.)

Однако, что мы действительно хотим иметь некоторое представление о том, как далеко мы можем быть (например, могут быть представлены шириной доверительного интервала для пропорции или пределом погрешности, который обычно составляет половину такой ширины) ,

120

1n

В результате мы более уверены в точности нашей оценки, когда выборка велика - если мы повторим наш эксперимент снова, другие подобные средства будут близки к текущему - они все более плотно объединяются, и поскольку (в данном случае) наша оценка объективна, они объединяются вокруг значений, которые мы пытаемся оценить. Одиночное среднее значение становится все более информативным о том, где может быть среднее значение популяции.

Glen_b - Восстановить Монику
источник
4

Практическое правило для «подсчета» статистики, например подсчета количества людей, которым нравятся апельсины, или подсчета количества «щелчков» в счетчике Гейгера из-за радиоактивного затухания, заключается в том, что погрешность для подсчета примерно равна квадрату Корень ожидаемого значения счета. Подсчет статистики известен как статистика Пуассона.

Квадратный корень из 6 равен 2,4, поэтому допустимая погрешность составляет около 40% (2,4 / 6). Квадратный корень из 600 равен 24, поэтому допустимая погрешность составляет около 4% (24/600). Вот почему подсчет 600 более важен, чем подсчет 6. Относительная ошибка составляет одну десятую.

Я немного неаккуратен в определении погрешности. Это действительно значение 1-сигма, и оно не является жестким отсечением, но это диапазон, в котором вы ожидаете, что большинство (68%) измерений будет лежать. Таким образом, если вы ожидаете 6 едоков апельсина, вы ожидаете, что ряд опросов даст вам в основном цифры в диапазоне от 4 до 8, например, 6,6,5,6,7,2,4,6,3,5,6, 6,7,6,10,8,6,5,6,6,9,3,7,8.

Марк Лаката
источник
3

У меня нет имени, которое вы ищете, но проблема не является статистической. Психологически то, как люди обрабатывают числа в нашем мозге, придает больший вес (авторитет) большим числам, чем меньшим, потому что величина (физический размер) визуально так же важна, как и репрезентативная ценность. Таким образом, 600/1000 кажется более достоверным, чем 6/10. Вот почему покупатели предпочитают видеть скидку 10%! для значений меньше 100 и «Сэкономьте 10 долларов!» для значений свыше 100 (называется «Правило 100»). Это о том, как наш мозг реагирует на восприятие.

Удивительный взгляд на этот и другие виды явлений обсуждает Ник Коленда в своем онлайн-трактате « Огромное руководство по психологии ценообразования ».

JBH
источник
2
Хотя другие ответы не являются неправильными, я не вижу их на самом деле правильно, обращаясь к цитируемому тексту, как это. В тексте рассматривается влияние представления чисел и предполагаемой точности, а не на то, являются ли цифры на самом деле более точными. То есть вы можете заставить человека осознать, что ваша информация более значима, говоря, что 600 из 1000 или 60%, или вы можете сделать это, кажется менее значимым, если говорить 6 из 10, хотя каждый из них означает одно и то же, подразумевая меньшую выборку. размер без фактического указания или, возможно, правда.
17
1
Этот пример кажется в корне ошибочным, на мой взгляд. Например, покупка 100 получает скидку 10% на общую сумму 90, в то время как покупка 100.01 получает скидку 25 на общую сумму 75,01, в результате чего получается совершенно другая цена. На самом деле есть разница в значениях, пока вы не получите 250.05 (или 250.10 в зависимости от округления или усечения). Вопрос говорит о размере выборки и стандартной ошибке, а ваш пример больше о реальной разнице из-за нашего восприятия.
Джо У
@ Joe W, хотя я не могу говорить об особенностях «правила 100» (не будучи психологом), мой ответ заключается в том, что психологи определили, что люди доверяют большему числу людей, а не из-за большего размер выборки, который он представляет, но из-за восприятия большего значения, придаваемого большему числу. Как инженер, я бы предпочел, чтобы так не было - но так работает человеческий разум. Если вы хотите оспорить это, я бы рекомендовал прочитать основные детали презентации г-на Коленда.
JBH
Вы упускаете мою точку зрения, разница в 10% к 100 и 25 больше, это не просто вопрос восприятия. Простой факт состоит в том, что если вы взяли оба значения равными 100, разница в 15% будет гораздо проще измерить, чем стандартная ошибка, если говорить о двух разных выборках, одной из 10 и одной из 1000.
Joe W
Я изменил свой вопрос, чтобы использовать 10% и 10 долларов, чтобы помочь вам. Смысл «правила 100» состоит в том, что люди воспринимают большие числа как имеющие большее значение и считают денежную стоимость более важной, чем просто процент. Это вопрос, выходящий за рамки обсуждения для целей ФП.
JBH
3

Хотя фактическая погрешность важна, причина, по которой она звучит более убедительно, заключается в более эвристическом (эмпирическом) опыте с людьми. Фактическая погрешность подтверждает, что эта эвристика имеет свои достоинства.

Если выборка 6 для и 4 против, это может быть 50/50, если один человек меняет свой голос, или один человек был записан по ошибке. На шестой стороне только два человека. Все знают два хлопья, все знают, что образец может быть собран вишней: вы спрашивали только официанток, и больше никого. Или вы только опросили 10 профессоров колледжей в залах университета. Или вы спросили 10 богатых людей за пределами Saks Fifth Avenue.

Даже математическая погрешность предполагает истинную случайность и не учитывает предвзятость выбора, предвзятость самоотбора или что-либо еще, люди могут интуитивно понять это.

Напротив, результат 600 против 400 имеет на 200 человек больше с одной стороны, чем с другой, и 100 человек должны изменить свое мнение. Эти цифры очень трудно найти (но не невозможно) из-за какой-то случайности того, где вы опрашивали, как вы заставляли людей соглашаться, как люди понимали или интерпретировали вопрос и т. Д.

Это более убедительно не из-за математического доказательства того, что так должно быть, а потому, что из опыта мы знаем, что толпы из 1000 гораздо более склонны к разным мнениям (по любому вопросу), чем группа из 10 человек (если вы не сделали этого тайно). ваш опрос на съезде политической партии или митинг ККК или что-то еще, что может привлечь одностороннюю толпу).

Математика точно определяет только то, что мы уже знаем интуицией; что случайным образом набрать один или два случайных голоса из 10 легче, чем случайным образом набрать 100 или 200 случайных голосов из 1000.

Amadeus-восстановило-Моника
источник
3

Что-то, что не было упомянуто, должно смотреть на проблему с байесовской точки зрения.

pp

pBeta(α,β)no|pBin(n,p).

β=αβ=α=1pU(0,1)

nnona=nno

p

p|no,naBeta(no+1,na+1).

pno/(no+na)n

no=6na=4

задний с n_o = 6 и n_a = 4

no=600na=400введите описание изображения здесь

p=0.4p=0.8

Обратите внимание, что хотя эти графики похожи на david25272, они представляют собой нечто совершенно иное .

pno

nop

Лука Чити
источник
2

Краткий ответ:

По сути, более убедительно иметь 600 из 1000, чем шесть из 10, потому что при равных предпочтениях вероятность того, что 6 из 10 произойдет случайно , гораздо выше.

Давайте сделаем предположение - что доля тех, кто предпочитает апельсины и яблоки, на самом деле равна (то есть 50% каждый). Назовите это нулевой гипотезой. Учитывая эти равные вероятности, вероятность двух результатов:

  • Учитывая выборку из 10 человек, есть 38% вероятности случайного получения выборки из 6 или более людей, которые предпочитают апельсины (что не так уж и маловероятно).
  • При выборке из 1000 человек вероятность того, что 600 или более из 1000 человек предпочитают апельсины, составляет менее 1 на миллиард .

(Для простоты я предполагаю бесконечную популяцию, из которой можно брать неограниченное количество образцов).


Простой вывод

Один из способов получить этот результат - просто перечислить потенциальные способы объединения людей в наших примерах:

Для десяти человек это просто:

Подумайте о том, чтобы выбрать 10 случайных людей из бесконечной популяции людей с одинаковыми предпочтениями в отношении яблок или апельсинов. При одинаковых предпочтениях легко перечислить все возможные комбинации из 10 человек:

Вот полный список.

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r - это число результатов (люди, которые предпочитают апельсины), C - количество возможных способов того, что многие люди предпочитают апельсины, и p - итоговая вероятность того, что многие люди предпочитают апельсины в нашей выборке.

(p - это просто C, деленное на общее количество комбинаций. Обратите внимание, что существует 1024 способа упорядочения этих двух предпочтений в целом (т.е. от 2 до степени 10).

  • Например, есть только один способ (один образец) для 10 человек (r = 10), чтобы все предпочитали апельсины. То же самое верно для всех людей, предпочитающих яблоки (r = 0).
  • Есть 10 различных комбинаций, в результате чего девять из них предпочитают апельсины. (Один и тот же человек предпочитает яблоки в каждом образце).
  • Есть 45 образцов (комбинаций), где 2 человека предпочитают яблоки и т. Д. И т. Д.

(В общем, мы говорим о n C r комбинациях результатов r из выборки из n человек. Существуют онлайн-калькуляторы, которые можно использовать для проверки этих чисел.)

Этот список позволяет нам дать нам вероятности выше, используя только деление. Существует 21% шансов получить 6 человек в выборке, которые предпочитают апельсины (210 из 1024 комбинаций). Шанс получить шесть или более человек в нашей выборке составляет 38% (сумма всех выборок с шестью или более людьми или 386 из 1024 комбинаций).

Графически вероятности выглядят так:

биномиальный размер выборки 10

С увеличением числа число потенциальных комбинаций быстро растет.

Для выборок всего из 20 человек существует 1 048 576 возможных образцов, причем все с равной вероятностью. (Примечание: я показал только каждую вторую комбинацию ниже).

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

Есть еще только один образец, где все 20 человек предпочитают апельсины. Комбинации, которые показывают смешанные результаты, гораздо более вероятны, просто потому, что существует гораздо больше способов объединения людей в выборках.

Смещенные образцы гораздо более маловероятны, просто потому что есть меньше комбинаций людей, которые могут привести к этим образцам:

Если в каждой выборке всего 20 человек, совокупная вероятность того, что 60% или более (12 или более) человек в нашей выборке предпочитают апельсины, снижается до 25%.

Распределение вероятностей становится все тоньше и выше:

биномиальный размер выборки 20

С 1000 человек цифры огромны

Мы можем распространить приведенные выше примеры на более крупные выборки (но числа растут слишком быстро, чтобы можно было перечислить все комбинации), вместо этого я вычислил вероятности в R:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

Совокупная вероятность того, что 600 или более из 1000 человек предпочитают апельсины, составляет всего 1,364232e-10.

Распределение вероятностей теперь намного более сконцентрировано вокруг центра:

[биноминальная выборка размером 1000 [3]

(Например, для расчета вероятности 600 из 1000 человек, предпочитающих апельсины при использовании R, dbinom(600, 1000, prob=0.5)это равно 4,633908e-11, а вероятность 600 или более человек 1-pbinom(599, 1000, prob=0.5)равна 1,364232e-10 (менее 1 на миллиард).

david25272
источник
1

Это потому, что большее число обеспечивает большую точность. Например, если вы выберете 1000 случайных людей из любой точки планеты, и 599 из них - мужчины против 10 случайных людей с 6 мужчинами, первое будет более точным. Точно так же, если вы предположите, что население составляет 7 миллиардов человек, и рассчитаете число мужчин, вы получите более точное число, которое, очевидно, будет более убедительным, чем при наличии только 1000 человек.

зет
источник