Джон Керрич Монета-флип Данные

12

Кто-нибудь может подсказать, где можно получить результаты 10000 монетных бросков (то есть всех 10000 голов и хвостов), выполненных Джоном Керричем во время Второй мировой войны?

Томас
источник
1
Учитывая, что в то время он был заперт в нацистской тюрьме, мне интересно, хватило ли у него бумаги, чтобы записать все результаты по 10 тыс., Или он действительно только записал итоговые значения.
Corone
6
Результаты @Corone 10K можно легко записать на одном стандартном листе бумаги, используя, скажем, точку и штрих-код (как в и ||||..|....||.|..||.т. Д.). Это может быть сжато, используя (например) шестнадцатеричный. В предыдущем примере, пусть |будет 1 и .0, шестнадцатеричное представление f21a6. Написав маленькие, но видимые символы, я могу легко разместить 50 таких символов в одной строке и 50 строк на листе, таким образом представляя последовательность из 50 * 50 * 4 = 10K результатов.
whuber
2
@whuber хаха, да, я начал размышлять о подобных вещах после моего комментария. Я сомневаюсь, что в до-компьютерную эпоху на ум пришло бы шестнадцатеричное, как сейчас, хотя восьмеричное все-таки даст вам шанс. Тем не менее, я попробовал, и только по точкам и тире я мог получить более 100 на листе, так что, если бы он использовал обе стороны, 10К подходил бы. Может быть, поэтому он остановился на 10K!
Corone
Нацистская тюрьма, да, но в Дании это был не лагерь уничтожения ...
kjetil b halvorsen
@kjetilbhalvorsen - фактически датский тюремный лагерь в Хальде с датскими охранниками и т. д., чтобы защитить интернированных от немцев
Генри

Ответы:

13

Я не слышал о Керриче раньше - какая странная история. Сканирование книги Google (предоставленное reftt) «Экспериментального введения в теорию вероятностей», по-видимому, не включает основной текст. Чувствуя себя немного старомодным, я проверил копию издания 1950 года из библиотеки.

Я отсканировал несколько страниц, которые мне показались интересными. На страницах описываются условия его испытаний, данные первых 2000 монетных бросков и данные первых 500 из серии 5000 экспериментов с урнами, звучащими в равной степени неправдоподобно (с 2 красными и 2 зелеными шарами для пинг-понга).


Распознавание текста (и некоторая очистка) с использованием Mathematica 9 дает эту последовательность из 2000 хвостов (0) и головок (1) из Таблицы 1. Число головок 1014 на единицу больше, чем 502 + 511 = 1013 в Таблице 2, поэтому распознавание было несовершенный, но выглядит довольно хорошо - по крайней мере, он получил правильное количество символов! (Острым читателям предлагается исправить это.)

Вот графическое резюме этой случайной прогулки, а затем сами данные. Накопленная разница между подсчетом головы и хвоста происходит слева направо, охватывая все 2000 результатов.

фигура

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111
Билл Брэдли
источник
3
Пожалуйста. Я наложил график этих данных на ваше отсканированное изображение, надеясь, что это сделает очевидными любые расхождения, но я вообще не могу найти никаких отличий. Либо ошибок нет, и Керрич ошибся в подсчете, либо я просто не могу найти ошибку, но в любом случае данные, представленные здесь, являются точным текстовым отображением его Таблицы 1.
whuber
4

Эта презентация показывает данные для заданных интервалов бросков. Он также ссылается на первоисточник из Kerrich.


источник
2
Источником (сводных) данных в этой презентации является Freedman, Pisani & Purves Statistics (любое издание). Это, однако, только резюме, а не отчет обо всех результатах, запрошенных здесь. Керрич опубликовал свои результаты в 1946 году в небольшой книге; Google оцифровал его .
whuber
Как я уже сказал, в нем есть данные для «интервалов бросков», и в презентации упоминается монография Керрича, где он опубликовал свои результаты. Я не знаю, опубликовал ли Керрич свой список всех бросков. Понял, что это было по крайней мере более полезным, чем просто общая пропорция.
@whuber: да, это была монография, упомянутая в презентации. кажется, ограниченная доступность. кто-нибудь нашел PDF?
2

В книге «Случайные встречи: первый курс по анализу и выводу данных» есть еще одно упоминание Керрича, написанное Крисом Уайлдом и Джорджем Себером, в котором в 4-й главе (можно загрузить приложение на этой странице ) говорится, что данные опубликованы в «Керрич» [1964] и Фридман [1991, табл. 1, с. 248]. Книга Керриха, вероятно, является экспериментальным введением в теорию вероятностей , а Фридман - это тот же учебник, который уже упоминался. Я сомневаюсь, что монография 1964 года содержала бы больше данных, чем монография 1946 года.

reftt
источник
2

Эту книгу Керрича можно купить подержанной у Амазонки, но указанная цена довольно жесткая!

Лучшим вариантом является https://openlibrary.org.
Вам необходимо создать там учетную запись, а затем установить Adobe Digital Editions для чтения книги. (кажется, что никакая другая программа не подойдет, загруженная книга имеет DRM, управление цифровыми ограничениями). Затем вы можете скачать («одолжить») книгу. Я читаю это только сейчас. Я думаю, что могу взять экранную копию страниц с результатами и использовать ocr для этого. Для последующего ...

(Нет, я быстро просмотрел книгу, кажется, что только первые 2000 бросков даны по отдельности, но есть много разных таблиц с кратким описанием бросков. Есть также таблицы для некоторых других экспериментов, таких как рисование шариков из урны в том же духе.

Къетил б Халворсен
источник
3
Не ясно, заметили ли вы, что первые 2000 отдельных результатов уже доступны в этой теме в ответе Билла Брэдли . Книга появляется в книгах Google; Я предоставил ссылку в другом комментарии . В настоящее время Google ссылается на других книготорговцев, помимо Amazon, где указанная цена (включая доставку) значительно дешевле.
whuber
Спасибо, я отмечал 2000 бросков, где это было доступно выше, но надеялся, что смогу найти больше в самой книге. Кажется нет. Я не могу читать книгу через Google Книги, может быть, этот доступ зависит от географии? Кстати, теперь я вернул кредит из openlibrary, чтобы другие могли попробовать ...
kjetil b halvorsen
1
Я попытался сделать то же самое, когда появилась эта тема, с такими же отрицательными результатами. :-( Я не хотел сказать, что мы на самом деле можем прочитать версию в книгах Google: она только для поиска. Основная ценность ГБ (по крайней мере, до изменения политики Google) заключается в предоставлении ссылок на места, где мы могли бы ее купить.
whuber
1

Я сталкивался с этим, когда делал некоторые предварительные исследования Керриха. Я взял данные из ответа Билла Брэдли - действительно ценю, что данные были оцифрованы! Я добавил данные в пакет R, который я использую для обучения, который доступен на GitHub .

Крис Пренер
источник