Крошечные (реальные) наборы данных для примеров в классе?

43

Преподавая уроки начального уровня, учителя, которых я знаю, склонны придумывать цифры и рассказы, чтобы проиллюстрировать метод, которому они учат.

Я бы предпочел рассказать реальную историю с реальными числами. Однако эти истории должны относиться к очень крошечному набору данных, который позволяет выполнять ручные вычисления.

Любые предложения по таким наборам данных будут приветствоваться.

Некоторые примеры тем для крошечных наборов данных:

  • корреляция / регрессия (базовая)
  • ANOVA (1/2 пути)
  • z / t тесты - один / два непарных образца
  • сравнение пропорций - двухсторонние таблицы
Tal Galili
источник
Вы можете определить «крошечный»? Включает ли «ручной» расчет использование калькулятора?
Дэвид Лебауэр
Привет, Дэвид - калькулятор в порядке - но идея состоит в том, чтобы не иметь слишком много цифр (поскольку все они должны быть написаны на доске)
Тал Галили

Ответы:

26

Библиотека данных и историй представляет собой «онлайн-библиотеку файлов данных и историй, иллюстрирующих использование основных методов статистики».

Этот сайт, кажется, имеет то, что вам нужно, и вы можете искать его для определенных наборов данных.

Дэвид
источник
Привет, Дэвид! Сайт, на который ты ссылаешься, действительно хорош - спасибо.
Тал Галили
Сервис в настоящее время недоступен (по состоянию на апрель 2016 года)
Фелипе Алмейда
@FelipeAlmeida Я только что зашел на сайт; пожалуйста, проверьте еще раз, возможно, на другом компьютере / устройстве
David LeBauer
@DavidLeBauer вы пытались нажать на «список всех тем» и затем выбрать один из методов? смотрите эту ссылку здесь
Фелипе Алмейда
1
@FelipeAlmeida я вижу. Я говорил с сопровождающим сайта, который говорит: «Ищите новый, более современный и гораздо лучший DASL, который скоро появится на dasl.datadesk.com».
Дэвид Лебауэр
23

Есть книга под названием «Справочник малых наборов данных», написанная DJ Hand, F. Daly, AD Lunn, KJ McConway и E. Ostrowski. Статистический отдел NCSU разместил в электронном виде наборы данных из этой книги здесь .

Сайт выше дает только данные; вам нужно будет прочитать книгу, чтобы получить историю за цифрами, то есть любую историю, выходящую за рамки того, что вы можете почерпнуть из заголовка набора данных. Но они маленькие , и они настоящие .

user1108
источник
Это просто правильный размер. Вы можете просмотреть книгу, выполнив поиск в «Справочнике по небольшим наборам данных» в Google scholar - вы можете просмотреть ее части в книгах Google.
Фелипе Алмейда
Данная ссылка не работает. Пожалуйста, обновите ссылку. Спасибо
MYaseen208
13

Для двухсторонних таблиц мне нравятся данные о поле и выживании титановых пассажиров:

       | Alive  Dead | Total
-------+-------------+------
Female | 308    154  |  462
Male   | 142    709  |  851
-------+-------------+------
Total  | 450    863  | 1313

С помощью этих данных можно обсудить такие вещи, как критерий хи-квадрат на независимость и показатель ассоциации, такие как относительный коэффициент и отношение шансов. Например, пассажиры женского пола выжили в ~ 4 раза чаще, чем пассажиры мужского пола. В то же время у пассажиров мужского пола вероятность умереть была в 2,5 раза выше, чем у женщин. Отношение шансов для выживания / смерти всегда 10, хотя.

Wolfgang
источник
Хорошая идея, Вольфганг, я не думал об этом.
Тал Галили
(Опубликовать вики сообщества в соответствии со всеми остальными ответами.)
Glen_b
6

CAUSEweb имеет наборы данных, а также множество других учебных ресурсов.

См. Http://www.causeweb.org/resources/datasets/ для наборов данных.

ПРИЧИНА выступает за Консорциум для улучшения образования студентов бакалавриата.

Аарон - Восстановить Монику
источник
4

Вероятно, такой очевидный ответ, что его не нужно упоминать, но для корреляции или линейной регрессии квартет Анскомба является логичным выбором. Хотя это и не настоящая история с реальными данными, я думаю, что это такой простой пример, который вполне вписался бы в ваши критерии.

Энди У
источник
Хороший пример Энди - сегодня я узнал что-то новое :)
Тал Галили
2

Хорошая статья под названием Resource Discovery for Teaching Statistics пролила свет на эту тему.

MYaseen208
источник
Только что закончил читать большую часть статьи (я просмотрел несколько частей) - это действительно хороший обзор ситуации. Будет интересно посмотреть, как это будет развиваться в будущем ...
Таль Галили
2
Возможно ли, вы могли бы добавить ключевые моменты здесь, или дать резюме? Ссылка может в какой-то момент оборваться, и это также поможет читателям узнать, хотят ли они продолжать ссылку, не нажимая на нее.
gung - Восстановить Монику
1

https://tuvalabs.com

Я уверен, что вы уже давно нашли то, что искали, но для всех, кто сталкивался с вопросом - TuvaLabs - хороший источник для наборов данных для Классных комнат. Он курирует наборы данных, историю, описание, небольшие упражнения и возможности визуализации, а также вы можете запрашивать наборы данных на нем.

мутант
источник