Какую самую влиятельную книгу должен прочитать каждый статистик?

77

Если бы вы могли вернуться в прошлое и сказать себе, что в начале своей карьеры в качестве статистика вы прочитаете конкретную книгу, то какой это будет книга?

Нил Макгиган
источник
1
Здесь действительно три отдельных вопроса! 1) Какая самая влиятельная книга по статистике; 2) какую книгу должен прочитать каждый статистик; 3) Какую книгу вы прочитали, которую вы больше всего хотели бы прочитать намного раньше. (2) и (3) вероятно имеют значительное совпадение; (1) может быть совершенно отличным.
OneStop
1
Этот вопрос - еще один способ взглянуть на этот вопрос. Я надеюсь, что это даст хорошее дополнение, как только получит хорошие ответы.
naught101

Ответы:

38

Вот два, чтобы поместить в список:

Тафт. Визуальное отображение количественной информации
Tukey. Исследовательский анализ данных

Роб Хиндман
источник
10
И то, и другое стоит периодического перечитывания, возможно, раз в десять лет, просто чтобы освежить идеи. Что касается Тьюки: замечательно время от времени просто сидеть с карандашом и бумагой и делать глубокий анализ интересного набора данных.
whuber
6
Что касается графики для статистики, я предпочитаю книги Уильяма Кливленда книгам Туфте.
Питер Флом - Восстановить Монику
1
У меня такое чувство, что эти книги предназначались для анализа нелинейных данных, когда нелинейные методы были не так доступны?
Роберт Кубрик
34

Элементы статистического обучения Хасти, Тибширани и Фридмана http://www-stat.stanford.edu/~tibs/ElemStatLearn/ должны быть в библиотеке любого статистика!

робин джирард
источник
6
Я не согласен - это тесно связано с машинным обучением, а не статистикой как таковой !
aL3xa
@ aL3xa: это, безусловно, сфокусировано на машинном обучении ... вот почему я думаю, что статистики должны быть подвержены этому на раннем этапе.
Клифф AB
Очевидно, я в меньшинстве, думая, что эта книга переоценена. Похоже, что он написан для аспирантов, но не заботится о деталях того, как что-то работает.
Лаконичный
25

Я не статистика, и я не так много читал по этой теме, но, возможно,

Чай "Леди Дегустация": как статистика революционизировала науку в двадцатом веке

следует упомянуть? Это не учебник, но все же стоит прочитать.

Виви
источник
1
Я второй это. Кроме того, есть много предложений для дальнейшего чтения, которые я считаю полезными в книге.
Крис Били
1
Я думаю, что эта книга говорит с теми, кто вначале ничего не знал, кроме тупости языка и культурного багажа, связанного с полем. Эта книга дала разуму крылья - она ​​говорит, что статистика - это поиск полезной правды в море шума и недоразумений.
EngrStudent
2
Многие люди сообщают об этом как о развлечении, но в нем много необычных ошибок. Если вы можете найти его, мой обзор в Biometrics 57: 1273-1274 (2001) дает далеко не полный список. (В Сальсбурге смешиваются разные Бернулли, что легче сделать.)
Ник Кокс
21

Теория вероятностей: логика науки

Кристофер Д. Лонг
источник
Эта книга жесткая. Речь идет об основах вероятности, и даже в этой части статистики я не думаю, что это справочный текст. Я верю, что на планете Земля может быть 14 человек, которые прочитали и поняли его полное послание, но я бы, вероятно, классифицировал бы его как обязательное для вероятностников, ради тысяч других, которые глубоко разбираются в вещах, таких как GLM, GAM, Байесовские модели и другие вещи.
средства к значению
1
Также немного грустно, что некоторые из последующих глав отсутствуют и / или недостаточно разработаны - например, нет главы о регрессии, но был доступен черновик неопубликованной рукописи с некоторыми захватывающими сведениями о регрессиях «ошибки измерения». Некоторые очень крутые вещи во временных рядах.
probabilityislogic
21

Даррелл Хафф - Как лгать со статистикой

Rob Hyndman
источник
5
Когда это было за 3,95 доллара, а затем за 4,95 доллара в мягкой обложке, я купил дюжину копий и раздал их друзьям, клиентам и всем, кому это может быть интересно.
whuber
Это заслуженно запомнилось. Но, к сожалению, это нестатистический контент, не в последнюю очередь чрезвычайно большая доля мультфильмов, показывающих курящих людей (и даже детей). 60 с лишним лет, это уже не забавно. (Некоторые перепечатки, например, один в Великобритании обновил мультфильмы.)
Ник Кокс
14

Не книга, но я недавно обнаружил статью Джейкоба Коэна в журнале «Американский психолог» под названием «Вещи, которые я выучил (до сих пор)». Это доступно в формате PDF здесь .

Freya Harrison
источник
Это замечательная статья, написанная в ясном и разговорном стиле Коэна.
richiemorrisroe
12

Давным-давно небольшая монография Джека Кифера «Введение в статистический вывод» раскрыла тайну большого количества классической статистики и помогла мне начать работу с остальной литературой. Я все еще ссылаюсь на это и горячо рекомендую это сильным студентам на курсах второго курса по статистике.

Rob Hyndman
источник
2
Отличная рекомендация, спасибо - я недавно получил копию, основанную на этом, и это действительно неплохо.
АРС
1
Я рад слышать, что кто-то еще ценит эту книгу!
whuber
12

Я бы не стал утверждать, что любую из них следует считать «самой влиятельной книгой ... [для] статистики [с]», но для тех, кто только начинает изучать эту тему, есть две полезные книги:

  1. Роберт Абельсон, Статистика как принципиальный аргумент
  2. Пол Меррелл, Введение в информационные технологии
gung - Восстановить Монику
источник
Абельсон был бы полезен для многих, кто также не только начинает.
Питер Флом - Восстановить Монику
11

Книга Уильяма Кливленда «Элементы отображения данных» или его книга «Визуализация данных»

Роберт Альбертс
источник
1
В настоящее время я читаю «Элементы» (визуализация данных отсутствует в моей текущей школьной библиотеке). В чем разница между элементами и визуализацией данных? Я не смог найти достаточно подробных описаний, чтобы сформулировать разницу между ними.
Энди W
2
Я согласен. Я думаю, что для статистиков Кливленд лучше, чем Туфте.
Питер Флом - Восстановить Монику
3
+1 Роберту Альбертсу и +1 Питеру Флому (книги Кливленда определенно лучше для статистиков, хотя Туфте тоже прекрасны, и я прочитал их все). @AndyW, Elements является вводной, например, в ней есть рекомендации по созданию информативной графики. Визуализация демонстрирует, как сосредоточить процесс исследования данных на графике; он начинается с предварительной визуализации данных, рассказывает о существующих проблемах и проходит весь путь до оценки окончательной модели (например, остаточного анализа) с помощью графики. Последнее гораздо более информативно, чем первое.
gung - Восстановить Монику
@AndyW Один из них немного более технический, чем другой (я забыл, какой именно, хотя!)
Питер Флом - Восстановить Монику
1
Как говорит @gung, Визуализация - более продвинутое продолжение Elements . Есть некоторые совпадения, но это скорее полезно, чем раздражает. Оба настоятельно рекомендуется. Дата последнего пересмотра 1993 и 1994 гг., Но они все еще свежи 20+ лет спустя. Обратите внимание, что нетехнические читатели могли бы получить пользу от обоих: я могу лично подтвердить, что математика в средней школе является достаточным фоном.
Ник Кокс
10

Я думаю, что каждый статистик должен прочитать Стиглера « История статистики: измерение неопределенности до 1900 года».

Это красиво написано, тщательно, и это не точка зрения историка, а точка зрения математика, следовательно, он не избегает технических деталей.

Грэм Куксон
источник
6

Со стороны математики / основ: математические методы статистики Харальда Крамера .

АРС
источник
Кстати, это самое раннее место, где я нашел упоминание о фотографии Крамера. Удивительно, как прекрасный маленький знакомый в этой книге стал известным методом много десятилетий спустя.
Тал Галили
5

Для ясного изложения того, что должно быть в статьях журнала социальных наук (помощь, если вы пишете или рецензируете), мне нравится Руководство рецензента по количественным методам в социальных науках . В частности, мне нравится таблица desideratra как краткий обзор минимума, который должна содержать статья (статья, диссертация, диссертация). Главы разделены методом анализа, что приятно. Я думаю, что книга имеет более широкое применение, чем «просто» социальные науки, поскольку описанные методы используются во многих областях.

Довольно рано, поэтому, возможно, не охваченный этим вопросом, я был ознакомлен с введением Отта к статистическим методам и анализу данных . Это довольно дорого, но это прекрасный ресурс, показывающий основные статистические модели для различных методов GLM. Я мечтаю о том дне, когда журналы должны содержать статьи, показывающие формулу проверенной статистической модели.

Для проверки предположений теста, изучения эффектов различных вариантов в тесте и т. Д. Это единственная книга, которую я хотел бы иметь, когда учился . У меня есть предыдущая версия, и это один из лучших общих ресурсов, которые я приобрел, благодаря четкому и последовательному изложению информации о тестах. Он содержит хорошие примеры, иллюстрирующие тест (ы), и не требует, чтобы у читателя был определенный статистический пакет, чтобы следовать изложениям.

Мишель
источник
4

Обманутый Случайностью Талебом

Талеб - профессор Колумбийского университета и трейдер опционов. В 2008 году он заработал около 800 миллионов долларов, делая ставки против рынка. Он также написал Черный лебедь. Он обсуждает абсурдность использования нормального распределения для моделирования рынков и философствует о нашей способности использовать индукцию.

Neil McGuigan
источник
8
Ужасная книга, написанная кем-то, кто не разбирается в статистике ...
Сиань
4
Сиань, хотите расширить или предоставить ссылки на некоторые критические замечания?
naught101
4
Здесь есть куча комментариев о Черном лебеде (и Талебе в целом) здесь
Питер Флом - Восстановить Монику
4
  1. Статистический вывод Майкла Оукса : комментарий к социальным и поведенческим наукам .
  2. Множественная регрессия Элазар Педазур в поведенческих исследованиях . Если вы можете выдержать огромные детали и самоуверенный тон.

Если вам интересно, я ознакомился как на Amazon, так и на http://www.integrativestatistics.com/fabilities.htm.

rolando2
источник
4

Я прочитал приведенные выше рекомендации и с удивлением обнаружил, что большинство людей, ответивших на вопрос, были люди, которые сами не являются статистиками. С 2 или 3 исключениями ... Как промышленный статистик, который также работал с социологами и медицинскими работниками, я бы сказал, что если бы я мог взять только одну книгу со мной на необитаемый остров, то это был бы Джордж Бокс, статистик для экспериментаторов. (Wiley). В своем неподражаемом юмористическом и ясном стиле он объясняет суть и философию построения математических моделей для реальных данных. Строгое мышление, никакие математические легкомыслия, никакая чепуха не учит нас мыслить статистически, строить и визуализировать все, что вы можете. Шедевр компетентного прикладного ученого (инженер-химик, ставший статистиком). Всегда весело читать снова.

JH
источник
2
Хороший выбор! Его соавтор покойный Уильям Хантер и Дж. Стюарт Хантер также внесли свой вклад в книгу.
Майкл Черник
Первое издание чище и свежее, чем второе. Бокс был отличным статистиком, но в дальнейшем стал плохим корректором.
Ник Кокс,
3

Много хороших книг уже предложено. Но вот другое: «Расчеты с риском» Герда Гигеренцера, потому что понимание того, как статистика влияет на решения, важнее, чем правильная теория. На самом деле грех статистиков номер один не в состоянии ясно общаться. Его книга рассказывает о последствиях плохого общения и о том, как этого избежать.

матовый черный
источник
«Понимание того, как статистика влияет на решения, важнее, чем правильная теория ...» Не правда ли? Я пришел из архитектуры и могу сказать, что иногда теория только мешает ...
naught101
2

Я собираюсь пойти дальше и предложить стандартный учебник в этой области. Я говорю о вероятности и статистике Дегрута и Шервиша, впервые опубликованной в 1975 году.

Эта книга послужила учебником для многих студентов и считается классикой, по праву таковой, на мой взгляд. Он охватывает такие темы, как комбинаторика, распределения, байесовская статистика, вероятностный вывод и регрессионный анализ. Насколько я знаю, ни один другой учебник не является настолько тщательным, поэтому я считаю, что это необходимо.

JohnK
источник
1

Основное руководство по размерам эффектов: статистическая мощь, метаанализ и интерпретация результатов исследований Пол Д. Эллис

Эта книга «обязательна» для всех, кто проводит какие-либо научные исследования, особенно те, которые основаны не на чистой статистике / математике. Книга ниже расширяет первую в отношении доверительных интервалов.

Понимание новой статистики: размеры эффектов, доверительные интервалы и метаанализ Джеффа Камминга

оборота Адам Пзедничек
источник
1

«Самый влиятельный» - это совсем другое понятие, чем «каждый должен читать». Я не квалифицирован, чтобы ответить на первое - вам нужен кто-то, кто является историком статистики - но для второго, вот некоторые:

  1. Статистика как принципиальный аргумент Роберта Абельсона должна быть прочитана любым, кто делает или использует статистику для достижения науки, гуманитарных наук и т. Д.

  2. Две книги Уильяма С. Кливленда по графике: Элементы графического изображения и Визуализация данных . Для статистиков я бы поставил их перед работой даже Tufte, потому что Tufte не стоит, а потому что a) Кливленд писал со статистиками в качестве целевой аудитории и b) Cleveland основывал свои рекомендации на экспериментальных данных о том, как люди смотрят на графики, а не интуиция.

  3. Исследовательский анализ данных Джона Тьюки. Это устаревшее, но ценное - вы можете многое сделать с помощью карандаша, бумаги и мозга (по крайней мере, если ваш мозг так же хорош, как у Тьюки!)

Питер Флом - Восстановить Монику
источник
1

Вероятно, это будет Байесовский анализ данных Гельмана или Deep Learning с Python . Но это немного похоже на прием стрептомицина в средневековье. Они не были написаны, когда я начинал свою карьеру, и многие вещи из книг были бы большими новостями тогда. Хотя некоторые из самых влиятельных вещей, о которых все должны знать, не находятся ни в одном источнике (возможно, они должны быть, но ...)

Бьерн
источник
0

« Руководство по эконометрике» Кеннеди содержит множество практических советов по широкому спектру статистического анализа. Он невероятно насыщен информацией и легко читается, и я все равно узнаю что-то новое каждый раз, когда поднимаю его.

Вводная эконометрика Вулдриджа также содержит множество подобных обсуждений, но в качестве вводного учебника она более самодостаточна. Хотелось бы, чтобы у меня был курс, основанный на этом.

Лаконичный
источник