Книга для широкого и концептуального обзора статистических методов

12

Меня очень интересует потенциал статистического анализа для моделирования / прогнозирования / оценки функций и т. Д.

Тем не менее, я не знаю много об этом, и мои математические знания все еще весьма ограничены - я младший студент в области разработки программного обеспечения.

Я ищу книгу, которая поможет мне начать с некоторых вещей, о которых я продолжаю читать: линейная регрессия и другие виды регрессии, байесовские методы, методы Монте-Карло, машинное обучение и т. Д. Я также хочу начать с R, так что если была книга, которая объединила и то, и другое.

Желательно, чтобы я хотел, чтобы книга содержала концептуальное объяснение, а не слишком много технических деталей - я бы хотел, чтобы статистика была для меня очень интуитивной, потому что я понимаю, что в статистике очень много рискованных ошибок.

Я, конечно, готов читать больше книг, чтобы улучшить мое понимание тем, которые я считаю ценными.

Жером Ле Шателье
источник

Ответы:

11
  • Может быть, вы хотели бы что-то вроде анализа данных и графики с использованием R: примерный подход Джона Майндональда и У. Джона Брауна

    • Сайт для книги
    • Amazon с разными отзывами
    • Я рекомендую это, потому что книга помечает несколько ваших ящиков; это учит немного R; он дает обзор ряда различных методов моделирования (например, множественная регрессия, временные ряды, графики, обобщенная линейная модель и т. д.), не вдаваясь в подробности математики; это справедливо применяется.
  • Я согласен с @Greg Snow, что вам, возможно, будет лучше подумать о том, чтобы прочитать несколько разных книг. Для каждой упомянутой вами темы (например, байесовская статистика, временные ряды, моделирование, R, машинное обучение) есть хорошие книги, посвященные этой конкретной теме. Вы можете задать отдельные вопросы о том, что будет хорошей книгой, учитывая ваши конкретные интересы в этой теме.

  • Хорошие свободно доступные онлайн варианты

    • «Элементы статистического обучения» - отличная книга, которая доступна бесплатно онлайн. Из вашего поста я понял, что на первый взгляд он может быть немного более техническим, чем вы хотите, но посмотрите на него и посмотрите, что вы думаете. Может быть, вы будете готовы к этому сейчас; может быть позже.
    • Экологические модели и данные Бенджамина Болкера в R - еще один хороший пример . Это с точки зрения экологии, но действительно объясняет моделирование и подгонку модели с относительно нетехнической точки зрения; и все это реализовано в R. Вы можете увидеть весь его код R на сайте. Вы даже можете увидеть документы Sweave, использованные для создания книги!
    • Есть хороший список бесплатной документации R по CRAN, причем некоторые документы также содержат более широкие инструкции по статистике.
Джером англим
источник
5

Одна книга, включающая все эти темы, будет довольно впечатляющей, и, вероятно, будет весить больше, чем вы. Это все равно что просить одну книгу, которая учит основам программирования, C, Java, Perl и расширенному проектированию баз данных в одной книге (на самом деле, вероятно, больше, но я не знаю достаточно терминов, порождающих программное обеспечение, чтобы добавить некоторые более продвинутые) ,

Сама регрессия обычно представляет собой, по крайней мере, полный курс колледжа, байесовская статистика требует одного или двух теоретических курсов, прежде чем перейти на байесовский курс, чтобы полностью понять и т. Д.

Нет быстрого и легкого пути к тому, что вы пытаетесь сделать. Я бы посоветовал пройти хорошие курсы в вашем университете и работать там.

Были и другие обсуждения хороших книг, которые вы можете посмотреть на некоторые идеи.

Грег Сноу
источник
Спасибо за ваш ответ. Тем не менее, я не пытаюсь понять все обо всем из одной книги, но, читая, скажем, 50 страниц о регрессии определенно очень помогли бы мне получить хоть какое-то разумное понимание этого предмета ...
Жером Ле Шателье
5

Для комбинации R со многими описанными вами методами, в дополнение к тексту Майндональда и Брауна, упомянутому @Jeromy Anglim, я бы посоветовал вам взглянуть на эти две книги Джулиана Фаравея:

Оба имеют достаточно простые введения в различные темы, последний охватывает широкий спектр более современных подходов к регрессии, включая многие методы машинного обучения, но делает это в более быстром темпе с меньшим количеством описания, и оба иллюстрируют методы с помощью кода R.

Вы можете получить код в разделе « Книги» на веб-сайте R, чтобы получить скидку в 20% на RRP, если вы покупаете напрямую у Chapman & Hall / CRC Press, но проверяете цену Amazon или аналогичную для своего региона, так как часто сокращение на Amazon является конкурентоспособным. с ценой издателя после скидки.

Одно из преимуществ этой пары книг состоит в том, что они дают вам хорошее представление о современных методах с достаточным количеством деталей, чтобы затем изучить области, которые вы хотите более подробно, с помощью более специализированных текстов.

Часть контента, который вошел в эти книги, доступна в онлайн-формате PDF Джулианом через раздел « Внесенные документы » на веб-сайте R. Я призываю вас просмотреть этот раздел, чтобы узнать, есть ли другие документы, которые могут помочь вам начать работу без необходимости выкладывать деньги. Ранняя версия текста, который превратился в первое издание текста Майндональда и Брауна, также может быть найдена в этом разделе.

Восстановить Монику - Дж. Симпсон
источник
3

Ну, если вы хотите обзор большинства статистических методов, и R для них код, вы можете не ошибетесь с Винейблесом и Рипли современной прикладной статистики в S .

Его лаконичный, понятный и достаточно R-код, чтобы вы могли начать практически любую статистическую тему, которую вы хотите назвать.

Я купил эту книгу и был осторожен в отношении цены к количеству страниц, но это стоило вложений. Они предполагают исчисление и линейную алгебру, но, учитывая, что вы инженер, это не должно быть слишком большой проблемой.

Их S-программирование также прекрасно, но, вероятно, не то, что вы ищете прямо сейчас.

richiemorrisroe
источник
2

Элементы статистического обучения могут быть немного пугающими для начинающих. Я бы порекомендовал прочитать « Введение в статистическое обучение с приложениями в R », которое можно бесплатно скачать здесь -> http://www-bcf.usc.edu/~gareth/ISL/. Также были разработаны примеры в R в конце каждой главы.

« Машинное обучение: алгоритмическая перспектива » Стивена Марсленда также охватывает более широкий круг тем, не вдаваясь в математику.

Siddhesh
источник
1

Предыдущие ответы имеют много на стороне приложения вещей. Что касается концептуального материала и хорошего статистического мышления, я бы порекомендовал Теорию вероятности: логика науки Эдвина Джейнса. Первые три главы доступны бесплатно здесь

Это не имеет большого отношения к компьютерным программам, так что прикладная сторона вещей находится на более стилизованных проблемах. Имеет блестящую главу о парадоксах теории вероятностей, с одним исключением, в «маргинализация парадокс», который правильно решен здесь (хотя Джейнс по существу «получает урок» в том , что неправильное до должно быть пределом последовательности собственных априорных) ,

probabilityislogic
источник
2
Я сам любил эту книгу, но я не уверен, что это то место, где можно начать пытаться построить интуицию для статистики. Это довольно полемический и своеобразный текст.
Бен Лодердейл
1

Все предложения, сделанные до сих пор, превосходны, но сфокусированы на самых передовых и сложных методах с использованием программного обеспечения R. Для превосходного и интуитивно понятного обзора классических многомерных методов, лежащих в основе для самых современных подходов, включая регрессию, ANOVA, факторный анализ, кластерный анализ, дискриминантный анализ, анализ таблиц сопряженности и анализ структурных уравнений, многовариантность Диллона и Гольдштейна Статистика, опубликованная Wiley в 80-х годах, остается классической. Он понятен и применяется в своих примерах, не будучи чрезмерно теоретическим или привязанным к программному обеспечению.

Диллон и Гольдштейн - книга, которую я бы порекомендовал всем, кто хочет понять, откуда появились современные методы машинного обучения.

Майк Хантер
источник
0

Поваренная книга R - отличный способ перейти в R и начать изучать, как ее использовать. Это очень практично, поэтому отлично подходит для изучения языка, но вам также стоит поискать хорошую книгу по теории.

Zach
источник