Меня очень интересует потенциал статистического анализа для моделирования / прогнозирования / оценки функций и т. Д.
Тем не менее, я не знаю много об этом, и мои математические знания все еще весьма ограничены - я младший студент в области разработки программного обеспечения.
Я ищу книгу, которая поможет мне начать с некоторых вещей, о которых я продолжаю читать: линейная регрессия и другие виды регрессии, байесовские методы, методы Монте-Карло, машинное обучение и т. Д. Я также хочу начать с R, так что если была книга, которая объединила и то, и другое.
Желательно, чтобы я хотел, чтобы книга содержала концептуальное объяснение, а не слишком много технических деталей - я бы хотел, чтобы статистика была для меня очень интуитивной, потому что я понимаю, что в статистике очень много рискованных ошибок.
Я, конечно, готов читать больше книг, чтобы улучшить мое понимание тем, которые я считаю ценными.
источник
Для комбинации R со многими описанными вами методами, в дополнение к тексту Майндональда и Брауна, упомянутому @Jeromy Anglim, я бы посоветовал вам взглянуть на эти две книги Джулиана Фаравея:
Оба имеют достаточно простые введения в различные темы, последний охватывает широкий спектр более современных подходов к регрессии, включая многие методы машинного обучения, но делает это в более быстром темпе с меньшим количеством описания, и оба иллюстрируют методы с помощью кода R.
Вы можете получить код в разделе « Книги» на веб-сайте R, чтобы получить скидку в 20% на RRP, если вы покупаете напрямую у Chapman & Hall / CRC Press, но проверяете цену Amazon или аналогичную для своего региона, так как часто сокращение на Amazon является конкурентоспособным. с ценой издателя после скидки.
Одно из преимуществ этой пары книг состоит в том, что они дают вам хорошее представление о современных методах с достаточным количеством деталей, чтобы затем изучить области, которые вы хотите более подробно, с помощью более специализированных текстов.
Часть контента, который вошел в эти книги, доступна в онлайн-формате PDF Джулианом через раздел « Внесенные документы » на веб-сайте R. Я призываю вас просмотреть этот раздел, чтобы узнать, есть ли другие документы, которые могут помочь вам начать работу без необходимости выкладывать деньги. Ранняя версия текста, который превратился в первое издание текста Майндональда и Брауна, также может быть найдена в этом разделе.
источник
Ну, если вы хотите обзор большинства статистических методов, и R для них код, вы можете не ошибетесь с Винейблесом и Рипли современной прикладной статистики в S .
Его лаконичный, понятный и достаточно R-код, чтобы вы могли начать практически любую статистическую тему, которую вы хотите назвать.
Я купил эту книгу и был осторожен в отношении цены к количеству страниц, но это стоило вложений. Они предполагают исчисление и линейную алгебру, но, учитывая, что вы инженер, это не должно быть слишком большой проблемой.
Их S-программирование также прекрасно, но, вероятно, не то, что вы ищете прямо сейчас.
источник
Элементы статистического обучения могут быть немного пугающими для начинающих. Я бы порекомендовал прочитать « Введение в статистическое обучение с приложениями в R », которое можно бесплатно скачать здесь -> http://www-bcf.usc.edu/~gareth/ISL/. Также были разработаны примеры в R в конце каждой главы.
« Машинное обучение: алгоритмическая перспектива » Стивена Марсленда также охватывает более широкий круг тем, не вдаваясь в математику.
источник
Предыдущие ответы имеют много на стороне приложения вещей. Что касается концептуального материала и хорошего статистического мышления, я бы порекомендовал Теорию вероятности: логика науки Эдвина Джейнса. Первые три главы доступны бесплатно здесь
Это не имеет большого отношения к компьютерным программам, так что прикладная сторона вещей находится на более стилизованных проблемах. Имеет блестящую главу о парадоксах теории вероятностей, с одним исключением, в «маргинализация парадокс», который правильно решен здесь (хотя Джейнс по существу «получает урок» в том , что неправильное до должно быть пределом последовательности собственных априорных) ,
источник
Все предложения, сделанные до сих пор, превосходны, но сфокусированы на самых передовых и сложных методах с использованием программного обеспечения R. Для превосходного и интуитивно понятного обзора классических многомерных методов, лежащих в основе для самых современных подходов, включая регрессию, ANOVA, факторный анализ, кластерный анализ, дискриминантный анализ, анализ таблиц сопряженности и анализ структурных уравнений, многовариантность Диллона и Гольдштейна Статистика, опубликованная Wiley в 80-х годах, остается классической. Он понятен и применяется в своих примерах, не будучи чрезмерно теоретическим или привязанным к программному обеспечению.
Диллон и Гольдштейн - книга, которую я бы порекомендовал всем, кто хочет понять, откуда появились современные методы машинного обучения.
источник
Я бы порекомендовал «Анализ временных рядов и его приложения с примерами R» Шумвея и Стоффера.
Третье издание: http://www.stat.pitt.edu/stoffer/tsa3/
Нажмите и купите http://www.amazon.com/Time-Analysis-Its-Applications-Statistics/dp/144197864X/ref=dp_ob_title_bk
источник
Поваренная книга R - отличный способ перейти в R и начать изучать, как ее использовать. Это очень практично, поэтому отлично подходит для изучения языка, но вам также стоит поискать хорошую книгу по теории.
источник