У меня есть опыт работы в области компьютерного программирования и теории элементарных чисел, но я не изучал реальную статистику, и недавно «обнаружил», что удивительный мир целого ряда методов на самом деле является статистическим миром. Кажется, что матричные факторизации, матричное пополнение, многомерные тензоры, вложения, оценка плотности, байесовский вывод, марковские разбиения, вычисления по собственным векторам, PageRank - все это высоко статистические методы, и что алгоритмы машинного обучения, использующие такие вещи, используют много статистики ,
Моя цель - иметь возможность читать статьи, в которых обсуждаются такие вещи, а также реализовывать или создавать алгоритмы, понимая при этом обозначения, «доказательства» и используемые статистические аргументы. Полагаю, самое сложное - это следовать всем доказательствам, связанным с матрицами.
Какие основные документы могут помочь мне начать? Или хороший учебник с упражнениями, которые стоит пройти?
В частности, некоторые статьи, которые я хотел бы полностью понять:
- Завершение точной матрицы с помощью выпуклой оптимизации, Candes, Recht, 2008
- Быстрое преобразование Коши и быстрая робастная линейная регрессия, Clarkson et al, 2013
- Случайные проекции для машин опорных векторов, Пол и др., 2013
- Высокомерная оценка вероятности с использованием моделей с большой плотностью, Rippel, Adams, 2013
- Получение оценок, минимизирующих ошибки, и универсальных оценок ошибок при вводе для заполнения матрицы низкого ранга, Király, Theran, 2013
источник
Ответы:
Я бы порекомендовал курс машинного обучения Эндрю Нгса на Coursera, он блестяще освещает все основы. Если вы изучаете что-либо, связанное с вероятностными графическими моделями, было бы неплохо взглянуть на курс Дафни Коллерс.
Это также сокровищница для ресурсов для самостоятельного изучения http://ragle.sanukcode.net/articles/machine-learning-self-study-resources/ Лекции Херба Гроссмана потрясающие.
Мне также порекомендовали эту книгу https://www.openintro.org/stat/textbook.php, так как я все еще учусь сам, и статистика не является моей историей!
Мои два цента - математическая сторона вещей и бумаг, хотя я не слишком увлечен второстепенной математикой. Изучите основы и ознакомьтесь с документами, на которых построены упомянутые вами документы, и увидите, что они легче (возможно, вам придется вернуться к нескольким статьям, чтобы получить что-то, что вы можете понять - это то, что я делаю сам), есть много различные элементы математики в ML, и легко засосать кроличью нору (опять-таки, я сам это делал не раз!).
Желаем удачи, это действительно интересное поле!
источник