Вопросы с тегом «machine-learning»

12

Рекомендуемые книги или статьи в качестве введения в кластерный анализ?

Я работаю над небольшим (200 МБ) корпусом текста, который я хочу изучить с помощью некоторого кластерного анализа. Какие книги или статьи на эту тему вы бы порекомендовали?...

machine-learning references clustering

12

Akinator.com и Наивный байесовский классификатор

Контекст: я программист с некоторым (наполовину забытым) опытом в области статистики из университетских курсов. Недавно я наткнулся на http://akinator.com и провел некоторое время, пытаясь заставить его потерпеть неудачу. А кто не был? :) Я решил выяснить, как это может работать. После поиска в...

machine-learning naive-bayes

12

Количество параметров в марковской модели

Я хочу использовать BIC для выбора модели HMM: BIC = -2*logLike + num_of_params * log(num_of_data) Итак, как мне посчитать количество параметров в модели HMM. Рассмотрим простой HMM с двумя состояниями, где у нас есть следующие данные: data = [1 2 1 1 2 2 2 1 2 3 3 2 3 2 1 2 2 3 4 5 5 3 3 2 6 6 5 6...

machine-learning model-comparison bic hidden-markov-model

12

Книга для широкого и концептуального обзора статистических методов

Меня очень интересует потенциал статистического анализа для моделирования / прогнозирования / оценки функций и т. Д. Тем не менее, я не знаю много об этом, и мои математические знания все еще весьма ограничены - я младший студент в области разработки программного обеспечения. Я ищу книгу, которая...

r regression machine-learning references simulation

12

SVM с неравными размерами групп в данных обучения

Я пытаюсь построить SVM из данных обучения, где одна группа представлена больше, чем другая. Тем не менее, группы будут в равной степени представлены в возможных данных испытаний. Поэтому я хотел бы использовать class.weightsпараметр e1071интерфейса пакета R, libsvmчтобы сбалансировать влияние...

r machine-learning svm

12

Какой язык программирования вы рекомендуете для создания прототипа проблемы машинного обучения?

В настоящее время работает в Octave, но из-за плохой документации прогресс очень медленный. Какой язык прост в изучении и использовании и хорошо документирован для решения проблем машинного обучения? Я ищу прототип на небольшом наборе данных (тысячи примеров), поэтому скорость не важна....

r machine-learning matlab software python

12

SVM, переменное взаимодействие и подбор данных обучения

У меня есть 2 общих / более теоретических вопроса. 1) Мне интересно, как SVM обрабатывают переменные взаимодействия при построении прогностических моделей. Например, если у меня есть две функции f1 и f2, а цель зависит от f1, f2 и, скажем, f1 * f2 (или некоторой функции h (f1, f2)), подходит ли SVM...

machine-learning predictive-models svm interaction

12

Прогнозирование нескольких целей или классов?

Предположим, я строю прогностическую модель, в которой я пытаюсь предсказать несколько событий (например, бросок кубика и бросок монеты). Большинство известных мне алгоритмов работают только с одной целью, поэтому мне интересно, существует ли стандартный подход к такого рода вещам. Я вижу два...

machine-learning classification predictive-models multi-class

12

Понимание отсутствия теоремы о бесплатном обеде в Duda et al.

У меня есть несколько вопросов по поводу обозначений, использованных в Разделе 9.2. Отсутствие врожденного превосходства любого классификатора в классификации образцов Дуды, Харта и Аиста . Сначала позвольте мне процитировать некоторый соответствующий текст из книги: Для простоты рассмотрим задачу...

machine-learning

12

Различия между PROC Mixed и lme / lmer в R - степени свободы

Примечание: этот вопрос является репостом, так как мой предыдущий вопрос пришлось удалить по юридическим причинам. Сравнивая PROC MIXED из SAS с функцией lmeиз nlmeпакета в R, я наткнулся на некоторые довольно запутанные различия. Более конкретно, степени свободы в разных тестах различаются между...

r mixed-model sas degrees-of-freedom pdf unbiased-estimator distance-functions functional-data-analysis hellinger time-series outliers c++ relative-risk absolute-risk rare-events regression t-test multiple-regression survival teaching multiple-regression regression self-study t-distribution machine-learning recommender-system self-study binomial standard-deviation data-visualization r predictive-models pearson-r spearman-rho r regression modeling r categorical-data data-visualization ggplot2 many-categories machine-learning cross-validation weka microarray variance sampling monte-carlo regression cross-validation model-selection feature-selection elastic-net distance-functions information-theory r regression mixed-model random-effects-model fixed-effects-model dataset data-mining

12

Мешок слов против модели векторного пространства?

В чем разница между этими моделями представления текста: мешок слов и модель векторного

machine-learning text-mining

12

Что нормы и как они относятся к регуляризации?

В последнее время я видел много статей о разреженных представлениях, и большинство из них используют норму и выполняют некоторую минимизацию. Мой вопрос: что норма и смешанная норма? И как они имеют отношение к регуляризации?ℓ p ℓ p , qℓpℓp\ell_pℓpℓp\ell_pℓp,qℓp,q\ell_{p, q}...

machine-learning regularization sparse

12

Взаимосвязь между количеством векторов поддержки и количеством функций

Я запустил SVM для данного набора данных и сделал следующее наблюдение: если я изменю количество функций для построения классификатора, число результирующих векторов поддержки также будет изменено. Я хотел бы знать, как объяснить такой...

machine-learning classification svm kernel-trick

12

Стратифицированная классификация со случайными лесами (или другой классификатор)

Итак, у меня есть матрица размером около 60 x 1000. Я рассматриваю ее как 60 объектов с 1000 объектов; 60 объектов сгруппированы в 3 класса (a, b, c). 20 предметов в каждом классе, и мы знаем истинную классификацию. Я хотел бы провести обучение под наблюдением на этом наборе из 60 обучающих...

machine-learning classification multilevel-analysis random-forest stratification

12

Какие алгоритмы машинного обучения хороши для оценки того, какие функции важнее?

У меня есть данные с минимальным количеством функций, которые не меняются, и несколькими дополнительными функциями, которые могут измениться и оказать большое влияние на результат. Мой набор данных выглядит так: Особенности: A, B, C (всегда присутствует) и D, E, F, G, H (иногда присутствует) A =...

machine-learning feature-selection

12

Kernelised k Ближайший сосед

Я новичок в ядрах и попал в ловушку при попытке ядра KNN. прелиминарии Я использую ядро с полиномами: K(x,y)=(1+⟨x,y⟩)dK(x,y)=(1+⟨x,y⟩)dK(\mathbf{x},\mathbf{y}) = (1 + \langle \mathbf{x},\mathbf{y} \rangle)^d Ваш типичный евклидов kNN использует следующую метрику расстояния:...

machine-learning kernel-trick k-nearest-neighbour

12

Как совместить результаты логистической регрессии и случайного леса?

Я новичок в машинном обучении. Я применил логистическую регрессию и случайный лес к одному и тому же набору данных. Таким образом, я получаю значение переменной (абсолютный коэффициент для логистической регрессии и значение переменной для случайного леса). Я думаю объединить два, чтобы получить...

machine-learning logistic random-forest

12

Интерпретация результата кластеризации k-средних в R

Я использовал kmeansинструкцию R для выполнения алгоритма k-средних в наборе данных радужной оболочки глаза Андерсона. У меня есть вопрос о некоторых параметрах, которые я получил. Результаты: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 В...

r machine-learning clustering interpretation k-means

12

Первые шаги в обучении для прогнозирования финансовых временных рядов с использованием машинного обучения

Я пытаюсь понять, как использовать машинное обучение для прогнозирования финансовых временных рядов на 1 или более шагов в будущее. У меня есть финансовые временные ряды с некоторыми описательными данными, и я хотел бы сформировать модель и затем использовать модель для прогнозирования n шагов...

r time-series machine-learning random-forest finance

12

Как применять нейронные сети в задачах классификации по нескольким меткам?

Описание: Пусть проблемная область будет классификацией документов, где существует набор векторов признаков, каждый из которых принадлежит одному или нескольким классам. Например, документ doc_1может принадлежать Sportsи Englishкатегориям. Вопрос: Используя нейронную сеть для классификации, какой...

machine-learning neural-networks natural-language multilabel