Вопросы с тегом «machine-learning»

10

Обратная ковариационная матрица против ковариационной матрицы в PCA

В PCA, имеет ли значение, если мы выбираем главные компоненты обратной ковариационной матрицы ИЛИ, если мы отбрасываем собственные векторы ковариационной матрицы, соответствующие большим собственным значениям? Это связано с обсуждением в этом посте...

machine-learning pca computational-statistics

10

Обычно нейронным сетям требуется время, чтобы «включиться» во время тренировки?

Я пытаюсь обучить глубокую нейронную сеть для классификации, используя обратное распространение. В частности, я использую сверточную нейронную сеть для классификации изображений, используя библиотеку Tensor Flow. Во время тренировок я испытываю какое-то странное поведение, и мне просто интересно,...

machine-learning classification neural-networks conv-neural-network tensorflow

10

Почему требуется градиентный спуск?

Когда мы можем дифференцировать функцию стоимости и найти параметры, решая уравнения, полученные посредством частичного дифференцирования по каждому параметру, и выяснить, где функция стоимости минимальна. Также я думаю, что можно найти несколько мест, где производные равны нулю, поэтому мы можем...

machine-learning computational-statistics

10

Можно ли обучить нейронную сеть рисовать картинку в определенном стиле?

Можно ли научить нейронную сеть рисовать картинку в определенном стиле? (Таким образом, он берет изображение и перерисовывает его в стиле, для которого он был обучен.) Есть ли одобренная технология для такого рода вещей? Я знаю об алгоритме DeepArt. Хорошо заполнить основное изображение...

machine-learning neural-networks deep-learning

10

Почему бета-оценка определяет бета как это?

Это бета-оценка F: Fβ= ( 1 + β2) ⋅ р г е с я с я о п ⋅ г е с л л( β2⋅ р т е с я с я о п ) + г е грл лFβзнак равно(1+β2)⋅пресяsяоN⋅ресaLL(β2⋅пресяsяоN)+ресaLLF_\beta = (1 + \beta^2) \cdot \frac{\mathrm{precision} \cdot \mathrm{recall}}{(\beta^2 \cdot \mathrm{precision}) + \mathrm{recall}} В статье...

machine-learning precision-recall model-evaluation

10

Как рассчитать из выборки R в квадрате?

Я знаю, что это, вероятно, обсуждалось где-то еще, но я не смог найти четкого ответа. Я пытаюсь использовать формулу для расчета вне выборки R 2 модели линейной регрессии, где S S R - это сумма квадратов невязок, а S S T - это общая сумма квадратов. Для тренировочного набора ясно,...

regression machine-learning r-squared out-of-sample

10

Графические модели и машины Больцмана связаны математически?

Хотя я фактически занимался программированием на машинах Больцмана в классе физики, я не знаком с их теоретической характеристикой. Напротив, я знаю скромное количество о теории графических моделей (о первых нескольких главах книги Лауритцена « Графические модели» ). Вопрос: Есть ли какая-либо...

machine-learning neural-networks mathematical-statistics graphical-model rbm

10

Разница между нейронной сетью и глубоким обучением

С точки зрения различий между нейронной сетью и глубоким обучением мы можем перечислить несколько элементов, таких как добавление большего количества слоев, массивный набор данных, мощное компьютерное оборудование, чтобы сделать обучение сложной моделью. Помимо этого, есть ли более подробное...

machine-learning neural-networks deep-learning conv-neural-network deep-belief-networks

10

Комплексный анализ, функциональный анализ для более глубокого понимания машинного обучения

Я хочу углубиться в машинное обучение (теория и применение в финансах). Я хочу спросить, насколько важны комплексный анализ и функциональный анализ в качестве основы для машинного обучения? Нужно ли изучать эти предметы или мне нужно сосредоточиться на другой теме (если да, то на...

machine-learning pac-learning

10

Чем обоснован этот расчет производной матричной функции?

В курсе машинного обучения Эндрю Нг он использует следующую формулу: ∇Atr(ABATC)=CAB+CTABT∇Atr(ABATC)=CAB+CTABT\nabla_A tr(ABA^TC) = CAB + C^TAB^T и он делает быстрое доказательство, которое показано ниже:...

machine-learning matrix derivative

10

Как SVM = соответствие шаблона?

Я прочитал о SVM и узнал, что они решают проблему оптимизации, и идея максимальной маржи была очень разумной. Теперь, используя ядра, они могут найти даже нелинейные границы разделения, что было здорово. До сих пор я действительно не представляю, как SVM (специальная машина ядра) и машины ядра...

machine-learning neural-networks svm deep-learning kernel-trick

10

Почему результаты моего случайного леса такие переменные?

Я пытаюсь проверить способность случайного леса классифицировать выборки между 2 группами; Для классификации используются 54 образца и различное количество переменных. Мне было интересно, почему оценки «вне сумки» могут отличаться на 5% друг от друга, даже если я использую 50 000 деревьев? Может ли...

machine-learning random-forest

10

Что имеют в виду статистики, когда говорят, что мы не совсем понимаем, как работает LASSO (регуляризация)?

Недавно я принимал участие в нескольких обсуждениях статистики по Лассо (регуляризация), и постоянно поднимается вопрос: мы не очень понимаем, почему Лассо работает или почему он так хорошо работает. Мне интересно, к чему относится это утверждение. Очевидно, я понимаю, почему Лассо работает...

machine-learning lasso regularization

10

Является ли теорема об относительном контрасте от Beyer et al. статья: «Об удивительном поведении дистанционных метрик в многомерном пространстве» вводит в заблуждение?

Это часто упоминается, когда упоминается проклятие размерности и идет (формула справа называется относительным контрастом) Итd→ ∞вар ( | | Xd| |КЕ[ | | Иксd| |К]) =0,то: DМаксимумКd- DминКdDминКd→ 0Итd→∞вар(||Иксd||КЕ[||Иксd||К])знак равно0,тогда:DМаксимумdК-DминdКDминdК→0 \lim_{d\rightarrow...

machine-learning distance-functions high-dimensional

10

Почему случайные функции Фурье неотрицательны?

Случайные функции Фурье обеспечивают приближение к функциям ядра. Они используются для различных методов ядра, таких как SVM и гауссовские процессы. Сегодня я попытался использовать реализацию TensorFlow и получил отрицательные значения для половины своих функций. Насколько я понимаю, этого не...

machine-learning kernel-smoothing feature-construction tensorflow fourier-transform

10

Когда не использовать перекрестную проверку?

Когда я читаю сайт, большинство ответов показывают, что перекрестная проверка должна выполняться в алгоритмах машинного обучения. Однако, когда я читал книгу «Понимание машинного обучения», я увидел, что есть упражнение, в котором иногда лучше не использовать перекрестную проверку. Я действительно...

machine-learning self-study cross-validation

10

Назначение шума Дирихле в бумаге AlphaZero

В документах DeepMind AlphaGo Zero и AlphaZero они описывают добавление шума Дирихле к предыдущим вероятностям действий от корневого узла (состояния платы) в Поиске дерева Монте-Карло: Дополнительное исследование достигается путем добавления шума Дирихле к предшествующим вероятностям в корневом...

machine-learning neural-networks dirichlet-distribution

10

регрессия гауссовского процесса для больших наборов данных

Я узнал о регрессии гауссовского процесса из онлайн-видео и заметок к лекциям, и я понимаю, что если у нас есть набор данных с точками, то мы предполагаем, что данные взяты из n- мерного многомерного гауссиана. Таким образом, мой вопрос в том случае, если n равно 10 из миллионов, регрессия...

machine-learning probability inference gaussian-process multivariate-regression

10

Имеют ли плотности случайные процессы, такие как процесс Гаусса / процесс Дирихле? Если нет, то как к ним можно применить правило Байеса?

Процесс Дирихле и процесс Гаусса часто называют «распределениями по функциям» или «распределениями по распределениям». В таком случае, могу ли я осмысленно говорить о плотности функции под GP? То есть, есть ли у гауссовского процесса или процесса Дирихле понятие плотности вероятности? Если это не...

machine-learning probability bayesian nonparametric nonparametric-bayes

9

Влияет ли реализация перекрестной проверки на ее результаты?

Как вы знаете, существует два популярных типа перекрестной проверки: K-кратная и случайная субсэмплинг (как описано в Википедии ). Тем не менее, я знаю, что некоторые исследователи делают и публикуют статьи, где нечто, описываемое как K-кратное резюме, действительно является случайным...

machine-learning cross-validation