Статистика и большие данные

9
Почему мои модели VAR работают лучше с нестационарными данными, чем со стационарными данными?

Я использую библиотеку python statsmodels VAR для моделирования данных финансовых временных рядов, и некоторые результаты меня озадачили. Я знаю, что модели VAR предполагают, что данные временного ряда являются стационарными. Я непреднамеренно подбираю нестационарную серию журнальных цен для двух...

9
На самом деле это нормально, чтобы выполнить неконтролируемый выбор функции перед перекрестной проверкой?

В «Элементах статистического обучения» я нашел следующее утверждение: Существует одна квалификация: начальные неконтролируемые этапы скрининга могут быть выполнены до того, как образцы будут опущены. Например, мы могли бы выбрать 1000 предикторов с наибольшей дисперсией во всех 50 выборках перед...

9
Каковы последствия наличия непостоянной дисперсии в терминах ошибки в линейной регрессии?

Одно из предположений о линейной регрессии состоит в том, что должна быть постоянная дисперсия в терминах ошибок и что доверительные интервалы и проверки гипотез, связанные с моделью, основаны на этом предположении. Что именно происходит, когда члены ошибки не имеют постоянной...

9
Неквадратные изображения для классификации изображений

У меня есть набор данных с широкими изображениями: 1760x128. Я читал учебники и книги, и в большинстве из них утверждается, что входные изображения должны быть квадратными, а если нет, то они преобразуются в квадратные, чтобы их можно было обучить уже обученным (на квадратных изображениях) cnns....

9
Пример того, как байесовская статистика может оценивать параметры, которые очень сложно оценить с помощью частых методов

Байесовские статистики утверждают, что «Байесовская статистика может оценивать параметры, которые очень сложно оценить с помощью частых методов». Означает ли следующая цитата, взятая из этой документации SAS, то же самое? Он обеспечивает выводы, которые зависят от данных и являются точными, не...

9
Предположения наименьших квадратов

Предположим следующую линейную зависимость: , где - зависимая переменная, - одна независимая переменная, а - термин ошибки.Y i X i u iYi=β0+β1Xi+uiYi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_iYiYiY_iXiXiX_iuiuiu_i Согласно Stock & Watson (Введение в эконометрику; глава 4 ), третье...

9
Как применить Softmax в качестве функции активации в многослойном Perceptron в scikit-learn? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 11 месяцев назад . Мне нужно применить функцию активации Softmax к многослойному Perceptron в Scikit. Документация...

9
Применение стохастического вариационного вывода к байесовской смеси Гаусса

Я пытаюсь реализовать модель гауссовой смеси со стохастическим вариационным выводом, следуя этой статье . Это программа гауссовой смеси. Согласно статье, полный алгоритм стохастического вариационного вывода: И я все еще очень запутался в методе масштабирования до GMM. Во-первых, я думал, что...

9
Левая и правая номенклатура в регрессионных моделях

y=β0+β1x1+ε0y=β0+β1x1+ε0y = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0} Язык для описания регрессионных моделей, таких как очень простая линейная регрессия, указанная выше, часто варьируется, и такие вариации часто несут тонкие сдвиги в значениях. Например, часть модели в левой части уравнения...

9
Сомнения в выводе уравнений регрессии гауссовского процесса в статье

Я читаю этот препринт и испытываю трудности с выводом уравнений для регрессии гауссовского процесса. Они используют настройки и обозначения Расмуссена и Уильямса . Таким образом, аддитивный, с нулевым средним, стационарный и нормально распределенный шум с дисперсией...

9
Размер образцов начальной загрузки

Я изучаю начальную загрузку как средство оценки дисперсии выборочной статистики. У меня есть одно основное сомнение. Цитата из http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Сколько наблюдений мы должны пересчитать? Хорошее предложение - оригинальный размер выборки. Как...

9
В чем разница между многообразным обучением и нелинейным уменьшением размерности?

В чем разница между многообразным обучением и нелинейным уменьшением размерности ? Я видел эти два термина взаимозаменяемо. Например: http://www.cs.cornell.edu/~kilian/research/manifold/manifold.html : Изучение многообразия (часто также называемое нелинейным уменьшением размерности) преследует цель...

9
Модель смешанных эффектов со сплайнами

Я подгоняю модель со смешанными эффектами сплайн-термином в приложении, где известно, что тренд во времени является криволинейным. Тем не менее, я хотел бы оценить, происходит ли криволинейный тренд из-за индивидуального отклонения от линейности, или это эффект на уровне группы, который делает...

9
Выбор функций с использованием глубокого обучения?

Я хочу рассчитать важность каждой входной функции, используя глубокую модель. Но я нашел только одну статью о выборе функций с использованием глубокого обучения - глубокий выбор функций . Они вставляют слой узлов, связанных с каждым объектом, непосредственно перед первым скрытым слоем. Я слышал,...

9
Многомерная линейная регрессия с лассо по r

Я пытаюсь создать сокращенную модель для прогнозирования многих зависимых переменных (DV) (~ 450), которые сильно коррелированы. Мои независимые переменные (IV) также многочисленны (~ 2000) и сильно коррелированы. Если я использую лассо, чтобы выбрать сокращенную модель для каждого выходного...

9
Как мне подойти к этой проблеме бинарного предсказания?

У меня есть набор данных в следующем формате. Есть бинарный исход рак / нет рака. Каждый врач в наборе данных осмотрел каждого пациента и дал независимое суждение о том, есть ли у пациента рак или нет. Затем врачи дают из 5 уровень уверенности в том, что их диагноз верен, а уровень достоверности...

9
Градиенты для скипграмм word2vec

Я изучаю проблемы письменных заданий в классе глубокого обучения Стэнфордского НЛП http://cs224d.stanford.edu/assignment1/assignment1_soln Я пытаюсь понять ответ для 3а, где они ищут производную от вектора для центрального слова. Предположим, вам дан вектор предсказанного слова соответствующий...

9
Связь между MLE и наименьшими квадратами в случае линейной регрессии

Хасти и Тибширани упоминают в разделе 4.3.2 своей книги, что в случае линейной регрессии подход наименьших квадратов фактически является частным случаем максимальной вероятности. Как мы можем доказать этот результат? PS: не жалейте математических...

9
Небольшое несоответствие между встроенной функцией R Крускала-Уоллиса и ручным расчетом

Меня смущает следующее, и я не смог найти ответ в другом месте. Я пытаюсь изучить R, выполняя некоторую статистику, и, в качестве упражнения, я пытаюсь перепроверить результаты встроенных функций R, также делая их «вручную», как это было в R. Однако , для теста Крускала-Уоллиса я продолжаю получать...

9
Понимание топологии LSTM

Как и многие другие, я обнаружил, что ресурсы здесь и здесь чрезвычайно полезны для понимания ячеек LSTM. Я уверен, что понимаю, как значения обновляются и обновляются, и я достаточно уверен, чтобы добавить упомянутые «глазковые соединения» и т. Д. В моем примере у меня на каждом шаге времени есть...