Статистика и большие данные

69
Почему исследователи нейронных сетей заботятся о эпохах?

Эпоха в стохастическом градиентном спуске определяется как один проход данных. Для каждой мини-партии SGD отбирается Кkk выборок, вычисляется градиент и обновляются параметры. В настройках эпохи образцы оформляются без замены. Но это кажется ненужным. Почему бы не нарисовать каждый мини-пакет SGD...

69
Форма доверительного интервала для прогнозируемых значений в линейной регрессии

Я заметил, что доверительный интервал для предсказанных значений в линейной регрессии имеет тенденцию быть узким вокруг среднего значения предиктора, а жирность - вокруг минимального и максимального значений предиктора. Это можно увидеть на графиках этих 4 линейных регрессий: Сначала я думал, что...

69
Как настроить гиперпараметры деревьев xgboost?

У меня есть несбалансированные данные класса, и я хочу настроить гиперпараметры усиленного тресса с помощью xgboost. Вопросов Есть ли эквивалент для gridsearchcv или randomsearchcv для xgboost? Если нет, то каков рекомендуемый подход для настройки параметров xgboost?...

68
Как «сложить» стандартное отклонение?

У меня есть среднемесячное значение и стандартное отклонение, соответствующее этому среднему. Сейчас я вычисляю среднегодовое значение как сумму среднемесячных значений, как я могу представить стандартное отклонение для суммированного среднего значения? Например, учитывая выход из ветровой...

68
Что не так с экстраполяцией?

Я помню, как сидел на курсах статистики как студент, слушавший, почему экстраполяция была плохой идеей. Кроме того, есть множество источников онлайн, которые комментируют это. Там также упоминание о нем здесь . Может кто-нибудь помочь мне понять, почему экстраполяция это плохая идея? Если это так,...

68
Все ли термины взаимодействия нуждаются в отдельных терминах в регрессионной модели?

Я на самом деле рецензирую рукопись, где авторы сравнивают 5-6 моделей логит-регрессии с AIC. Тем не менее, некоторые модели имеют термины взаимодействия без включения отдельных ковариатных терминов. Имеет ли когда-нибудь смысл делать это? Например (не относится к моделям logit): M1: Y = X1 + X2 +...

68
Многофакторная множественная регрессия в R

У меня есть 2 зависимые переменные (DV), на каждую из которых может влиять набор из 7 независимых переменных (IV). DV являются непрерывными, в то время как набор IV состоит из смеси непрерывных и двоично-закодированных переменных. (В коде ниже непрерывные переменные пишутся заглавными буквами, а...

68
Каковы хорошие начальные веса в нейронной сети?

Я только что слышал, что это хорошая идея, чтобы выбрать начальные веса нейронной сети из диапазона , где - это количество входов в данный нейрон. Предполагается, что множества нормализованы - среднее значение 0, дисперсия 1 (не знаю, имеет ли это значение).г( - 1d√, 1d√)(−1d,1d)(\frac{-1}{\sqrt d}...

68
Как сформировать равномерно распределенные точки на поверхности сферы 3-го блока?

Мне интересно, как генерировать равномерно распределенные точки на поверхности 3-й единицы сферы? Кроме того, после генерации этих точек, как лучше всего визуализировать и проверить, являются ли они действительно однородными на поверхности...

68
Нужен ли выбор переменных для прогнозного моделирования в 2016 году?

Этот вопрос был задан в CV несколько лет назад, и кажется, что стоит сделать репост в свете 1) лучшей вычислительной технологии на порядок (например, параллельные вычисления, HPC и т. Д.) И 2) более новой техники, например [3]. Сначала немного контекста. Давайте предположим, что целью является не...

68
Почему я должен быть байесовским, когда моя модель не так?

Редактирование: я добавил простой пример: вывод среднего значения . Я также немного разъяснил, почему достоверные интервалы, не соответствующие доверительным интервалам, являются плохими.XiXiX_i Я, довольно набожный байесовский, нахожусь в разгар своего рода кризиса веры. Моя проблема заключается в...

67
Какую хорошую базовую статистику использовать для порядковых данных?

У меня есть некоторые порядковые данные, полученные из вопросов опроса. В моем случае это ответы в стиле Лайкерта (категорически не согласен-не согласен-нейтрален-согласен-полностью согласен). По моим данным они кодируются как 1-5. Я не думаю, что средства здесь много значат, так что какая основная...

67
Что делает ядро ​​Гаусса таким волшебным для PCA, а также вообще?

Я читал о ядре PCA ( 1 , 2 , 3 ) с гауссовым и полиномиальным ядрами. Как ядро ​​Гаусса, по-видимому, исключительно хорошо разделяет любые нелинейные данные? Пожалуйста, дайте интуитивный анализ, а также, если возможно, математически сложный анализ. Какое свойство ядра Гаусса (с идеальной ),...

67
Как именно статистики согласились использовать (n-1) в качестве несмещенной оценки для дисперсии населения без моделирования?

Формула для вычисления дисперсии имеет в знаменателе:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Я всегда задавался вопросом, почему. Тем не менее, чтение и просмотр нескольких хороших видеофильмов о том, «почему», кажется, является хорошей...

67
Есть ли * математическая * основа для дебатов Байеса против частых?

В Википедии сказано, что: математика [вероятности] в значительной степени не зависит от какой-либо интерпретации вероятности. Вопрос: Тогда, если мы хотим быть математически правильными, не должны ли мы запретить какую-либо интерпретацию вероятности? Т.е. математически неверны и байесовский, и...

67
Правильный способ использования рекуррентной нейронной сети для анализа временных рядов

Рекуррентные нейронные сети отличаются от «обычных» тем, что имеют слой «памяти». Благодаря этому слою рекуррентные NN должны быть полезны при моделировании временных рядов. Тем не менее, я не уверен, что правильно понимаю, как их использовать. Допустим, у меня есть следующие временные ряды (слева...

67
40000 нейробиологических работ могут быть ошибочными

Я видел эту статью в «Экономисте» о, казалось бы, разрушительной работе [1], ставящей под сомнение «что-то вроде 40 000 опубликованных [МРТ] исследований». Ошибка, говорят они, из-за «ошибочных статистических предположений». Я прочитал статью и вижу, что отчасти это проблема с множественными...