Статистика и большие данные

69

Что подразумевается под «случайной величиной»?

Что они имеют в виду, когда говорят «случайная величина»?

69

Чем коэффициент корреляции отличается от наклона регрессии?

Я ожидал бы, что коэффициент корреляции будет таким же, как у регрессионного наклона (бета), однако, только сравнив их, они различаются. Чем они отличаются - какую информацию они...

regression correlation

69

Почему исследователи нейронных сетей заботятся о эпохах?

Эпоха в стохастическом градиентном спуске определяется как один проход данных. Для каждой мини-партии SGD отбирается Кkk выборок, вычисляется градиент и обновляются параметры. В настройках эпохи образцы оформляются без замены. Но это кажется ненужным. Почему бы не нарисовать каждый мини-пакет SGD...

neural-networks deep-learning gradient-descent

69

Форма доверительного интервала для прогнозируемых значений в линейной регрессии

Я заметил, что доверительный интервал для предсказанных значений в линейной регрессии имеет тенденцию быть узким вокруг среднего значения предиктора, а жирность - вокруг минимального и максимального значений предиктора. Это можно увидеть на графиках этих 4 линейных регрессий: Сначала я думал, что...

regression confidence-interval linear-model standard-error prediction-interval

69

Кендалл Тау или Ро Спирмена?

В каких случаях один предпочитает один другому? Я нашел кого-то, кто претендует на преимущество для Кендалла по педагогическим причинам , есть ли другие

correlation nonparametric spearman-rho kendall-tau

69

Как настроить гиперпараметры деревьев xgboost?

У меня есть несбалансированные данные класса, и я хочу настроить гиперпараметры усиленного тресса с помощью xgboost. Вопросов Есть ли эквивалент для gridsearchcv или randomsearchcv для xgboost? Если нет, то каков рекомендуемый подход для настройки параметров xgboost?...

machine-learning cross-validation xgboost boosting

68

Как «сложить» стандартное отклонение?

У меня есть среднемесячное значение и стандартное отклонение, соответствующее этому среднему. Сейчас я вычисляю среднегодовое значение как сумму среднемесячных значений, как я могу представить стандартное отклонение для суммированного среднего значения? Например, учитывая выход из ветровой...

standard-deviation descriptive-statistics

68

Что не так с экстраполяцией?

Я помню, как сидел на курсах статистики как студент, слушавший, почему экстраполяция была плохой идеей. Кроме того, есть множество источников онлайн, которые комментируют это. Там также упоминание о нем здесь . Может кто-нибудь помочь мне понять, почему экстраполяция это плохая идея? Если это так,...

regression time-series forecasting

68

Все ли термины взаимодействия нуждаются в отдельных терминах в регрессионной модели?

Я на самом деле рецензирую рукопись, где авторы сравнивают 5-6 моделей логит-регрессии с AIC. Тем не менее, некоторые модели имеют термины взаимодействия без включения отдельных ковариатных терминов. Имеет ли когда-нибудь смысл делать это? Например (не относится к моделям logit): M1: Y = X1 + X2 +...

regression modeling interaction aic

68

Многофакторная множественная регрессия в R

У меня есть 2 зависимые переменные (DV), на каждую из которых может влиять набор из 7 независимых переменных (IV). DV являются непрерывными, в то время как набор IV состоит из смеси непрерывных и двоично-закодированных переменных. (В коде ниже непрерывные переменные пишутся заглавными буквами, а...

r multivariate-analysis manova multiple-regression multivariate-regression

68

Каковы хорошие начальные веса в нейронной сети?

Я только что слышал, что это хорошая идея, чтобы выбрать начальные веса нейронной сети из диапазона , где - это количество входов в данный нейрон. Предполагается, что множества нормализованы - среднее значение 0, дисперсия 1 (не знаю, имеет ли это значение).г( - 1d√, 1d√)(−1d,1d)(\frac{-1}{\sqrt d}...

neural-networks normalization

68

Как сформировать равномерно распределенные точки на поверхности сферы 3-го блока?

Мне интересно, как генерировать равномерно распределенные точки на поверхности 3-й единицы сферы? Кроме того, после генерации этих точек, как лучше всего визуализировать и проверить, являются ли они действительно однородными на поверхности...

random-generation

68

Нужен ли выбор переменных для прогнозного моделирования в 2016 году?

Этот вопрос был задан в CV несколько лет назад, и кажется, что стоит сделать репост в свете 1) лучшей вычислительной технологии на порядок (например, параллельные вычисления, HPC и т. Д.) И 2) более новой техники, например [3]. Сначала немного контекста. Давайте предположим, что целью является не...

machine-learning modeling feature-selection model-selection prediction

68

Почему я должен быть байесовским, когда моя модель не так?

Редактирование: я добавил простой пример: вывод среднего значения . Я также немного разъяснил, почему достоверные интервалы, не соответствующие доверительным интервалам, являются плохими.XiXiX_i Я, довольно набожный байесовский, нахожусь в разгар своего рода кризиса веры. Моя проблема заключается в...

bayesian modeling philosophical misspecification

67

Какую хорошую базовую статистику использовать для порядковых данных?

У меня есть некоторые порядковые данные, полученные из вопросов опроса. В моем случае это ответы в стиле Лайкерта (категорически не согласен-не согласен-нейтрален-согласен-полностью согласен). По моим данным они кодируются как 1-5. Я не думаю, что средства здесь много значат, так что какая основная...

descriptive-statistics likert ordinal-data

67

Что делает ядро Гаусса таким волшебным для PCA, а также вообще?

Я читал о ядре PCA ( 1 , 2 , 3 ) с гауссовым и полиномиальным ядрами. Как ядро Гаусса, по-видимому, исключительно хорошо разделяет любые нелинейные данные? Пожалуйста, дайте интуитивный анализ, а также, если возможно, математически сложный анализ. Какое свойство ядра Гаусса (с идеальной ),...

machine-learning pca svm kernel-trick

67

Как именно статистики согласились использовать (n-1) в качестве несмещенной оценки для дисперсии населения без моделирования?

Формула для вычисления дисперсии имеет в знаменателе:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Я всегда задавался вопросом, почему. Тем не менее, чтение и просмотр нескольких хороших видеофильмов о том, «почему», кажется, является хорошей...

variance unbiased-estimator proof history

67

Есть ли * математическая * основа для дебатов Байеса против частых?

В Википедии сказано, что: математика [вероятности] в значительной степени не зависит от какой-либо интерпретации вероятности. Вопрос: Тогда, если мы хотим быть математически правильными, не должны ли мы запретить какую-либо интерпретацию вероятности? Т.е. математически неверны и байесовский, и...

probability bayesian frequentist philosophical kolmogorov-axioms

67

Правильный способ использования рекуррентной нейронной сети для анализа временных рядов

Рекуррентные нейронные сети отличаются от «обычных» тем, что имеют слой «памяти». Благодаря этому слою рекуррентные NN должны быть полезны при моделировании временных рядов. Тем не менее, я не уверен, что правильно понимаю, как их использовать. Допустим, у меня есть следующие временные ряды (слева...

time-series machine-learning neural-networks

67

40000 нейробиологических работ могут быть ошибочными

Я видел эту статью в «Экономисте» о, казалось бы, разрушительной работе [1], ставящей под сомнение «что-то вроде 40 000 опубликованных [МРТ] исследований». Ошибка, говорят они, из-за «ошибочных статистических предположений». Я прочитал статью и вижу, что отчасти это проблема с множественными...

hypothesis-testing multiple-comparisons spatial neuroimaging neuroscience