Статистика и большие данные

64

Как интерпретировать коэффициенты в регрессии Пуассона?

Как я могу интерпретировать основные эффекты (коэффициенты для фиктивного фактора) в регрессии Пуассона? Предположим следующий пример: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13,...

64

Является ли язык R надежным в области экономики?

Я аспирант по экономике, который недавно перешел на R из других очень известных статистических пакетов (в основном я использовал SPSS). На данный момент моя маленькая проблема в том, что я единственный пользователь R в своем классе. Мои одноклассники используют Stata и Gauss, и один из моих...

r software econometrics

64

Какая функция потерь для задач мультиклассовой классификации с несколькими метками в нейронных сетях?

Я тренирую нейронную сеть, чтобы классифицировать набор объектов в n-классы. Каждый объект может принадлежать нескольким классам одновременно (несколько классов, несколько меток). Я читал, что для многоклассовых задач обычно рекомендуется использовать softmax и категориальную кросс-энтропию в...

neural-networks python loss-functions keras cross-entropy

64

Нижний индекс в ожиданиях

Каково точное значение индексной записи в условных ожиданиях в рамках теории меры? Эти индексы не появляются в определении условного ожидания, но мы можем видеть, например, на этой странице википедии . (Обратите внимание, что это было не всегда так, одна и та же страница несколько месяцев...

conditional-expectation notation

64

Почему нейронным сетям нужно так много обучающих примеров для выполнения?

Ребенку в возрасте 2 лет требуется около 5 экземпляров автомобиля, чтобы можно было с достаточной точностью идентифицировать его, независимо от цвета, марки и т. Д. Когда моему сыну было 2 года, он смог опознать трамваи и поезда, даже если он видел немного. Поскольку он обычно путал друг друга,...

neural-networks neuroscience

64

Что является хорошим, убедительным примером, в котором p-значения полезны?

Мой вопрос в названии говорит сам за себя, но я хотел бы дать ему некоторый контекст. Ранее на этой неделе ASA опубликовала заявление « о p-значениях: контекст, процесс и цель », в котором изложены различные распространенные заблуждения о p-значении и содержится настоятельная рекомендация не...

hypothesis-testing bayesian p-value inference frequentist

63

Как сообщать о крошечных

Для некоторых тестов в R, существует нижний предел на р-значение расчетов 2,22 ⋅ 10- 162.22⋅10−162.22 \cdot 10^{-16} . Я не уверен, почему это число, если для этого есть веская причина или оно просто произвольно. Многие другие пакеты статистики просто идут 0.0001, так что это намного более высокий...

r p-value reporting precision

63

В чем разница между дискретными данными и непрерывными данными?

В чем разница между дискретными данными и непрерывными

continuous-data discrete-data

63

Список ситуаций, в которых байесовский подход проще, практичнее или удобнее

В статистике было много споров между байесовцами и частыми лицами. Я обычно нахожу это довольно отталкивающим (хотя я думаю, что это утихло). С другой стороны, я встречал несколько человек, которые придерживаются совершенно прагматичного взгляда на проблему, говоря, что иногда удобнее проводить...

bayesian frequentist

63

За PCA следует ротация (например, varimax), все еще PCA?

Я пытался воспроизвести некоторые исследования (с использованием PCA) из SPSS в R. По моему опыту, principal() функция из пакета psychбыла единственной функцией, которая приблизилась (или, если моя память мне не изменяет), чтобы соответствовать выводу. Чтобы соответствовать тем же результатам, что...

r spss pca factor-analysis factor-rotation

63

Ссылки, содержащие аргументы против проверки значимости нулевой гипотезы?

За последние несколько лет я прочитал ряд статей, в которых приводил доводы против использования в науке проверки значимости нулевых гипотез, но не думал, что следует вести постоянный список. Недавно мой коллега попросил у меня такой список, и я подумал, что я бы попросил всех присутствующих помочь...

hypothesis-testing statistical-significance references p-value

63

Талеб и Черный лебедь

Книга Талеба «Черный лебедь» была бестселлером New York Times, когда вышла несколько лет назад. Книга вышла во втором издании. После встречи со статистиками в JSM (ежегодная статистическая конференция) Талеб несколько смягчил свою критику статистики. Но смысл книги в том, что статистика не очень...

extreme-value rare-events

63

Объясните разницу между множественной регрессией и многомерной регрессией с минимальным использованием символов / математики

Являются ли множественные и многомерные регрессии действительно разными? Что такое вариация в любом

regression multiple-regression terminology multivariate-regression

63

Когда использовать обобщенные оценочные уравнения и модели со смешанными эффектами?

Я довольно долго использовал модели смешанных эффектов с продольными данными. Хотелось бы, чтобы я соответствовал отношениям AR в lmer (думаю, я прав, что не могу этого сделать?), Но я не думаю, что это отчаянно важно, поэтому я не слишком беспокоюсь. Я только что натолкнулся на обобщенные...

mixed-model gee

63

Softmax против сигмоидальной функции в логистическом классификаторе?

От чего зависит выбор функции (Softmax vs Sigmoid) в классификаторе логистики? Предположим, есть 4 выходных класса. Каждая из вышеприведенных функций дает вероятности того, что каждый класс является правильным выводом. Так какой же взять за...

machine-learning logistic classification softmax

62

Дисперсия суммы равна сумме дисперсий?

Верно ли (всегда), что V a r ( ∑я = 1мИкся) = ∑я = 1мV a r ( Xя)?Вaр(Σязнак равно1мИкся)знак равноΣязнак равно1мВaр(Икся)?\mathrm{Var}\left(\sum\limits_{i=1}^m{X_i}\right) = \sum\limits_{i=1}^m{\mathrm{Var}(X_i)}...

variance

62

Если A и B связаны с C, почему A и B не обязательно связаны?

Я знаю эмпирически, что это так. Я только что разработал модели, которые сталкиваются с этой загадкой. Я также подозреваю, что это не обязательно ответ да / нет. Я имею в виду, что если и A, и B соотносятся с C, это может иметь некоторое значение в отношении корреляции между A и B. Но это значение...

correlation cross-correlation

62

Что означают остатки в логистической регрессии?

Отвечая на этот вопрос, Джон Кристи предложил оценить соответствие моделей логистической регрессии путем оценки остатков. Я знаком с тем, как интерпретировать невязки в OLS, они находятся в том же масштабе, что и DV, и очень четко различие между y и y, предсказанное моделью. Однако для...

r logistic generalized-linear-model residuals aic

62

Как на самом деле построить образец дерева из randomForest :: getTree ()? [закрыто]

Кто-нибудь получил библиотеку или предложения кода о том, как на самом деле построить пару образцов деревьев из: getTree(rfobj, k, labelVar=TRUE) (Да, я знаю, что вы не должны делать это оперативно, RF - это черный ящик и т. Д. И т. Д. Я хочу визуально проверить работоспособность дерева, чтобы...

r data-visualization random-forest cart

62

Регрессия с несколькими зависимыми переменными?

Возможно ли иметь (множественное) уравнение регрессии с двумя или более зависимыми переменными? Конечно, вы могли бы запустить два отдельных уравнения регрессии, по одному для каждого DV, но не похоже, чтобы оно охватило какую-либо связь между двумя...

regression