Вопросы с тегом «metric»

241

Почему евклидово расстояние не является хорошим показателем в больших измерениях?

Я читал, что «евклидово расстояние не является хорошим расстоянием в больших измерениях». Я думаю, что это утверждение как-то связано с проклятием размерности, но что именно? Кроме того, что такое «большие размеры»? Я применял иерархическую кластеризацию, используя евклидово расстояние со 100...

96

Как выбрать t-критерий или непараметрический критерий, например, Уилкоксон в небольших выборках

Определенные гипотезы могут быть проверены с использованием t- критерия Стьюдента (возможно, с использованием поправки Уэлча для неравных отклонений в случае двух выборок) или с помощью непараметрического теста, такого как парный критерий Уилкоксона со знаком, ранговый критерий...

hypothesis-testing t-test nonparametric small-sample wilcoxon-mann-whitney

82

Почему надежная (и устойчивая) статистика не заменила классические методы?

При решении бизнес-задач с использованием данных обычно используется хотя бы одно ключевое предположение о том, что подкрепляющая классическая статистика недопустима. В большинстве случаев никто не удосуживается проверить эти предположения, поэтому вы никогда не узнаете. Например, то, что многие из...

model-selection nonparametric outliers robust philosophical

69

Кендалл Тау или Ро Спирмена?

В каких случаях один предпочитает один другому? Я нашел кого-то, кто претендует на преимущество для Кендалла по педагогическим причинам , есть ли другие

correlation nonparametric spearman-rho kendall-tau

60

Почему параметрическая статистика всегда предпочтительнее непараметрической?

Может ли кто-нибудь объяснить мне, почему кто-то выбрал бы параметрический непараметрический статистический метод для проверки гипотез или регрессионного анализа? На мой взгляд, это все равно, что заняться рафтингом и выбрать не водостойкие часы, потому что вы можете их не намочить. Почему бы не...

regression hypothesis-testing mathematical-statistics estimation nonparametric

56

Какую реализацию теста перестановки в R использовать вместо t-тестов (парных и непарных)?

У меня есть данные из эксперимента, которые я проанализировал с помощью t-тестов. Зависимая переменная масштабируется по интервалу, а данные либо непарные (т. Е. 2 группы), либо парные (т. Е. Внутри-субъекты). Например (в рамках предметов): x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, 99.5, 99.5,...

r t-test nonparametric permutation-test

55

Что такого крутого в теореме о представлении де Финетти?

Из теории статистики Марка Дж. Шервиша (стр. 12): Хотя теорема ДеФинетти о представлении 1.49 является центральной для мотивации параметрических моделей, она фактически не используется в их реализации. Как теорема является центральной в параметрических...

probability modeling mathematical-statistics parametric

46

Процент перекрывающихся областей двух нормальных распределений

Мне было интересно, учитывая два нормальных распределения с и \ sigma_2, \ \ mu_2σ1, μ1σ1, μ1\sigma_1,\ \mu_1σ2, μ2σ2, μ2\sigma_2, \ \mu_2 Как я могу рассчитать процент перекрывающихся регионов двух распределений? Я полагаю, что у этой проблемы есть определенное имя, знаете ли вы какое-либо...

normal-distribution similarities metric bhattacharyya

46

Интерпретация логарифмически преобразованного предиктора и / или ответа

Мне интересно, имеет ли это значение при интерпретации того, являются ли логически преобразованными только зависимые, как зависимые, так и независимые, или только независимые переменные. Рассмотрим случай log(DV) = Intercept + B1*IV + Error Я могу интерпретировать IV как процентное увеличение, но...

regression data-transformation interpretation regression-coefficients logarithm r dataset stata hypothesis-testing contingency-tables hypothesis-testing statistical-significance standard-deviation unbiased-estimator t-distribution r functional-data-analysis maximum-likelihood bootstrap regression change-point regression sas hypothesis-testing bayesian randomness predictive-models nonparametric terminology parametric correlation effect-size loess mean pdf quantile-function bioinformatics regression terminology r-squared pdf maximum multivariate-analysis references data-visualization r pca r mixed-model lme4-nlme distributions probability bayesian prior anova chi-squared binomial generalized-linear-model anova repeated-measures t-test post-hoc clustering variance probability hypothesis-testing references binomial profile-likelihood self-study excel data-transformation skewness distributions statistical-significance econometrics spatial r regression anova spss linear-model

45

Все модели бесполезны? Возможна ли какая-то точная модель - или полезная?

Этот вопрос был в моей голове более месяца. Выпуск Amstat News за февраль 2015 года содержит статью профессора Беркли Марка ван дер Лаана, которая ругает людей за использование неточных моделей. Он утверждает, что при использовании моделей статистика становится искусством, а не наукой. По его...

machine-learning maximum-likelihood modeling nonparametric parametric

40

Напомним и точность в классификации

Я прочитал некоторые определения отзыва и точности, хотя это каждый раз в контексте поиска информации. Мне было интересно, может ли кто-нибудь объяснить это немного подробнее в контексте классификации и, возможно, проиллюстрировать некоторые примеры. Скажем, например, у меня есть двоичный...

machine-learning metric

37

Бутстреп против проверки гипотезы о перестановке

Существует несколько популярных методов передискретизации, которые часто используются на практике, такие как начальная загрузка, тест перестановки, складной нож и т. Д. Об этих методах рассказывается множество статей и книг, например, Philip I Good (2010) Permutation, Parametric и Bootstrap Tests...

hypothesis-testing nonparametric bootstrap permutation-test

34

Какова слабая сторона деревьев решений?

Деревья решений кажутся очень понятным методом машинного обучения. После создания он может быть легко проверен человеком, что является большим преимуществом в некоторых приложениях. Каковы практические слабые стороны деревьев...

machine-learning nonparametric cart

31

Интуиция за взаимодействиями тензорных произведений в GAM (пакет MGCV в R)

Обобщенными аддитивными моделями являются те, где Y= α + f1( х1) + f2( х2) + еяy=α+f1(x1)+f2(x2)+ei y = \alpha + f_1(x_1) + f_2(x_2) + e_i например. функции гладкие и должны быть оценены. Обычно по штрафным сплайнам. MGCV - это пакет в R, который делает это, и автор (Саймон Вуд) пишет книгу о своем...

r nonparametric interaction splines intuition

30

Существует ли надежный непараметрический доверительный интервал для среднего перекошенного распределения?

Очень искаженные распределения, такие как log-normal, не дают точных доверительных интервалов начальной загрузки. Вот пример, показывающий, что левая и правая области хвоста далеки от идеальных 0,025 независимо от того, какой метод начальной загрузки вы используете в R: require(boot) n <- 25 B...

confidence-interval nonparametric mean bootstrap median

30

Как строго определить вероятность?

Вероятность может быть определена несколькими способами, например: функция LLL из Θ × X,Θ×X\Theta\times{\cal X} которая отображает в т.е. .(θ,x)(θ,x)(\theta,x)L(θ∣x)L(θ∣x)L(\theta \mid x)L:Θ×X→RL:Θ×X→RL:\Theta\times{\cal X} \rightarrow \mathbb{R} случайная функцияL(⋅∣X)L(⋅∣X)L(\cdot \mid X) мы...

mathematical-statistics likelihood likelihood-ratio parametric

29

R: Случайный лес, выбрасывающий NaN / Inf в ошибке «вызова сторонней функции», несмотря на отсутствие NaN в наборе данных [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Я использую каретку, чтобы запустить перекрестный проверенный случайный лес по набору данных. Переменная...

r random-forest caret regression prediction fitting social-science poisson-distribution distributions characteristic-function bayesian prior regression normal-distribution interaction nonparametric skewness svm standard-deviation standard-error regression-coefficients igraph natural-language word2vec word-embeddings regression machine-learning sampling r regression machine-learning random-forest ensemble sampling unbiased-estimator proof estimators mse probability conditional-probability bayes anova missing-data neural-networks recommender-system r confidence-interval sample multiple-imputation r time-series forecasting mase

28

Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

28

Каковы некоторые иллюстративные применения эмпирической вероятности?

Я слышал об эмпирической вероятности Оуэна, но до недавнего времени не обращал на это внимания, пока не наткнулся на интересную статью ( Mengersen et al. 2012 ). В моих попытках понять это я выяснил, что вероятность наблюдаемых данных представляется в виде L = ∏япя= ∏яп( Xя= х ) = ∏яп( Xя≤ x ) - P(...

bayesian maximum-likelihood nonparametric likelihood empirical-likelihood

26

Почему модели гауссовских процессов называют непараметрическими?

Я немного смущен. Почему гауссовские процессы называют непараметрическими моделями? Они предполагают, что функциональные значения или их подмножества имеют гауссовский априор со средним 0 и ковариационную функцию, заданную в качестве функции ядра. Эти функции ядра сами имеют некоторые параметры...

nonparametric gaussian-process