Вопросы с тегом «metric»

14
Есть ли альтернатива критерию Колмогорова-Смирнова для связанных данных с коррекцией?

У меня есть набор данных из двух выборок (контрольной и обработанной), каждая из которых содержит несколько тысяч значений, которые должны пройти проверку на значимость в R. Теоретически значения должны быть непрерывными, но из-за округления, выполняемого программным обеспечением для измерения, они...

14
Дивергенция Дженсена Шеннона - Дивергенция Кульбака-Лейблера?

Я знаю, что дивергенция KL не является симметричной, и ее нельзя строго рассматривать как метрику. Если да, то почему он используется, когда JS Divergence удовлетворяет требуемым свойствам метрики? Существуют ли сценарии, в которых может использоваться дивергенция KL, но не дивергенция JS или...

14
Почему связи непросты в непараметрической статистике?

Мой непараметрический текст, Практическая непараметрическая статистика , часто дает четкие формулы для ожиданий, отклонений, статистики тестов и т. П., Но содержит предостережение о том, что это работает, только если мы игнорируем связи. При расчете U-статистики Манна-Уитни рекомендуется...

13
Почему асимптотическая относительная эффективность теста Уилкоксона

Хорошо известно, что асимптотическая относительная эффективность (ARE) критерия Уилкоксона со знаком ранга равна 3π≈0.9553π≈0.955\frac{3}{\pi} \approx 0.955по сравнению стстудента , если данные получены из нормально распределенной популяции. Это верно как для базового теста с одним образцом, так и...

13
Применимость критерия хи-квадрат, если многие ячейки имеют частоты менее 5

Чтобы найти связь между поддержкой сверстников (независимая переменная) и удовлетворенностью работой (зависимая переменная), я хочу применить критерий хи-квадрат. Поддержка сверстников - это категории в четырех группах в зависимости от степени поддержки: 1 = очень меньшая степень, 2 = в некоторой...

13
Есть ли вероятностное расстояние, которое сохраняет все свойства метрики?

Изучая расстояние Кульбака – Лейблера, мы очень быстро узнаем две вещи: оно не учитывает ни неравенство треугольника, ни симметрию, требуемые свойства метрики. Мой вопрос заключается в том, есть ли метрика функций плотности вероятности, которые удовлетворяют всем ограничениям метрики...

13
Выполняется ли неравенство треугольника для этих корреляционных расстояний?

Для иерархической кластеризации я часто вижу следующие две «метрики» (они точно не говорят) для измерения расстояния между двумя случайными переменными XXX и YYY : \newcommand{\Cor}{\mathrm{Cor}} d1(X,Y)d2(X,Y)=1−|Cor(X,Y)|,=1−(Cor(X,Y))2d1(X,Y)=1−|Cor(X,Y)|,d2(X,Y)=1−(Cor(X,Y))2\begin{align}...

13
Зачем использовать параметрическую загрузку?

В настоящее время я пытаюсь разобраться в некоторых вещах, касающихся параметрической начальной загрузки. Большинство вещей, вероятно, тривиально, но я все еще думаю, что, возможно, что-то пропустил. Предположим, я хочу получить доверительные интервалы для данных с помощью параметрической процедуры...

12
Надежная (непараметрическая) мера, такая как коэффициент вариации - IQR / медиана или альтернатива?

Для данного набора данных разброс часто рассчитывается либо как стандартное отклонение, либо как IQR (межквартильный диапазон). Принимая во внимание, что a standard deviationнормализовано (z-показатели и т. Д.), И поэтому его можно использовать для сравнения разброса по двум различным популяциям,...

12
Существует ли вариант с несколькими выборками или альтернатива тесту Колмогорова-Смирнова?

Я сравниваю распределение по размеру деревьев на шести парах участков, где один участок подвергался обработке, а другой - контролю. Используя тест Колмогорова-Смирнова на каждой паре графиков, я обнаружил, что находится в диапазоне от 0,0003707 до 0,75 . Существуют ли какие-либо подходящие методы...

12
Определите, значительно ли улучшился распределенный процесс с тяжелыми хвостами

Я наблюдаю время обработки процесса до и после изменения, чтобы выяснить, улучшился ли процесс в результате изменения. Процесс улучшился, если время обработки сократилось. Распределение времени обработки жирнохвостое, поэтому сравнение по среднему показателю нецелесообразно. Вместо этого я хотел бы...

12
Как бороться с потолочным эффектом благодаря измерительному инструменту?

Я собрал психофизиологические данные, измеряющие способность испытуемых (двух групп) воспринимать вибрацию. Вибрирующий зонд перемещается к коже при меньшем и меньшем смещении, и субъект указывает, когда он чувствует вибрацию. К сожалению, на высоких частотах датчик может перемещаться только на...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Параметрический расчет размера выборки и непараметрический анализ

Мне любопытно узнать, есть ли у кого-нибудь конкретная ссылка (текстовая или журнальная статья), чтобы поддержать общепринятую в медицинской литературе практику расчета размера выборки с использованием параметрических методов (т. Е. Предполагающих нормальное распределение и определенную дисперсию...

12
Как называется метод оценки плотности, при котором все возможные пары используются для создания нормального распределения смеси?

Я просто подумал о аккуратном (не обязательно хорошем) способе создания одномерных оценок плотности, и мой вопрос: У этого метода оценки плотности есть имя? Если нет, то является ли это частным случаем какого-либо другого метода в литературе? Вот метод: Мы имеем вектор который мы предполагаем, взят...

12
Непараметрическая мера силы ассоциации между порядковым и непрерывным случайным числом

Я бросаю здесь проблему, как я получил это. У меня есть две случайные величины. Один из которых является непрерывным (Y), а другой - дискретным и будет обозначаться как ординал (X). Я поместил ниже график, который я получил вместе с запросом. Человек, который посылает мне данные, хочет измерить...

12
В чем разница между бесплатной статистикой / методами распределения и непараметрической статистикой?

Из Википедии Первое значение непараметрических охватывает методы, которые не полагаются на данные, принадлежащие к какому-либо конкретному распределению. К ним, среди прочего, относятся: методы без распределения, которые не основаны на предположениях о том, что данные взяты из заданного...

12
Каковы реальные примеры «непараметрических статистических моделей»?

Я читаю здесь статью о статистических моделях в Википедии , и я несколько озадачен значением «непараметрических статистических моделей», а именно: Статистическая модель является непараметрической, если множество параметров бесконечномерно. Статистическая модель является полупараметрической, если...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...