Вопросы с тегом «statistical-significance»

14
Что Фишер подразумевает под этой цитатой?

Я продолжаю видеть эту знаменитую цитату повсюду, но не могу понять подчеркнутую часть каждый раз. Человек, который «отвергает» гипотезу временно, в порядке обычной практики, когда значение находится на уровне 1% или выше, наверняка будет ошибаться не более чем в 1% таких решений. Поскольку, когда...

14
Проверка значимости улучшения точности

Предположим, у меня есть алгоритм, который классифицирует вещи на две категории. Я могу измерить точность алгоритма, скажем, на 1000 тестовых вещей - предположим, 80% вещей классифицированы правильно. Предположим, что я каким-то образом модифицирую алгоритм, чтобы 81% вещей были классифицированы...

14
Вы отвергаете нулевую гипотезу, когда

Это явно вопрос определения или соглашения, и он практически не имеет практического значения. Если для αα\alpha установлено традиционное значение 0,05, считается ли значение ppp 0,0500000000000 ... статистически значимым или нет? Является ли правило определения статистической значимости...

14
Карет глмнет против cv.glmnet

Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с...

14
Почему в этом отрывке говорится, что объективная оценка стандартного отклонения обычно не актуальна?

Я читал о вычислении объективной оценки стандартного отклонения и источника, который я прочитал (...) за исключением некоторых важных ситуаций, задача имеет мало отношения к приложениям статистики, поскольку ее необходимость избегается стандартными процедурами, такими как использование тестов...

14
Проверка на статистически значимый пик

У меня есть набор данных, и . Я хотел бы проверить следующую гипотезу: есть пик ; то есть, когда увеличивается, сначала увеличивается, а затем уменьшается.yYyxxxyyyxxxyyy Моей первой идеей было подгонка и в зеркалке. То есть, если я обнаружу, что коэффициент до существенно положительный, а...

14
Как вычислить, имеет ли моя линейная регрессия статистически значимое отличие от известной теоретической линии?

У меня есть некоторые данные, которые соответствуют примерно линейной линии: Когда я делаю линейную регрессию этих значений, я получаю линейное уравнение: Y= 0,997 х - 0,0136Yзнак равно0,997Икс-0,0136y = 0.997x-0.0136 В идеальном мире уравнение должно быть .Y= хYзнак равноИксy = x Ясно, что мои...

14
Проверьте значительную разницу между двумя значениями уклона

Данные, которые у меня есть, представляют собой значение наклона регрессии y ~ time, стандартную ошибку, значение n и значение ap для конкретного вида в двух разных областях. Я хочу проверить, существенно ли отличается наклон регрессии для одной области от наклона регрессии для другой области -...

14
Является ли р = 5,0% значимым?

Сегодня меня спросили, считается ли значение р 0,05 (точно) значимым (учитывая альфа = 5%) или нет. Я не знал ответа, и Google нашел оба ответа: (a) результат значим, если p меньше 5%, и (b) если p меньше 5% или равен 5%. Конечно, ни один из этих сайтов никого не цитировал. Почему один - это...

14
Что такое надежный статистический тест? Что такое мощный статистический тест?

Некоторые статистические тесты являются надежными, а некоторые нет. Что именно означает надежность? Удивительно, но я не смог найти такой вопрос на этом сайте. Более того, иногда надежность и мощь теста обсуждаются вместе. И интуитивно я не мог различить эти два понятия. Что такое мощный тест? Чем...

14
Статистическая значимость (p-значение) для сравнения двух классификаторов в отношении (среднего) ROC AUC, чувствительности и специфичности

У меня есть тестовый набор из 100 случаев и два классификатора. Я генерировал прогнозы и вычислял ROC AUC, чувствительность и специфичность для обоих классификаторов. Вопрос 1: Как я могу вычислить значение p, чтобы проверить, является ли одно значительно лучше другого по всем показателям (ROC AUC,...

13
LARS против координатного спуска для лассо

Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи...

13
Правильно ли называть результаты «почти» или «несколько» значительными?

Общий консенсус по аналогичному вопросу. Неправильно ли называть результаты «очень значимыми»? заключается в том, что «очень значительный» является допустимым, хотя и неспецифическим, способом описания силы ассоциации, у которой значение p намного ниже предварительно установленного порога...

13
Тест на значимость разности коэффициента корреляции Спирмена

(Большое спасибо за быстрые ответы! Я плохо задал вопрос, поэтому позвольте мне повторить.) Я не знаю, как выяснить, является ли разница между двумя корреляциями Спирмена статистически значимой. Я хотел бы знать, как это выяснить. Причина, которую я хотел выяснить, заключается в том, что в...

13
Как я могу рассчитать критическое значение т, используя R?

Извините, если это новый вопрос; Я пытаюсь научить себя статистике в первый раз. Я думаю, что у меня есть базовая процедура, но я изо всех сил пытаюсь выполнить ее с R. Итак, я пытаюсь оценить значимость коэффициентов регрессии в множественной линейной регрессии формы y^=Xβ^y^=Xβ^ \hat y = X \hat...

13
Почему неправильно останавливать тестирование A / B до достижения оптимального размера выборки?

Я отвечаю за представление результатов A / B-тестов (на разных сайтах) в моей компании. Мы запускаем тест в течение месяца, а затем регулярно проверяем p-значения до тех пор, пока не достигнем значимости (или откажемся, если значимость не будет достигнута после длительного выполнения теста), что я...

13
Поиск лучших функций в моделях взаимодействия

У меня есть список белков с их характеристиками. Пример таблицы выглядит так: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 Ряды - это белки, а столбцы - это особенности. У меня также есть список белков, которые также взаимодействуют; например...

13
Почему высокий положительный эксцесс проблематичен для проверки гипотез?

Я слышал (извините, не могу предоставить ссылку на текст, что мне сказали), что высокий положительный эксцесс остатков может быть проблематичным для точных проверок гипотез и доверительных интервалов (и, следовательно, проблем со статистическим выводом). Это правда, и если да, то почему? Не будет...

13
Статистика: отношения между альфа и бета

Мой вопрос касается связи между альфа и бета и их определениями в статистике. альфа = тип ошибки I типа = рассматриваемый уровень значимости, что гипотеза NULL верна Бета = тип ошибки II Если альфа понижена (специфичность увеличивается как альфа = 1-специфичность), бета увеличивается...

13
Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...