Вопросы с тегом «t-test»

13
Экспресс-ответы в исходных единицах, в преобразованных Бокс-Коксом данных

Для некоторых измерений результаты анализа соответствующим образом представлены в преобразованной шкале. Однако в большинстве случаев желательно представлять результаты в исходной шкале измерений (в противном случае ваша работа более или менее бесполезна). Например, в случае данных, преобразованных...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Оценки «Приблизительно нормально» для t-тестов

Я проверяю равенство средств, используя t-критерий Уэлча. Базовое распределение далеко от нормального (более искажено, чем пример в соответствующем обсуждении здесь ). Я могу получить больше данных, но хотел бы найти принципиальный способ определить, в какой степени это сделать. Существует ли...

12
Как выполнить тест начальной загрузки, чтобы сравнить средства двух образцов?

У меня есть две сильно искаженные выборки, и я пытаюсь использовать начальную загрузку, чтобы сравнить их с помощью t-статистики. Как правильно это сделать? Процесс, который я использую Я обеспокоен целесообразностью использования стандартной ошибки исходных / наблюдаемых данных на последнем этапе,...

12
T-тест с двумя выборками с взвешенными данными

Я хочу выполнить T-тест с двумя выборками, чтобы проверить разницу между двумя независимыми выборками, каждая из которых соответствует предположениям T-теста (можно считать, что каждое распределение является независимым и идентично распределяется как Нормальное с равной дисперсией) , Единственное...

12
Могу ли я использовать парный t-критерий, когда образцы обычно распределяются, но их различие отсутствует?

У меня есть данные из эксперимента, в котором я применил два разных метода лечения в одинаковых начальных условиях, и в качестве результата я получил целое число от 0 до 500 в каждом случае. Я хочу использовать парный критерий Стьюдента, чтобы определить, значительно ли отличаются эффекты,...

12
Разница между t-тестом и ANOVA в линейной регрессии

Интересно, чем отличаются t-тест и ANOVA в линейной регрессии? Является ли t-тест для проверки того, имеет ли какой-либо из уклонов и пересечений среднее значение «ноль», а ANOVA для проверки того, имеет ли все уклоны среднее значение «ноль»? Это единственная разница между ними? В простой линейной...

12
Какие предположения нормальности требуются для непарного t-теста? И когда они встретились?

Если мы хотим провести парный t-тест, необходимо (если я правильно понимаю), что средняя разница между согласованными единицами измерения будет распределена нормально. В парном t-тесте это сформулировано (AFAIK) в требовании, чтобы разница между подобранными единицами измерения была распределена...

12
Статистическая значимость разницы между расстояниями

У меня есть более 3000 векторов на двумерной сетке с приблизительно равномерным дискретным распределением. Некоторые пары векторов удовлетворяют определенному условию. Примечание: условие применимо только к парам векторов, а не к отдельным векторам. У меня есть список из примерно 1500 таких пар,...

12
тесты противтестов?

Я пытаюсь выяснить, в чем именно разница между тестами и тестами.TttZzz Насколько я могу судить, для обоих классов тестов используется одна и та же статистика тестов, что-то вроде б^- Ссеˆ( б^)б^-Ссе^(б^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} где - некоторая выборочная статистика,...

12
Минимальное количество наблюдений для множественной линейной регрессии

Я делаю множественную линейную регрессию. У меня 21 наблюдение и 5 переменных. Моя цель просто найти связь между переменными Достаточно ли моих данных для множественной регрессии? Результат t-теста показал, что 3 мои переменные не являются значимыми. Нужно ли мне снова проводить регрессию со...

12
Различия между PROC Mixed и lme / lmer в R - степени свободы

Примечание: этот вопрос является репостом, так как мой предыдущий вопрос пришлось удалить по юридическим причинам. Сравнивая PROC MIXED из SAS с функцией lmeиз nlmeпакета в R, я наткнулся на некоторые довольно запутанные различия. Более конкретно, степени свободы в разных тестах различаются между...

11
Размер выборки, необходимый для определения, какой из набора рекламных объявлений имеет самый высокий рейтинг кликов.

По профессии я дизайнер программного обеспечения и работаю над проектом для клиента, и я хотел бы убедиться, что мой анализ является статистически обоснованным. Подумайте над следующим: у нас есть n рекламных объявлений (n <10), и мы просто хотим знать, какое объявление работает лучше всего. Наш...

11
Как лучше всего анализировать данные о продолжительности пребывания в РКИ в больнице?

Мне интересно знать, существует ли консенсус относительно оптимального способа анализа данных о продолжительности пребывания в больнице (LOS) из РКИ. Это, как правило, распределение с очень правильным перекосом, при котором большинство пациентов выписывается в течение нескольких дней или недели, но...

11
В каких настройках доверительные интервалы не улучшатся с увеличением размера выборки?

В сообщении в блоге я обнаружил, что «Я полагаю, что WG Cochrane первым указал (примерно 1970-е годы), что при доверительных интервалах в условиях наблюдений малые размеры выборки приводят к лучшему охвату при достаточно больших выборках, обеспечивающих практически нулевое покрытие! Теперь я...

11
Разве неправильно использовать ANOVA вместо t-критерия для сравнения двух средних?

У меня есть распределение зарплат, и я хочу сравнить разницу в средствах для мужчин и женщин. Я знаю, что есть T-тест студента для сравнения двух средств, но после предложения ANOVA я получил некоторую критику, говоря, что ANOVA предназначен для сравнения более чем двух средств. Что (если что-то)...

11
Как выполнить t-тест с огромными образцами?

У меня есть две популяции, одна с N = 38,704 (количество наблюдений) и другая с N = 1 313 662. Эти наборы данных имеют ~ 25 переменных, все непрерывные. Я взял среднее значение каждого в каждом наборе данных и вычислил статистику теста, используя формулу t = средняя разница / стандартная ошибка...

11
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...