T-критерий Уэлча для неравных отклонений (также известный как Уэлч-Саттерсвэйт или Уэлч-Аспин) обычно имеет нецелые степени свободы . Как следует указывать эти степени свободы при сообщении результатов теста?
«Традиционно округлять до ближайшего целого числа, прежде чем обращаться к стандартным t-таблицам» в соответствии с различными источниками * - что имеет смысл, поскольку это направление округления является консервативным. ** Некоторые старые статистические программы тоже могут это делать (например, Graphpad Prism до версии 6 ) и некоторые онлайн калькуляторы все еще делают. Если бы использовалась эта процедура, представляется целесообразным сообщить округленные степени свободы. (Хотя использование более качественного программного обеспечения может быть даже более подходящим!)
Но подавляющее большинство современных пакетов используют дробную часть, поэтому в этом случае кажется, что дробная часть должна быть заключена в кавычки. Я не думаю, что было бы уместно цитировать более двух знаков после запятой, поскольку тысячная часть степени свободы имела бы лишь незначительное влияние на р- значение.
Оглядываясь вокруг ученого Google, я вижу документы, в которых цитируется df как целое число, с одним десятичным знаком или с двумя десятичными знаками. Есть ли какие-либо рекомендации относительно того, какую точность использовать? Кроме того , если программное обеспечение используется полной дробная часть, если цитируемый ДФ округляются вниз до нужного количества цифр (например до 1 дп или как целое число) , как это было уместен с консервативный расчет, или, как мне кажется, более разумный, округленный условно ( с точностью до ближайшего ) так, чтобы до 1 dp или до ближайшего целого?
Редактировать: помимо знания наиболее теоретически обоснованного способа сообщения нецелых df, было бы также полезно знать, что люди делают на практике . Предположительно, журналы и руководства по стилю имеют свои требования. Мне было бы любопытно, что требуют такие влиятельные руководства по стилю, как АПА. Из того, что я могу различить (их руководство не доступно в свободном доступе онлайн), у APA есть общее предпочтение, что почти все должно отображаться с двумя десятичными знаками, кроме p- значений (которые могут быть двумя или тремя dp) и процентов (округленных до ближайший процент) - это охватывает наклоны регрессии, t- статистику, F- статистику,статистика и тд. Это довольно нелогично, учитывая, что второе десятичное место занимает совсем другую значимую цифру и предполагает совершенно иную точность в 2,47, чем в 982,47, но может объяснить число Уэлч df с двумя десятичными знаками, которые я видел в моей ненаучной выборке ,
например, Рекстон, Г.Д. T-тест с неравной дисперсией является недостаточно используемой альтернативой t-критерию Стьюдента и U-критерию Манна – Уитни , «Поведенческая экология» (июль / август 2006 г.) 17 (4): 688-690 doi: 10.1093 / beheco / ark016
Хотя само приближение Уэлча-Саттерфуэйта может быть или не быть консервативным, и в случае, когда оно не является консервативным, округление степеней свободы не является гарантией компенсации в целом.
Ответы:
I have not studied actual practice, so this reply cannot address that aspect of the question. As a general principle I would expect the treatment of significant digits in reporting the degrees of freedom (df) to be based on judgment related to significant figures.
The principle is to be consistent: use the precision in one quantity that is appropriate for the precision used in another one that is related to it. Specifically, when reporting valuesx and y=f(x) when x is given to the nearest multiple of a small value h (such as h=12×10−6 for six places after the decimal point), the relative precision in y as mediated by the function f is
The approximation applies whenf is continuously differentiable on the interval [x−h,x+h] .
In the present application,y is the p -value, x is the degrees of freedom ν , and
wheret is the Welch-Satterthwaite statistic and Fν is the CDF of the Student t distribution with ν degrees of freedom.
For relatively high dfν , often a change in the first decimal place would not change the p-value at all (to the level of precision reported), so rounding to an integer is fine (h=1/2 but h|ddxf(x)| is very small). For very low df and extreme values of the statistic t , the magnitude of the derivative |∂∂νFν(t)| can exceed 0.01 , suggesting in such cases that ν should be reported to only one less decimal place than p itself.
See for yourself with this labeled contour plot of the magnitude of the derivative for the lowest (reasonable) df and ranges of|t| that would be of interest (because they can lead to low p-values).
The labels show the base-10 logarithm of the derivative. Thus, at points between−k and −(k+1) on this plot, changing the reported df in the jth place after the decimal point will likely change the reported p-value only in the (j+k)th and later places. For example, suppose you are rounding the p-value to 10−6 (six decimal places). Consider the statistics ν=2.5 and t=8 . These are located near the −3 log contour. Therefore, ν should be reported to 6+(−3)=3 decimal places.
The light blue areas, for the largestk , are the ones of concern, because they show where small changes in ν have the greatest effects on the p-value.
Contrast this with the situation for higher df (from4 to 30 shown):
The influence ofν on the precision of p quickly wanes as ν increases.
источник
The reason that was a convention is because tables don't have noninteger df. There's no reason to do it otherwise.
Well, the statistic doesn't actually have a t-distribution, because he squared denominator doesn't actually have a scaled chi-squared distribution. It's an approximation that may or may not be conservative in some particular instance -- rounding df down may not be certain to be conservative when we consider the exact distribution of the statistic in a particular instance.
p-values from t-distributions (applying the cdf to a t-statistic) can be computed by a variety of pretty accurate approximations, so they're effectively calculated rather than interpolated.
I agree.
One possibility might be to investigate how accurate the Welch-Satterthwaite approximation for the p-value is in that general region of variance ratios and not quote substantially more relative accuracy than that would suggest was in the d.f. (keeping in mind that the df on the chi-squared in the square of the denominator are just giving an approximation to something that isn't chi-squared anyway).
источник