95 ci

95 ci

Да, возможно, что HSD от Tukey или любая другая процедура тестирования (отличная от теста с двумя образцами T) не смогут обнаружить существенных различий, несмотря на то, что доверительные интервалы с двумя образцами T/95% не перекрываются. Обратное также верно.

По сути, это связано с тем, что используемые формулы различны, поэтому вы можете придумать разные результаты. Наряду с различными формулами часто возникают разные предположения и различия между тем, что на самом деле тестируется (например, разница между средствами и различиями между медианами).

В качестве примера из более простой проблемы рассмотрим два образца размера 10 из нормальных распределений со средним значением $ (0,1) $ и дисперсии, равные $ 1 $. Мы сравниваем т-тест с двумя образцами с Тестом настроения , который проверяет различия между медианами, но в случае нормального распределения, так как медиана равна среднему, мы будем использовать его в любом случае:

mood.test<-function(x,y){   z <- c(x,y)   g <- rep(1:2, c(length(x),length(y)))   m <- median(z)   fisher.test(z<- rnorm(10) x2 <- rnorm(10,1)  t.test(x1,x2) median.test(x1,x2) 

Если вы запустите это несколько раз, вы быстро увидите что-то вроде:

    Welch Two Sample t-test  data:  x1 and x2 t = -2.3588, df = 17.91, p-value = 0.0299 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:  -1.8988634 -0.1094742 sample estimates:  mean of x  mean of y  -0.1981598  0.8060090   > mood.test(x1,x2) [1] 0.1788954 

где t-тест отклоняет нулевую гипотезу (правильно), но тест Mood не работает.

Разница между «t-критерием отклоняет нулевую гипотезу» и «доверительные интервалы 95%, не перекрывающиеся», является лишь вопросом степени; последнее подразумевает первое.

В случае Tukey HSD: HSD пытается исправить проблему множественных сравнений. Следовательно, доверительные интервалы для парных различий, которые он генерирует, обычно намного шире, чем доверительные интервалы, генерируемые парными сравнениями, выполненными без учета проблемы множественных сравнений. Это может легко привести к ситуациям, в которых ANOVA отвергнет, но HSD не сможет отклонить конкретную парную нулевую гипотезу.

В качестве указаний в скобках, HSD предполагает, что все отклонения внутри группы одинаковы, что явно не близко к случаю ваших данных, поскольку, как представляется, внутригрупповые отклонения для групп A, B и C соответственно составляют примерно 35 долларов США, 160 долларов США и 48 долларов США соответственно. Вы можете проверить, почему это так; если это проблема с данными, которая может быть легко разрешима, но если это кажется реальным эффектом, это может оказать значительное влияние на HSD.

Вот что происходит, когда мы сравниваем индивидуальные доверительные интервалы друг с другом и результаты теста HSD на смоделированные данные. Параметры симулированных данных устанавливаются как близкие к тем, которые я получил из ваших данных выше, как я мог получить, учитывая ограниченное количество цифр точности, но это не имеет значения. Я пощадил неосторожного читателя и удалил много нерелевантных строк вывода. Как вы увидите, в этом конкретном прогоне (второй, который я выполнил) CI для средств A и B не перекрываются, но тест HSD не может отклонить нулевую гипотезу о том, что разница между этими двумя средствами равна $ 0 $:

> x <- c(rnorm(248,1.6,5.9), rnorm(1000,3.9,12.65), rnorm(102,2.5,6.9)) > cl <- as.factor(c(rep('A',248), rep('B',1000), rep('C',102))) >  > ma <- aov(x~cl) >  > TukeyHSD(ma)   Tukey multiple comparisons of means     95% family-wise confidence level  Fit: aov(formula = x ~ cl)  $cl           diff        lwr       upr     p adj B-A  1.5447169 -0.2854547 3.3748885 0.1174464 C-A -0.3394765 -3.3741952 2.6952423 0.9627381 C-B -1.8841934 -4.5658370 0.7974502 0.2257234  > t.test(x[cl=='A'])  # Lines not relevant to the CI removed... 95 percent confidence interval:  1.216763 2.699738  > t.test(x[cl=='B'])  # Lines not relevant to the CI removed  95 percent confidence interval:  2.743672 4.262262 

Учитывая, что вы выполняете несколько сравнений, я бы предпочел выводы Tukey в парах выводах t-теста, но я определенно проверил бы данные категории B, чтобы понять, почему дисперсия намного больше, чем для двух других категорий до финализации мой анализ.



Источник: switch-case.ru


Добавить комментарий