Пермутационный t-критерий
Добавлено: 21 фев 2013, 21:46
Кто-нибудь знает, в R он есть в виде отдельной функции? Нужно сравнить средние двух выборок рандомизационным методом.
Геоинформационные системы (ГИС) и Дистанционное зондирование Земли
https://gis-lab.info/forum/
у вас заголовок поста неправильный: t-критерий параметрический, перестановочные критерии непараметрические, и то, и другое вместе не бывает.Dryomys писал(а):Кто-нибудь знает, в R он есть в виде отдельной функции? Нужно сравнить средние двух выборок рандомизационным методом.
Код: Выделить всё
library(boot)
x1<-rnorm(50,0,1)
x2<-rnorm(50,1,1)
ind<-rep(1:2,each=50)
tmp<-data.frame(x=c(x1,x2),series=ind) # имя series - фиксированное
abc.ci(tmp, mean.diff)
1) о каком "приведении к нормальному виду" вы говорите - по крайне мере в критерии Стьюдента его нет.Dryomys писал(а):gamm ничего подобного. Можно тут использовать пермутации, как раз смысл в том, что в данном случае не нужно заморачиваться с приведением данных к нормальному виду. Например: считаем t-критерий как обычно, потом 1000 раз считаем с помощью пермутаций, рисуем распределение и смотрим, куда попал наш, вычисленный по исходным данным.
для корреляции сам коэффициент корреляции и есть статистика (в отличие от t-статистики, для которой исходной статистикой, которую собственно и проверяют, является разность средних).Dryomys писал(а):Кстати, для параметрического коэффициента корреляции Пирсона в пакете coin функция есть.
посмотрел пакет coin. Там того, что вы предлагаете, естественно нет, там вообще параметрический (точный) критерий, распределение вероятностей для которого в некоторых случаях вычисляется с использованием перестановочных тестов. Никто там коэффициент корреляции не вычисляет, там вычисляется некоторая статистика, которая (при разных модификациях) может использоваться для проверки разных гипотез, там их дюжина. Так что название поправьте.Dryomys писал(а): Кстати, для параметрического коэффициента корреляции Пирсона в пакете coin функция есть.
1) приведенная функция не решает вашу задачуDryomys писал(а):искомая функция нашлась на сайте Пьера Лежандра adn.biol.umontreal.ca/~numericalecology/Rcode/
поскольку это парный тест (сравнение показателя объекта до treatment и после).Нужно сравнить средние двух выборок рандомизационным методом.
Код: Выделить всё
set.seed(123)
p.x<-rnorm(20)
p.y<-rnorm(20)
p.xy<-p.y - p.x
res.sd<-c()
for(i in 1:1000) {
ind<-rbinom(100,1,0.5)
p.xy1<-p.xy*(1-2*ind)
res.sd<-c(res.sd,sd(p.xy1))
}
p.sd<-sd(p.xy)
hist(res.sd,breaks=30,xlim=range(c(p.sd,res.sd)))
lines(c(p.sd,p.sd),c(0,1000),col="red")