CONTRASTES DE HIPOTESIS PARA LA MEDIA: -si la duracion media de las baterias de la planta A es menor a 180 con un nivel de confianza del 99 % t.test(Battery$facilityA, mu=180, conf.level=.99, alternative="less") -realizar un contraste para ver si las baterias de la planta A duran mas que las de la planta B utilizando un nivel de confianza del 95 % t.test(Battery$facilityA, Battery$facilityB, conf.level=.95,alternative="greater") CONTRASTE DE UNA PROPORCION EN UNA POBLACION Preguntamos por la calle a 100 personas elegidas al azar sobre cierta cuestion y 42 personas responden que si a la misma. ¿Es este dato compatible con la hipotesis de que la proporcion de sies en la poblacion es del 50 %? prop.test(42,100,p=0.5) si queremos añadir nivel confianza: prop.test(42,100,p=0.5,conf.level=.99) sin la correccion de la continuidad de Yates: prop.test(42,100,p=0.5,conf.level=0.99,correct=F) CONTRASTE DE DOS PROPORCIONES Si otro encuestador realizo 200 encuestas y obtuvo 110 sies en otra poblacion, podemos preguntarnos si la proporcion de sies es la misma en las dos poblaciones: prop.test(c(42,110),c(100,200)) Se pueden comparar 4 muestras: smokers=c(83,90,129,70) patients=c(86,93,136,82) prop.test(smokers,patients) tambien podemos añadir las proporciones poblacionales (y por esto sale df=4 y no df=3): prop.test(smokers, patients, p=c(0.95,0.95,0.95,0.85)) AL TENER LAS PROPORCIONES MUESTRALES Simulamos una base de datos con 350 datos, 200 de ellos unos y el resto ceros. > x=c(rep(1,200),rep(0,150)) > y=sample(x) #con esta instruccion se desordenan los datos y parece mas real > w=as.factor(y) #Convertimos en factor el vector de ceros y unos > b=data.frame(w) #creamos una estructura de datos con el factor si no salen con negrita lo de estadisticos/proporciones/para una muestra.. poner: .Table=xtabs(~ w, data=b) .Table prop.test(rbind(.Table),alternative='two.sided',p=.5,conf.level=.95,correct=F) CASOS DE 2 MUESTRAS Crearemos una estructura de datos, fumadores con dos variables: fumador y salud, cada una con 250 valores. fumador <- sample(c("no","si"),size=250,replace=TRUE) salud <- sample(c("buena","mala"),size=250,replace=TRUE) table(fumador,salud) fumadores=data.frame(fumador,salud) hacer estadisticos/proporciones/para dos muestras.. otro test que se puede realizar en lo anterior es el de la ji-cuadrado de Pearson m <- matrix(table(fumador,salud),nrow=2) m chisq.test(m) CONTRASTANDO UNA MEDIA (ejemplo que no se puede hacer con t-test y se hace a mano) med.muestra=22;destip=1.5;n=10;mediaH0=25 t=(med.muestra-mediaH0)/(destip/sqrt(10)) t > p_valor=pt(t,df=n-1) > p_valor CONTRASTANDO UNA MEDIANA (prueba de signos) Queremos contrastar si la mediana es 5 x=c(12.8,3.5,2.9,9.4,8.7,0.7,0.2,2.8,1.9,2.8,3.1,15.8)restamos 5 a x: y=x-5 y contamos positivos: positivos=length(y[y>0]) contamos no nulos: nonulos=length(y[y!=0]) se aplica el test binomial: binom.test(positivos,nonulos,p=0.5) tambien se puede hacer con WILCOXON: wilcox.test(x,mu=5) y para añadir intervalo de confianza: wilcox.test(x,conf.int=TRUE) CONTRASTE DE MEDIAS PARA DOS MUESTRAS Se realiza un experimento para determinar el efecto del tiempo de curado del hormigon sobre la carga de rotura a compresion del mismo. Se han tomado dos muestras x e y de 15 probetas de hormigon cada una. La muestra x se somete a un curado de dos dias y la muestra y a uno de seis. x<-c(1236,1302,1324,1270,1287,1328,1318,1296,1306,1329,1255,1310,1255,1291,1280) y<-c(1387,1301,1376,1397,1399,1378,1343,1349,1321,1364,1332,1396,1372,1341,1374) ¿Puede concluirse que la media de la carga de rotura es superior para las probetas curadas durante 6 dias? con varianzas poblaciones iguales: t.test(x,y,var.equal=TRUE,alt="less") con varianas poblaciones distintas: t.test(x,y,alt="less") (calculos con correccion Welch) CASO DE DATOS EMPAREJADOS con poblaciones normales: t.test(x,y,paired=TRUE) con poblaciones no normales: wilcox.test(x,y,alternative="less") con intervalo de confianza: wilcox.test(x,y,alternative="less",conf.int=TRUE) si las poblaciones no pueden suponerse normales: x=c(586,568,587,550,543,552,562,577,558,571) y=c(582,569,587,543,540,548,563,572,559,566) wilcox.test(x,y,paired=TRUE) con intervalo de confianza: wilcox.test(x,y,paired=TRUE,conf.int=TRUE) HIPOTESIS DE NORMALIDAD x=c(1236,1302,1324,1270,1287,1328,1318,1296,1306,1329,1255,1310,1255,1291,1280) qqnorm(x) qqline(x) CONTRASTE DE VARIANZAS y=c(1387,1301,1376,1397,1399,1378,1343,1349,1321,1364,1332,1396,1372,1341,1374) var.test(x,y)