CONTRASTES DE HIPOTESIS PARA LA MEDIA:
-si la duracion media de las baterias de la planta A es menor a 180 con un nivel de confianza del 99 %
t.test(Battery$facilityA, mu=180, conf.level=.99, alternative="less")
-realizar un contraste para ver si las baterias de la planta A duran mas que las de la planta B utilizando un nivel de confianza del
95 %
t.test(Battery$facilityA, Battery$facilityB, conf.level=.95,alternative="greater")
CONTRASTE DE UNA PROPORCION EN UNA POBLACION
Preguntamos por la calle a 100 personas elegidas al azar sobre cierta cuestion y 42 personas responden que si a la misma. ¿Es este
dato compatible con la hipotesis de que la proporcion de sies en la poblacion es del 50 %?
prop.test(42,100,p=0.5)
si queremos añadir nivel confianza: prop.test(42,100,p=0.5,conf.level=.99)
sin la correccion de la continuidad de Yates:
prop.test(42,100,p=0.5,conf.level=0.99,correct=F)
CONTRASTE DE DOS PROPORCIONES
Si otro encuestador realizo 200 encuestas y obtuvo 110 sies en otra poblacion,
podemos preguntarnos si la proporcion de sies es la misma en las dos poblaciones:
prop.test(c(42,110),c(100,200))
Se pueden comparar 4 muestras:
smokers=c(83,90,129,70)
patients=c(86,93,136,82)
prop.test(smokers,patients)
tambien podemos añadir las proporciones poblacionales (y por esto sale df=4 y no df=3):
prop.test(smokers, patients, p=c(0.95,0.95,0.95,0.85))
AL TENER LAS PROPORCIONES MUESTRALES
Simulamos una base de datos con 350 datos, 200 de ellos unos y el resto
ceros.
> x=c(rep(1,200),rep(0,150))
> y=sample(x) #con esta instruccion se desordenan los datos y parece mas real
> w=as.factor(y) #Convertimos en factor el vector de ceros y unos
> b=data.frame(w) #creamos una estructura de datos con el factor
si no salen con negrita lo de estadisticos/proporciones/para una muestra.. poner:
.Table=xtabs(~ w, data=b)
.Table
prop.test(rbind(.Table),alternative='two.sided',p=.5,conf.level=.95,correct=F)
CASOS DE 2 MUESTRAS
Crearemos una estructura de datos, fumadores con dos variables: fumador y salud,
cada una con 250 valores.
fumador <- sample(c("no","si"),size=250,replace=TRUE)
salud <- sample(c("buena","mala"),size=250,replace=TRUE)
table(fumador,salud)
fumadores=data.frame(fumador,salud)
hacer estadisticos/proporciones/para dos muestras..
otro test que se puede realizar en lo anterior es el de la ji-cuadrado de Pearson
m <- matrix(table(fumador,salud),nrow=2)
m
chisq.test(m)
CONTRASTANDO UNA MEDIA (ejemplo que no se puede hacer con t-test y se hace a mano)
med.muestra=22;destip=1.5;n=10;mediaH0=25
t=(med.muestra-mediaH0)/(destip/sqrt(10))
t
> p_valor=pt(t,df=n-1)
> p_valor
CONTRASTANDO UNA MEDIANA (prueba de signos)
Queremos contrastar si la mediana es 5
x=c(12.8,3.5,2.9,9.4,8.7,0.7,0.2,2.8,1.9,2.8,3.1,15.8)restamos 5 a x:
y=x-5
y
contamos positivos: positivos=length(y[y>0])
contamos no nulos: nonulos=length(y[y!=0])
se aplica el test binomial:
binom.test(positivos,nonulos,p=0.5)
tambien se puede hacer con WILCOXON:
wilcox.test(x,mu=5)
y para añadir intervalo de confianza: wilcox.test(x,conf.int=TRUE)
CONTRASTE DE MEDIAS PARA DOS MUESTRAS
Se realiza un experimento para determinar el efecto del tiempo de
curado del hormigon sobre la carga de rotura a compresion del mismo. Se
han tomado dos muestras x e y de 15 probetas de hormigon cada una. La
muestra x se somete a un curado de dos dias y la muestra y a uno de seis.
x<-c(1236,1302,1324,1270,1287,1328,1318,1296,1306,1329,1255,1310,1255,1291,1280)
y<-c(1387,1301,1376,1397,1399,1378,1343,1349,1321,1364,1332,1396,1372,1341,1374)
¿Puede concluirse que la media de la carga de rotura es superior para las probetas
curadas durante 6 dias?
con varianzas poblaciones iguales: t.test(x,y,var.equal=TRUE,alt="less")
con varianas poblaciones distintas: t.test(x,y,alt="less") (calculos con correccion Welch)
CASO DE DATOS EMPAREJADOS
con poblaciones normales:
t.test(x,y,paired=TRUE)
con poblaciones no normales:
wilcox.test(x,y,alternative="less")
con intervalo de confianza: wilcox.test(x,y,alternative="less",conf.int=TRUE)
si las poblaciones no pueden suponerse normales:
x=c(586,568,587,550,543,552,562,577,558,571)
y=c(582,569,587,543,540,548,563,572,559,566)
wilcox.test(x,y,paired=TRUE)
con intervalo de confianza: wilcox.test(x,y,paired=TRUE,conf.int=TRUE)
HIPOTESIS DE NORMALIDAD
x=c(1236,1302,1324,1270,1287,1328,1318,1296,1306,1329,1255,1310,1255,1291,1280)
qqnorm(x)
qqline(x)
CONTRASTE DE VARIANZAS
y=c(1387,1301,1376,1397,1399,1378,1343,1349,1321,1364,1332,1396,1372,1341,1374)
var.test(x,y)