Estadística Industrial
PRUEBAS DE BONDAD DE AJUSTE, DE
INDEPENDENCIA, TABLAS DE CONTINGEN-
CIA Y HOMOGENEIDAD
[email protected]
Bibliografía recomendada: Devore, J. Probabilidad y Estadística para
ingeniería y ciencias. Cap. 14 Pruebas de bondad de ajuste y
análisis de datos categóricos.
2020-1
Pruebas de Bondad de Ajuste
Las medidas de bondad en general resumen la discrepancia entre los valores
observados y los valores esperados en el modelo de estudio.
La Prueba de Bondad de Ajuste Chi Cuadrado es el test de bondad de
ajuste más utilizado.
El procedimiento Prueba de Chi-Cuadrado tabula una variable en categorías y
calcula un estadístico χ2. Esta prueba de bondad de ajuste compara las
frecuencias observadas y esperadas en cada categoría para contrastar que
todas las categorías contengan la misma proporción de valores o que cada
categoría contenga una proporción de valores especificada por el usuario.
Ejemplos. La prueba de Chi-Cuadrado podría utilizarse para determinar si una
bolsa de caramelos contiene igual proporción de caramelos de color azul,
marrón, verde, naranja, rojo y amarillo. También podría utilizarse para ver si
una bolsa de caramelos contiene un 5% de color azul, un 30% de color marrón,
un 10% de color verde, un 20% de color naranja, un 15% de color rojo y un
15% de color amarillo.
Comentarios sobre la prueba Chi Cuadrado
a) El test de la 2 se puede aplicar en situaciones donde se desea decidir si una serie
de datos (observaciones) se ajusta o no a una función teórica previamente
determinada (Binomial, Poisson, Normal, etc.)
b) Es necesario que las frecuencias esperadas de las distintas modalidades no sea
inferior a cinco. Si alguna modalidad tiene una frecuencia esperada menor que
cinco se agrupan dos o más modalidades contiguas en una sola hasta conseguir
que la frecuencia esperada sea igual o mayor que cinco.
c) El número de grados de libertad del estadístico Chi-Cuadrado se calcula de la
siguiente forma:
A priori, tendrá tantos grados de libertad como parejas «frecuencia observada
- frecuencia esperada».
A esta cantidad se debe restar el número de restricciones lineales impuestas a
las frecuencias observadas, es decir, el número de parámetros que es
necesario calcular directamente a partir de los valores observados para
establecer los valores esperados. Este número es, como mínimo, uno ya que
siempre tendremos que calcular el número total de observaciones de la
muestra.
Un método estadístico, llamado técnica ji-cuadrada permite analizar
variables que se han medido a nivel nominal y tiene cuatro aplicaciones
principales:
1. Probar la supuesta independencia de dos variables cualitativas de una
población.
2. Hacer inferencias sobre más de dos proporciones de una población.
3. Hacer inferencias sobre la varianza de la población.
4. Realizar pruebas de bondad de ajuste para evaluar la credibilidad de que
los datos muestrales, vienen de una población cuyos elementos se
ajustan a un tipo específico de distribución de probabilidad.
Experimento multinomial
La distribución multinomial es similar a la distribución binomial, con la diferencia de
que en lugar de dos posibles resultados (atributos, categorías, características) en
cada ensayo, puede haber múltiples resultados:
a) Ejemplo de distribución binomial. A unas elecciones en el Distrito de Putina -
Puno se presentaron dos partidos políticos: el PO que obtuvo un 70% de los
votos y el JE el 30% restante ¿Cuál es la probabilidad de que al elegir 5
ciudadanos al azar, 4 de ellos hallan votado por el JE? Asumir que no hay votos
viciados ni en blanco.
n!
B(n, p) p x (1 p) n x
x!(n x)!
b) Ejemplo de distribución multinomial. A unas elecciones se presentaron cuatro
partidos políticos, el PO que obtuvo un 40% de los votos, el JE el 30%, el MU el
20% y el LA el 10% restante. ¿Cuál es la probabilidad de que al elegir 5
ciudadanos al azar, 3 hayan votado al PO, 1 al MU y 1 al LA? Asumir que no hay
votos viciados ni en blanco.
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN MULTINOMIAL
La prueba de bondad de ajuste se utiliza para probar la hipótesis de que una
distribución de frecuencias se ajusta (o concuerda con) alguna distribución de
probabilidad que se asevera.
La prueba determina si la población tiene las categorías en las proporciones
esperadas (teóricas). Las categorías son los valores que asume una variable
cualitativa; dicho de otra forma, las categorías son las “partes” en los que
podríamos “partir” una población.
Pasos:
1. Plantear las hipótesis: (Por ejemplo)
Ho: la población tiene las categorías en las proporciones esperadas.
Ha: la población no tiene las categorías en las proporciones esperadas.
2. Determinar el valor de α
3. Si p1, p2, p3, ... pk son las proporciones esperadas y n es el tamaño de la
muestra, entonces calcular las frecuencias esperadas mediante:
E1 = p1 * n / (p1 + p2 + p3 +...)
E2 = p2 * n / (p1 + p2 + p3 +...)
E3 = p3 * n / (p1 + p2 + p3 +...)
...
4. Construir la siguiente tabla:
Frecs. Observadas
Frecs. Esperadas
de las categorías (Oi-Ei)2 / Ei
(Ei)
(Oi)
Categoría 1
Categoría 2
...
2P Σ =
Nota: El estadístico de prueba tiene distribución Chi cuadrado con (k – m – 1)
grados de libertad siempre que las frecuencias esperadas sean 5 o más para
todas las categorías.
5. Sea r el número de categorías. Obtén χc21 - α con (r - 1) grados de
libertad
6. Si 2P es mayor o igual que χc2 rechazar Ho
Si 2P es menor que χc2 aceptar H0
6a. Otra alternativa será aplicar el p-value
Ejemplo 1. Sospechamos una Se quiere investigar si los
Sean 1000 valores de temperatura media horaria divididos en 6 clases: D. P. Normal datos se ajustan razonable-
mente con una distribución
38 horas han tenido una temperatura media de 0 °C gausiana. (a) α = 5%
144 horas han tenido una temperatura media de 1 °C µ = 2.47 (b) α = 1%
342 horas han tenido una temperatura media de 2 °C
287 horas han tenido una temperatura media de 3 °C σ = 1.11
164 horas han tenido una temperatura media de 4 °C
25 horas han tenido una temperatura media de 5 °C GL = k – m – 1. En donde:
K = número de clasificaciones
H0: Las temperaturas siguen una distribución normal. (categorías) en el
H1: Las temperaturas no siguen una distribución normal. problema. (6 para el
(Cada temperatura promedio se considera como marca de clase) ejemplo)
m = número de parámetros
Centro del Límites Variable Área bajo
intervalo del Estandarizada la curva # Esperado = # Observado
estimados a partir de los
(ºC) intervalo (z) en el 1000*Area datos muestrales para
intervalo
0 -0.5 -2.675 0.03415 34.15 38 0.434
obtener los valores
0.5 -1.775
esperados. (2: µ y σ)
1 0.5 -1.775 0.15318 153.18 144 0.550
1.5 -0.874
2 1.5 -0.874 0.31972 319.72 342 1.553
2.5 0.027
3 2.5 0.027 0.31248 312.48 287 2.078
3.5 0.928
4 3.5 0.928 0.14304 143.04 164 3.071
4.5 1.829
5 4.5 1.829 0.03048 30.48 25 0.985
5.5 2.730
Total
χ2p 8.671
Ejemplo 2.
A lo largo de los años las participaciones en el mercado
galletero de Elfos se han estabilizado en 30% para la
empresa A, 50% para la empresa B y 20% para la
empresa C. Esta última empresa ha elaborado un nuevo
producto para sustituir a uno de sus productos en el
mercado y pidió a la empresa de marketing Somos Lornas
Research que determinara si el nuevo producto modificaría
su participación en el mercado. Toma α = 5%.
Propuesta de solución:
La empresa de marketing realizará un estudio muestral y
calculará la proporción que prefiere el producto de cada
empresa. Después aplicará una prueba de hipótesis para
verificar si el nuevo producto modifica las participaciones
en el mercado galletero. Supón que el nuevo producto de
la empresa C no modifica las participaciones en el
mercado.
Ejemplo 2: Somos Lorna...
Para este estudio la empresa de investigación de mercado ha empleado un
panel de 200 consumidores. A cada individuo se le pide que indique su
preferencia entre el producto de la empresa A, de la empresa B o el nuevo
producto de la empresa C. Las respuestas obtenidas se presentan a
continuación:
Frecuencia observada
Producto de la Producto de la Producto de la
Empresa A Empresa B Empresa C
48 98 54
Ejemplo 2: Somos Lorna...
En este caso la distribución de p. de interés es una multinomial;
cada cliente se clasifica como cliente de la empresa A, de la empresa B
o de la empresa C. De manera que se tiene una población multinomial
con tres resultados posibles. Para las proporciones se usa la notación
siguiente:
• pA = participación en el mercado de la empresa A
• pB = participación en el mercado de la empresa B
• pC = participación en el mercado de la empresa C
Las hipótesis nula y alternativa serán las siguientes:
HO: pA = 0,30; pB = 0,50 y pC = 0,20
Ha : Las proporciones poblacionales no son pA = 0,30; pB
= 0,50 y pC = 0,20
Ejemplo 2: Somos Lorna...
Si los resultados muestrales llevan al rechazo de H0 la empresa tendrá
evidencias de que la introducción del nuevo producto afecta las
participaciones del mercado.
Ahora se realiza la prueba de bondad de ajuste para determinar si la
muestra de las 200 preferencias de los clientes coincide con la hipótesis
nula.
La prueba de bondad de ajuste se basa en la comparación de los
resultados muestrales observados con los resultados esperados, bajo la
suposición de que la hipótesis nula es verdadera.
Por tanto, el paso siguiente es calcular las preferencias esperadas en los
200 clientes, con el supuesto de que pA = 0,30, pB = 0,50 y pC = 0,20;
hacerlo dará los resultados esperados.
Ejemplo 2: Somos Lorna...
Frecuencia esperada (Teórica)
Producto de la Producto de la Producto de la
Empresa A Empresa B Empresa C
200(0,30) = 60 200(0,50) = 100 200(0,20) = 40
Como se observa, la frecuencia esperada de cada categoría se
encuentra multiplicando el tamaño de la muestra (200) por la proporción
hipotética de esa categoría.
Tip:
• En la prueba de bondad de ajuste lo que interesa son las diferencias
entre frecuencias observadas y esperadas. Grandes diferencias entre
frecuencias observadas y esperadas harán dudar sobre la exactitud de
las proporciones o participaciones en el mercado hipotético.
• El que las diferencias entre frecuencias observadas y esperadas sean
“grandes” o “pequeñas” es una cuestión que se determina con ayuda
del estadístico de prueba ji cuadrado.
• Las pruebas de hipótesis por bondad de ajuste siempre son de cola
derecha.
Ejemplo 2: Somos Lorna...
Estadístico para la prueba de bondad de ajuste:
Mediante las frecuencias observadas y esperadas se calcula el valor
del estadístico de prueba utilizando la fórmula anterior.
Tabla para calcular el chi cuadrado de prueba (completa la tabla)
Proporción Frecuencia Frecuencia
Categoría (fi - ei )2 /ei
hipotética observada fi esperada ei
Empresa A 0,3 48 60 144/60 = 2,40
Empresa B 0,5 98 100 4/100 = 0,04
Empresa C 0,2 54 40 196/40 = 4,90
Totales 200 Xp2 = 7,34
Ejemplo 2: Somos Lorna...
El área en la cola superior se emplea en el método del estadístico de
prueba ji cuadrado y en el método del valor-p para determinar si se
puede rechazar la hipótesis nula. Para (k – m - 1) = 2 grados de
libertad, en la tabla de la distribución chi-cuadrada se observan los
datos siguientes: (alternativamente se puede obtener a través del
Excel)
Área en la cola superior 0.10 0.05 0.025 0.01 0.005
Valor 𝑥2 = (2gl) 4.605 5.991 7.378 9.210 10.597
χp2 = 7,34
El estadístico de prueba 𝑋p2 = 7,34 se encuentra entre 5,991
y 7,378. Por consiguiente, el área correspondiente en la
cola superior o valor-p debe estar entre 0,05 y 0,025. Como
el valor-p ≤ α = 0,05, se rechaza H0 y se concluye que la
introducción en el mercado del nuevo producto de la
empresa C sí modifica la estructura de la participación en el
mercado galletero de Elfos.
Ejercicio.
Nemesia, directora de Demuéstralo Pues SA, tiene la responsabilidad de controlar el
nivel de existencias para cuatro tipos de automóvil vendidos por la firma. En el pasado,
ha ordenado nuevos automóviles bajo la premisa de que los cuatro tipos son
igualmente populares y la demanda de cada tipo es la misma. Sin embargo,
recientemente las existencias se han vuelto más difíciles de controlar, y Neme considera
que debería probar su hipótesis respecto a una demanda uniforme. Sus hipótesis son:
H0: La demanda es uniforme para los cuatro tipos de autos.
H1: La demanda no es uniforme para los cuatro tipos de autos.
La Tabla 1 muestra la expectativa uniforme para una muestra de 48 autos vendidos
durante el mes pasado. Realiza la prueba no paramétrica correspondiente para
comprobar que la demanda sigue una distribución rectangular para (a) α = 5% y (b) α =
2%
Tabla 1. Registro de Ventas de Demuéstralo Pues SA (en unidades)
Ventas esperadas
Tipo de auto Ventas observadas
(Completa la columna)
Kaput 15 12
Fiesta 11 12
Focus 10 12
Clio 12 12
R. (a) Gl = 3; Como 1,17 < 7,815 la hipótesis de que la demanda es uniforme no se
rechaza. (b)
Ejemplo 3. (Celda(s) con Frecuencia Esperada menor a 5).
Para analizar el número de artículos defectuosos en una fabrica ubicada en el Distrito de
Totos (Provincia de Cangallo), tomamos una muestra aleatoria de n = 60 artículos y se
observó el número de defectuosos y se obtuvieron los siguientes resultados (α = 0,05):
N° art. Frec.
Defectosos Observada
Se propuso una distribución
0 32
de Poisson. 1 15
2 9
3 4 Cálculo de Frecuencia Esperada
Total 60 N° art. Prob. Frec.
Defectosos Poisson Esperada
Las frecuencias esperadas se calculan multiplicando el 0 28,32
tamaño de la muestra n = 60 por las probabilidades Poisson. 1 21,24
2 7,98
3 o más 2,46
Considerando que la frecuencia esperada de la última celda es menor que 5 se combinan
las dos últimas celdas:
Cálculo de Frecuencia Esperada
reajustada
μ x μ
p ( x) e ( x 0; 1...)
N° art. Prob. Frec.
Defectosos Poisson Esperada
0
1
28,32
21,24 x!
2 o más 10,44
...
Como 2,94 (2p)es menor que 3,84 (2c: 5%; 1) no es posible rechazar la hipótesis nula de
que la distribución de los defectos sigue una distribución de Poisson.
Prueba no paramétrica de Independencia y de Homogeneidad
Prueba de Homogeneidad de varias muestras cualitativas, consiste
en comprobar si varias muestras de carácter cualitativo proceden de la misma
población; por ejemplo: ¿estas tres muestras de alumnos provienen
de poblaciones con igual distribución de aprobados?.
Es necesario que las dos variables medibles estén representadas mediante
categorías con las cuales construiremos una tabla de contingencia.
Prueba de Independencia, consistente en comprobar si dos características
cualitativas están relacionadas entre sí; por ejemplo: ¿el color de ojos está
relacionado con el color de los cabellos?.
Aunque conceptualmente difiere del anterior, operativamente proporciona los
mismos resultados.
Este tipo de contrastes se aplica cuando deseamos comparar una variable en
dos situaciones o poblaciones diferentes, i.e., deseamos estudiar si existen
diferencias en las dos poblaciones respecto a la variable de estudio.
Variable categórica. Una variable categórica es una variable que clasifica cada
individuo de una población en una de las varias clases mutuamente excluyentes
en que esta se divide.
Concepto de Asociación y/o Relación
Dos variables están relacionadas entre sí, cuando ciertos valores, de una de las
variables, se asocian con ciertos valores de la otra variable.
Por ejemplo, si tenemos en cuenta las variables género y estrés y... si sucede que
cuando se tiene el valor "Varón" en la variable género, hay una incidencia mayor
del valor "Sí" en la variable estrés, y además, cuando se tiene el valor "Mujer" en
la variable género, hay una incidencia mayor del valor "No" en la variable estrés,
decimos que las variables género y estrés están relacionadas.
Sin embargo, la asociación o relación entre las variables género y estrés también
podría ser al revés: los varones tienden a no tener estrés y las mujeres tienden a
tenerlo.
Aún existe otra opción posible que puede darse en esta situación: tanto los
varones como las mujeres pueden estar equiparados en el estrés o no estrés. Así,
no existiría asociación y/o relación entre las variables consideradas.
Dependencia funcional
(existe una relación matemática exacta entre ambas variables) El carácter X
depende del carácter Y, si a cada modalidad yj de Y corresponde una única
modalidad posible de X. Por lo tanto cualquiera que sea j, la frecuencia absoluta nij
vale cero salvo para un valor de i correspondiente a una columna j tal que nij = n.j
Cada columna de la tabla de frecuencias tendrá, por consiguiente, un único término
distinto de cero. Si a cada modalidad xi de X corresponde una única modalidad
posible de Y, será Y dependiente de X. La dependencia de X respecto de Y no implica
que Y dependa de X.
Para que la dependencia sea recíproca, los caracteres X e Y deben presentar el
mismo número de modalidades (debe ser n = m) y en cada fila como en cada
columna de la tabla debe haber uno y solo un término diferente de cero.
Sea X el salario de un empleado e Y la antigüedad del mismo en la empresa
Dependencia funcional recíproca: X depende de Y e Y depende de X
Y depende de X pero X no depende de Y.
Dependencia estadística
(existe una relación aproximada) Existen caracteres que ni son independientes, ni se
da entre ellos una relación de dependencia funcional, pero si se percibe una cierta
relación de dependencia entre ambos; se trata de una dependencia estadística.
Cuando los caracteres son de tipo cuantitativo, el estudio de la dependencia
estadística se conoce como el problema de "regresión", y el análisis del grado de
dependencia que existe entre las variables se conoce como el problema de
correlación.
Prueba no paramétrica de Independencia
(Chi-cuadrado de contingencia o independencia)
La condición de independencia: X e Y son independientes si y solo si para cualquier pareja
de valores x e y la probabilidad de que X tome el valor x e Y el valor y, simultáneamente, es
igual al producto de las probabilidades de que cada una tome el valor correspondiente.
Por tanto, todo lo que necesitamos serán unas estimas de las funciones de probabilidad de
ambas variables por separado (f(x) y f(y)) y de la función de probabilidad conjunta (f(x,y))
Ejemplos.
• La Ford Motor Company opera una planta de ensamble en Dearborn, Michigan. La
planta opera tres turnos por día, 5 días a la semana. El gerente de control de calidad
quiere comparar el nivel de calidad en los tres turnos. Los vehículos se clasifican por sus
niveles de calidad (aceptable, inaceptable) y por turnos (matutino, vespertino,
nocturno). ¿Hay alguna diferencia en el nivel de calidad en los tres turnos? Es decir,
¿está relacionada la calidad del producto con el turno que lo fabricó? ¿O es
independiente la calidad del producto del turno que lo fabricó?
• Una muestra de 100 conductores detenidos por rebasar los límites de velocidad se
clasificó por género y el uso del cinturón de seguridad. En esta muestra, ¿el uso del
cinturón de seguridad se relaciona con el género?
• ¿Un hombre liberado de una prisión preventiva tiene una adaptación diferente a la vida
civil si regresa a su ciudad natal o si se va a vivir a otra parte? Las dos variables son:
adaptación a la vida civil y lugar de residencia. Observa que las dos variables se miden
en una escala nominal.
Prueba de Independencia
Prueba de Tabla de Contingencias (Tabla de r x c)
Para probar si dos variables son independientes estadísticamente
se selecciona una muestra y se aplica la tabulación cruzada para
resumir, en forma simultánea, los datos de las dos variables.
Existen diferentes procedimientos estadísticos para el análisis de
las tablas de contingencia como la prueba 2, la prueba exacta de
fisher, la prueba de McNemar o la prueba Q de Cochran, entre
otras.
La prueba 2 en el contraste de independencia de variables
aleatorias cualitativas.
Ejemplo. La licorería Vino Para Quedarse distribuye tres tipos de
cerveza: Ligera, clara y oscura.
En un análisis de segmentación de mercado se desea conocer si
las preferencias para las tres cervezas son diferentes entre los
consumidores hombres y mujeres.
Se toma una muestra de 150 bebedores de cerveza. A
continuación la data.
Vino para...
Tabla de contingencia de preferencias de
cerveza y sexo del consumidor
Cerveza
Sexo Ligera Clara Oscura Total
Hombre 20 40 20 80
Mujer 30 30 10 70
Total 50 70 30 150
Grados de libertad en una Tabla de Contingencia
Los grados de libertad de un estadístico calculado sobre un conjunto
datos se refieren al número de cantidades independientes que se
necesitan en su cálculo, menos el número de restricciones que ligan a
las observaciones y el estadístico. El número de grados de libertad del
estadístico Chi-cuadrado se calcula de la siguiente forma:
Se calcula, en primer lugar el número de sumandos, es decir m x n,
siendo n y m el número de filas y número de columnas en la tabla.
A esta cantidad se debe restar el número de restricciones impuestas
a las frecuencias observadas. Observa que podemos cambiar todas
las frecuencias de la tabla sin cambiar los totales por filas y
columnas, excepto los datos en la última fila y la última columna de
la tabla, pues una vez que fijemos todos los valores excepto estos,
quedan automáticamente fijados.
Por tanto, si la tabla tiene m filas y n columnas, el número de grados
de libertad (k) es (m-1) * (n-1)
Vino para...
La frecuencia esperada para cualquier casilla de una tabla de r x c se puede
obtener multiplicando el total de renglón al que pertenece por el total de la
columna a la que pertenece por el total de la columna a la que pertenece y
dividiendo entre el total general de la tabla entera.
Frecuencias esperadas de independencia entre preferencias de
cerveza y sexo del consumidor
Cerveza Clara
Sexo Ligera (Completa Oscura Total
la col.)
Hombre 26.67 37.33 16.00 80.00
Mujer 23.33 32.67 14.00 70.00
Total 50.00 70.00 30.00 150.00
Vino para...
Hipótesis:
Ho: La preferencia de cerveza es independiente del sexo del consumidor
H1: La preferencia de cerveza no es independiente del sexo del consumidor
La prueba de independencia siempre es unilateral y la región de rechazo
está en la cola superior de la distribución chi-cuadrado.
n
p2
m fij e
ij
2
i 1 j 1 eij
fij frecuencia observada para la categoría fila i, columna j
eij frecuencia esperada para la categoría fila i, columna j.
eij cada celda debe ser 5 o más
gl (n 1)(m 1) donde n filas, m columnas
En tablas : 02.05,( n 1)(m 1) 02.05,( 21)(31) 02.05, 2 5.99
Vino para...
Tabla para hallar 2p
Sexo/Cerveza
(fij) (eij) (fij-eij)2/eij
H / Ligera
20 26.67 1.67
H / Clara
40 37.33 0.19
H / Oscura
20 16.00 1.00
M / Ligera
30 23.33 1.91
M / Clara
30 32.67 0.22
M / Oscura
10 14.00 1.14
(Completa)
Total 150 6.13
2p c2
6,3 5,99 Se rechaza H o . 2p
Ejercicio.
Chan_Fernando evalúa una propuesta para fusionarse con una corporación
fabricante de alimentos para pavos domésticos. El Directorio desea muestrear la
opinión de los accionistas comunes para determinar si esta es independiente del
número de acciones comunes que posee cada uno. Una muestra aleatoria de
250 accionistas de Chan_Fernando da los siguientes resultados:
Número de Opinión
acciones comunes A favor En contra Indecisos Totales
Menos de 200 38 29 9 76
200 - 1000 30 42 7 79
Más de 1000 32 59 4 95
Totales 100 130 20 250
¿Existe alguna razón para dudar de que la opinión con respecto a la
propuesta es independiente del número de acciones comunes que posee
cada accionista? Asume α = 0,1.
PRUEBA DE INDEPENDENCIA...
Propuesta de solución
La hipótesis nula de independencia de las dos características:
H0 : pij = pi.* p.j i = 1; 2; 3… j = 1; 2; 3;…
La opinion de los accionistas respecto a la fusion es independiente del
nùmero de acciones comunes que posee cada accionista.
H1: __________________________________________________________
Tabla de cálculo del estadístico Sumas
1,9 2,80036437 1,40236842 6,10273279
0,08101266 0,0206037 0,07316456 0,17478092
0,94736842 1,86558704 1,70526316 4,51821862
Suma Total 2 10,7957323
p
El valor obtenido de la muestra para χp2 = 10,7957323. El valor crítico que
se obtiene en la distribución chi-cuadrado es χc20,9;4 = 7,77943396. Como
10,795 > 7,779 el estadístico de prueba se encuentra dentro de la región
crítica y por tanto la hipótesis nula debe rechazarse.
Ejercicio. Serapio quiere estudiar si hay asociación entre la práctica deportiva y la
sensación de bienestar. Extrae una muestra aleatoria de 100 sujetos. Los datos
aparecen a continuación:
Sensación de Práctica deportiva Total
Bienestar Sí no
Sí 20 25 45
No 10 45 55
Total 30 70 100
fi . f . j
Cálculo de las frecuencias esperadas en caso de independencia: eij
Sensación
n
Práctica deportiva
de
Bienestar Sí No
Sí 13,5 31,5
No 16,5 38,5
Cálculo del estadístico Chi-cuadrado de la prueba:
p
2 = 3,1296 + 2,5606 + 1,3413 + 1,0974 = 8,13
Grados de libertad = 1; La probabilidad de obtener un valor 8,13 o mayor con 1 grado
de libertad es pvalue = 0,004. Por tanto el valor es estadísticamente significativo, pues es
menor que 0,01.
La decisión que se debe tomar es rechazar la hipótesis de independencia entre
bienestar y la práctica deportiva.