La prueba ANOVA
MEM. JUAN MANUEL ESCOBEDO HERNÁNDEZ
¿Cómo funciona la prueba ANOVA?
Recuerde que se desea determinar si varias medias muestrales provienen
de una sola población o de poblaciones con medias diferentes. En realidad,
estas medias muestrales se comparan mediante sus varianzas.
Una de estas suposiciones fue que las desviaciones estándares de las
diversas poblaciones normales tenían que ser las mismas.
Se aprovecha este requisito en la prueba ANOVA. La estrategia es estimar
la varianza de la población (desviación estándar al cuadrado) de dos formas
para después determinar la razón de dichas estimaciones.
Si esta razón es aproximadamente 1, entonces por lógica las dos
estimaciones son iguales, y se concluye que las medias poblacionales no
son iguales.
La distribución F sirve como un árbitro para indicar en qué instancia la razón
de las varianzas muestrales es mucho mayor que 1 para haber ocurrido por
casualidad.
En un ejemplo del centro financiero. El gerente desea determinar si hay una
diferencia entre los números medios de clientes atendidos.
Para iniciar, determine la media global de las 12 observaciones. Ésta es de
58, calculada de (55+54+…+48)/12. Después, en cada una de las 12
observaciones encuentre la diferencia entre el valor particular y la media
global.
Cada una de estas diferencias se eleva al cuadrado y estos cuadrados se
suman. Este término se denomina variación total.
Desde hace algún tiempo las aerolíneas han reducido sus servicios, como
alimentos y bocadillos durante sus vuelos, y empezaron a cobrar un precio
adicional por algunos de ellos, como llevar sobrepeso de equipaje, cambios
de vuelo de último momento y por mascotas que viajan en la cabina. Sin
embargo, aún están muy preocupadas por el servicio que ofrecen. Hace
poco un grupo de cuatro aerolíneas contrató a Brunner Marketing Research,
Inc., para encuestar a sus pasajeros sobre la adquisición de boletos,
abordaje, servicio durante el vuelo, manejo del equipaje, comunicación del
piloto, etc. Hicieron 25 preguntas con diversas respuestas posibles:
excelente, bueno, regular o deficiente. Una respuesta de excelente tiene
una calificación de 4, bueno 3, regular 2 y deficiente 1. Estas respuestas se
sumaron, de modo que la calificación final fue una indicación de la
satisfacción con el vuelo. Entre mayor la calificación, mayor el nivel de
satisfacción con el servicio.
La calificación mayor posible fue 100. Brunner seleccionó y estudió al azar
pasajeros de las cuatro aerolíneas. A continuación se muestra la información. ¿Hay
alguna diferencia entre los niveles de satisfacción medios con respecto a las cuatro
aerolíneas? Use el nivel de significancia de 0.01.
Utilice el procedimiento de prueba de hipótesis de cinco pasos.
Paso 1: Formule las hipótesis nula y alternativa. La hipótesis nula es que
las calificaciones medias de las cuatro aerolíneas son iguales.
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
La hipótesis alternativa es que no todas las calificaciones medias son
iguales.
𝐻1 = No todas las calificaciones medias son iguales.
La hipótesis alternativa también se considera como “al menos dos
calificaciones medias no son iguales”.
Si no se rechaza la hipótesis nula, se concluye que no hay una diferencia
entre las calificaciones medias de las cuatro aerolíneas.
Si se rechaza 𝐻0 , se concluye que hay una diferencia en al menos un par
de calificaciones medias, pero en este punto no se sabe cuál par o cuántos
pares difieren.
Paso 2: Seleccione el nivel de significancia. Seleccionó el nivel de
significancia de 0.01.
Paso 3: Determine el estadístico de prueba. El estadístico de prueba
sigue la distribución F.
Paso 4: Formule la regla de decisión. Para determinar la regla de
decisión, necesita el valor crítico. El valor crítico del estadístico F.
Los valores críticos del nivel de significancia 0.05 se encuentran en la
primera página, y el nivel de significancia de 0.01, en la segunda. Para
utilizar esta tabla necesita conocer los grados de libertad del numerador y
del denominador.
Los grados de libertad del numerador son iguales al número de
tratamientos, designado k, menos 1. Los grados de libertad del
denominador son el número total de observaciones, n, menos el número de
tratamientos. En este ejemplo hay cuatro tratamientos y un total de 22
observaciones.
Grados de libertad del numerador k – 1 = 4 – 1 = 3
Grados de libertad del denominador n – k = 22 – 4 = 18
Consultar el nivel de significancia de 0.01. Moverse horizontalmente por la
parte superior a tres grados de libertad del numerador. Después vaya hacia
abajo por esa columna hasta la fila con 18 grados de libertad.
El valor en esta intersección es 5.09. Por lo tanto, la regla de decisión es
rechazar H0 si el valor calculado de F es mayor que 5.09.
Paso 5: Seleccione la muestra, realice los cálculos y tome una
decisión.
Es conveniente resumir los cálculos del estadístico F en una tabla ANOVA.
El formato de una tabla ANOVA es como sigue. En los paquetes de software
estadístico también se emplea este formato.
Hay tres valores, o suma de cuadrados, para calcular el estadístico de
prueba F. Estos valores se determinan al obtener SS total y SSE, después
SST mediante una resta. El término SS total es la variación total, SST es la
variación debida a los tratamientos, y SSE es la variación dentro de los
tratamientos o el error aleatorio.
En general, el proceso se inicia al determinar SST total: la suma de las
diferencias elevadas al cuadrado entre cada observación y la media global.
La fórmula para determinar SS total es:
2
𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 = 𝑥 − 𝑥ҧ𝐺
donde:
𝑥 = 𝑒𝑠 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
𝑥ҧ𝐺 = 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 𝑜 𝑡𝑜𝑡𝑎𝑙.
En seguida se determina SSE o la suma de los errores elevados al
cuadrado: la suma de las diferencias elevadas al cuadrado entre cada
observación y su respectiva media de tratamiento. La fórmula para
encontrar SSE es:
2
𝑆𝑆𝐸 = 𝑥 − 𝑥ҧ𝐶
donde:
𝑥ҧ𝐶 = 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑑𝑒𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑐.
A continuación se presentan los cálculos detallados de SS total y SSE de este
ejemplo. Para determinar los valores de SS total y SSE se comienza por
calcular la media global o total.
Hay 22 observaciones y el total es 1 664, por lo cual la media total es 75.64.
Luego se encuentra la desviación de cada observación a la
media total: se elevan al cuadrado estas desviaciones y se
suma el resultado de las 22 observaciones. Por ejemplo, el
primer pasajero encuestado tenía una calificación de 94, y la
media global o total es 75.64. Por lo tanto 𝑥 − 𝑥𝐺 = 94 −
75.64 = 18.36, En el caso del último pasajero, 𝑥 − 𝑥𝐺 = 65 −
75.64 = −10.64. los cálculos relativos a los otros pasajeros son:
Después se eleva al cuadrado cada una de estas diferencias y
se suman todos los valores. Así, en el caso del primer
pasajero:
𝑥 − 𝑥ҧ𝐺 2 = 94 − 75.64 2 = 18.36 2 = 337.09
Por último, se suman todas las diferencias elevadas al cuadrado,
como se indica en la fórmula. El valor SS total es 1 485.10
Para calcular el término SSE se encuentra la desviación entre cada observación y su media de
tratamiento. En el ejemplo, la media del primer tratamiento (es decir, los pasajeros en
349
Northern Airlines) es 87.25, determinada mediante 𝑥ҧ𝑁 = . El subíndice N se refiere a
4
Northern Airlines.
El primer pasajero calificó a Northern con 94, por lo que 𝑥 − 𝑥ҧ𝑁 = 94 − 87.25 = 6.75
El primer pasajero del grupo de TWA respondió con una calificación total de 75, por lo cual
𝑥 − 𝑥ҧ𝑤 = 75 − 78.20 = −3.2. El detalle de todos los pasajeros es:
Cada uno de estos valores se eleva al cuadrado y después se suman las 22 observaciones. Los
valores se muestran en la siguiente tabla.
2
Por lo tanto, el valos SSE es 594.41. Es decir, σ 𝑥 − 𝑥ҧ𝑐 = 594.41
Por último, se determina SST, la suma de los cuadrados debida a los tratamientos,
con la resta:
𝑆𝑆𝑇 = 𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 − 𝑆𝑆𝐸
En este ejemplo:
𝑆𝑆𝑇 = 𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 − 𝑆𝑆𝐸 = 1485.10 − 594.41 = 890.69
Para determinar el valor calculado de F, consulte la tabla ANOVA. Los grados de
libertad del numerador y del denominador son los mismos que en el paso 4 en la
página 420, donde se determinó el valor crítico de F. El término media cuadrática es
otra expresión de la estimación de la varianza. La media cuadrática de tratamientos
es SST dividido entre sus grados de libertad. El resultado es la media cuadrática de
tratamientos, y se escribe MST. Calcule el error medio cuadrático de una manera
similar. Para ser precisos, divida SSE entre sus grados de libertad. Para completar el
proceso y obtener F, divida MST entre MSE. Sustituya los valores particulares de F
en una tabla ANOVA y calcule el valor de F, como se muestra a continuación.
El valor calculado de F es 8.99, mayor que el valor crítico de 5.09, por
lo que la hipótesis nula se rechaza. La conclusión es que no todas las
medias poblacionales son iguales. Las calificaciones medias de las
cuatro aerolíneas no son iguales. Es probable que las calificaciones de
los pasajeros se relacionen con una de ellas. En este punto sólo es
posible concluir que hay una diferencia entre las medias del
tratamiento. No se puede determinar cuáles ni cuántos grupos de
tratamientos difieren.