PRUEBA DEL SIGNO
Curso de Estadística Aplicada a la Gestión
Mg. ITALO ROMERO CUADROS
6
PRUEBA DEL SIGNO
Es una prueba no paramétrica que permite probar (1) si la mediana de una
población es igual a un valor particular , o bien, (2) si las medianas de dos
poblaciones son similares.
Esta prueba considera únicamente la dirección (signos) de las diferencias
generadas entre los valores de:
• una muestra respecto a un valor hipotético
• dos muestras relacionadas
La Prueba del Signo se basa en la distribución Binomial y en el hecho de que si
la mediana de la población de las diferencias es cero, entonces las probabilidades
P(+) y P(-) tendrán un valor de 0.5 para cualquier par de observaciones cuya
diferencia sea distinta de cero.
Suposiciones:
• La distribución de la variable es continua
• La escala de medición es cuando menos ordinal
PRUEBA DEL SIGNO
Se aplica para probar la hipótesis si la mediana o media es igual a un valor
conocido. Es la contraparte de la prueba t para la prueba de la media de
una población.
Caso 1: Para una muestra
Hipótesis de trabajo:
La muestra se extrajo de una población cuya mediana (Me) es igual a un valor
hipotético (Me0)
Hp: Me = Me0 Hp: Me = Me0 Hp: Me = Me0
Ha: Me Me0 Ha: Me < Me0 Ha: Me > Me0
Profesores A B C D Valor hipotético
Tiza marca X 2 5 4 1 Me = 4.5
Signo - + - -
di = xi – Me0
n = número de pares para los cuales di 0
T = número de pares para los cuales di > 0
P (E) = P (F) = 0.5 ó P(+) = P(-) = 0.5
Caso 2: Para dos muestras relacionadas
Hipótesis de trabajo:
Las muestras se extraen de una población donde la mediana (Me d) de las
diferencias es igual a cero
Hp: Med = 0 Hp: Med = 0 Hp: Med = 0
Ha: Med 0 Ha: Med < 0 Ha: Med > 0
Profesores A B C D
Tiza marca X 2 5 4 1
Tiza marca Y 3 5 3 3
Signo - 0 + -
di = x i – y i
n = número de pares para los cuales di 0
T = número de pares para los cuales di > 0
MUESTRAS PEQUEÑAS (nA 11 y nB 11)
1) Plantemiento de las hipótesis (Hp, Ha)
2) Nivel de significación ()
3) Prueba estadística
Dos colas: P = 2 P(X xA / n, = 0.5) = 2 P(X xB / n, = 0.5)
Una cola : P = P(X xA / n, = 0.5) ó P(X xB / n, = 0.5)
4) Regiones críticas
5) Conclusiones
Si P < entonces, Se rechaza Hp
Si P > entonces, Se acepta Hp
Ejemplo:
Se afirma que las unidades ensambladas en un sistema rediseñado de ensamble de
productos será mayor que con el sistema antiguo, cuya mediana es de 80
unidades por turno. Pruebe la hipótesis con un nivel de significación de 5%
Turno muestreado Unidades ensambladas Signo
1 75 -
2 85 +
3 92 +
4 80 0
5 94 +
6 90 +
7 91 +
8 76 -
9 88 +
10 82 +
11 96 +
12 83 +
Solución:
Hp: Me = 80 Hp: N = A
Ha: Me > 80 Hp: N > A
a = 0.05
Tabla de probabilidades binomiales
P = P(X 9 / n = 11, = 0.5) = 0.0269 + 0.0054 + 0.0005 = 0.0328
Como P = 0.0328 < = 0.05 entonces, se rechaza la Hp, es decir, las evidencias
muestrales indican para un nivel de significación de 0.05 que el sistema
rediseñado de ensamble de productos es mejor que el antiguo
Ejemplo:
Considere el resultado de un panel de prueba de 15 estudiantes que evalúa dos
tipos de clases: utilizando el método de casos y sin utilizar el método de casos. A
continuación se presentan las respuestas a la pregunta: ¿ Cómo califica la
eficiencia en el rendimiento de estos dos métodos ?. La calificación es de 1 a 4
donde 1 es un calificativo deficiente y 4 un calificativo excelente.
Miembro 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Con 2 1 4 4 3 3 4 2 4 1 3 3 4 4 4
casos
Sin casos 3 2 2 3 4 2 2 1 3 1 2 3 4 4 3
Signo - - + + - + + + + 0 + 0 0 0 +
Pruebe la hipótesis correspondiente. Use = 0.01
Solución:
Hp: Med = 0 Tamaño de muestra inicial 15
Ha: Med 0 Número de signos +8
Número de signos -3
Número de ceros 4
a = 0.01 Tamaño de muestra final 11
Tabla de probabilidades binomiales
P = 2 [P(X 3 / n = 11, = 0.5)] = 2 [ P(X=0) + P(X=1) + P(X=2) + P(X=3) ]
= 2 [ 0.0005 + 0.0054 + 0.0269 + 0.0806 ] = 2 [ 0.1134 ] = 0.2268
Como P = 0.2268 > = 0.01 entonces, se acepta la Hp, es decir, las evidencias
muestrales indican para un nivel de significación de 0.01 que ambos métodos de
enseñanza producen rendimientos similares
MUESTRAS GRANDES (nA > 11 y nB > 11)
1) Plantemiento de las hipótesis (Hp, Ha)
2) Nivel de significación ()
3) Prueba estadística
Z=x-/
Media = 0.50n
Variancia 2 = 0.25n
4) Regiones Críticas
5) Conclusiones
Ejemplo:
Considere el resultado de un panel de prueba de 40 estudiantes que evalúa dos
tipos de clases: utilizando el método de casos y sin utilizar el método de casos. A
continuación se presentan las respuestas a la pregunta: ¿ Cómo califica la
eficiencia en el rendimiento de estos dos métodos ?. La calificación es de 1 a 4
donde 1 es un calificativo deficiente y 4 un calificativo excelente. Plantee y
pruebe la hipótesis correspondiente. Use = 0.05
Miembro 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Con 2 1 4 4 3 3 4 2 4 1 3 3 4 4 4
casos
Sin casos 3 2 2 3 4 2 2 1 3 1 2 3 4 4 3
Signo - - + + - + + + + 0 + 0 0 0 +
Miembro 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Con 1 1 2 2 4 4 4 4 3 3 2 3 4 3 4
casos
Sin casos 2 3 2 3 3 1 4 3 3 2 2 1 1 1 3
Signo - - 0 - + + 0 + 0 + 0 + + + +
Mienbro 31 32 33 34 35 36 37 38 39 40
Con casos 3 1 4 3 2 2 2 1 3 3
Sin casos 2 2 4 4 3 3 1 1 4 2
Signo + - 0 - - - + 0 - +
Solución:
Hp: Med = 0 Tamaño de muestra inicial 40
Ha: Med 0 Número de signos +19
Número de signos - 11
Número de ceros 10
a = 0.05 Tamaño de muestra final 30
Tabla de probabilidades binomiales
Z = x - / = 19 – 15 / 2.74 = 1.46
= 0.50n = 0.50 (30) = 15
2 = 0.25n = 0.25 (30) = 7.5 = 2.74|
ZTAB = 1.96
Se acepta Hp
Ejemplo:
Una muestra aleatoria de 100 niños se les pidió que comparasen dos nuevos
sabores de helado: vainilla y fresa, si a 4 de ellos les daba igual y 56 prefirieron el
helado de vainilla, ¿ existe preferencia por un sabor u otro ?. Use = 0.05
Solución:
Hp: Med = 0
Ha: Med = 0
= 0.05
Z = x - / = 56 – 48 / 4.9 = 1.63
= 0.50n = 0.50 (96) = 48
2 = 0.25n = 0.25 (96) = 24 = 4.9|
ZTAB = 1.96
Se acepta Hp
Procedimiento de la
prueba del signo
EJERCICIO PROPUESTO
Se analizan dos paquetes de software para ser usados en el departamento de
control de inventarios de una pequeña empresa de manufactura. La firma
seleccionó 12 diferentes tareas de computación comunes para los dos tipos de
acciones que se espera realicen tales paquetes, y luego registró los segundos
que requería cada paquete para efectuar la tarea. Con un nivel de 0.10,
¿podemos concluir que la mediana de la diferencia para la población de tales
tareas sería cero?
Tarea Xi Yi
A 24.0 23.1
B 16.7 20.4
C 21.6 17.7
D 23.7 20.7
E 37.5 42.1
F 31.4 36.1
G 14.9 21.8
H 37.3 40.3
I 17.9 26.0
J 15.5 15.5
K 29.0 35.4
L 19.9 25.5
EJERCICIO PROPUESTO
¿El tipo de semilla afecta el crecimiento del maíz? En 1908 William Gosset
publicó el artículo “The Probable Error of a Mean” bajo el seudónimo de
“Student” (Biometrika, vol. 6, núm. 1). Él incluyó los datos que se listan en la
tabla para dos tipos diferentes de semillas de maíz (normales y secadas en
horno), que se utilizaron en parcelas de tierra adyacentes. Los valores
corresponden a las cosechas de cabezas de maíz (o mazorcas) en libras por
acre. Utilice la prueba del signo con un nivel de significancia de 0.05 para
probar la aseveración de que no hay diferencia entre las cosechas de las
semillas normales y las de las semillas secadas en horno
EJERCICIO PROPUESTO
Temperaturas corporales El conjunto de datos de Body Temperature incluye
temperaturas corporales medidas en adultos. Utilice las 106 temperaturas
listadas para las 12:00 a.m. del día 2 con la prueba del signo para probar la
aseveración de que la mediana es menor que 98.6°F. El conjunto de datos tiene
106 sujetos, 68 sujetos con temperaturas por debajo de 98.6°F, 23 sujetos con
temperaturas por arriba de 98.6°F y 15 sujetos con temperaturas iguales a
98.6°F.