SlideShare una empresa de Scribd logo
Coeficientes Correlación:
Phi, Contingencia, Biserial, Spearman
Prof: Johnnalid González G.
2018
Universidad Central de Venezuela
Facultad de Humanidades y Educación
Escuela de Educación
Cátedra: Métodos Cuantitativos
Asignatura: Estadística Aplicada a la Educación
Introducción
Prof.: Johnnalid González G.
El presente tema pretende estudiar coeficientes de correlación, para
determinar el grado de asociación de variables cualitativas, es decir,
aquellas variables cuyas modalidades no se pueden cuantificar.
La técnica de la correlación ordinal puede aplicarse también a mediciones,
si a estos valores se les asigna un número de acuerdo a su cuantía y
característica. Ej: los resultados de una prueba (estadística, inglés u otra
asignatura) pueden ser representados por medio de números ordinales que
indican las posiciones o lugares ocupado por quienes la presentaron.
Estructura de las Escalas de Medición
Prof.: Johnnalid González G.
Datos
Cuantitativos
Intervalo Razón
Correlación Ordinal
Cuando los valores de dos variables están
representados por números ordinales, para
calcular la magnitud de la posible relación entre
ellas, se utilizan los llamados coeficientes de
correlación ordinal o de rango, siendo los de
mayor uso, el de Spearman y el de Kendall.
Fuente: Chourio, Hugo.2011:175.
Prof.: Johnnalid González G.
Correlación Ordinal
Cuando los valores de dos variables están
representados por números ordinales, para
calcular la magnitud de la posible relación entre
ellas, se utilizan los llamados coeficientes de
correlación ordinal o de rango, siendo los de
mayor uso, el de Spearman y el de Kendall.
Fuente: Chourio, Hugo.2011:175.
Prof.: Johnnalid González G.
Aspectos a considerar:
Es el coeficiente más empleado en los métodos de correlación por rangos
Se recomienda usar este método, con datos entre 25 o 30 o menos
Las variables son medidos en escalas ordinales
Es más fácil y rápido de calcular que el Coeficiente de Correlación de
Pearson.
Propiedades:
Toma valores entre – 1 < rs <+ 1
El coeficiente rs es un caso particular de xy
Si calculamos el coeficiente de correlación de Pearson entre dos variables
X e Y, y el coeficiente de correlación de Spearman para las mismas
puntuaciones pero transformadas en rangos, ambos coeficientes se
aproximan en valor según aumenta el número de sujetos n.
Coeficiente de Spearman
Prof.: Johnnalid González G.
APLICACIÓN DEL COEFICIENTE DE SPEARMAN:
Un hecho común en los estudios de investigación es que las respuestas a
las preguntas en que los investigadores están más interesados sólo se
pueden medir con escalas ordinales o incluso nominales.
Por ejemplo:
Si estuvieran interesados en estudiar el consumo de café entre hombres y
mujeres. En este caso, aplicar el coeficiente de correlación de Pearson a los
datos podría suponer que estas medidas de sexo tienen propiedades de
escala de intervalo o de razón y posiblemente producirá resultados
engañosos o exagerados.
Coeficiente de Spearman
Prof.: Johnnalid González G.
Definición:
Es un caso especial del Coeficiente de Correlación de Pearson, cuando los
valores se presentan como los primeros números consecutivos.
Si los rangos se tratan como puntajes u otros valores, y no hay rangos
empates, entonces es cierto que:  = rs, entonces la fórmula a emplear
sería:
Coeficiente de Spearman
1
1
,
6
1
6
1
)
1
)(
1
(
1
2
3
1
2












 

r
n
n
n
d
n
d
r s
n
i
i
n
i
i
s
n
Prof.: Johnnalid González G.
Pasos para el cálculo del Coeficiente de Spearman:
1) Verificar que los datos estén dados en rangos o posiciones
2) Establecer la diferencia entre los rangos ocupados por cada variable de
estudio.
3) Elevar al cuadrado cada una de estas diferencias
4) Aplicar la fórmula
5) Interpretar el resultado
Coeficiente de Spearman
1
1
,
6
1
6
1
)
1
)(
1
(
1
2
3
1
2












 

r
n
n
n
d
n
d
r s
n
i
i
n
i
i
s
n
Prof.: Johnnalid González G.
Ejemplo 1:
Se desea conocer el grado de relación entre las posiciones que ocuparon
10 atletas que tomaron parte en dos pruebas de 100 (Xi ) y 200 (Yi ) mts
planos. Los resultados se muestran a continuación:
Coeficiente de Spearman
Atleta A B C D E F G H I J
100 1 2 4 3 5 6 7 8 10 9
200 2 1 3 4 6 5 7 8 9 10
Prof.: Johnnalid González G.
Procedimiento:
1) Los valores están dados directamente en rangos
2) Establecer la diferencia entre los lugares ocupados por cada atleta:
di = Xi - Yi
Coeficiente de Spearman
Atleta A B C D E F G H I J
100
(Xi )
1 2 4 3 5 6 7 8 10 9
200
(Yi )
2 1 3 4 6 5 7 8 9 10
di -1 1 1 -1 -1 1 0 0 1 -1
Prof.: Johnnalid González G.
Procedimiento:
3) Elevar al cuadrado cada diferencia y finalmente sumar el cuadrado de
tales diferencias.  di
2 .
Coeficiente de Spearman
Atleta A B C D E F G H I J
100
(Xi )
1 2 4 3 5 6 7 8 10 9
200
(Yi )
2 1 3 4 6 5 7 8 9 10
di -1 1 1 -1 -1 1 0 0 1 -1
di2 1 1 1 1 1 1 0 0 1 1 =  di
2 = 8
Prof.: Johnnalid González G.
4) Aplicar la fórmula
Coeficiente de Spearman
95
,
0
9
*
11
*
10
8
*
6
1
6
1
)
1
)(
1
(
1
2









n
n
n
d
r
n
i
i
s
5) Interpretación: Los atletas que lograron las mejores posiciones
en la prueba de 100 metros planos, tienden en forma muy alta a
obtener las mejores posiciones en la prueba de 200 metros planos.
Prof.: Johnnalid González G.
Ejemplo 2:
Calcular e interpretar el Coeficiente de Correlación de Spearman, entre los
resultados obtenidos por un grupo de estudiantes de tercer año en dos
pruebas objetivas finales de lapso, Castellano (Xi ) y Cs. Biológicas (Yi ).
Coeficiente de Spearman
Estudiantes A B C D E F G
Castellano 48 47 46 46 45 43 43
Cs
Biológicas
25 25 19 12 12 12 11
Prof.: Johnnalid González G.
Coeficiente de Spearman
Estudiantes A B C D E F G
Castellano
(Xi )
48 47 46 46 45 43 43
Cs
Biológicas
(Yi )
25 25 19 12 12 12 11
(Xi ´) 1 2 3,5 3,5 5 6,5 6,5
(Yi ´) 1,5 1,5 3 5 5 5 7
Procedimiento:
1) Se convierte los puntajes en posiciones, de la siguiente manera: en la Variable Xi
(Castellano), el estudiante A obtuvo la mayor puntuación, entonces se le asigna la
posición 1 y asi sucesivamente, en el caso de los estudiantes C y D, tienen las
mismas puntuaciones, es decir se tiene un “empates”, se deben sumar los
lugares que les tocarían si no estuviesen empates y se divide entre el número de
valores iguales, de la misma forma se le aplicaría a los estudiantes F y G.
Prof.: Johnnalid González G.
Coeficiente de Spearman
Estudiantes A B C D E F G
(Xi ´) 1 2 3,5 3,5 5 6,5 6,5
(Yi ´) 1,5 1,5 3 5 5 5 7
di -0,5 0,5 0,5 -1,5 0 1,5 -0,5
di2 0,25 0,25 0,25 2,25 0 2,25 0,25
Procedimiento:
2) Establecer la diferencia entre los lugares ocupados por cada atleta:
di = Xi ´- Yi ´.
3) Elevar al cuadrado cada diferencia y finalmente sumar el cuadrado de tales
diferencias.  di
2 .
=  di
2 = 5,5
Prof.: Johnnalid González G.
4) Aplicar la fórmula
Coeficiente de Spearman
90
,
0
6
*
8
*
7
5
,
5
*
6
1
6
1
)
1
)(
1
(
1
2









n
n
n
d
r
n
i
i
s
5) Interpretación: Los estudiantes que lograron las mejores notas
en la prueba de Castellano, tienden muy altamente a obtener las
mejores calificaciones en la prueba de Ciencias Biológicas.
Prof.: Johnnalid González G.
Definición:
El coeficiente de correlación biserial, se utiliza cuando queremos conocer la
correlación existente entre dos variables, de las cuales una ha sido
considerada como escala de intervalos y la otra resulta ser una variable
dicotómica (significa que toma dos modalidades. Ej: sexo, si o no, etc).
Observación: Cuando la variable continua dicotomizada, o ambas variables,
se desvían demasiado de la distribución normal, el valor calculado del
coeficiente de correlación rb , es mayor que la unidad.
Coeficiente de Correlación Biserial
Prof.: Johnnalid González G.
Coeficiente de Correlación Biserial
y
q
p
st
x
x q
p
b
r
*
*




Las fórmulas empleadas para calcular el coeficiente de correlación
biserial son las siguientes:
ó y
p
St
x
x t
p
b
r *




Donde:
p
x

Media aritmética de la categoría “p”
st Desviación típica total
es la proporción de observaciones de unas de dos modalidades
p
y Altura de la ordenada que separa en la curva normal a las proporciones “p” y “q”
Prof.: Johnnalid González G.
Coeficiente de Correlación Biserial
Ejemplo 1:
Un grupo de bachilleres aspirantes a FACES de la UCV, fue sometido a una prueba
objetiva de conocimientos generales (PCG: Xi ) y a un test de aptitud (Yi ) hacia las
carreras vigentes en esa Facultad. Se desea saber qué relación existe entre los
puntajes obtenidos en la prueba y los resultados del test. El test ha sido
dicotomizado así: Con Vocación (CV) y Sin Vocación (SV). Los resultados fueron los
siguientes:
ASP 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
PCG 54 53 60 44 39 34 36 43 49 62 66 46 44 49 56 48
TEST 28 24 30 17 20 16 18 22 22 28 30 22 17 18 15 24
Asp
1
7
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
PCG 45 35 65 54 48 56 49 57 54 40 49 50 43 68 44 68
TEST 20 16 25 27 26 29 22 26 22 14 18 23 22 29 16 28
Prof.: Johnnalid González G.
Coeficiente de Correlación Biserial
Pasos para el cálculo del Coeficiente de Correlación Biserial:
1) Determinar las características de las variables
2) Se distribuye la variable continua no dicotomizada en intervalo de clase
3) Se calcula el rango y el número de clases
4) Construir la tabla de distribución de la variable Yi
5) Se calcula el factor dicotomizador de la variable Yi , para obtener las dos
categorías, a la cual, llamaremos “p” y “q”.
6) Se construye la tabla de Dicotomización de la variable Yi y operaciones
Dicotomización de la
variable Yi y operaciones
Prof.: Johnnalid González G.
Coeficiente de Correlación Biserial
Cálculos:
Paso 5:
.
31
,
22
32
714
ptos
n
Y Yi





Se calcula el Coeficiente de Correlación Biserial
93
,
0
)
3944
,
0
44
,
0
(
*
06
,
9
75
,
50
28
,
58
* 






y
p
St
x
x t
p
b
r
Interpretación: Los bachilleres que lograron las mejores puntuaciones
en la prueba de conocimientos generales, tienden muy altamente a
obtener las mejores calificaciones en el test y viceversa.
Prof.: Johnnalid González G.
Coeficiente de Correlación Phi ()
Aspectos a considerar:
Se utiliza cuando las dos variables son dicotómicas: Verdadero o Falso, Si o
No.
Este coeficiente al igual que el Coeficiente de Correlación Biserial Puntual,
son coeficientes producto-momento, del tipo de Pearson, aun cuando no
posean la misma precisión de este último.
Es el más utilizado en análisis de ítems.
Cuando las dos variables se reparten por igual, los límites máximos del
coeficiente de correlación Phi se encuentra entre -1 y +1.
Prof.: Johnnalid González G.
La fórmula a emplear sería:
Coeficiente de Correlación Phi ()
1
1
,
)
)(
)(
)(
(









 

C
A
D
B
D
C
B
A
BC
AD
Donde las letras A,B, C y D, representan las frecuencias de la siguiente
tabla de doble entrada:
(+ -)
B
(+ +)
A
(A + B)
p
Las
proporciones
son:
(- -)
D
(- +)
C
(C+ D)
q
p=(A+B)/n
q=(C+D)/n
(B + D)
q´
(A + C)
p´ n
p´=(A+C)/n
q´=(B+D)/n
Prof.: Johnnalid González G.
Ejemplo:
Diez estudiantes presentaron un examen de Sociología y se desea conocer
la relación que existe entre las repuestas a los ítems 7 y 20. los resultados
observados fueron los siguientes: “0 = no respondió” y “1 = respondió mal”
Coeficiente de Correlación Phi ()
Alumno A B C D E F G H I J
Ítem 7
(Xi )
0 1 1 0 0 1 1 1 0 1
Ítem 20
(Yi ) 0 0 1 0 1 1 1 1 0 1
Prof.: Johnnalid González G.
Coeficiente de Correlación Phi ()
Procedimiento:
1) Se considera la tabla de los signos con sus respectivas letras.
2) Se colocan signos: positivo a una categoría y negativo a la otra. En este
ejercicio se le colocó el signo positivo (+) al “1” y negativo (-) al “0”.
Alumno Ítem 7 Ítem 20
A -0 -0
(+ -)
B*
(+ +)
A*****
(A + B)
p=6
B +1 -0
(- -)
D***
(- +)
C*
(C+ D)
q=4
C +1 +1
(B + D)
q´=4
(A + C)
p´=6
n=10
D -0 -0
E -0 +1
F +1 +1
G +1 +1
H +1 +1
I -0 -0
J +1 +1
Prof.: Johnnalid González G.
La fórmula a emplear sería:
Coeficiente de Correlación Phi ()
58
,
0
4
*
6
*
4
*
6
1
3
*
5
)
)(
)(
)(
(









C
A
D
B
D
C
B
A
BC
AD

Interpretación:
Los estudiantes que respondieron correctamente al ítem 7 tienden
moderadamente a acertar el ítem 20 o viceversa.
Prof.: Johnnalid González G.
Definición:
Este coeficiente se aplica para variables nominales, se presenta en forma de tabla de
doble entrada con variables que expresan “atributos”, donde la í-esima fila y j-esima
columna, denominada Oij, describen cada una de las frecuencias observadas
asociadas a los atributos.
Características:
No existe relación entre las variables, por tanto diremos que estas tendrán una
proporción similar.
Se utiliza para evitar el efecto del tamaño de la muestra.
En una tabla de dos filas por columna es recomendable realizar la corrección de
Yates.
Propiedades:
Su valor se encuentra entre -1 y +1
Mide la intensidad de la relación
El valor de C depende del número de filas y columnas de la tabla de contingencia
construido para su calculo.
Coeficiente de Contingencia
Prof.: Johnnalid González G.
Su fórmula es:
Coeficiente de Contingencia
e
o
e
ij
n
i
m
j
ij
ij

 


1 1
2
2
)
(

Donde:
2 = Chi – Cuadrado
eij = frecuencia esperada por fila y columna
Oij = frecuencia observada por fila y columna
n
f
f
e
c
f
ij
*

Donde:
ff = Frecuencias marginal por fila
fc = Frecuencias marginal por columna
n = Número total de observaciones
Interpretación:
Si 2 = 0, entonces, hay independencia entre las variables
Si 2  0, entonces, hay mayor grado de asociación entre variables
Si 2 < 0, entonces, hay menor grado de asociación entre variables
Observación: El mayor inconveniente que tiene este coeficiente es que es proporcional al
número de observaciones, y por tanto no tiene una cota, por lo que no es muy adecuado
su uso.
Prof.: Johnnalid González G.
Ejemplo:
Se desea determinar si existe relación entre el sexo y la especialidad cursada para los
alumnos que estudian en el Magisterio.
Coeficiente de Contingencia
Sexo
Especialidad Académica
Total
Ciencias Humanas Lengua Preescolar
Hombre 70 60 36 12 178
Mujer 40 54 39 38 171
Total 110 114 75 50 349
Prof.: Johnnalid González G.
Paso 1:
Calcular las frecuencias esperadas para la i-ésima fila y la j-ésima columna
simultáneamente, mediante la siguiente fórmula:
Paso 2:
Calcular el valor del chi cuadrado, mediante la siguiente fórmula:
Paso 3:
Calcular el valor de “C”:
Coeficiente de Contingencia
n
f
f
e
c
f
ij
*

e
o
e
ij
n
i
m
j
ij
ij

 


1 1
2
2
)
(

Prof.: Johnnalid González G.
n
C




2
2
Resumen de Coeficientes de Correlación Ordinal
Prof.: Johnnalid González G.
•2 Variables
Cualitativas
•Variable Dicotómica
•2 Variables
Cualitativas
•Escala de medición
Nominales
• 1 Variables
Continua
•1 Variable
dicotomizada
•2 Variables
Cualitativas
•Escala Ordinales
Coeficiente
de Spearman
(rs)
Coeficiente
Biserial (rb)
Coeficiente
Phi ()
Contingencia
Reglas prácticas acerca de la fuerza de los
Coeficientes de Correlación
Rango de
Coeficiente
Descripción de la
Fuerza
± 0.81 a ± 1.0 Muy fuerte
± 0.61 a ± 0.8 Fuerte
± 0.41 a ± 0.6 Moderada
± 0.21 a ± 0.4 Débil
± 0.00 a ± 0.2 Ninguna
Prof.: Johnnalid González G.
Lista de Coeficientes según el tipo de variable
Prof.: Johnnalid González G.
Variables o Escalas Coeficientes
Dos cuantitativas (intervalo o de razón)
Coeficientes de Correlación de
Pearson
cuantitativas y ordinal o dos ordinales
Coeficientes de Correlación de
Spearman
dos nominales o nominal y cuantitativa Coeficiente de Contingencia
cuantitativas y cuantitativa con dicotomia
artificial
Coeficientes de Correlación Biseral
cuantitativas y cuantitativa con dicotomia
auténtica
Coeficientes de Correlación Punto
Biseral
dos nominales de dicotomia auténtica Coeficiente Phi()
dos de dicotomia artificial (con "n" mayor de
100)
Correlacion Tetracónica

Más contenido relacionado

PPTX
Coeficiente de pearson y spearman (estadistica)
PPTX
COEFICIENTE DE SPERMAN1111111111111111111111111111
PPTX
Coeficiente de correlación de pearson y sperman
PPTX
Presentación1 coeficientes de correlación
PPTX
PPTX
Coeficiente de correlacion
PPTX
Presentación coeficientes Pearson y Spearman
PPTX
Presentacion coeficientes de correlacion de Pearson y Spearman
Coeficiente de pearson y spearman (estadistica)
COEFICIENTE DE SPERMAN1111111111111111111111111111
Coeficiente de correlación de pearson y sperman
Presentación1 coeficientes de correlación
Coeficiente de correlacion
Presentación coeficientes Pearson y Spearman
Presentacion coeficientes de correlacion de Pearson y Spearman

Similar a Otros Coeficientes Correlación_FHE_UCV.pdf (20)

PPTX
coeficientes de correlación de Pearson y de Sperman
PPTX
Coeficientes de correlación pearson y sperman
PPTX
Coeficiente de corelacio de pearson y spearman
PPTX
coeficientes de correlacion spearman y pearson
PPTX
Coeficientes de correlacion de pearson y de sperman.
PPTX
Luis trabajo
PPTX
Coeficiente de Correlación de Pearson y Spearman
ODP
Jose a virardi estadistica
PPTX
Coeficientes de Correlación de Pearson y de Sperman
PPTX
Coeficientes de Correlación de Pearson y de Spermanxposicion
PPTX
Pearson y spearman
PPTX
Pearson y spearman Estadistica
PPTX
Roman rincon
DOCX
Estadistica .
PPTX
Coeficiented e Correlacion Pearson y Spearman
PPTX
Pearson
PPTX
Correlación PEARSON
PPTX
Presentación3 estadistica
PPTX
Correlacion de Pearson
PPTX
Coeficiente de correlacion de pearson y sperman
coeficientes de correlación de Pearson y de Sperman
Coeficientes de correlación pearson y sperman
Coeficiente de corelacio de pearson y spearman
coeficientes de correlacion spearman y pearson
Coeficientes de correlacion de pearson y de sperman.
Luis trabajo
Coeficiente de Correlación de Pearson y Spearman
Jose a virardi estadistica
Coeficientes de Correlación de Pearson y de Sperman
Coeficientes de Correlación de Pearson y de Spermanxposicion
Pearson y spearman
Pearson y spearman Estadistica
Roman rincon
Estadistica .
Coeficiented e Correlacion Pearson y Spearman
Pearson
Correlación PEARSON
Presentación3 estadistica
Correlacion de Pearson
Coeficiente de correlacion de pearson y sperman
Publicidad

Último (20)

PPTX
EXPO ADMINISTRACION ESTRATEGICA HISTORIA Y EVOLUCIÓN DE LA ADMINISTRACIÓN
PPTX
Slide_Introducci_n_a_las_empresas.pptx__
PDF
ORD-REG-ELEMENTOS-PUBLICITARIOS-AMSS-12-MARZO.pdf
DOC
SESIÓN COMO FUNCIONA EL MERCADO Y SU IMPLICANCIA EN LA ECONOMÍA
PPTX
SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓ...
PDF
IDEAS PARA PROYECTOS EMPRENDIMIENTO EPT-
PPTX
FORMATO DE PRESENTACION EMPRESARIAL.pptx
PPTX
Presentación Plan de Negocio Moderno Morado y Blanco.pptx
PDF
Presentación_rendición_de_cuentas_2020_26-FEB-2021.pdf
PDF
CLASE 4.pdfkjljbjkbkjbihviuvvuuuuuuuuuuuu
PPT
Introducción a la contabilidad de costos.ppt
PPTX
ECONOMIA PLURAL para el entendimiento empresarial
PPTX
norma epidemiologica en el primer nivel de atencion
PPTX
TRABAJO FINAL-EMPRESA CARNES FRIAS CON CORRECCIONES.pptx
PDF
Indicadores Clave de Desempeño (KPI) para transporte
PPTX
criminologia.pptxcriminologia policiales
PDF
EL ESTUDIO DE MERCADO PROYECTO INVERSION.pdf
PPTX
LA INTELIGENCIA ARTIFICIAL EN ESTE MUNDO
PDF
NIAS 250 ............................................
PDF
UP digital strategy v 2.0 s1.pdf solo chicos bien
EXPO ADMINISTRACION ESTRATEGICA HISTORIA Y EVOLUCIÓN DE LA ADMINISTRACIÓN
Slide_Introducci_n_a_las_empresas.pptx__
ORD-REG-ELEMENTOS-PUBLICITARIOS-AMSS-12-MARZO.pdf
SESIÓN COMO FUNCIONA EL MERCADO Y SU IMPLICANCIA EN LA ECONOMÍA
SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓN17SESIÓ...
IDEAS PARA PROYECTOS EMPRENDIMIENTO EPT-
FORMATO DE PRESENTACION EMPRESARIAL.pptx
Presentación Plan de Negocio Moderno Morado y Blanco.pptx
Presentación_rendición_de_cuentas_2020_26-FEB-2021.pdf
CLASE 4.pdfkjljbjkbkjbihviuvvuuuuuuuuuuuu
Introducción a la contabilidad de costos.ppt
ECONOMIA PLURAL para el entendimiento empresarial
norma epidemiologica en el primer nivel de atencion
TRABAJO FINAL-EMPRESA CARNES FRIAS CON CORRECCIONES.pptx
Indicadores Clave de Desempeño (KPI) para transporte
criminologia.pptxcriminologia policiales
EL ESTUDIO DE MERCADO PROYECTO INVERSION.pdf
LA INTELIGENCIA ARTIFICIAL EN ESTE MUNDO
NIAS 250 ............................................
UP digital strategy v 2.0 s1.pdf solo chicos bien
Publicidad

Otros Coeficientes Correlación_FHE_UCV.pdf

  • 1. Coeficientes Correlación: Phi, Contingencia, Biserial, Spearman Prof: Johnnalid González G. 2018 Universidad Central de Venezuela Facultad de Humanidades y Educación Escuela de Educación Cátedra: Métodos Cuantitativos Asignatura: Estadística Aplicada a la Educación
  • 2. Introducción Prof.: Johnnalid González G. El presente tema pretende estudiar coeficientes de correlación, para determinar el grado de asociación de variables cualitativas, es decir, aquellas variables cuyas modalidades no se pueden cuantificar. La técnica de la correlación ordinal puede aplicarse también a mediciones, si a estos valores se les asigna un número de acuerdo a su cuantía y característica. Ej: los resultados de una prueba (estadística, inglés u otra asignatura) pueden ser representados por medio de números ordinales que indican las posiciones o lugares ocupado por quienes la presentaron.
  • 3. Estructura de las Escalas de Medición Prof.: Johnnalid González G. Datos Cuantitativos Intervalo Razón
  • 4. Correlación Ordinal Cuando los valores de dos variables están representados por números ordinales, para calcular la magnitud de la posible relación entre ellas, se utilizan los llamados coeficientes de correlación ordinal o de rango, siendo los de mayor uso, el de Spearman y el de Kendall. Fuente: Chourio, Hugo.2011:175. Prof.: Johnnalid González G.
  • 5. Correlación Ordinal Cuando los valores de dos variables están representados por números ordinales, para calcular la magnitud de la posible relación entre ellas, se utilizan los llamados coeficientes de correlación ordinal o de rango, siendo los de mayor uso, el de Spearman y el de Kendall. Fuente: Chourio, Hugo.2011:175. Prof.: Johnnalid González G.
  • 6. Aspectos a considerar: Es el coeficiente más empleado en los métodos de correlación por rangos Se recomienda usar este método, con datos entre 25 o 30 o menos Las variables son medidos en escalas ordinales Es más fácil y rápido de calcular que el Coeficiente de Correlación de Pearson. Propiedades: Toma valores entre – 1 < rs <+ 1 El coeficiente rs es un caso particular de xy Si calculamos el coeficiente de correlación de Pearson entre dos variables X e Y, y el coeficiente de correlación de Spearman para las mismas puntuaciones pero transformadas en rangos, ambos coeficientes se aproximan en valor según aumenta el número de sujetos n. Coeficiente de Spearman Prof.: Johnnalid González G.
  • 7. APLICACIÓN DEL COEFICIENTE DE SPEARMAN: Un hecho común en los estudios de investigación es que las respuestas a las preguntas en que los investigadores están más interesados sólo se pueden medir con escalas ordinales o incluso nominales. Por ejemplo: Si estuvieran interesados en estudiar el consumo de café entre hombres y mujeres. En este caso, aplicar el coeficiente de correlación de Pearson a los datos podría suponer que estas medidas de sexo tienen propiedades de escala de intervalo o de razón y posiblemente producirá resultados engañosos o exagerados. Coeficiente de Spearman Prof.: Johnnalid González G.
  • 8. Definición: Es un caso especial del Coeficiente de Correlación de Pearson, cuando los valores se presentan como los primeros números consecutivos. Si los rangos se tratan como puntajes u otros valores, y no hay rangos empates, entonces es cierto que:  = rs, entonces la fórmula a emplear sería: Coeficiente de Spearman 1 1 , 6 1 6 1 ) 1 )( 1 ( 1 2 3 1 2                r n n n d n d r s n i i n i i s n Prof.: Johnnalid González G.
  • 9. Pasos para el cálculo del Coeficiente de Spearman: 1) Verificar que los datos estén dados en rangos o posiciones 2) Establecer la diferencia entre los rangos ocupados por cada variable de estudio. 3) Elevar al cuadrado cada una de estas diferencias 4) Aplicar la fórmula 5) Interpretar el resultado Coeficiente de Spearman 1 1 , 6 1 6 1 ) 1 )( 1 ( 1 2 3 1 2                r n n n d n d r s n i i n i i s n Prof.: Johnnalid González G.
  • 10. Ejemplo 1: Se desea conocer el grado de relación entre las posiciones que ocuparon 10 atletas que tomaron parte en dos pruebas de 100 (Xi ) y 200 (Yi ) mts planos. Los resultados se muestran a continuación: Coeficiente de Spearman Atleta A B C D E F G H I J 100 1 2 4 3 5 6 7 8 10 9 200 2 1 3 4 6 5 7 8 9 10 Prof.: Johnnalid González G.
  • 11. Procedimiento: 1) Los valores están dados directamente en rangos 2) Establecer la diferencia entre los lugares ocupados por cada atleta: di = Xi - Yi Coeficiente de Spearman Atleta A B C D E F G H I J 100 (Xi ) 1 2 4 3 5 6 7 8 10 9 200 (Yi ) 2 1 3 4 6 5 7 8 9 10 di -1 1 1 -1 -1 1 0 0 1 -1 Prof.: Johnnalid González G.
  • 12. Procedimiento: 3) Elevar al cuadrado cada diferencia y finalmente sumar el cuadrado de tales diferencias.  di 2 . Coeficiente de Spearman Atleta A B C D E F G H I J 100 (Xi ) 1 2 4 3 5 6 7 8 10 9 200 (Yi ) 2 1 3 4 6 5 7 8 9 10 di -1 1 1 -1 -1 1 0 0 1 -1 di2 1 1 1 1 1 1 0 0 1 1 =  di 2 = 8 Prof.: Johnnalid González G.
  • 13. 4) Aplicar la fórmula Coeficiente de Spearman 95 , 0 9 * 11 * 10 8 * 6 1 6 1 ) 1 )( 1 ( 1 2          n n n d r n i i s 5) Interpretación: Los atletas que lograron las mejores posiciones en la prueba de 100 metros planos, tienden en forma muy alta a obtener las mejores posiciones en la prueba de 200 metros planos. Prof.: Johnnalid González G.
  • 14. Ejemplo 2: Calcular e interpretar el Coeficiente de Correlación de Spearman, entre los resultados obtenidos por un grupo de estudiantes de tercer año en dos pruebas objetivas finales de lapso, Castellano (Xi ) y Cs. Biológicas (Yi ). Coeficiente de Spearman Estudiantes A B C D E F G Castellano 48 47 46 46 45 43 43 Cs Biológicas 25 25 19 12 12 12 11 Prof.: Johnnalid González G.
  • 15. Coeficiente de Spearman Estudiantes A B C D E F G Castellano (Xi ) 48 47 46 46 45 43 43 Cs Biológicas (Yi ) 25 25 19 12 12 12 11 (Xi ´) 1 2 3,5 3,5 5 6,5 6,5 (Yi ´) 1,5 1,5 3 5 5 5 7 Procedimiento: 1) Se convierte los puntajes en posiciones, de la siguiente manera: en la Variable Xi (Castellano), el estudiante A obtuvo la mayor puntuación, entonces se le asigna la posición 1 y asi sucesivamente, en el caso de los estudiantes C y D, tienen las mismas puntuaciones, es decir se tiene un “empates”, se deben sumar los lugares que les tocarían si no estuviesen empates y se divide entre el número de valores iguales, de la misma forma se le aplicaría a los estudiantes F y G. Prof.: Johnnalid González G.
  • 16. Coeficiente de Spearman Estudiantes A B C D E F G (Xi ´) 1 2 3,5 3,5 5 6,5 6,5 (Yi ´) 1,5 1,5 3 5 5 5 7 di -0,5 0,5 0,5 -1,5 0 1,5 -0,5 di2 0,25 0,25 0,25 2,25 0 2,25 0,25 Procedimiento: 2) Establecer la diferencia entre los lugares ocupados por cada atleta: di = Xi ´- Yi ´. 3) Elevar al cuadrado cada diferencia y finalmente sumar el cuadrado de tales diferencias.  di 2 . =  di 2 = 5,5 Prof.: Johnnalid González G.
  • 17. 4) Aplicar la fórmula Coeficiente de Spearman 90 , 0 6 * 8 * 7 5 , 5 * 6 1 6 1 ) 1 )( 1 ( 1 2          n n n d r n i i s 5) Interpretación: Los estudiantes que lograron las mejores notas en la prueba de Castellano, tienden muy altamente a obtener las mejores calificaciones en la prueba de Ciencias Biológicas. Prof.: Johnnalid González G.
  • 18. Definición: El coeficiente de correlación biserial, se utiliza cuando queremos conocer la correlación existente entre dos variables, de las cuales una ha sido considerada como escala de intervalos y la otra resulta ser una variable dicotómica (significa que toma dos modalidades. Ej: sexo, si o no, etc). Observación: Cuando la variable continua dicotomizada, o ambas variables, se desvían demasiado de la distribución normal, el valor calculado del coeficiente de correlación rb , es mayor que la unidad. Coeficiente de Correlación Biserial Prof.: Johnnalid González G.
  • 19. Coeficiente de Correlación Biserial y q p st x x q p b r * *     Las fórmulas empleadas para calcular el coeficiente de correlación biserial son las siguientes: ó y p St x x t p b r *     Donde: p x  Media aritmética de la categoría “p” st Desviación típica total es la proporción de observaciones de unas de dos modalidades p y Altura de la ordenada que separa en la curva normal a las proporciones “p” y “q” Prof.: Johnnalid González G.
  • 20. Coeficiente de Correlación Biserial Ejemplo 1: Un grupo de bachilleres aspirantes a FACES de la UCV, fue sometido a una prueba objetiva de conocimientos generales (PCG: Xi ) y a un test de aptitud (Yi ) hacia las carreras vigentes en esa Facultad. Se desea saber qué relación existe entre los puntajes obtenidos en la prueba y los resultados del test. El test ha sido dicotomizado así: Con Vocación (CV) y Sin Vocación (SV). Los resultados fueron los siguientes: ASP 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 PCG 54 53 60 44 39 34 36 43 49 62 66 46 44 49 56 48 TEST 28 24 30 17 20 16 18 22 22 28 30 22 17 18 15 24 Asp 1 7 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 PCG 45 35 65 54 48 56 49 57 54 40 49 50 43 68 44 68 TEST 20 16 25 27 26 29 22 26 22 14 18 23 22 29 16 28 Prof.: Johnnalid González G.
  • 21. Coeficiente de Correlación Biserial Pasos para el cálculo del Coeficiente de Correlación Biserial: 1) Determinar las características de las variables 2) Se distribuye la variable continua no dicotomizada en intervalo de clase 3) Se calcula el rango y el número de clases 4) Construir la tabla de distribución de la variable Yi 5) Se calcula el factor dicotomizador de la variable Yi , para obtener las dos categorías, a la cual, llamaremos “p” y “q”. 6) Se construye la tabla de Dicotomización de la variable Yi y operaciones Dicotomización de la variable Yi y operaciones Prof.: Johnnalid González G.
  • 22. Coeficiente de Correlación Biserial Cálculos: Paso 5: . 31 , 22 32 714 ptos n Y Yi      Se calcula el Coeficiente de Correlación Biserial 93 , 0 ) 3944 , 0 44 , 0 ( * 06 , 9 75 , 50 28 , 58 *        y p St x x t p b r Interpretación: Los bachilleres que lograron las mejores puntuaciones en la prueba de conocimientos generales, tienden muy altamente a obtener las mejores calificaciones en el test y viceversa. Prof.: Johnnalid González G.
  • 23. Coeficiente de Correlación Phi () Aspectos a considerar: Se utiliza cuando las dos variables son dicotómicas: Verdadero o Falso, Si o No. Este coeficiente al igual que el Coeficiente de Correlación Biserial Puntual, son coeficientes producto-momento, del tipo de Pearson, aun cuando no posean la misma precisión de este último. Es el más utilizado en análisis de ítems. Cuando las dos variables se reparten por igual, los límites máximos del coeficiente de correlación Phi se encuentra entre -1 y +1. Prof.: Johnnalid González G.
  • 24. La fórmula a emplear sería: Coeficiente de Correlación Phi () 1 1 , ) )( )( )( (             C A D B D C B A BC AD Donde las letras A,B, C y D, representan las frecuencias de la siguiente tabla de doble entrada: (+ -) B (+ +) A (A + B) p Las proporciones son: (- -) D (- +) C (C+ D) q p=(A+B)/n q=(C+D)/n (B + D) q´ (A + C) p´ n p´=(A+C)/n q´=(B+D)/n Prof.: Johnnalid González G.
  • 25. Ejemplo: Diez estudiantes presentaron un examen de Sociología y se desea conocer la relación que existe entre las repuestas a los ítems 7 y 20. los resultados observados fueron los siguientes: “0 = no respondió” y “1 = respondió mal” Coeficiente de Correlación Phi () Alumno A B C D E F G H I J Ítem 7 (Xi ) 0 1 1 0 0 1 1 1 0 1 Ítem 20 (Yi ) 0 0 1 0 1 1 1 1 0 1 Prof.: Johnnalid González G.
  • 26. Coeficiente de Correlación Phi () Procedimiento: 1) Se considera la tabla de los signos con sus respectivas letras. 2) Se colocan signos: positivo a una categoría y negativo a la otra. En este ejercicio se le colocó el signo positivo (+) al “1” y negativo (-) al “0”. Alumno Ítem 7 Ítem 20 A -0 -0 (+ -) B* (+ +) A***** (A + B) p=6 B +1 -0 (- -) D*** (- +) C* (C+ D) q=4 C +1 +1 (B + D) q´=4 (A + C) p´=6 n=10 D -0 -0 E -0 +1 F +1 +1 G +1 +1 H +1 +1 I -0 -0 J +1 +1 Prof.: Johnnalid González G.
  • 27. La fórmula a emplear sería: Coeficiente de Correlación Phi () 58 , 0 4 * 6 * 4 * 6 1 3 * 5 ) )( )( )( (          C A D B D C B A BC AD  Interpretación: Los estudiantes que respondieron correctamente al ítem 7 tienden moderadamente a acertar el ítem 20 o viceversa. Prof.: Johnnalid González G.
  • 28. Definición: Este coeficiente se aplica para variables nominales, se presenta en forma de tabla de doble entrada con variables que expresan “atributos”, donde la í-esima fila y j-esima columna, denominada Oij, describen cada una de las frecuencias observadas asociadas a los atributos. Características: No existe relación entre las variables, por tanto diremos que estas tendrán una proporción similar. Se utiliza para evitar el efecto del tamaño de la muestra. En una tabla de dos filas por columna es recomendable realizar la corrección de Yates. Propiedades: Su valor se encuentra entre -1 y +1 Mide la intensidad de la relación El valor de C depende del número de filas y columnas de la tabla de contingencia construido para su calculo. Coeficiente de Contingencia Prof.: Johnnalid González G.
  • 29. Su fórmula es: Coeficiente de Contingencia e o e ij n i m j ij ij      1 1 2 2 ) (  Donde: 2 = Chi – Cuadrado eij = frecuencia esperada por fila y columna Oij = frecuencia observada por fila y columna n f f e c f ij *  Donde: ff = Frecuencias marginal por fila fc = Frecuencias marginal por columna n = Número total de observaciones Interpretación: Si 2 = 0, entonces, hay independencia entre las variables Si 2  0, entonces, hay mayor grado de asociación entre variables Si 2 < 0, entonces, hay menor grado de asociación entre variables Observación: El mayor inconveniente que tiene este coeficiente es que es proporcional al número de observaciones, y por tanto no tiene una cota, por lo que no es muy adecuado su uso. Prof.: Johnnalid González G.
  • 30. Ejemplo: Se desea determinar si existe relación entre el sexo y la especialidad cursada para los alumnos que estudian en el Magisterio. Coeficiente de Contingencia Sexo Especialidad Académica Total Ciencias Humanas Lengua Preescolar Hombre 70 60 36 12 178 Mujer 40 54 39 38 171 Total 110 114 75 50 349 Prof.: Johnnalid González G.
  • 31. Paso 1: Calcular las frecuencias esperadas para la i-ésima fila y la j-ésima columna simultáneamente, mediante la siguiente fórmula: Paso 2: Calcular el valor del chi cuadrado, mediante la siguiente fórmula: Paso 3: Calcular el valor de “C”: Coeficiente de Contingencia n f f e c f ij *  e o e ij n i m j ij ij      1 1 2 2 ) (  Prof.: Johnnalid González G. n C     2 2
  • 32. Resumen de Coeficientes de Correlación Ordinal Prof.: Johnnalid González G. •2 Variables Cualitativas •Variable Dicotómica •2 Variables Cualitativas •Escala de medición Nominales • 1 Variables Continua •1 Variable dicotomizada •2 Variables Cualitativas •Escala Ordinales Coeficiente de Spearman (rs) Coeficiente Biserial (rb) Coeficiente Phi () Contingencia
  • 33. Reglas prácticas acerca de la fuerza de los Coeficientes de Correlación Rango de Coeficiente Descripción de la Fuerza ± 0.81 a ± 1.0 Muy fuerte ± 0.61 a ± 0.8 Fuerte ± 0.41 a ± 0.6 Moderada ± 0.21 a ± 0.4 Débil ± 0.00 a ± 0.2 Ninguna Prof.: Johnnalid González G.
  • 34. Lista de Coeficientes según el tipo de variable Prof.: Johnnalid González G. Variables o Escalas Coeficientes Dos cuantitativas (intervalo o de razón) Coeficientes de Correlación de Pearson cuantitativas y ordinal o dos ordinales Coeficientes de Correlación de Spearman dos nominales o nominal y cuantitativa Coeficiente de Contingencia cuantitativas y cuantitativa con dicotomia artificial Coeficientes de Correlación Biseral cuantitativas y cuantitativa con dicotomia auténtica Coeficientes de Correlación Punto Biseral dos nominales de dicotomia auténtica Coeficiente Phi() dos de dicotomia artificial (con "n" mayor de 100) Correlacion Tetracónica