R Commander:
Tablas de
contingencia y
asociación entre
variables.
Realizado por Ismael Rodríguez
Godino
Subgrupo 16 – Virgen del Rocío
Estadística y TICS. SEMINARIO VII.
INTRODUCCIÓN.
R Commander puede realizar operaciones estadísticas de diversas índoles. En esta ocasión, vamos a
realizar actividades relacionadas con la asociación de variables, utilizando tablas de contingencia.
Las actividades a realizar son:
 A partir de este ejercicio, realizarlo manualmente y contrastar los resultados con la actividad hecha
en R Commander.
• Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer;
estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:
 De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
 De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
 Establecer y describir si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:
 Practicadeporte (Sí, No);
 Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la
semana”, 4- “Tres o más veces a la semana”, 5 “A diario”.
Ejercicio manual y ejercicio
a resolver en R
Commander.
1ª Actividad del seminario VII.
El enunciado de la actividad es:
 Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres
fumadoras y a 1750 mujeres no fumadoras y encontramos que:
• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
1. Representa los datos en un tabla de
contingencia indicando las frecuencias
observadas y porcentajes.
2. Establece una hipótesis adecuada para el estudio.
¿Existe asociación entre el consumo de tabaco y la probabilidad de tener un bebe con bajo peso al nacer?
Ho= No existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los bebes.
Hi= existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los bebes.
3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis.
a) Para calcular la chi cuadrado es necesario calcular las frecuencias esperadas (aquellas que deberían haberse
observado si la Ho fuese cierta) y frecuencias observadas en nuestro estudio (FO).
Las frecuencias esperadas serán:
𝐹𝐸11 =
𝑎 + 𝑏 ∗ 𝑎 + 𝑐
𝑛
=
43 + 207 ∗ 43 + 105
2000
= 18,5
𝐹𝐸12 =
𝑏 + 𝑎 ∗ 𝑏 + 𝑑
𝑛
=
207 + 43 ∗ 207 + 1645
2000
= 231,5
𝐹𝐸21 =
𝑐 + 𝑎 ∗ 𝑐 + 𝑑
𝑛
=
105 + 43 ∗ 105 + 1645
2000
= 129,5
𝐹𝐸22 =
𝑑 + 𝑐 ∗ 𝑑 + 𝑏
𝑛
=
1645 + 105 ∗ (1645 + 207)
2000
= 1620,5
𝑋2
=
(𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠)2
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠
=
=
(43 − 18,5)2
18,5
+
(207 − 231,5)2
231,5
+
(105 − 129,5)2
129,5
+
(1645 − 1620,5)2
1620,5
= 40, 04436402.
La tabla de frecuencias
observadas y las esperadas
quedará de esta manera:
b) A continuación, vamos a
calcular chi cuadrado
mediante la fórmula:
c) Una vez conocida la X2, necesitamos saber los grados de libertad. Los grados de libertad se
calculan  (Número de filas-1)*(Número de columnas menos 1), por tanto nuestros g.l serán 1.
d) Una vez conocidos tantos chi cuadrado real como los grados de libertad, vamos a la tabla chi cuadrada, para
conocer la chi cuadrada teórica asociada a nuestro margen de error establecido (0,05).
De manera que teniendo en cuenta la condición:
• Si el chi cuadrado real es menor o igual que la chi cuadrado teórica  aceptamos hipótesis nula (no hay relación
entre variables)
• Si el chi cuadrado real es mayor que la chi cuadrado teórica  rechazamos la hipótesis nula, aceptando la
alternativa (hay relación entre variables).
Por tanto, como X2 real (40,044) > X2 teórica (3,84) nuestra hipótesis nula es FALSA (Ho) y por tanto, existirá
dependencia o asociación entre el consumo de tabaco y el bajo peso al nacer de los bebes.
4. Calcula la odds ratio.
𝑂𝑅 =
(𝑎 ∗ 𝑑)
(𝑐 ∗ 𝑏)
=
43 ∗ 1645
105 ∗ 207
= 3,2544
En nuestro caso, la odds ratio es mayor a 1, por tanto, OR>1 la presencia del factor se asocia a mayor ocurrencia del
evento.
5. Repite el ejercicio con R Commander ¿Los resultados son los mismos?
a) Primero vamos a abrir R Commander. Una vez abierto, pulsamos sobre “estadísticos”, luego
sobre “tablas de contingencia” y finalmente sobre “Introducir y analizar un tabla de doble
entrada”.
Introducimos los valores de
nuestra tabla de 2x2, cogiendo
los datos del ejercicio propuesto:
R
Una vez incluido los datos, pulsamos en aceptar y nos aparecerá en la ventana
de resultados, los valores de chi cuadrado y “p”; test exacto de Fisher y la odds
ratio.
Valores de X2 y “P”.
Frecuencias esperadas (FE)
Test exacto de Fisher y odds ratio.
CONCLUSIÓN: Los valores de X2 (40,044), “p”, las FE (frecuencias esperadas), test exacto
de Fisher y Odds ratio (3,25158) presentan valores similares a los valores dados al
realizar de manera manual la actividad.
Asociación entre variables
de un conjunto de datos.
2ª Actividad
1. Primero debemos abrir R commander. Una vez dentro, deberemos cargar el archivo de R “activossalud-
2.Rdata”. Para ello, pulsamos sobre “Datos” y posteriormente sobre “Cargar conjunto de datos” (Realmente
habria un paso anterior, determinando el directorio de trabajo pero eso ya lo hemos explicado en seminarios
anteriores).
Nos aparecerá una ventana, buscamos nuestro archivo de R en nuestro
ordenador y posteriormente pulsamos en aceptar.
2. Una vez cargado el conjunto de datos vamos a construir una tabla de contingencia. Para ello,
pulsamos sobre “estadísticos”, luego sobre “Tablas de contingencia” y finalmente sobre “Tabla de
doble entrada…”.
3. Una vez hecho lo anterior comenzamos a probar la asociación entre ciertas variables:
a) Entre la variable “SEXO” y la variable “PRACTICADEPORTE”.
Conclusión: Como podemos ver en los resultados la X2 real es 19,163, como la X2 real es mayor que X2
teórica (3,84), rechazamos la hipótesis nula (Ho) y, por tanto, al aceptar la hipótesis alternativa
declaramos que existe asociación entre la variable “sexo” y la variable “practicadeporte”.
b) Entre la variable “sexo” y la variable “Fruta”.
Conclusión: Como podemos ver en los resultados la X2 real es 7,6036; como la X2 real es mayor que X2 teórica
(3,84), rechazamos la hipótesis nula (Ho) y, por tanto, al aceptar la hipótesis alternativa declaramos que existe
asociación entre la variable “sexo” y la variable “Fruta”.

Más contenido relacionado

PPTX
PPTX
Presentación 7
DOC
Seminario 7-ejercicio-1
PPTX
Seminario 7 (2)
PPTX
Power seminario 7
PPTX
TAREA SEMINARIO 7
Presentación 7
Seminario 7-ejercicio-1
Seminario 7 (2)
Power seminario 7
TAREA SEMINARIO 7

La actualidad más candente (20)

PDF
Estadistica seminario 7
PPTX
Restaurado
PPTX
Seminario VII
DOCX
Seminario estadistica
PPTX
Tarea 7
PPTX
PPTX
Tarea seminario 7 Cecilia
PPTX
Ejercicio 2
PPTX
Seminario 7
PPTX
Tarea 7
PPTX
DOCX
Tarea Estadística y TICs SEMINARIO 7
PPTX
Tarea 8
PPTX
Seminario 7 estadistica y tics
PPTX
Presentación sin título
PPTX
Seminario 7
PPTX
Tarea 7
PPTX
Seminario 10 ejercicio2
PPT
Estadistica seminario 7
Restaurado
Seminario VII
Seminario estadistica
Tarea 7
Tarea seminario 7 Cecilia
Ejercicio 2
Seminario 7
Tarea 7
Tarea Estadística y TICs SEMINARIO 7
Tarea 8
Seminario 7 estadistica y tics
Presentación sin título
Seminario 7
Tarea 7
Seminario 10 ejercicio2
Publicidad

Similar a Ejercicio estadística seminario 7 (20)

PPTX
Seminario 7 estadistica
PPTX
Seminario 7 blog
PPTX
Seminario 7
PPTX
Seminario 7
PPTX
PPTX
Seminario 7
PPTX
Seminario VII
PPTX
Seminario 7: Análisis bivariado con variables cualitativas.
PPTX
Seminario 7
PDF
Tarea seminario 7
PPTX
Seminario 7
PPTX
Seminario 9 de tic
DOCX
Seminario 7 (1)
PPTX
Seminario vii
PPTX
Seminario 7
PPTX
Estadistica 1
DOCX
Informe de analisis bivariado
PPTX
Ejercicios de correlación lineal de Pearson con “IBM SPSS Statistics 20”
PDF
Tarea seminario 9
Seminario 7 estadistica
Seminario 7 blog
Seminario 7
Seminario 7
Seminario 7
Seminario VII
Seminario 7: Análisis bivariado con variables cualitativas.
Seminario 7
Tarea seminario 7
Seminario 7
Seminario 9 de tic
Seminario 7 (1)
Seminario vii
Seminario 7
Estadistica 1
Informe de analisis bivariado
Ejercicios de correlación lineal de Pearson con “IBM SPSS Statistics 20”
Tarea seminario 9
Publicidad

Más de Ismael Rodríguez Godino (12)

PPTX
Seminario 8 estadistica
DOCX
Ejercicio estadística seminario 7 (autoguardado)
PPTX
Seminario estadística 6 IRG.
PPTX
Seminario estadística 6 IRG
PPTX
R commander práctica seminario 5
PPTX
R commander práctica seminario 5
DOCX
Ejercicio seminario 4 - Lectura crítica del texto científico
PPTX
Lectura crítica de texto científico
PPTX
Lectura crítica de texto científico
PPTX
Lectura crítica de texto científico
PPTX
Búsqueda en base de datos -PubMed y Cinahl
PPTX
Estadística seminario II - búsqueda bibliográfica
Seminario 8 estadistica
Ejercicio estadística seminario 7 (autoguardado)
Seminario estadística 6 IRG.
Seminario estadística 6 IRG
R commander práctica seminario 5
R commander práctica seminario 5
Ejercicio seminario 4 - Lectura crítica del texto científico
Lectura crítica de texto científico
Lectura crítica de texto científico
Lectura crítica de texto científico
Búsqueda en base de datos -PubMed y Cinahl
Estadística seminario II - búsqueda bibliográfica

Último (20)

PDF
El Duelo: Fabulas de un Proceso. Proceso creativo
PDF
Ilustraciones recientes de CCG (Conrado C. Giusti)
PPTX
Tres maestros de la guitarra clásica.pptx
PPT
escultura del renacimiento en el cinquecento
PPTX
PARADIGMAS UNIMILITAR 2025 de la 4.0.pptx
PPTX
Clase 11 - Concepto Cultura en Educación
PDF
S03 - Material Calidad de vida urbana.pdf
PPTX
TEMA 2 Antecedentes Históricos de la Arqueología
PDF
Revista de Films Matters Numero 1 Edition.pdf
PPT
renacimientocinquecenttopinturarafael.ppt
PPT
Riesgo Psicosocial.ppt en el trabjao labral
PDF
Catalogo de obras personales en artes visuales
PPTX
Arquitectura. -Racionalismo_ Walter Gropius, Mies Van der Rohe, Le Corbusier....
PDF
09. GEOdfsssssssssssdGRAFIA POLITICA.pdf
PDF
El pseudo artista para el público pseudo conocedor
PPT
renacimientocinquecenttopinturamiguelangel.ppt
DOCX
carpetapedagogica-240618012615-d457c91e.docx
PPT
neuroventas97-171011193339 desde la perrs
PDF
4° grado Lectura Cuagdgdfgdgdeyfyrnillo 1.pdf
PDF
Revista de fotografía minimalista moderno.pdf
El Duelo: Fabulas de un Proceso. Proceso creativo
Ilustraciones recientes de CCG (Conrado C. Giusti)
Tres maestros de la guitarra clásica.pptx
escultura del renacimiento en el cinquecento
PARADIGMAS UNIMILITAR 2025 de la 4.0.pptx
Clase 11 - Concepto Cultura en Educación
S03 - Material Calidad de vida urbana.pdf
TEMA 2 Antecedentes Históricos de la Arqueología
Revista de Films Matters Numero 1 Edition.pdf
renacimientocinquecenttopinturarafael.ppt
Riesgo Psicosocial.ppt en el trabjao labral
Catalogo de obras personales en artes visuales
Arquitectura. -Racionalismo_ Walter Gropius, Mies Van der Rohe, Le Corbusier....
09. GEOdfsssssssssssdGRAFIA POLITICA.pdf
El pseudo artista para el público pseudo conocedor
renacimientocinquecenttopinturamiguelangel.ppt
carpetapedagogica-240618012615-d457c91e.docx
neuroventas97-171011193339 desde la perrs
4° grado Lectura Cuagdgdfgdgdeyfyrnillo 1.pdf
Revista de fotografía minimalista moderno.pdf

Ejercicio estadística seminario 7

  • 1. R Commander: Tablas de contingencia y asociación entre variables. Realizado por Ismael Rodríguez Godino Subgrupo 16 – Virgen del Rocío Estadística y TICS. SEMINARIO VII.
  • 2. INTRODUCCIÓN. R Commander puede realizar operaciones estadísticas de diversas índoles. En esta ocasión, vamos a realizar actividades relacionadas con la asociación de variables, utilizando tablas de contingencia. Las actividades a realizar son:  A partir de este ejercicio, realizarlo manualmente y contrastar los resultados con la actividad hecha en R Commander. • Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:  De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.  De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.  Establecer y describir si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:  Practicadeporte (Sí, No);  Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”.
  • 3. Ejercicio manual y ejercicio a resolver en R Commander. 1ª Actividad del seminario VII.
  • 4. El enunciado de la actividad es:  Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que: • De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer. • De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer. 1. Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes.
  • 5. 2. Establece una hipótesis adecuada para el estudio. ¿Existe asociación entre el consumo de tabaco y la probabilidad de tener un bebe con bajo peso al nacer? Ho= No existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los bebes. Hi= existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los bebes. 3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis. a) Para calcular la chi cuadrado es necesario calcular las frecuencias esperadas (aquellas que deberían haberse observado si la Ho fuese cierta) y frecuencias observadas en nuestro estudio (FO). Las frecuencias esperadas serán: 𝐹𝐸11 = 𝑎 + 𝑏 ∗ 𝑎 + 𝑐 𝑛 = 43 + 207 ∗ 43 + 105 2000 = 18,5 𝐹𝐸12 = 𝑏 + 𝑎 ∗ 𝑏 + 𝑑 𝑛 = 207 + 43 ∗ 207 + 1645 2000 = 231,5 𝐹𝐸21 = 𝑐 + 𝑎 ∗ 𝑐 + 𝑑 𝑛 = 105 + 43 ∗ 105 + 1645 2000 = 129,5 𝐹𝐸22 = 𝑑 + 𝑐 ∗ 𝑑 + 𝑏 𝑛 = 1645 + 105 ∗ (1645 + 207) 2000 = 1620,5
  • 6. 𝑋2 = (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠)2 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠 = = (43 − 18,5)2 18,5 + (207 − 231,5)2 231,5 + (105 − 129,5)2 129,5 + (1645 − 1620,5)2 1620,5 = 40, 04436402. La tabla de frecuencias observadas y las esperadas quedará de esta manera: b) A continuación, vamos a calcular chi cuadrado mediante la fórmula: c) Una vez conocida la X2, necesitamos saber los grados de libertad. Los grados de libertad se calculan  (Número de filas-1)*(Número de columnas menos 1), por tanto nuestros g.l serán 1.
  • 7. d) Una vez conocidos tantos chi cuadrado real como los grados de libertad, vamos a la tabla chi cuadrada, para conocer la chi cuadrada teórica asociada a nuestro margen de error establecido (0,05). De manera que teniendo en cuenta la condición: • Si el chi cuadrado real es menor o igual que la chi cuadrado teórica  aceptamos hipótesis nula (no hay relación entre variables) • Si el chi cuadrado real es mayor que la chi cuadrado teórica  rechazamos la hipótesis nula, aceptando la alternativa (hay relación entre variables). Por tanto, como X2 real (40,044) > X2 teórica (3,84) nuestra hipótesis nula es FALSA (Ho) y por tanto, existirá dependencia o asociación entre el consumo de tabaco y el bajo peso al nacer de los bebes. 4. Calcula la odds ratio. 𝑂𝑅 = (𝑎 ∗ 𝑑) (𝑐 ∗ 𝑏) = 43 ∗ 1645 105 ∗ 207 = 3,2544 En nuestro caso, la odds ratio es mayor a 1, por tanto, OR>1 la presencia del factor se asocia a mayor ocurrencia del evento.
  • 8. 5. Repite el ejercicio con R Commander ¿Los resultados son los mismos? a) Primero vamos a abrir R Commander. Una vez abierto, pulsamos sobre “estadísticos”, luego sobre “tablas de contingencia” y finalmente sobre “Introducir y analizar un tabla de doble entrada”. Introducimos los valores de nuestra tabla de 2x2, cogiendo los datos del ejercicio propuesto: R
  • 9. Una vez incluido los datos, pulsamos en aceptar y nos aparecerá en la ventana de resultados, los valores de chi cuadrado y “p”; test exacto de Fisher y la odds ratio. Valores de X2 y “P”. Frecuencias esperadas (FE) Test exacto de Fisher y odds ratio. CONCLUSIÓN: Los valores de X2 (40,044), “p”, las FE (frecuencias esperadas), test exacto de Fisher y Odds ratio (3,25158) presentan valores similares a los valores dados al realizar de manera manual la actividad.
  • 10. Asociación entre variables de un conjunto de datos. 2ª Actividad
  • 11. 1. Primero debemos abrir R commander. Una vez dentro, deberemos cargar el archivo de R “activossalud- 2.Rdata”. Para ello, pulsamos sobre “Datos” y posteriormente sobre “Cargar conjunto de datos” (Realmente habria un paso anterior, determinando el directorio de trabajo pero eso ya lo hemos explicado en seminarios anteriores). Nos aparecerá una ventana, buscamos nuestro archivo de R en nuestro ordenador y posteriormente pulsamos en aceptar.
  • 12. 2. Una vez cargado el conjunto de datos vamos a construir una tabla de contingencia. Para ello, pulsamos sobre “estadísticos”, luego sobre “Tablas de contingencia” y finalmente sobre “Tabla de doble entrada…”.
  • 13. 3. Una vez hecho lo anterior comenzamos a probar la asociación entre ciertas variables: a) Entre la variable “SEXO” y la variable “PRACTICADEPORTE”. Conclusión: Como podemos ver en los resultados la X2 real es 19,163, como la X2 real es mayor que X2 teórica (3,84), rechazamos la hipótesis nula (Ho) y, por tanto, al aceptar la hipótesis alternativa declaramos que existe asociación entre la variable “sexo” y la variable “practicadeporte”.
  • 14. b) Entre la variable “sexo” y la variable “Fruta”. Conclusión: Como podemos ver en los resultados la X2 real es 7,6036; como la X2 real es mayor que X2 teórica (3,84), rechazamos la hipótesis nula (Ho) y, por tanto, al aceptar la hipótesis alternativa declaramos que existe asociación entre la variable “sexo” y la variable “Fruta”.