0% encontró este documento útil (0 votos)
147 vistas

Manual-Estadistica - CICLO2

Este documento presenta un manual de curso sobre estadística descriptiva. Se divide en 5 temas principales: conceptos básicos, medidas de tendencia central, medidas de posición, medidas de dispersión y medidas de distribución de forma. Explica conceptos estadísticos clave, métodos de recolección y análisis de datos, y cálculos e interpretaciones de diferentes medidas estadísticas comúnmente usadas.

Cargado por

Medaly Contreras
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
147 vistas

Manual-Estadistica - CICLO2

Este documento presenta un manual de curso sobre estadística descriptiva. Se divide en 5 temas principales: conceptos básicos, medidas de tendencia central, medidas de posición, medidas de dispersión y medidas de distribución de forma. Explica conceptos estadísticos clave, métodos de recolección y análisis de datos, y cálculos e interpretaciones de diferentes medidas estadísticas comúnmente usadas.

Cargado por

Medaly Contreras
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 115

Estadística

ESTADÍSTICA 2

Curso Estadística (SP2242)


Formato Manual de curso
Autor Institucional Cibertec
Páginas 115 p.
Elaborador Gamarra Camacho, Alexander
Revisor de Contenidos Reynaga Huarcaya, Mery Angelis

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 3

Índice
Presentación 5
Red de contenidos 6

UNIDAD DE APRENDIZAJE 1: ESTADÍSTICA DESCRIPTIVA

1.1 Tema 1 : Conceptos básicos sobre estadística 9


1.1.1 : Población y muestra 9
1.1.2 : Variables estadísticas y su clasificación 10
1.1.3 : Técnicas e instrumentos de recolección de datos 11
1.1.4 : Elaboración de tablas de distribución de frecuencias 11
1.1.5 : Interpretación y elaboración de gráficos estadísticos: Histograma, 16
polígono de frecuencias y diagrama circular

1.2 Tema 2 : Medidas de tendencia central 25


1.2.1 : Tipos de medidas de tendencia central: Media mediana y moda. 25
1.2.2 : Cálculo e interpretación de medidas de tendencia central 25

1.3 Tema 3 : Medidas de posición 38


1.3.1 : Tipos de medidas de posición: Cuartil, decil y percentil 38
1.3.2 : Cálculo e interpretación de las medidas de posición 38

1.4 Tema 4 : Medidas de dispersión 50


1.4.1 : Tipos de medidas de dispersión: Varianza, desviación estándar y 50
coeficiente de variación
1.4.2 : Cálculo e interpretación de medidas de dispersión 51

1.5 Tema 5 : Medidas de distribución de forma 63


1.5.1 : Medidas de asimetría: Asimetría negativa, simetría, asimetría 63
positiva
1.5.2 : Medidas de curtosis: Platicúrtica, mesocúrtica, leptocúrtica 66

UNIDAD DE APRENDIZAJE 2: PROBABILIDADES

2.1 Tema 6 : Probabilidad clásica 72


2.1.1 : Definición 73
2.1.2 : Principio de adición y multiplicación 74

2.2 Tema 7 : Probabilidad condicional 78


2.2.1 : Definición 78
2.2.2 : Aplicaciones 78

2.3 Tema 8 : Distribución de probabilidad discreta 83


2.3.1 : Variable aleatoria discreta 83
2.3.2 : Probabilidad asociada a una variable aleatoria 84
2.3.3 : Esperanza matemática y varianza asociadas a variables aleatorias 85
discretas

UNIDAD DE APRENDIZAJE 3: INFERENCIA ESTADÍSTICA

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 4

3.1 Tema 9 : Muestreo y tamaño de muestra 92


3.1.1 : Definición e importancia 92
3.1.2 : Tipos de muestreo 92
3.1.3 : Aplicaciones prácticas de muestreo aleatorio simple 93

3.2 Tema 10 : Intervalo de confianza 99


3.2.1 : Definición 99
3.2.2 : Aplicaciones prácticas 101

3.3 Tema 11 : Tópicos complementarios 105


3.3.1 : Proyección de ventas: Pronósticos básicos 105

3.4 Tema 12 : Herramientas básicas del programa IBM SPSS 109


3.4.1 : Ingreso y análisis de datos en IBM SPSS 109

Bibliografía 114

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 5

Presentación
Hoy, como en todas las épocas de la humanidad, el manejo de datos, su análisis e interpretación
ha sido, es y será de fundamental importancia para los diferentes estados y sus políticas a aplicar
en materia económica, salud, educación, entre otros aspectos de vital importancia para la
sociedad. Así como a ellos, al sector empresarial y/o de emprendimiento, e incluso en el aspecto
personal, también es imperiosa la necesidad de obtener datos, analizarlos e interpretarlos, y en
base a ello, sacar conclusiones y tomar decisiones.

El desarrollo del curso brindará las herramientas necesarias y suficientes, para que el futuro
profesional las aplique a los diferentes ámbitos de su vida laboral, con el rigor necesario que ella
demande. Profundizaremos los fundamentos teóricos y prácticos de la estadística descriptiva;
análisis, organización e interpretación de datos, mediante elaboración de tablas de frecuencias
y gráficos. Conoceremos la definición clásica de probabilidad, así como asociadas a variables
aleatorias discretas, las que nos darán la base a la estadística inferencial. Finalmente
conoceremos y aplicaremos los fundamentos e importancia de elegir una muestra adecuada,
sobre la cual se tomarán decisiones y se obtendrán conclusiones confiables que podremos
aplicar a una proyección de ventas.

Así también, durante el desarrollo del curso, nos apoyaremos en las herramientas del Excel como
aspecto fundamental en el manejo de datos, el cual será complementado con las herramientas
básicas del programa IBM SPSS, para el análisis de los datos.

El curso es carácter teórico – práctico, en ese sentido, ambos aspectos se desarrollan


unívocamente; pero siempre considerando lo práctico como aspecto principal para
fundamentar las bases teóricas.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 6

Red de contenidos

Estadística

Unidad 1 Unidad 2 Unidad 3

Estadística Probabilidades Inferencia estadística


descriptiva

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 7

UNIDAD

1
ESTADÍSTICA DESCRIPTIVA
LOGRO DE LA UNIDAD DE APRENDIZAJE
Al término de la unidad, el estudiante, trabajando de manera individual, realiza un análisis
descriptivo a través del calcula e interpreta medidas de tendencia central, dispersión y medidas
de forma de distribución, sobre la base de un conjunto de datos no agrupados o agrupados en
una tabla de distribución de frecuencias.

TEMARIO
1.1 Tema 1 : Conceptos básicos sobre estadística
1.1.1 : Población y muestra
1.1.2 : Variables estadísticas y su clasificación
1.1.3 : Técnicas e instrumentos de recolección de datos
1.1.4 : Elaboración de tablas de distribución de frecuencias
1.1.5 : Interpretación y elaboración de gráficos estadísticos: Histograma,
polígono de frecuencias y diagrama circular

1.2 Tema 2 : Medidas de tendencia central


1.2.1 : Tipos de medidas de tendencia central: Media, mediana y moda
1.2.2 : Cálculo e interpretación de las medidas de tendencia central

1.3 Tema 3 : Medidas de posición


1.3.1 : Tipos de medidas de posición: Cuartil, decil y percentil
1.3.2 : Cálculo e interpretación de las medidas de posición

1.4 Tema 4 : Medidas de dispersión


1.4.1 : Tipos de medidas de dispersión: Varianza, desviación estándar y
coeficiente de variación
1.4.2 : Cálculo e interpretación de las medidas de dispersión

1.5 Tema 5 : Medidas de distribución de forma


1.5.1 : Medidas de asimetría: Asimetría negativa, simetría, asimetría
positiva
1.5.2 : Medidas de curtosis: Platicúrtica, mesocúrtica, leptocúrtica

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 8

ACTIVIDADES PROPUESTAS

• Los estudiantes identifican la población, muestra y variables de un conjunto de


datos.
• Los estudiantes elaboran las tablas de frecuencias y sus respectivos gráficos, de
acuerdo al tipo de variable.
• Los estudiantes calculan las medidas de tendencia central, las medidas de
posición y las medidas de dispersión e interpretan cada resultado.
• Los estudiantes determinan la simetría y asimetría de una distribución de datos.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 9

1.1. CONCEPTOS BÁSICOS SOBRE ESTADÍSTICA


La estadística es una ciencia que permite la elaboración y uso de métodos y procedimientos para
la toma de decisiones en presencia de incertidumbre (Gómez – Cárdenas – Condado, 2006,
p.13).

La estadística comprende dos áreas importantes:

• Estadística descriptiva: Es el área de la estadística que trata de la organización, resumen,


análisis e interpretación de los datos (Gómez – Cárdenas – Condado, 2006, p.19).

• Estadística inferencial: Es el área de la estadística que usa métodos apropiados con los que
es posible hacer una generalización o inferencia acerca de una o más características de la
población, basándose en la información contenida en la muestra. Debe señalarse que la
teoría de la probabilidad es el soporte de la Inferencia Estadística (Gómez – Cárdenas –
Condado, 2006, p.19).

La estadística inferencial comprende dos áreas importantes:

• Estimación: Puntual y por intervalos.


• Prueba de hipótesis estadística.

1.1.1. Población y muestra

Figura 1: Población y muestra


Fuente - Tomado de https://www.universoformulas.com/estadistica/descriptiva/muestra-estadistica/

Población: Se denomina población a un conjunto de elementos que consiste de personas,


objetos, etc. En los que se pueden observar o medir una o más características de naturaleza
cualitativa o cuantitativa.

A cada elemento de la población se le denomina unidad elemental o unidad estadística.

Ejemplos:

1) Los estudiantes del sistema escolar peruano.


2) Las placas de los automóviles que circulan en el Perú.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 10

3) Las madres gestantes de la región Lima.

Muestra: Se denomina muestra a una parte de la población seleccionada de acuerdo a un plan


o una regla con el fin de obtener información acerca de la población de la cual proviene. La
muestra debe ser seleccionada de manera que sea representativa de la población.

Ejemplos:

1) Si la población es “los estudiantes del sistema escolar peruano”, entonces la muestra podría
ser “el 20% de los estudiantes del sistema escolar peruano”.

2) Si la población es “las placas de los automóviles que circulan en el Perú”, entonces la


muestra podría ser “las placas de los automóviles que circulan por las regiones del norte
del Perú”.

3) Si la población es “las madres gestantes de la región Lima”, la muestra podría ser “las
madres gestantes del distrito de San Juan de Lurigancho”.

1.1.2. Variables estadísticas y su clasificación

Es una característica de la población, observable y medible, el cual se va investigar.

Las variables se clasifican en: Cualitativas y cuantitativas.

Variable cualitativa: Es la característica cuyos valores son cualidades, tributos o categorías.

Las variables cualitativas se clasifican en: Nominales y ordinales.

• Variable cualitativa nominal: Son aquellas que establecen la distinción de los elementos en
las categorías sin implicar orden entre ellas.

• Variable cualitativa ordinal: Son aquellas que agrupan a los objetos, individuos, en categorías
ordenadas, para establecer relaciones comparativas; es decir, son susceptibles de
ordenación, pero no de medición cuantitativas.

Variable cuantitativa: Es la característica cuyos valores son numéricos.

Las variables cualitativas se clasifican en: Discretas y continuas.

• Variable cuantitativa discreta: Son aquellas que surgen por el procedimiento de conteo.

• Variable cuantitativa continua: Son aquellas que surgen por el procedimiento de medir
alguna característica.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 11

En resumen:
Tabla 1: Variables estadísticas y su clasificación

VARIABLES ESTADÍSTICAS
VARIABLE CUALITATIVA VARIABLE CUANTITATIVA
NOMINAL ORDINAL DISCRETA CONTINUA
✓ Nacionalidad. ✓ Grado d ✓ Número de ✓ Estatura.
✓ Religión. instrucción. empleados de ✓ Nivel de
✓ Estado civil. ✓ Orden de una empresa. inflación
mérito. ✓ Número de mensual.
hijos.
Nota. Elaboración Propia

1.1.3. Técnicas e instrumentos de recolección de datos

Figura 2: Técnicas e instrumentos de recolección de datos


Fuente.- Tomado de https://www.questionpro.com/blog/es/recoleccion-de-datos-para-investigacion/

Las técnicas de recolección de datos son procedimientos que permiten al investigador obtener
información necesaria que le permita confirmar o replantear su hipótesis. Los instrumentos de
recolección de datos, dependerá del tipo de técnica que se desee aplicar.

Veamos algunas técnicas de recolección de datos y el respectivo instrumento para la obtención


de los datos:

TÉCNICA - INSTRUMENTO
✓ Análisis documental – Ficha de registro de datos
✓ Encuesta – Cuestionario
✓ Entrevista – Guía de entrevista
✓ Focus Goup – Guía de moderación
✓ Observación experimental – Ficha de observación
✓ Observación no experimental – Guía de observación

1.1.4. Elaboración de tablas de distribución de frecuencias

• A continuación, veamos las notas de un grupo de estudiantes:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 12

0 2 3 3.5 4 4 4 4.5 4.5 4.8


5 5 6 6 6 6.5 6.6 6.6 7 7
7 7.4 7.5 7.9 8 8.3 8.3 8.3 8.5 8.5
8.5 8.9 9 9 9 10 10 10.4 10.5 10.5
10.6 10.6 10.6 10.7 10.8 10.9 11 11 11 11
11.3 11.3 11.4 11.5 11.5 11.6 11.6 11.6 11.6 11.6
11.8 11.8 11.8 11.8 13 13 13 13 13 13.5
13.5 13.5 13.5 13.6 13.6 13.6 13.7 13.8 14 14
14 14 14 15.4 15.5 15.7 15.8 15.9 15.9 15.9
16 16 16 17.5 18 18.8 18.8 20 20 20
Figura 3: Notas de un grupo de alumnos
Fuente .- Elaboración Propia

Para elaborar la tabla de frecuencias, seguiremos los siguientes pasos:

1) Alcance: [Xmín ; Xmáx]

Donde:
Xmín: dato mínimo.
Xmáx: dato máximo.

De la tabla anterior, Xmín = 0 y Xmáx = 20, entonces el alcance sería [0; 20]

2) Rango: R = Xmáx – Xmín

En nuestro caso el rango sería R = 20 – 0 = 20.

3) Número de intervalos: 𝐊 = 𝟏 + 𝟑, 𝟑 × 𝐥𝐨𝐠𝐍 , conocida como regla de Sturges.

Donde:

N: Número de datos, número de encuestados o tamaño de la muestra.

En nuestro caso, de la tabla se observa N = 100, entonces K = 1 + 3,3 × log 100 = 7,6; como
“k” representa número de intervalos, debe ser un número natural, entonces tomamos
convenientemente K = 8

𝐑
4) Amplitud: 𝐀 = 𝐊

Recuerde que aquella fórmula se aplica cuando la amplitud es constante en todos los intervalos.

20
En nuestro caso, R = 20 y K = 8, entonces A = 8
= 2,5

𝐋í𝐦𝐢𝐭𝐞 𝐋í𝐦𝐢𝐭𝐞
5) Intervalo de clase: 𝑰𝒊 = [ ; ⟩
𝐢𝐧𝐟𝐞𝐫𝐢𝐨𝐫 𝐬𝐮𝐩𝐞𝐫𝐢𝐨𝐫

En nuestro caso, K = 8 y A = 2,5; entonces vamos a tener 8 intervalos:

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 13

I1 = [X mín ; X mín + A⟩ = [0; 2,5⟩

I2 = [X mín + A; X mín + 2A⟩ = [2,5; 5⟩

I3 = [X mín + 2A; X mín + 3A⟩ = [5; 7,5⟩

Así sucesivamente.

𝐋í𝐦𝐢𝐭𝐞 𝐋í𝐦𝐢𝐭𝐞
+
𝐢𝐧𝐟𝐞𝐫𝐢𝐨𝐫 𝐬𝐮𝐩𝐞𝐫𝐢𝐨𝐫
6) Marca de clase: 𝐦𝐢 = 𝟐

En nuestro caso:

0 + 2,5
𝑚1 = = 1,25
2

2,5 + 5
𝑚2 = = 3,75
2

5 + 7,5
𝑚3 = = 6,25
2

Así sucesivamente.

7) Frecuencia absoluta simple: fi: Indica el número de dato en Ii

Entonces concluimos que:

∑ 𝑓𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑘 = 𝑁
𝑖=1

8) Frecuencia absoluta acumulada:

F1 = f1

F2 = f1 + f2

F3 = f1 + f2 + f3
.
.
.

Fk = f1 + f2 + f3 + … + fk = N

9) Frecuencia relativa simple:

𝐟𝐢
𝐡𝐢 =
𝐍

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 14

Entonces concluimos que:

∑𝑘𝑖=1 ℎ𝑖 = ℎ1 + ℎ2 + ℎ3 + ⋯ + ℎ𝑘 = 1

10) Frecuencia relativa acumulada:

H1 = h1

H2 = h1 + h2

H3 = h1 + h2 + h3
.
.
.

Hk = h1 + h2 + h3 + … + hk = 1

Además:
𝐅𝐢
𝐇𝐢 =
𝐍

Entonces nuestra tabla de frecuencias quedaría de la siguiente manera:

Figura 4: Tabla de frecuencias respecto a las notas de un grupo de alumnos


Fuente .- Elaboración Propia

Observamos que nuestra variable en estudio, son las notas de 100 estudiantes: Variable
cuantitativa continua.

• Veamos ahora, los datos obtenidos a un grupo de parejas, sobre el número de hijos y
respondieron conforme se muestra la tabla a continuación.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 15

Figura 5: Número de hijos de un grupo de parejas


Fuente .- Elaboración Propia

Observamos, en esta oportunidad, que nuestra variable en estudio es del tipo cuantitativa
discreta, y su tabla de frecuencias sería:

Figura 6: Tabla de frecuencias respecto al número de hijos de un grupo de parejas


Fuente .- Elaboración Propia

• Veamos ahora, los datos obtenidos a un grupo de estudiantes, sobre el país al que
representan en un concurso de matemáticas sudamericanas y respondieron conforme se
muestra la tabla a continuación.

Figura 7: País al que representan un grupo de estudiantes


Fuente .- Elaboración Propia

Observamos, en esta oportunidad, que nuestra variable en estudio es del tipo cualitativa
nominal, y su tabla de frecuencias sería:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 16

Figura 8: Tabla de frecuencias respecto al país al que representan un grupo de estudiantes


Fuente .- Elaboración Propia

1.1.5. Interpretación y elaboración de gráficos: Histograma, polígono de frecuencias


y diagrama circular

Veamos la interpretación de algunos datos en nuestras tablas de distribución de frecuencias:

Si tenemos:

Figura 9: Tabla de frecuencias respecto a las notas de un grupo de alumnos


Fuente .- Elaboración Propia

• Interpretación:

o f4: hay 13 estudiantes cuyas notas están desde 7,5 y menor que 10.
o F6: hay 83 estudiantes cuyas notas son menores a 15.
o h2: el 8% de estudiantes tienen notas mayores o iguales a 2,5 y menores que 5.
o H3: el 22% de los estudiantes tienen una nota menor que 7,5.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 17

Veamos la elaboración de gráficos estadísticos, entre ellos tenemos: Diagrama de barras,


diagrama circular, histograma, polígono de frecuencias, diagrama escalonado y ojiva.

1. Diagrama de barras

Se presenta cuando la variable en estudio es del tipo cualitativa; y si es cuantitativa, obedece a


una distribución discreta. La gráfica se genera colocando la variable en el eje horizontal y la
altura de dichas barras corresponde a la frecuencia absoluta o relativa simple.

Figura 10: Diagrama de barras


Fuente.- Tomado de
http://www.iered.org/archivos/Proyecto_coKREA/REAfinales2014/EstadisticaContexto_LuisaHernandez/diagrama_de_barras.html

2. Diagrama circular

Generalmente, este diagrama se utiliza no solo para mostrar la cantidad de datos en


determinada característica; sino también para mostrar la proporción en la que aparecen.

Figura 11: Diagrama circular


Fuente.- Tomado de https://www.universoformulas.com/estadistica/descriptiva/diagrama-circular/comment-page-1/

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 18

3. Histograma

Este diagrama es la unión de varios rectángulos, cuyas bases corresponden a los intervalos de
clase y las alturas, a las frecuencias absolutas o relativas simples.

Figura 12: Histograma


Fuente.- Tomado de https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/histograma.html

4. Polígono de frecuencias

Este diagrama se obtiene considerando en el eje horizontal, las marcas de clase y en el eje
vertical las frecuencias absolutas o relativas simples. La unión de cada punto mediante
segmentos genera dicho polígono.

Figura 13: Polígono de frecuencias


Fuente.- Tomado de https://www.rbjlabs.com/probabilidad-y-estadistica/que-es-estadistica/

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 19

5. Diagrama escalonado

Este diagrama es la unión de varios rectángulos, cuyas bases corresponden a los intervalos de
clase y las alturas, a las frecuencias absolutas o relativas acumuladas.

Figura 14: Diagrama escalonado


Fuente.- Tomado de https://brainly.lat/tarea/49259501

6. Ojiva

Este diagrama se obtiene considerando en el eje horizontal, los intervalos de clase y en el eje
vertical las frecuencias absolutas o relativas acumuladas. Unimos cada punto, empezando desde
el punto en el dato mínimo del eje horizontal con el punto conformado por el límite superior de
dicho intervalo y la altura, seguidamente con el punto formado por el límite superior del
siguiente intervalo y la altura, y así sucesivamente.

Con los datos obtenidos en la tabla se puede crear diversas gráficas como se muestra a
continuación.
Esta ojiva se obtiene con los datos de la marca de clase.

Figura 15: Ojiva


Fuente.- Tomado de https://es.slideshare.net/YeltzinGarcia/ojiva-11878140

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 20

Actividades Propuestas

1) Ud. es el encargado de realizar un estudio de mercado para la empresa de comercialización


de zapatos para bebé “PUJLLAY SAC” en la ciudad de TOWN CENTER para conocer las
preferencias en el calzado de bebé de la población, así como el precio que estarían
dispuestos a pagar por el producto. Para el efecto, usted tomó una muestra aleatoria de
800 mujeres con hijos menores de 3 años en diferentes distritos de la ciudad y aplicó una
encuesta de opinión. Algunos de los resultados que se obtuvieron son los siguientes:

• El 75% de los encuestados prefiere adquirir zapatillas para bebé.


• Los encuestados, en promedio, pueden pagar 47 soles por un calzado para bebé.
• El color que más prefieren los encuestados para el calzado de bebé es el blanco.
• Al menos un tercio de las encuestadas compra zapatos de bebé dos veces al año.
• De acuerdo al enunciado, identifique la población, la muestra, las variables y sus
respectivos tipos.

2) Aceros Arequipa ha estado buscando los factores que influyen en las ventas de varas de
acero (en millones de toneladas) que realiza en la ciudad de Lima. Tomó una muestra de
300 establecimientos en diferentes partes de Lima y Callao y después de realizar un estudio
de mercado, la administración de la empresa obtuvo los siguientes resultados:

• Del total de encuestados el 27% dejó de comprar dicho producto.


• El 90% de encuestados afirman que el producto mantiene su calidad.
• El 32% no consume solamente el producto.
• El 56% afirma que el producto se encuentra escaso en el mercado, y de los que afirman
esto el 84% compran otro producto.
• El 95% de los consumidores paga por las varillas de ½ pulgadas entre $ 6.20 y $ 7.05
dólares.
• Además, se encontró que el precio fijado en la ciudad de Lima de $ 6.10 no se respeta,
y por esta razón, existe un desabastecimiento del 90% en la ciudad del Callao.
• De acuerdo a los datos anteriores, determine la población, la muestra y las variables
con sus respectivos tipos y además indique el tipo de estimación utilizada.

3) Una empresa dedicada a la fabricación de conservas de pescado tiene planeado introducir


al mercado conservas de trucha. Para ello, le encargó a una empresa investigadora de
mercado la realización de un estudio mediante el que le interesaba averiguar, entre otras
cosas, la aceptación del nuevo producto y el precio que las personas estarían dispuestas a
pagar. La encuesta fue realizada en Lima y se entrevistaron a 250 personas. De los
encuestados, el 67% estarían dispuestos a consumir el nuevo producto. Además, se
concluyó que el precio del producto debería oscilar entre S/. 3,50 y S/. 5,50. Determine lo
siguiente:
• La población y la muestra del estudio.
• Las variables y sus respectivos tipos.

4) Un empresario tiene la idea de implementar la venta de chicha morada en envase no


retornable. Piensa, en un principio, que debe analizar la posibilidad de lanzar su producto
en lugares que sean cálidos durante gran parte del año. Para ello, realiza un estudio de
factibilidad en Piura e Iquitos. En Piura, el 90% de los 250 encuestados está dispuesto a
consumir el nuevo producto. En cambio, en Iquitos, el 85% de los 300 encuestados muestra
esta disposición. También, obtuvo información acerca de la utilidad que conseguiría. En
Piura, lograría un promedio de S/. 1,5 de utilidad por producto y, en Iquitos, un promedio

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 21

de S/. 2. Determine lo siguiente:

• La población y la muestra del estudio.


• Las variables y sus respectivos tipos.
• Si tuviese que elegir entre una de las dos ciudades para llevar a cabo su proyecto, ¿Cuál
debería elegir? Justifique.

5) La empresa OILGASA, empresa que produce aceites para consumo humano, tiene en el
mercado tres tipos de aceites: Aceite compuesto, aceite vegetal premium y aceite de olivo.
Este laboratorio, preocupado por los incrementos de la competencia, encarga a una
empresa de estudios de mercado realizar un estudio sobre las preferencias de las personas
de clase media de la ciudad de Lima acerca de dichos productos. Para el estudio, se tomó
una muestra aleatoria de 600 personas, obteniéndose lo siguiente:
• El 55% de los encuestados prefieren el aceite vegetal.
• El 13% de los encuestados no supo diferenciar entre el aceite compuesto y el vegetal
Premium.
• El 26% de los encuestados confunden la marca por el envase.
• El 70% está de acuerdo con el precio de dichos productos.
• Por el precio del aceite de oliva, solamente el 5% lo consume.
• El 85% de las personas paga por un litro de aceite vegetal entre 4.00 y 5.50 nuevos
soles.
• La utilidad que se encontraría es de 1.20 nuevos soles en el aceite Premium y en el
aceite compuesto 1.30 nuevos soles.

De acuerdo al enunciado, identifique: Población, muestra, tipos de variables.

6) Los datos que se muestran a continuación corresponden a las edades de 50 beneficiarios


de un programa de asistencia social del gobierno:

81 53 67 60 80 64 56 54 91 61
66 88 67 65 97 72 74 65 73 69
43 54 76 70 86 68 82 75 79 60
41 87 76 97 70 45 60 45 65 56
92 72 82 80 52 65 50 58 70 76

Elabore su tabla de distribución de frecuencias.

7) Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el


número de empleados que hay en cada una de ellas para un estudio posterior. Las
observaciones obtenidas han sido:

12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14, 12,
11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 18, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11,
12.

• Elabore la tabla de distribución de frecuencias de la variable obteniendo las frecuencias


absolutas, relativas y sus correspondientes acumuladas.
• Determine qué proporción de sucursales tiene más de 15 empleados.
• Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su distribución de

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 22

frecuencias y represente su histograma y su polígono de frecuencias (QDOC.TIPS, 2011).

8) La empresa de investigación de mercado “Eléctrico” lleva a cabo un estudio para obtener


indicadores que le permitan inferir respecto al consumo de energía eléctrica mensual
(medido en kilovatios, redondeado al entero más próximo) de las familias en los
departamentos de Arequipa y Tacna. Dicho estudio, sustentado en el análisis de muestras
aleatorias tomadas en ambos departamentos, arrojó los siguientes resultados:

227 231 261 270 291 351 359 369 371 382 387 392 393 395
Arequipa 396 413 420 422 424 436 453 461 463 471 495 498 510 512
533 534 541 542 584 589 591 628 630 630 657 666

217 219 263 287 294 340 346 347 348 377 390 392
Tacna 395 396 397 408 418 424 426 429 438 438 442 446
447 450 456 481 496 508 511 533 549 583 609 636

Usando la regla de Sturges, calcule los intervalos de clase y marcas de clase por cada
departamento.

9) Los valores absolutos al número de empresas y trabajadores en una determinada región


son los siguientes:

Trabajadores Nº de Empresas
100 - 200 25
200 - 300 37
300 - 400 12
400 - 500 22
500 - 600 21
600 - 700 13
700 - 800 5
800 - 900 3
900 - 1000 2

• Complete la tabla de distribución de frecuencias adecuada a los datos.


• Determine el número de empresas con más de 300 trabajadores.
• Determine el porcentaje de empresas con más de 100 trabajadores y menos de 400.

10) Se ha aplicado un test a los empleados de una fábrica, obteniéndose la siguiente tabla:

Puntaje [38, 44> [44, 50> [50, 56> [56, 62> [62, 68> [68, 74> [74, 80]
Nº Trabajadores 7 8 15 25 18 9 6

Construye al menos dos gráficos apropiados a la información anterior:

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 23

11) La siguiente tabla corresponde a la distribución de frecuencias de los salarios del último
mes de los empleados de una empresa. Complete la tabla.

Frecuencia
Frecuencia Frecuencia
Marca de Frecuencia relativa
Clase Absoluta Acumulada
clase relativa (hi) Acumulada
(fi) (fi)
(hi)
[450 - > 8
750 10
33 0,3
12

12) Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los siguientes
resultados:

Plazas Nº de hoteles
[0 - 10> 25
[10 – 30> 50
[30 – 60> 55
[60 – 100> 20

• Calcule las marcas de clase de cada intervalo.


• Determine ¿Cuántos hoteles tienen treinta o menos plazas?
• Represente gráficamente esta distribución de frecuencias mediante un histograma.
• Determine ¿Cuál es la proporción de hoteles que disponen de entre 11 y 60 plazas?

13) Luis Vargas, asistente del Departamento de Finanzas de PC y Accesorios S.A., ha elaborado
el siguiente cuadro sobre la distribución de los montos pagados, en soles, en impuestos de
5ª. Categoría por los trabajadores de la empresa:

Montos pagados mi fi Fi
[ 150 – > 4
[ 250 – > 24
[ > 30
[ > 72
[ ] 8 80
TOTAL

• Complete el cuadro anterior.


• Determine el porcentaje de trabajadores cuyos pagos mínimos son de 500 soles.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 24

Resumen
1. La estadística es la ciencia de los datos. Los conceptos fundamentales que debemos conocer
son: Población, muestra y variable.

2. Con respecto a las variables, tener presente:

Variables estadísticas
Variable cualitativa Variable cuantitativa
Nominal Ordinal Discreta Continua
o Nacionalidad. o Grado d o Número de o Estatura.
o Religión. instrucción. empleados o Nivel de
o Estado civil. o Orden de de una inflación
mérito. empresa. mensual.
o Número de
hijos.

3. Para organizar adecuadamente los datos obtenidos, se recomienda organizarlas en las


tablas de distribución de frecuencias. Por lo general, las tablas de frecuencias presentan
características comunes independientemente del tipo de variable, salvo al colocar las
variables.

4. La elaboración de las gráficas estadísticas corresponde al tipo de variable y su organización


en la tabla de frecuencias y para ello disponemos de: Diagrama de barra, diagrama circular,
histograma, polígono de frecuencias, diagrama escalonado y ojiva.

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://es.slideshare.net/YeltzinGarcia/ojiva-11878140
o https://www.rbjlabs.com/probabilidad-y-estadistica/que-es-estadistica/
o https://www.universoformulas.com/estadistica/descriptiva/diagrama-circular/comment-
page-1/

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 25

1.2. MEDIDAS DE TENDENCIA CENTRAL


Son indicadores que resumen el conjunto de datos. Entre estas medidas descriptivas,
denominadas estadígrafo o estadístico, tenemos los de posición y entre ellos los estadígrafos de
tendencia central y los de localización.

Las llamadas medidas de tendencia central nos indicará el valor promedio de los datos, o en
torno a qué valor se distribuyen estos. Las medidas de localización están diseñadas para brindar
al analista algunos valores cuantitativos de la ubicación central o de otro tipo de los datos en
una muestra.

1.2.1. Tipos de medidas de tendencia central: Media mediana y moda

1. Media aritmética

La media aritmética es denominada simplemente media o promedio y es el estadígrafo de


tendencia central más conocida, de mayor uso y fácil de calcular.

Si los datos obtenidos son de una muestra, se denotará por x̅; en tanto que si son datos de toda
la población en estudio, se denota por μ.

2. Mediana

La mediana (Me), es un estadígrafo de tendencia central, que divide al conjunto de


observaciones ordenadas, de forma ascendente o descendente, en dos partes de igual número
de datos.

La mediana ocupa la posición central de los datos, cuyo valor depende de la cantidad de datos
y por consiguiente no es afectado por valores extremos (aislados).

3. Moda

La moda (Mo), es un estadígrafo de localización, y es aquel valor de la variable que se presenta


con mayor frecuencia.

Cuando todas las puntuaciones de un conjunto de datos tienen la misma frecuencia, éste no
tiene moda, entonces diremos que es amodal; si presenta una única moda, diremos unimodal;
así también pueden existir distribuciones bimodales; trimodales o incluso multimodales.

1.2.2. Cálculo e interpretación de las medidas de tendencia central

1. Media aritmética

Definición 1

Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, entonces la media es el cociente


de la suma de todos los valores observados entre el número de datos o tamaño de la muestra.
Su expresión matemática es:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 26

N
x + x2 + x3 + ⋯ + xN 1
̅= 1
X = ∑ xi
N N
i=1
Donde N es el número total de observaciones.

Ejemplo: Diez amigos de una sección se reúnen luego de recibir sus calificaciones del curso de
estadística, cuyas notas fueron: 18, 12, 08, 13, 08, 10, 13, 15, 13 y 07. Calculemos el promedio o
media de dichas notas.

18 + 12 + 08 + 13 + 08 + 10 + 13 + 15 + 13 + 07 117
̅=
X = = 11,7
10 10

Interpretación: El promedio de las notas de los diez amigos es 11,7.

Definición 2

Si N valores de una variable estadística X, se clasifican en los siguientes k valores distintos


x1 , x2 , x3 , … , xk con f1 , f2 , f3 , … , fk como sus respectivas frecuencias absolutas simples. Entonces
la expresión matemática para la media quedaría así:

k k
x × f + x 2 × f2 + x 3 × f3 + ⋯ + x k × fk 1
̅= 1 1
X = ∑ x i × fi = ∑ x i × h i
f1 + f2 + f3 + ⋯ + fk N
i=1 i=1

f
De donde sabemos que f1 + f2 + f3 + ⋯ + fk = N y Ni = hi .

Ejemplo: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo siguiente:

Figura 16: Número de hijos de un grupo de parejas


Fuente .- Elaboración Propia

Elaborando la tabla de frecuencias, obtendríamos:

Figura 17: Tabla de frecuencias para el cálculo de la media


Fuente .- Elaboración Propia

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 27

Entonces la media sería:


40
̅
X= =2
20

Interpretación: Las parejas encuestadas tienen en promedio 2 hijos.

Definición 3

Si N valores de una variable estadística X, se clasifican en k intervalos de clase, cuyas marcas de


clase son m1 , m2 , m3 , … , mk con f1 , f2 , f3 , … , fk como sus respectivas frecuencias absolutas
simples. Entonces la expresión matemática para la media quedaría así:

k k
m1 × f1 + m2 × f2 + m3 × f3 + ⋯ + mk × fk 1
̅
X= = ∑ m i × fi = ∑ m i × h i
f1 + f2 + f3 + ⋯ + fk N
i=1 i=1

f
De donde sabemos que f1 + f2 + f3 + ⋯ + fk = N y Ni = hi .

Ejemplo: Se recolectó las notas de un grupo de alumnos y se obtuvo lo siguiente:

0 2 3 3.5 4 4 4 4.5 4.5 4.8


5 5 6 6 6 6.5 6.6 6.6 7 7
7 7.4 7.5 7.9 8 8.3 8.3 8.3 8.5 8.5
8.5 8.9 9 9 9 10 10 10.4 10.5 10.5
10.6 10.6 10.6 10.7 10.8 10.9 11 11 11 11
11.3 11.3 11.4 11.5 11.5 11.6 11.6 11.6 11.6 11.6
11.8 11.8 11.8 11.8 13 13 13 13 13 13.5
13.5 13.5 13.5 13.6 13.6 13.6 13.7 13.8 14 14
14 14 14 15.4 15.5 15.7 15.8 15.9 15.9 15.9
16 16 16 17.5 18 18.8 18.8 20 20 20
Figura 18: Notas de un grupo de alumnos
Fuente .- Elaboración Propia

Elaborando la tabla de frecuencias, obtendríamos:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 28

Figura 19: Tabla de frecuencias para el cálculo de la media


Fuente .- Elaboración Propia

Entonces la media sería:


1102,50
̅
X= = 11,025
100

Interpretación: El promedio de las notas del grupo de estudiantes es 11,025.

1. Mediana

Definición 1

Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, una vez ordenados, la mediana
es el valor que supera al 50% de los datos y es superado por el 50% restante. Entonces:

a) Si el número de datos es impar, la mediana es el valor central del conjunto de datos.


b) Si el número de datos es par, la mediana es la media o promedio de los dos datos centrales.

Ejemplo: Calcular e interpretar la mediana de los datos en los siguientes casos:

a) 14, 11, 05, 08 y 10.

Ordenamos los datos de manera ascendente: 05 08 10 11 14; como tenemos una cantidad
impar de datos, entonces la mediana es el dato central Me = 10.

Interpretación: El 50% de los datos es menor o igual a 10.

b) 18, 12, 13, 08, 10 y 15

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 29

Ordenamos los datos de manera ascendente: 08 10 12 13 15 18; como tenemos una


12+13
cantidad par de datos, entonces la mediana es la media de los dos datos centrales Me = =
2
12,5.

Interpretación: El 50% de los datos es mayor o igual a 12,5.

Definición 2

Si N valores de una variable estadística X, se clasifican en los siguientes k valores distintos


x1 , x2 , x3 , … , xk , ordenados, con f1 , f2 , f3 , … , fk como sus respectivas frecuencias absolutas
simples. Entonces la mediana se calculará en base a la definición 1.

Ejemplo: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo siguiente:

Figura 20: Número de hijos de un grupo de parejas


Fuente .- Elaboración Propia

Elaborando la tabla de frecuencias, obtendríamos:

Figura 21: Tabla de frecuencias para el cálculo de la mediana


Fuente .- Elaboración Propia

Como la mediana divide a los datos en el 50%, entonces como tenemos una cantidad par de
datos, la mediana sería:
2+2
Me = =2
2

Interpretación: El 50% de las parejas encuestadas, tienen una cantidad de hijos mayor o igual a
2.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 30

Definición 3

Si N valores de una variable estadística X, se clasifican en k intervalos de clase. Entonces la


mediana para datos agrupados por intervalos se calcula así:

N
2
− Fi−1
Me = Linf. + A × [ ]
fi
Donde:

Linf. : Límite inferior de la clase mediana.


A: Amplitud de la clase mediana.
Fi−1 : Frecuencia absoluta acumulada del intervalo anterior a la clase mediana.
fi : Frecuencia absoluta acumulada del intervalo anterior a la clase mediana.

La clase mediana es el primer intervalo cuya frecuencia absoluta acumulada es mayor o igual
que la mitad del total de datos.

Ejemplo: Con los datos de la figura, elaboramos la siguiente tabla de frecuencias y calculamos la
mediana:

Figura 22: Tabla de frecuencias para el cálculo de la mediana


Fuente .- Elaboración Propia

Para calcular la mediana, seguimos los siguientes pasos:

N 100
i. Calculamos . Entonces = 50
2 2
N
ii. Hacemos Fi−1 ≤ < Fi . Entonces 35 ≤ 50 < 64, donde Fi−1 = F4 = 35 y Fi = F5 = 64.
2
iii. Identificamos la clase mediana. En nuestro caso sería el quinto intervalo I5 , entonces Linf. =
10, A = 2,5 y fi = f5 = 29

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 31

50−35
iv. Finalmente Me = 10 + 2,5 × [ 29
] = 11,29

Interpretación: El 50% de las notas de los estudiantes, es mayor o igual a 11,29.

1. Moda

Definición 1

Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, entonces la moda es el dato con
mayor frecuencia.

Ejemplo: Calcular e interpretar la moda de los datos en los siguientes casos:

a) 14, 11, 05, 11, 10, 08, 11 y 05

La moda es Mo = 11, es una distribución unimodal.

Interpretación: El dato con más frecuencia es 11.

b) 18, 12, 13, 12, 12, 13, 18, 13 y 15

El conjunto de datos presenta dos modas Mo = 12 y Mo = 13, es una distribución bimodal.

Interpretación: Los datos con mayor frecuencia son 12 y 13.

Definición 2

Si N valores de una variable estadística X, se clasifican en los siguientes k valores distintos


x1 , x2 , x3 , … , xk , ordenados, con f1 , f2 , f3 , … , fk como sus respectivas frecuencias absolutas
simples. Entonces la moda se calculará en base a la definición 1.

Ejemplo: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo siguiente:

Figura 23: Número de hijos de un grupo de parejas


Fuente .- Elaboración Propia

Elaborando la tabla de frecuencias, obtendríamos:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 32

Figura 24: tabla de frecuencias para el cálculo de la moda


Fuente .- Elaboración Propia

Como la moda es el dato con mayor frecuencia, y la frecuencia máxima es fmáx. = f2 = 7,


entonces Mo = 1 (unimodal).

Interpretación: El número de hijos con más frecuencia de las parejas encuestadas es 1.

Definición 3.

Si N valores de una variable estadística X, se clasifican en k intervalos de clase. Entonces la moda


para datos agrupados por intervalos se calcula así:

𝑑1
𝑀𝑜 = 𝐿𝑖𝑛𝑓. + 𝐴 × [ ]
𝑑1 + 𝑑2

Donde:
Linf. : Límite inferior de la clase modal.
A: Amplitud de la clase modal.
d1 = fi − fi−1
d2 = fi − fi+1
fi : Frecuencia absoluta simple del intervalo a la clase modal.

La clase modal es el intervalo cuya frecuencia absoluta simple es la mayor.

Ejemplo: Elaboramos la siguiente tabla de frecuencias y calculamos la moda:

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 33

Figura 25: Tabla de frecuencias para el cálculo de la moda


Fuente .- Elaboración Propia

Para calcular la moda, seguimos los siguientes pasos:


• Identificamos fmáx. = fi . Entonces fi = f5 = 29
• Identificamos la clase modal. En nuestro caso sería el quinto intervalo I5 , entonces Linf. =
10, A = 2,5 y fi−1 = f4 = 13 y fi+1 = f6 = 19
• Calculamos d1 = fi − fi−1 y d2 = fi − fi+1. Entonces d1 = 29 − 13 = 16 y d2 = 29 −
19 = 10.
16
• Finalmente Mo = 10 + 2,5 × [16+10] = 11,54

Interpretación: La nota con más frecuencia de los estudiantes encuestados es 11,54.

Actividades Propuestas

1) La empresa “A” tiene 100 empleados, con un sueldo promedio mensual por empleado de
$300, la empresa “B” tiene 400 empleados, con un sueldo medio mensual de $250, la
empresa “C” tiene 250 empleados y un sueldo promedio mensual de $280, ¿Determine cuál
es el sueldo medio mensual por empleado para las 3 empresas en conjunto?

2) Un inversionista compró 30 acciones de la empresa Star S.A. a S/. 15 cada acción, 40


acciones de la empresa Full Clean S.A. a S/.18 cada acción y 50 acciones de la empresa
Cosmos S.A. a S/. 21 cada acción. ¿Determine cuál es el costo promedio de una acción?

3) En una empresa el sueldo promedio de 60 trabajadores administrativos es 1200 soles. Por


incremento del costo de vida se presentan dos alternativas de aumento. La primera
propuesta es un aumento de 180 soles a cada trabajador y la segunda es un aumento de
10% de sus sueldos más 12 soles. ¿Determine cuál de las dos propuestas conviene más a
los trabajadores a fin de mejorar su ingreso promedio? Justifique su respuesta.

4) Los siguientes datos son los puntajes de una muestra de adolescentes al realizar un test de

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 34

agudeza visual: 25; 12; 15; 23; 24; 39; 13; 31; 19; 16.
Determine la diferencia en módulo de su promedio y de su respectiva mediana.

5) Calcule la suma de la media, mediana y moda de las notas obtenidas por un grupo de
estudiantes: 15; 16; 18; 14; 15; 15; 14; 18; 16; 14; 14; 14; 16; 18; 20; 14; 14; 16.

6) Una muestra de 20 empleados de cierto centro comercial obtuvo como salario quincenal,
los siguientes datos: 340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280,
240, 280, 255, 265, 255, 265.
Calcule: La media, mediana y moda.

7) Diez lotes de 100 artefactos fueron probados. El resultado de esta prueba está dado en la
siguiente tabla:

Lote Artefactos defectuosos


I II V 2
III X 5
IV VI IX 7
VII VIII 12

Determine el promedio de artefactos defectuosos por lote.

8) En un hospital se les preguntó a las señoras sobre el número de hijos que tenían,
obteniéndose la siguiente respuesta en la tabla adjunta.

Nº de 4 8 10 6 12 14 6
señoras
Nº de 0 1 2 3 4 5 6
hijos

Determine la suma de la media, mediana y moda.

9) Una muestra de 50 negociantes de antigüedades en el sudeste de Estados Unidos reveló


las siguientes ventas (en dólares) en el año pasado:

Ventas (miles de Puntos


Frecuencia Fi fi*xi
dólares) medios xi
100 - 120 110000 5 5 550000
120 - 140 130000 7 12 910000
140 - 160 150000 9 21 1350000
160 - 180 170000 16 37 2720000
180 - 200 190000 10 47 1900000
200 - 220 210000 3 50 630000
50

a. Calcule la media de las ventas.


b. Determine la mediana de las ventas y cuál es la venta más común.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 35

10) Para lanzar un nuevo producto al mercado, una empresa estudia el tiempo de publicidad,
en segundos, empleando en los medios audiovisuales por otra empresa que produce un
producto similar.

Duración Nº Anuncios
0-20 3
2025 17
25-30 13
30-40 9
40-60 8

Determine la duración media aproximada de los anuncios ¿Es representativa? ¿Cuál es la


duración más frecuente?

11) El servicio de estudios de una importante entidad bancaria está llevando a cabo un análisis
de las exportaciones realizadas por las empresas del sector industrial en España.
Concretamente los datos recabados han sido los siguientes:

Número de
Exportaciones
empresas
(miles €)
(cientos)
0 – 10 4
10 – 20 20
20 – 40 16
40 – 50 10

A partir de dicha información:

a) Calcule la media y la mediana de las exportaciones realizadas.


b) ¿Qué conclusiones obtiene de la comparación de ambos indicadores?

12) En un aparcamiento cobran por cada minuto que está estacionado el vehículo 1,5 céntimos
de €. La ocupación del aparcamiento durante la semana pasada fue la siguiente:

Tiempo de
estacionamiento Nº de vehículos
(min.)
0 - 60 1240
60 - 120 3575
120 - 180 746
180 - 240 327
240 - 360 218
360 - 1440 44

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 36

Se pide:

a) Determine el tiempo medio de estacionamiento, el más frecuente y el mediano.


b) ¿A partir de qué cantidad de tiempo un vehículo está estacionado más que el 85% de los
vehículos?
c) Calcule los ingresos totales, el ingreso medio y el más frecuente.

13) Gonzalo Muñoz, encargado de compras de un gran centro comercial, ha obtenido muestras
de lámparas eléctricas de dos empresas proveedoras. Probó ambas muestras con respecto
de la duración de su vida útil con los resultados siguientes:

Empresa
Duración (horas) Marca de clase
A B
700 - 900 8 10
900 - 1100 14 22
1100 -1300 26 18
1300 -1500 6 4

Determine ¿Cuál de las dos empresas proveedoras se quedaría Gonzalo si su decisión la toma
basándose en el promedio de la duración del producto?

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 37

Resumen
1. Las medidas de tendencia central son indicadores que resumen el conjunto de datos. Entre
estas medidas descriptivas, denominadas estadígrafo o estadístico, tenemos los de posición
y entre ellos los estadígrafos de tendencia central y los de localización.

2. La media aritmética es denominada simplemente media o promedio y es el estadígrafo de


tendencia central más conocida, de mayor uso y fácil de calcular. Solo se aplica a variables
cuantitativas.

Para datos no agrupados Para datos agrupados


Sin intervalos Con intervalos
𝑁
1
𝑋̅ = ∑ 𝑥𝑖 𝑘 𝑘
𝑁 1 1
𝑖=1 𝑋̅ = ∑ 𝑥𝑖 × 𝑓𝑖 𝑋̅ = ∑ 𝑚𝑖 × 𝑓𝑖
𝑁 𝑁
𝑖=1 𝑖=1

3. La mediana (Me), es un estadígrafo de tendencia central, que divide al conjunto de


observaciones ordenadas, de forma ascendente o descendente, en dos partes de igual
número de datos. Solo se aplica a variables cuantitativas.

Para datos agrupados por intervalos


N
2
− Fi−1
Me = Linf. + A × [ ]
fi

4. La moda (Mo), es un estadígrafo de localización, y es aquel valor de la variable que se


presenta con mayor frecuencia. Se aplica tanto para variables cualitativas como para
cuantitativas.

Para datos agrupados por intervalos:

d1
Mo = Linf. + A × [ ]
d1 + d2

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://es.slideshare.net/griseldamedinaramos/medidas-de-tendencia-central-55218108
o https://www.lifeder.com/medidas-de-posicion/
o https://www.pinterest.com/pin/784681935064379222/

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 38

1.3. MEDIDAS DE POSICIÓN


Son indicadores que resumen el conjunto de datos. Entre estas medidas descriptivas,
denominadas estadígrafo o estadístico, tenemos los de posición y entre ellos los estadígrafos de
tendencia central y los de localización.

Las medidas de localización están diseñadas para brindar al analista algunos valores
cuantitativos de la ubicación central o de otro tipo de los datos en una muestra. En ese sentido,
basados en el concepto de mediana y dividir los datos en el 50% de la muestra, podemos ampliar
aquel concepto con otros estadígrafos o medidas conocidos como cuantiles, cuyo propósito es
describir el comportamiento de una población y los valores se expresan generalmente en tanto
por ciento. Los cuantiles más utilizados son los cuartiles, deciles y percentiles.

1.3.1. Tipos de medidas de posición: Cuartil, decil y percentil

2. Cuartil

Los cuartiles son valores que dividen a un conjunto de datos ordenados (de manera ascendente
o descendente), en cuatro partes iguales.
Se les denota por Q1, Q2 y Q3.

3. Decil

Los deciles son valores que dividen a un conjunto de datos ordenados (de manera ascendente o
descendente), en diez partes iguales.
Se les denota por D1, D2, D3, …, D8 y D9.

4. Percentil

Los percentiles son valores que dividen a un conjunto de datos ordenados (de manera
ascendente o descendente), en cien partes iguales.
Se les denota por P1, P2, P3, …, P98 y P99.

1.3.2. Cálculo e interpretación de las medidas de posición

2. Cuartil

Definición 1

Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, una vez ordenados, el primer
cuartil (Q1) es el valor que supera al 25% de los datos y es superado por el 75% restante. El
segundo cuartil coincide con la mediana (Q2 = Me). El tercer cuartil (Q3) es el valor que supera al
75% de los datos y es superado por el 25% restante. Entonces:

Ejemplo 1: Calcular e interpretar el Q1 y Q3, para las siguientes notas: 11, 05, 06, 19, 20, 16, 08,
10, 09, 08 y 13.

Ordenamos los datos de manera ascendente:

05 06 08 08 09 10 11 13 16 19 20

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 39

𝑁+1 11+1
1° Calculamos 4
= 4
= 3.
𝑁+1
2° como es entero, entonces 05 06 08 08 09 10 11 13 16 19 20
4
3° Q1 = 08, Q2 = 10 y Q3 = 16

Interpretación:

Q1: El 25% de los datos es menor o igual a 08.


Q3: El 75% de los datos es menor o igual a 16.

Ejemplo 2: Calcular e interpretar el Q1 y Q3, para las siguientes notas: 16, 05, 06, 08, 08, 12, 09,
14, 15, 07, 08 y 12.

Ordenamos los datos de manera ascendente:

05 06 07 08 08 08 09 12 12 14 15 16

N+1 12+1
1° Calculamos 4
= 4
= 3,25.
N+1
2° como 4
no es entero, entonces
05 06 07 08 08 08 09 12 12 14 15 16
3° Q1 = 07 + (08 − 07) × (0,25) = 7,25 y
Q 3 = 12 + (14 − 12) × (0,75) = 13,5.

Interpretación:

Q1: El 75% de los datos es mayor o igual a 7,25.


Q3: El 25% de los datos es mayor o igual a 13,5.

Definición 2.

Si N valores de una variable estadística X, se clasifican en k intervalos de clase. Entonces el


cálculo de los cuartiles está dado por:

t×N
4
− Fi−1
Q t = Linf. + A × [ ]
fi

Donde:

t: 1, 2, 3.
𝐿𝑖𝑛𝑓. : Límite inferior de la clase que contiene a su respectivo cuartil.
𝐴: Amplitud de la clase que contiene al cuartil.
𝐹𝑖−1 : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
cuartil.
𝑓𝑖 : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
cuartil.

La clase que contiene al respectivo cuartil es el primer intervalo cuya frecuencia absoluta
acumulada es mayor o igual que el 25%, o el 50% o el 75% del total de datos respectivamente
para los cuartiles Q1, Q2 y Q3.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 40

Reemplazando t, tendríamos:
N
4
− Fi−1
Q1 = Linf. + A × [ ]
fi
2N
4
− Fi−1
Q 2 = Linf. + A × [ ] = Me
fi
3N
4
− Fi−1
Q 3 = Linf. + A × [ ]
fi

Ejemplo: Elaboramos la siguiente tabla de frecuencias y calculamos Q1 y Q3.

Figura 26: Tabla de frecuencias para el cálculo de los cuantiles


Fuente .- Elaboración Propia

Para calcular Q1, seguimos los siguientes pasos:

N 100
• Calculamos 4 . Entonces 4
= 25
N
• Hacemos Fi−1 ≤ 4
< Fi . Entonces 22 ≤ 25 < 35, donde Fi−1 = F3 = 22 y Fi = F4 = 35.
• Identificamos la clase Q1. En nuestro caso sería el cuarto intervalo I4 , entonces Linf. = 7,5;
A = 2,5 y fi = f4 = 13
25−22
• Finalmente Q1 = 7,5 + 2,5 × [ ] = 8,08
13

Interpretación: Q1: El 25% de las notas de los estudiantes, es menor o igual a 8,08.

Para calcular Q3, seguimos los siguientes pasos:

3N 3×100
• Calculamos 4
. Entonces 4
= 75

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 41

3N
• Hacemos Fi−1 ≤ 4 < Fi . Entonces 64 ≤ 75 < 83, donde Fi−1 = F5 = 64 y Fi = F6 = 83.
• Identificamos la clase Q3. En nuestro caso sería el sexto intervalo I6 , entonces Linf. = 12,5;
A = 2,5 y fi = f6 = 19
75−64
• Finalmente Q 3 = 12,5 + 2,5 × [ ] = 13,95
19

Interpretación: Q3: El 75% de las notas de los estudiantes, es menor o igual a 13,95.

3. Decil

Definición 1

Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, una vez ordenados, el primer
decil (D1) es el valor que supera al 10% de los datos y es superado por el 90% restante. El segundo
decil (D2) es el valor que supera al 20% de los datos y es superado por el 80% restante y así
sucesivamente, el noveno decil (D9) es el valor que supera al 90% de los datos y es superado por
el 10% restante.

Definición 2

Si N valores de una variable estadística X, se clasifican en k intervalos de clase. Entonces el


cálculo de los deciles está dado por:

t×N
10
− Fi−1
Dt = Linf. + A × [ ]
fi

Donde:

t: 1, 2, 3, …, 8, 9.
Linf. : Límite inferior de la clase que contiene a su respectivo decil.
A: Amplitud de la clase que contiene al decil.
Fi−1 : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
decil.
fi : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
decil.

La clase que contiene al respectivo decil es el primer intervalo cuya frecuencia absoluta
acumulada es mayor o igual que el 10%, 20%, 30%, …, 90% del total de datos respectivamente
para los cuartiles D1, D2, D3, …, D9.

Reemplazando t, tendríamos:
N
10
− Fi−1
D1 = Linf. + A × [ ]
fi
2N
10
− Fi−1
D2 = Linf. + A × [ ]
fi

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 42

5N
10
− Fi−1
D5 = Linf. + A × [ ] = Me
fi

9N
10
− Fi−1
D9 = Linf. + A × [ ]
fi

Ejemplo: Elaboramos la siguiente tabla de frecuencias y calculamos D3 y D8.

Figura 27: Tabla de frecuencias para el cálculo de los cuantiles


Fuente .- Elaboración Propia

Para calcular D3, seguimos los siguientes pasos:

3N 3×100
• Calculamos . Entonces = 30
10 10
3N
• Hacemos Fi−1 ≤ 10
< Fi . Entonces 22 ≤ 30 < 35, donde Fi−1 = F3 = 22 y Fi = F4 = 35.
• Identificamos la clase D3. En nuestro caso sería el cuarto intervalo I4 , entonces Linf. = 7,5;
A = 2,5 y fi = f4 = 13
30−22
• Finalmente D3 = 7,5 + 2,5 × [ 13
] = 9,04

Interpretación:

D3: El 30% de las notas de los estudiantes, es menor o igual a 9,04.

Para calcular D8, seguimos los siguientes pasos:

8N 8×100
• Calculamos 10 . Entonces 10
= 80
8N
• Hacemos Fi−1 ≤ < Fi . Entonces 64 ≤ 80 < 83, donde Fi−1 = F5 = 64 y Fi = F6 = 83.
10

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 43

• Identificamos la clase D8. En nuestro caso sería el sexto intervalo I6 , entonces Linf. = 12,5;
A = 2,5 y fi = f6 = 19
80−64
• Finalmente 𝐷8 = 12,5 + 2,5 × [ 19
] = 14,61

Interpretación:

D8: El 80% de las notas de los estudiantes, es menor o igual a 14,61.

4. Percentil

Definición 1

Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, una vez ordenados, el primer
percentil (P1) es el valor que supera al 1% de los datos y es superado por el 99% restante. El
segundo percentil (P2) es el valor que supera al 2% de los datos y es superado por el 98% restante
y así sucesivamente, el noventa y nueve percentil (P99) es el valor que supera al 99% de los datos
y es superado por el 1% restante.

Definición 2

Si N valores de una variable estadística X, se clasifican en k intervalos de clase. Entonces el


cálculo de los percentiles está dado por:

𝑡×𝑁
100
− 𝐹𝑖−1
𝑃𝑡 = 𝐿𝑖𝑛𝑓. + 𝐴 × [ ]
𝑓𝑖

Donde:
t: 1, 2, 3, …, 98, 99.
Linf. : Límite inferior de la clase que contiene a su respectivo decil.
A: Amplitud de la clase que contiene al decil.
Fi−1 : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
decil.
fi : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
decil.

La clase que contiene al respectivo percentil es el primer intervalo cuya frecuencia absoluta
acumulada es mayor o igual que el 1%, 2%, 3%, …, 99% del total de datos respectivamente para
los percentiles P1, P2, P3, …, P99.

Reemplazando t, tendríamos:
N
100
− Fi−1
P1 = Linf. + A × [ ]
fi
2N
100
− Fi−1
P2 = Linf. + A × [ ]
fi

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 44

50N
100
− Fi−1
P50 = Linf. + A × [ ] = Me
fi

99N
100
− Fi−1
P99 = Linf. + A × [ ]
fi

Ejemplo: Elaboramos la siguiente tabla de frecuencias y calculamos P18 y P79.

Figura 28: Tabla de frecuencias para el cálculo de los cuantiles


Fuente .- Elaboración Propia

Para calcular P18, seguimos los siguientes pasos:

18N 18×100
• Calculamos . Entonces = 18
100 100
18N
• Hacemos Fi−1 ≤ < Fi . Entonces 10 ≤ 18 < 22, donde Fi−1 = F2 = 10 y Fi = F3 =
100
22.
• Identificamos la clase P18. En nuestro caso sería el cuarto intervalo I3 , entonces Linf. = 5;
A = 2,5 y fi = f3 = 12
18−10
• Finalmente P18 = 5 + 2,5 × [ 12
] = 6,67

Interpretación:

P18: El 18% de las notas de los estudiantes, es menor o igual a 6,67.

Para calcular P79, seguimos los siguientes pasos:

79N 79×100
• Calculamos . Entonces = 79
100 100

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 45

79N
• Hacemos Fi−1 ≤ < Fi . Entonces 64 ≤ 79 < 83, donde Fi−1 = F5 = 64 y Fi = F6 =
100
83.
• Identificamos la clase P79. En nuestro caso sería el sexto intervalo I6 , entonces Linf. = 12,5;
A = 2,5 y fi = f6 = 19
79−64
• Finalmente P79 = 12,5 + 2,5 × [ 19
] = 14,47

Interpretación:

P79: El 79% de las notas de los estudiantes, es menor o igual a 14,47.

Actividades Propuestas

1) Calcule Q1 y Q3 e interprete.
Si las notas obtenidas por un grupo de estudiantes son:

15; 16; 18; 14; 15; 15; 14; 18; 16; 14; 14; 14; 16; 18; 20; 14; 14; 16.

2) Una muestra de 20 empleados de cierto centro comercial obtuvo como salario quincenal,
los siguientes datos:

340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280, 240, 280, 255, 265,
255, 265

• Calcule Q1 y Q3
• Interprete Q3

3) En un hospital se les preguntó a las señoras sobre el número de hijos que tenían,
obteniéndose la siguiente respuesta en la tabla adjunta.

Nº de 4 8 10 6 12 14 6
señoras
Nº de 0 1 2 3 4 5 6
hijos

• Determine el valor de Q1 + Q2 + Q3.


• Determine el valor de Q1 – Q3.
• Interprete Q1.

4) En un aparcamiento cobran por cada minuto que está estacionado el vehículo 1,5 céntimos
de €. La ocupación del aparcamiento durante la semana pasada fue la siguiente:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 46

Tiempo de
estacionamiento Nº de vehículos
(min.)
0 - 60 1240
60 - 120 3575
120 - 180 746
180 - 240 327
240 - 360 218
360 - 1440 44

Se pide:

a) Determine el tiempo de estacionamiento que es mayor o igual al 25% de los vehículos con
menos tiempo.
b) Calcular el valor de D3 + P83.
c) Interprete P29.

5) Luis Vargas, asistente del Departamento de Finanzas de PC y Accesorios S.A., ha elaborado


el siguiente cuadro sobre la distribución de los montos pagados, en soles, en impuestos de
5ª. Categoría por los trabajadores de la empresa:

Montos pagados mi fi Fi
[ 150 – > 4
[ 250 – > 24
[ > 30
[ > 72
[ ] 8 80
TOTAL

• Complete el cuadro anterior.


• Calcule Q3 – P37
• Interprete D7

6) En el siguiente histograma se muestra la distribución de frecuencias de los pesos de los


lingotes de acero de cierta compañía minera.

4n
3n
2n
n
91,5 92,5 93,5 94,5 95,5 96,5 Pesos

• Calcule P67.
• Interprete Q1.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 47

• Calcule el peso que supere el peso del 70% de los primeros pesos.

7) De la siguiente ojiva acerca de los sueldos de los empleados de una empresa. Halle el valor
P −D
de la expresión 91 4.
Q1

Fi
100
90

60

35

15
x
200 400 600 800 1000 1200

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 48

Resumen
1. Las medidas de posición son indicadores que resumen el conjunto de datos. Entre estas
medidas descriptivas, denominadas estadígrafo o estadístico, tenemos los de localización,
entre ellos los cuantiles.

2. El propósito de los cuantiles es describir el comportamiento de una población y los valores


se expresan generalmente en tanto por ciento. Los cuantiles más utilizados son los cuartiles,
deciles y percentiles.

3. Los cuartiles son valores que dividen a un conjunto de datos ordenados en cuatro partes
iguales. Se les denota por Q1, Q2 y Q3.

Para datos agrupados por intervalos (t: 1, 2, 3).

t×N
4
− Fi−1
Q t = Linf. + A × [ ]
fi

4. Los deciles son valores que dividen a un conjunto de datos ordenados en diez partes iguales.
Se les denota por D1, D2, …, D10.

Para datos agrupados por intervalos (t: 1, 2, …, 10)

t×N
10
− Fi−1
Dt = Linf. + A × [ ]
fi

5. Los percentiles son valores que dividen a un conjunto de datos ordenados en cien partes
iguales. Se les denota por P1, P2, …, P99.

Para datos agrupados por intervalos (t: 1, 2, …, 99)

t×N
100
− Fi−1
Pt = Linf. + A × [ ]
fi

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 49

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://lasmatesfaciles.com/2021/06/21/cuartiles-deciles-y-percentiles-para-datos-
agrupados/
o https://prezi.com/p/ro023noeos9p/cuartiles-deciles-y-percentiles/

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 50

1.4. MEDIDAS DE DISPERSIÓN


Los estadígrafos o estadísticos de posición, como los de tendencia central, contribuyen a la
descripción de un conjunto de datos, mediante un valor representativo; pero no es suficiente,
para lograr una imagen completa de cómo es la distribución, es necesario saber cómo se
distribuyen alrededor de dicho valor representativo.

En esta oportunidad conoceremos la forma de medir la dispersión o la variabilidad de los datos


con respecto a su centro con la finalidad de ampliar la descripción de los datos o de comparar
dos o más serie de datos.

1.4.1. Tipos de medidas de dispersión: Varianza, desviación estándar y coeficiente de


variación

Entre las medidas de dispersión tenemos:

El rango: El rango de variación o recorrido, es el número que resulta de la diferencia del valor
máximo y el mínimo.

El rango intercuartil: El rango intercuartil, es el número que resulta de la diferencia del cuartil
tres y el cuartil uno.

El rango semi-intercuartil: El rango semi-intercuartil, es el número que resulta de la semi


diferencia del cuartil tres y el cuartil uno.

Además:

1. La varianza

Es una medida de dispersión y se define como la media o promedio de los cuadrados de las
diferencias de los datos con respecto a su media aritmética.

Si los datos obtenidos son de una muestra, se denotará por s 2 (varianza muestral); en tanto que
si son datos de toda la población en estudio, se denota por σ2 (varianza poblacional).

Al observar la definición de la varianza, nos percatamos que las unidades en los que se expresa
el resultado es el cuadrado de la variable en estudio, por ejemplo, si nuestra variable en estudio
es “el número de hijos por familia”, entonces en la varianza obtenida tendría por unidades hijos2.
Así también, si la variable en estudio es “años de servicio en una empresa”, la varianza tendrá
por unidad años2.

2. La desviación estándar

La desviación estándar o desviación típica es la raíz cuadrada positiva de la varianza.

Si los datos obtenidos son de una muestra, se denotará por s; en tanto que si son datos de toda
la población en estudio, se denota por σ.

Tanto la varianza como la desviación estándar miden la dispersión de todos los valores de la
muestra con respecto a la media de la misma; pero para efectos de interpretación, la desviación
estándar es la más apropiada, pues presentará las mismas unidades en las que está la variable.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 51

3. El coeficiente de variación

Esta medida de dispersión se define como la relación (el cociente) entre la desviación estándar
y la media aritmética.

Esta medida de dispersión se denotará por CV y se caracteriza por ser una medida de dispersión
relativa; es decir, es adimensional (no presenta unidades de medición). Por tal motivo se utiliza
para comparar la variabilidad de 2 o más grupo de datos con igual o diferente unidades de
medición en estudio.

1.4.2. Cálculo e interpretación de las medidas de dispersión

Tenemos:

El rango: Rango = xmin − xmax

El rango intercuartil: Rango intercuartil = Q 3 − Q1

Q3 −Q1
El rango semi-intercuartil: Rango semi intercuartil =
2

Además:

1. La varianza

Definición 1

Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, entonces la varianza se calcula


así:

Varianza poblacional Varianza muestral

∑N
i=1(xi − μ)
2 ∑N 2
i=1 xi ∑N ̅ )2 ∑N
i=1(xi − x
2
̅2
i=1 xi − N. x
σ2 = = − μ2 s2 = =
N N N−1 N−1

Donde s2 es una estimación de la varianza, cuyo valor se muy similar al usar N en lugar de N – 1,
cuando el tamaño de la muestra es grande.

Ejemplo: Diez amigos de una sección se reúnen luego de recibir sus calificaciones del curso de
estadística, cuyas notas fueron: 18, 12, 08, 13, 08, 10, 13, 15, 13 y 07. Calculemos la varianza de
dichas notas.

Al tener una muestra pequeña, usaremos la estimación de la varianza s2:

x: 07 08 08 10 12 13 13 13 15 18 ⇒ 𝑥̅ = 11,7

x2: 49 64 64 100 144 169 169 169 225 324 ⇒ ∑10 2


𝑖=1 𝑥𝑖 = 1477

∑10 2
̅2
i=1 xi −N.x 1477−10×11,72
Entonces s 2 = N−1
= 10−1
= 12,01

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 52

Interpretación: La varianza de las notas de los 10 amigos, tiene una dispersión de 12,01 con
respecto a su media.

Definición 2

Si N valores de una variable estadística X, se clasifican en los siguientes k valores distintos


x1 , x2 , x3 , … , xk , con f1 , f2 , f3 , … , fk como sus respectivas frecuencias absolutas simples.
Entonces la varianza se calculará así

Varianza poblacional Varianza muestral

∑N 2
i=1(xi − μ) × fi ∑N ̅)2 × fi ∑N
i=1(xi − x
2
̅2
i=1 xi × fi − N. x
σ2 = s2 = =
N N−1 N−1
∑N 2
i=1 i × fi
x
= − μ2
N

Donde s2 es una estimación de la varianza, cuyo valor se muy similar al usar N en lugar de N – 1,
cuando el tamaño de la muestra es grande.

Ejemplo: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo siguiente

Figura 29: Número de hijos de un grupo de parejas


Fuente .- Elaboración Propia

Elaborando la tabla de frecuencias, obtendríamos:

Figura 30: Tabla de frecuencias para el cálculo de la varianza


Fuente .- Elaboración Propia

Como:
∑N 2
̅2
i=1 xi ×fi −N.x ∑N
i=1 xi ×fi
s2 = y x̅ =
N−1 N

40
De nuestra tabla de frecuencias tenemos: ∑N 2
i=1 xi × fi = 114, N = 20 y x
̅ = 20 = 2

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 53

114−20×22
Entonces s 2 = 20−1
= 1,79

Interpretación: La varianza del número de hijos para las 20 parejas, tiene una dispersión de 1,79
con respecto a su media.

Definición 3

Si N valores de una variable estadística X, se clasifican en k intervalos de clase. Entonces la


varianza para datos agrupados por intervalos se calcula así:

Varianza poblacional Varianza muestral

∑N 2
i=1(mi − μ) × fi ∑N ̅)2 × fi
i=1(mi − x
σ2 = s2 =
N N−1
∑N 2
i=1 i × fi
m ∑N 2
̅2
i=1 mi × fi − N. x
= − μ2 =
N N−1

Donde s2 es una estimación de la varianza, cuyo valor se muy similar al usar N en lugar de N – 1,
cuando el tamaño de la muestra es grande.

Ejemplo: Se recolectó las notas de un grupo de alumnos y se obtuvo lo siguiente

0 2 3 3.5 4 4 4 4.5 4.5 4.8


5 5 6 6 6 6.5 6.6 6.6 7 7
7 7.4 7.5 7.9 8 8.3 8.3 8.3 8.5 8.5
8.5 8.9 9 9 9 10 10 10.4 10.5 10.5
10.6 10.6 10.6 10.7 10.8 10.9 11 11 11 11
11.3 11.3 11.4 11.5 11.5 11.6 11.6 11.6 11.6 11.6
11.8 11.8 11.8 11.8 13 13 13 13 13 13.5
13.5 13.5 13.5 13.6 13.6 13.6 13.7 13.8 14 14
14 14 14 15.4 15.5 15.7 15.8 15.9 15.9 15.9
16 16 16 17.5 18 18.8 18.8 20 20 20
Figura 31: Notas de un grupo de alumnos
Fuente .- Elaboración Propia

Elaborando la tabla de frecuencias, obtendríamos:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 54

Figura 32: Tabla de frecuencias para el cálculo de la varianza


Fuente .- Elaboración Propia

Como:
∑N 2
̅2
i=1 mi ×fi −N.x ∑N
i=1 mi ×fi
s2 = N−1
y x̅ = N

de nuestra tabla de frecuencias tenemos


1102,50
∑N 2
i=1 mi × fi = 13943,7500; N = 100 y x̅= = 11,0250
100
13943,75−100×11,02502
Entonces s 2 = 100−1
= 18,07

Interpretación: La varianza de las notas para los 100 estudiantes, tiene una dispersión de 129,71
con respecto a su media.

2. La desviación estándar

Definición

Si los valores que obtenemos de una variable estadística son agrupados o no, el cálculo de la
desviación estándar es la raíz cuadrada positiva de la varianza

Desviación estándar poblacional Desviación estándar muestral

𝜎 = √𝜎 2 𝑠 = √𝑠 2

Ejemplo 1: Diez amigos de una sección se reúnen luego de recibir sus calificaciones del curso de
estadística, cuyas notas fueron: 18, 12, 08, 13, 08, 10, 13, 15, 13 y 07. Calculemos la desviación
estándar de dichas notas.

∑10 2
̅2
i=1 xi −N.x 1477−10×11,72
Como s 2 = = = 12,01
N−1 10−1

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 55

Entonces s = √12,01 = 3,47

Interpretación: La desviación de las notas de los 10 amigos, con respecto a su media es 3,47 en
promedio.

Ejemplo 2: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo


siguiente:

Figura 33: Número de hijos de un grupo de parejas


Fuente .- Elaboración Propia

114−20×22
Como s 2 = = 1,79
20−1

Entonces s = √1,79 = 1,34

Interpretación: La desviación del número de hijos para las 20 parejas, con respecto a su media
es 1,34 en promedio.

Ejemplo 3: Se recolectó las notas de un grupo de alumnos y se obtuvo lo siguiente:

0 2 3 3.5 4 4 4 4.5 4.5 4.8


5 5 6 6 6 6.5 6.6 6.6 7 7
7 7.4 7.5 7.9 8 8.3 8.3 8.3 8.5 8.5
8.5 8.9 9 9 9 10 10 10.4 10.5 10.5
10.6 10.6 10.6 10.7 10.8 10.9 11 11 11 11
11.3 11.3 11.4 11.5 11.5 11.6 11.6 11.6 11.6 11.6
11.8 11.8 11.8 11.8 13 13 13 13 13 13.5
13.5 13.5 13.5 13.6 13.6 13.6 13.7 13.8 14 14
14 14 14 15.4 15.5 15.7 15.8 15.9 15.9 15.9
16 16 16 17.5 18 18.8 18.8 20 20 20
Figura 34: Notas de un grupo de alumnos
Fuente .- Elaboración Propia

13943,75−100×11,02502
Como s 2 = 100−1
= 18,07

Entonces s = √18,07 = 4,25

Interpretación: La desviación de las notas para los 100 estudiantes, con respecto a su media es
4,25 en promedio.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 56

3. El coeficiente de variación: Dispersión relativa

Definición

Si los valores que obtenemos de una variable estadística son agrupados o no, el cálculo del
coeficiente de variación es:

s
CV = × 100%

A pesar de que el CV es una medida de dispersión que se utiliza para comparar la variabilidad de
2 o más grupo de datos con igual o diferente unidades de medición en estudio, podemos
considerar que sí.

Ejemplo 1: Diez amigos de una sección se reúnen luego de recibir sus calificaciones del curso de
estadística, cuyas notas fueron: 18, 12, 08, 13, 08, 10, 13, 15, 13 y 07. Calculemos el coeficiente
de variación de dichas notas.

Como s = 3,47 y x̅ = 11,7

3,47
Entonces CV = × 100% = 29,66%
11,7

Ejemplo 2: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo


siguiente:

Figura 35: Número de hijos de un grupo de parejas


Fuente .- Elaboración Propia

Como s = 1,34 y x̅ = 2

1,34
Entonces CV = 2
× 100% = 67%

Ejemplo 3: Se recolectó las notas de un grupo de alumnos y se obtuvo lo siguiente:

0 2 3 3.5 4 4 4 4.5 4.5 4.8


5 5 6 6 6 6.5 6.6 6.6 7 7
7 7.4 7.5 7.9 8 8.3 8.3 8.3 8.5 8.5
8.5 8.9 9 9 9 10 10 10.4 10.5 10.5
10.6 10.6 10.6 10.7 10.8 10.9 11 11 11 11
11.3 11.3 11.4 11.5 11.5 11.6 11.6 11.6 11.6 11.6
11.8 11.8 11.8 11.8 13 13 13 13 13 13.5
13.5 13.5 13.5 13.6 13.6 13.6 13.7 13.8 14 14
14 14 14 15.4 15.5 15.7 15.8 15.9 15.9 15.9
16 16 16 17.5 18 18.8 18.8 20 20 20
Figura 36: Notas de un grupo de alumnos
Fuente .- Elaboración Propia

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 57

Como s = 4,25 y x̅ = 11,0250

4,25
Entonces CV = 11,0250 × 100% = 38,55%

Debido a que el coeficiente de variación es una medida de dispersión relativa que permite
comparar la variabilidad de dos o más grupos de datos, veamos la interpretación de los tres
grupos de estudio estadístico que se realizó en los 3 ejemplos anteriores.

Interpretación: El grupo de 10 amigos poseen menor variabilidad (29,66%) con respecto a los
otros grupos; pues en los 100 estudiantes, tienen una variabilidad del 38,55% en sus notas; y las
20 parejas, respecto al número de hijos, presenta una variabilidad del 67%.

Actividades Propuestas
1) Los siguientes datos son los puntajes de una muestra de adolescentes al realizar un test de
agudeza visual: 25; 12; 15; 23; 24; 39; 13; 31; 19; 16.

Determine la varianza y la desviación estándar para el conjunto de datos.

2) Calcule el coeficiente de variación de las notas obtenidas por un grupo de estudiantes:

15; 16; 18; 14; 15; 15; 14; 18; 16; 14; 14; 14; 16; 18; 20; 14; 14; 16.

3) Una muestra de 20 empleados de cierto centro comercial obtuvo como salario quincenal,
los siguientes datos: 340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280,
240, 280, 255, 265, 255, 265
Calcule: La varianza, la desviación estándar y el coeficiente de variación.

4) En una empresa el sueldo promedio de 60 trabajadores administrativos es 2400 soles y una


desviación estándar de 15,6 soles. Por incremento del costo de vida se presentan dos
alternativas de aumento. La primera propuesta es un aumento de 180 soles a cada
trabajador y la segunda es un aumento de 10% de sus sueldos más 12 soles. Luego de
calcular la desviación estándar en cada uno de los casos, diga cual opción presenta menor
variabilidad.

5) El sueldo promedio de 200 empleados de una empresa es S/1200 con una desviación
estándar de varianza de 10,02 soles. Se proponen dos alternativas de aumento: a) S/. 75 a
cada uno, b) 15% de su sueldo más 10 soles a cada uno. Determine la alternativa que
presenta mayor variabilidad.

6) En un hospital se les preguntó a las señoras sobre el número de hijos que tenían,
obteniéndose la siguiente respuesta en la tabla adjunta.

Nº de 4 8 10 6 12 14 6
señoras
Nº de 0 1 2 3 4 5 6
hijos

Determine la varianza, la desviación estándar y el coeficiente de variación.

7) La siguiente información muestra la producción por hora de 10 trabajadores.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 58

Producción por hora 7 8 9 10 11


Nº de trabajadores 1 2 4 2 1

Determine la varianza, la desviación estándar y el coeficiente de variación.

8) El gerente de ventas de una empresa desea conocer la distribución de los volúmenes de


venta en el último mes. Para obtener los datos necesarios, se calculan los montos de ventas
mensuales (marzo de 2010) de cada vendedor. A continuación, se muestra los siguientes
datos:

Ventas en Número de
Marca de clase
miles de dólares vendedores fi
5,0 - 7,8 3
7,8 - 10,6 10
10,6 - 13,4 28
13,4 - 16,2 9

Calcule la desviación estándar muestral.

9) Una ONG dedicada a la investigación de problemas sociales tiene 4 áreas de trabajo:


Contabilidad, relaciones internacionales, proyectos y proyección social. Las
remuneraciones mensuales (en nuevos soles) en cada área son las siguientes:

Relaciones Proyección
Contabilidad Proyectos
Internacionales Social
Remuneración Media 1250 1500 1750 1300
Desviación estándar 150 250 100 200
N° empleados 8 5 12 25

a. Calcule el promedio de remuneraciones de toda la empresa.


b. Determine ¿Cuál de los departamentos las remuneraciones son más homogéneas?

10) Un encargado de compras ha obtenido muestras de lámparas incandescentes de dos


proveedores. En su propio laboratorio ha probado ambas muestras con respecto a la
duración de su vida útil, obteniendo los siguientes resultados:

Muestra
Vida útil en horas
Empresa “A” Empresa “B”
[700 - 900> 10 3
[900 - 1100> 16 36
[1100 -1300> 26 12
[1300 -1500] 8 3

a. Determine ¿Cuál de las empresas proveen mejores lámparas?


b. Determine ¿Cuál de las empresas se presenta una mayor homogeneidad en su duración?

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 59

11) La siguiente tabla muestra los resultados de una encuesta de sondeo realizada por un
operador de telefonía celular a los adolescentes de los distritos de Los Olivos y San Miguel
referente al uso del sistema prepago de telefonía celular. El estudio se refirió al tiempo de
uso del sistema telefónico y al gasto de los adolescentes en tarjetas prepago.

Los Olivos San Miguel


Tiempo de Uso
(en minutos) Gastos en Gastos en
Adolescentes Adolescentes
tarjetas (S/.) tarjetas (S/.)
[0 – 40> 30 10 25 12
[40 – 80> 50 15 20 20
[80 – 120> 85 20 40 25
[120 – 60> 25 30 55 30
[160 – 200> 10 50 15 55
[200 – 240] 10 60 5 80
Total 210 160

a. Determine ¿En cuál de los distritos el gasto de los adolescentes en tarjetas prepago es
mayor?
b. Determine ¿En qué distrito el tiempo que los adolescentes hacen uso del sistema de
telefonía celular es menor?

12) Los sueldos en soles de los ejecutivos de dos empresas A y B se dan en la siguiente tabla de
frecuencias:

Sueldos (en miles de Soles) Empresa A Empresa B


1–3 6 8
3–5 7 10
5–7 9 12
7–9 4 6
9 – 11 2 1

a. Determine el porcentaje de los empleados gana por encima de la media en la empresa.


b. Determine ¿En qué empresa los sueldos son más homogéneos?
c. Si todos los trabajadores de la empresa A reciben un aumento del 25% de sus sueldos,
determine ¿Cuál será el nuevo sueldo promedio?

13) El Ministerio de Trabajo ha recibido muchas quejas referidas al trato que las empresas
mineras están realizando con su personal. Uno de los grandes problemas son los sueldos,
que a pesar de que los trabajos son los mismos en diferentes unidades de la misma empresa
minera, los sueldos varían de una unidad a otra. El Ministerio de Trabajo ordena una
investigación a dicha empresa minera, y después de recoger toda la información tabula en
la siguiente tabla los sueldos de las dos unidades de trabajo de la empresa:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 60

UNIDAD (A) UNIDAD (B)


SUELDOS ($)
Nº empleados Nº empleados
400 – 500 20 20
500 – 600 25 10
600 – 700 10 15
700 – 800 18 25
800 – 900 12 20

a. ¿En qué unidad de la empresa los sueldos son más homogéneos?


b. En la unidad A, por debajo de qué valor se concentra el 77% de los sueldos.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 61

Resumen
1. Es fundamental medir la dispersión o la variabilidad de los datos con respecto a su centro
con la finalidad de ampliar la descripción de los datos o de comparar dos o más serie de
datos.

2. Entre las medidas de dispersión tenemos: El rango de variación o recorrido, el rango


intercuartil, el rango semi-intercuartil, la varianza, la desviación estándar y el coeficiente de
variación.

3. La varianza:

Varianza poblacional Varianza muestral

∑N
i=1(xi − μ)
2
2 ∑N 2
i=1 xi ∑N ̅)2 ∑N
i=1(xi − x
2
̅2
i=1 xi − N. x
σ = = − μ2 2
s = =
N N N−1 N−1

Varianza poblacional Varianza muestral

∑N 2
i=1(xi − μ) × fi ∑N ̅)2 × fi
i=1(xi − x
σ2 = s2 =
N N−1
∑N 2
i=1 i × fi
x ∑N 2
̅2
i=1 xi × fi − N. x
= − μ2 =
N N−1

Varianza poblacional Varianza muestral

2
∑N 2
i=1(mi − μ) × fi 2
∑N ̅)2 × fi
i=1(mi − x
σ = s =
N N−1
∑N 2
i=1 i × fi
m ∑N 2
̅2
i=1 mi × fi − N. x
= − μ2 =
N N−1

4. La desviación estándar:

Desviación estándar poblacional Desviación estándar muestral

σ = √σ2 s = √s 2

5. El coeficiente de variación: Dispersión relativa

s
CV = × 100%

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 62

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://www.youtube.com/watch?v=z4ITT_xFFjo
o https://economipedia.com/definiciones/varianza.html
o https://matemovil.com/coeficiente-de-variacion-ejemplos-y-ejercicios/

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 63

1.5. MEDIDAS DE DISTRIBUCIÓN DE FORMA


Para completar la descripción de la información, respecto a la distribución de frecuencias,
estudiaremos las medidas que nos permitirán ver la dirección de la dispersión; es decir, la forma
en que se separan o aglomeran los datos respecto a su centro.

Las principales medidas son: la asimetría y la curtosis.

1.5.1. Medidas de asimetría: Asimetría negativa, simétrica y asimetría positiva

En casos prácticos se observa generalmente que casi nunca se encuentran gráficos (polígonos o
histogramas) perfectamente simétricos, de ahí que el grado de asimetría constituye el sesgo.

1. Asimetría negativa

Una distribución de frecuencias unimodal presenta asimetría negativa o asimetría con sesgo a
la izquierda, si los datos mayores a la media son más frecuentes que aquellos por debajo a la
media. De donde se concluye que MEDIA < MEDIANA < MODA.

Figura 37: Asimetría negativa


Fuente - Tomado de https://smart-thinking.com.mx/usando-la-curtosis-y-asimetria/

𝑥̅ < 𝑀𝑒 < 𝑀𝑜

2. Simétrica

Una distribución de frecuencias unimodal presenta una distribución simétrica, si las frecuencias
absolutas simples equidistantes son iguales; así también la amplitud. De donde se concluye que
MEDIA = MEDIANA = MODA.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 64

Figura 38: Simétrica


Fuente - Tomado de http://ocw.uv.es/ciencias-sociales-y-juridicas/estadistica-i/tema_3_3.pdf

𝑥̅ = 𝑀𝑒 = 𝑀𝑜

3. Asimetría positiva

Una distribución de frecuencias unimodal presenta asimetría positiva o asimetría con sesgo a la
derecha, si los datos menores a la media son más frecuentes que aquellos por encima a la media.
De donde se concluye que MODA > MEDIANA > MEDIA.

Figura 39: Asimetría positiva


Fuente - Tomado de https://smart-thinking.com.mx/usando-la-curtosis-y-asimetria/

Mo > Me > x̅

Para calcular el índice de asimetría de datos muestrales, usaremos el coeficiente de asimetría


de tercer orden:

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 65

∑(mi − ̅
X)3 × fi
As =
N × s3

De donde:

Si As > 0: Asimetría positiva.


Si As = 0: Distribución simétrica.
Si As < 0: Asimetría negativa.

Ejemplo: Se recolectó las notas de un grupo de alumnos y se obtuvo lo siguiente

0 2 3 3.5 4 4 4 4.5 4.5 4.8


5 5 6 6 6 6.5 6.6 6.6 7 7
7 7.4 7.5 7.9 8 8.3 8.3 8.3 8.5 8.5
8.5 8.9 9 9 9 10 10 10.4 10.5 10.5
10.6 10.6 10.6 10.7 10.8 10.9 11 11 11 11
11.3 11.3 11.4 11.5 11.5 11.6 11.6 11.6 11.6 11.6
11.8 11.8 11.8 11.8 13 13 13 13 13 13.5
13.5 13.5 13.5 13.6 13.6 13.6 13.7 13.8 14 14
14 14 14 15.4 15.5 15.7 15.8 15.9 15.9 15.9
16 16 16 17.5 18 18.8 18.8 20 20 20
Figura 40: Notas de un grupo de alumnos
Fuente .- Elaboración Propia

Elaborando la tabla de frecuencias, obtendríamos:

Figura 41: Tabla de frecuencias para la medida de asimetría


Fuente .- Elaboración Propia

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 66

Como s = 4,25 y N = 100


−1369,62
Entonces As = 3 = −0,178
100×4,25

Interpretación: La distribución de las notas de los 100 estudiantes, presenta asimetría negativa.

̅ = 11,025; Me = 11,29 y Mo = 11,54; se verifica que x̅ < Me < Mo


Además como X

Finalmente tendríamos:
En distribuciones simétricas, se cumple M0 = Me = x̅
En distribuciones asimétricas positivas ((As > 0), se cumple Mo < Me < x̅

Figura 42: Simetría y asimetría


Fuente - Tomado de https://epamatematicas.blogspot.com/2019/08/relacion-entre-la-media-la-mediana-y-la.html

1.5.2. Medidas de curtosis: Platicúrtica, mesocúrtica y leptocúrtica

El coeficiente de curtosis de un conjunto de datos unimodal es una medida de apuntamiento o


aplastamiento de un polígono de frecuencias; es decir, se compara la dispersión de los datos
observados cercanos al valor central con la dispersión de los datos cercanos a ambo extremos
de la distribución. Por lo tanto, la curtosis se mide en comparación a la curva normal o
mesocútica.

Se definen 3 tipos de distribución según el grado de curtosis:

1. Platicúrtica

Presenta un bajo grado de concentración alrededor de los valores centrales de la variable y por
lo tanto presenta una curva simétrica menor a la normal.

2. Mesocúrtica

Presenta un grado de concentración medio alrededor de los valores centrales de la variable y


por lo tanto presenta una curva simétrica igual al de la normal.

3. Leptocúrtica

Presenta un alto grado de concentración alrededor de los valores centrales de la variable y por
lo tanto presenta una curva simétrica mayor a la normal.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 67

Figura 43: Curtosis


Fuente - Tomado de https://revistas.tec.ac.cr/index.php/eagronegocios/article/view/4456/4046

Para calcular el coeficiente de curtosis, usaremos:

∑(mi − ̅
X)4 × fi
Cr = −3
N × s4

De donde:

Si Cr > 0: Distribución leptocúrtica.


Si Cr = 0: Distribución mesocúrtica o normal.
Si Cr < 0: Distribución platicúrtica.

Ejemplo: Se recolectó las notas de un grupo de alumnos y se obtuvo lo siguiente:

0 2 3 3.5 4 4 4 4.5 4.5 4.8


5 5 6 6 6 6.5 6.6 6.6 7 7
7 7.4 7.5 7.9 8 8.3 8.3 8.3 8.5 8.5
8.5 8.9 9 9 9 10 10 10.4 10.5 10.5
10.6 10.6 10.6 10.7 10.8 10.9 11 11 11 11
11.3 11.3 11.4 11.5 11.5 11.6 11.6 11.6 11.6 11.6
11.8 11.8 11.8 11.8 13 13 13 13 13 13.5
13.5 13.5 13.5 13.6 13.6 13.6 13.7 13.8 14 14
14 14 14 15.4 15.5 15.7 15.8 15.9 15.9 15.9
16 16 16 17.5 18 18.8 18.8 20 20 20
Figura 44: Notas de un grupo de alumnos
Fuente .- Elaboración Propia

Elaborando la tabla de frecuencias, obtendríamos:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 68

Figura 45: Tabla de frecuencias para la medida de curtosis


Fuente .- Elaboración Propia

Como s = 4,25 y N = 100

80684,726
Entonces Cr = 100×4,254 − 3 = −0,527

Interpretación: La distribución de las notas de los 100 estudiantes, presenta una distribución
platicúrtica.

Actividades Propuestas

1) Los siguientes datos son los puntajes de una muestra de adolescentes al realizar un test de
agudeza visual: 25; 12; 15; 23; 24; 39; 13; 31; 19; 16.
Determine si la distribución es simétrica o asimétrica. De ser asimétrica, indique el nivel de
asimetría.

2) Calcule el grado de curtosis para las notas obtenidas por un grupo de estudiantes:
15; 16; 18; 14; 15; 15; 14; 18; 16; 14; 14; 14; 16; 18; 20; 14; 14; 16.

3) Una muestra de 20 empleados de cierto centro comercial obtuvo como salario quincenal,
los siguientes datos: 340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280,
240, 280, 255, 265, 255, 265.
Calcule el grado de asimetría y curtosis.

4) En un hospital se les preguntó a las señoras sobre el número de hijos que tenían,
obteniéndose la siguiente respuesta en la tabla adjunta.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 69

Nº de 4 8 10 6 12 14 6
señoras
Nº de 0 1 2 3 4 5 6
hijos

Determine el grado de asimetría y curtosis.

5) La siguiente información muestra la producción por hora de 10 trabajadores.

Producción por hora 7 8 9 10 11


Nº de trabajadores 1 2 4 2 1

Determine el grado de asimetría y curtosis.

6) De la siguiente tabla, determina si el apuntamiento es platicúrtica, mesocúrtica o


leptocúrtica.

Montos pagados mi fi Fi
[ 150 – > 4
[ 250 – > 24
[ > 30
[ > 72
[ ] 8 80
TOTAL

7) Calcule las medidas de asimetría y curtosis de los siguientes datos:

a. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:

[100, [110,
Peso [50, 60> [60, 70> [70, 80> [80,90> [90, 100>
110> 120>
fi 8 10 16 14 10 5 2

b. Los pagos diarios de los 125 empleados de una fábrica vienen dados por la siguiente tabla:

Peso [10, 20> [20, 30> [30, 40> [40,50> [50, 60> [60, 70> [70, 80>
fi 18 20 26 24 10 15 12

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 70

Resumen
1. Para completar la descripción de la información, respecto a la distribución de frecuencias,
estudiaremos las medidas que nos permitirán ver la dirección de la dispersión; es decir, la
forma en que se separan o aglomeran los datos respecto a su centro.

2. Las distribuciones unimodales pueden presentar asimetría negativa, asimetría positiva o


pueden ser simétricas.

̅)3 × fi
∑(mi − X
As =
N × s3

De donde:
Si As > 0: Asimetría positiva.
Si As = 0: Distribución simétrica.
Si As < 0: Asimetría negativa.

3. El coeficiente de curtosis de un conjunto de datos unimodal es una medida de


apuntamiento o aplastamiento de un polígono de frecuencias.

̅)4 × fi
∑(mi − X
Cr = −3
N × s4

De donde:
Si Cr > 0: Distribución leptocúrtica.
Si Cr = 0: Distribución mesocúrtica o normal.
Si Cr < 0: Distribución platicúrtica.

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://smart-thinking.com.mx/usando-la-curtosis-y-asimetria/
o http://ocw.uv.es/ciencias-sociales-y-juridicas/estadistica-i/tema_3_3.pdf
o https://www.universoformulas.com/estadistica/descriptiva/curtosis/

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 71

UNIDAD

2
1
PROBABILIDADES
LOGRO DE LA UNIDAD DE APRENDIZAJE
Al término de la unidad, el estudiante, trabajando de manera individual, calcula e
interpreta la probabilidad de ocurrencia de un evento y una probabilidad condicional,
acorde con determinadas condiciones sobre la base de casos de estudio planteados.

TEMARIO
2.1 Tema 6 : Probabilidad clásica
2.1.1 : Definición
2.1.2 : Variables estadísticas y su clasificación

2.2 Tema 7 : Probabilidad condicional


2.2.1 : Definición
2.2.2 : Aplicaciones

2.3 Tema 8 : Distribución de probabilidad discreta


2.3.1 : Variable aleatoria discreta
2.3.2 : Probabilidad asociada a una variable aleatoria
2.3.3 : Esperanza matemática y varianza asociadas a variables aleatorias

ACTIVIDADES PROPUESTAS

• Los estudiantes diferencian de un experimento aleatorio, espacio muestral y


evento.
• Los estudiantes calculan el espacio muestral y los eventos; así también como la
cantidad de elementos de los mismos.
• Los estudiantes calculan la probabilidad de cualquier evento usando la definición
clásica.
• Los estudiantes reconocen los eventos mutuamente excluyentes y los eventos
independientes; así también calculan sus probabilidades.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 72

2.1. PROBABILIDAD CLÁSICA


La teoría de probabilidades proporciona modelos matemáticos que permite describir los
fenómenos aleatorios y cuyo objetivo principal es la comprensión matemática de las
irregularidades de tales fenómenos.

La teoría de probabilidades se construye de manera formal; es decir, tiene una construcción


axiomática, sin embargo, antes de conocer los conceptos básicos de probabilidad, es necesario
tener presente conceptos como experimento aleatorio, espacio muestral y evento.

a) Experimento aleatorio (𝛆)

Es aquel proceso cuya ejecución se puede realizar una o más veces y el resultado es incierto,
vale decir, depende del azar.

Ejemplos:

✓ 𝜀1 : Lanzar un dado y observar el resultado en la cara superior.


✓ 𝜀2 : Lanzar una moneda dos veces y observar el resultado global.
✓ 𝜀3 : Lanzar un dado y una moneda, y observar el resultado en la cara superior del dado y el
de la moneda.

b) Espacio muestral (𝛀)

Es el conjunto de todos los posibles resultados del experimento aleatorio.

Ejemplos:

• Para 𝜀1 : Lanzar un dado y observar el resultado en la cara superior.


Entonces el espacio muestral sería Ω1 = {1, 2, 3, 4, 5, 6}; donde 𝑛(Ω1 ) = 6

• Para 𝜀2 : Lanzar una moneda dos veces y observar el resultado global.

Figura 46: Espacio muestral para dos monedas


Fuente .- Elaboración Propia

Entonces el espacio muestral sería Ω2 = {CC, CS, SC, SS}; donde n(Ω2 ) = 4

• Para 𝜀3 : Lanzar un dado y una moneda, y observar el resultado en la cara superior del dado
y el de la moneda.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 73

Figura 47: Espacio muestral para un dado y una moneda


Fuente .- Elaboración Propia

Entonces el espacio muestral sería

Ω3 = {(1; 𝐶), (1; 𝑆), (2; 𝐶), (2; 𝑆), (3; 𝐶), (3; 𝑆), (4; 𝐶), (4; 𝑆), (5; 𝐶), (5, 𝑆), (6; 𝐶), (6; 𝑆)}; donde
𝑛(Ω1 ) = 12

c) Eventos

Es todo subconjunto del espacio muestral.

Ejemplos:

• Para ε1 con Ω1 = {1, 2, 3, 4, 5, 6}; donde n(Ω1 ) = 6


Consideremos el evento A: obtener número mayor que 4.
⟹ A = {5; 6}; donde n(A) = 2

• Para ε2 con Ω2 = {CC, CS, SC, SS}; donde n(Ω2 ) = 4


Consideremos el evento B: obtener al menos una cara.
⟹ B = {CC, CS, SC}; donde n(B) = 3

• Para ε3 con
Ω3 = {(1; C), (1; S), (2; C), (2; S), (3; C), (3; S), (4; C), (4; S), (5; C), (5, S), (6; C), (6; S)};
donde n(Ω1 ) = 12
Consideremos el evento C: obtener número par en el dado y sello en la moneda.
⟹ C = {(2; S), (4; S), (6; S)}; donde n(C) = 3

2.1.1. Definición

Mucho antes de la fundamentación axiomática del cálculo de probabilidades, se calcularon


probabilidades de eventos aleatorios. La definición en la que se basaban dichos cálculos es lo
que hoy conocemos como definición clásica o también regla de Laplace.

La definición clásica de probabilidades establece que la probabilidad de un evento “A”, es igual


al cociente entre el número de elementos de dicho evento con respecto al número de elementos
de su espacio muestral.

n(A) casos favorables


P(A) = =
n(Ω) casos totales

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 74

Ejemplos:

• Si lanzamos un dado, ¿Cuál es la probabilidad de obtener en la cara superior un número


mayor que 4?

Como Ω1 = {1, 2, 3, 4, 5, 6}; donde n(Ω1 ) = 6. Consideremos “A” el evento de obtener un


resultado mayor que 4 ⟹ A = {5; 6}; donde n(A) = 2
n(A) 2
Por lo tanto P(A) = n(Ω ) = 6 = 0,33
1

• ¿Cuál es la probabilidad de obtener al menos una cara si lanzamos una moneda dos veces?

Como Ω2 = {CC, CS, SC, SS}; donde n(Ω2 ) = 4. Consideremos “B” el evento de obtener al
menos una cara ⟹ B = {CC, CS, SC}; donde n(B) = 3
n(B) 3
Por lo tanto P(B) = n(Ω ) = 4 = 0,75
2

• El profesor de estadística decide lanzar un dado y una moneda, ¿Cuál es la probabilidad de


obtener número par en el dado y sello en la moneda?

Como:

Ω3 = {(1; C), (1; S), (2; C), (2; S), (3; C), (3; S), (4; C), (4; S), (5; C), (5, S), (6; C), (6; S)};
donde n(Ω1 ) = 12. Consideremos “C” el evento de obtener número par en el dado y sello
en la moneda ⟹ C = {(2; S), (4; S), (6; S)}; donde n(C) = 3
n(C) 3
Por lo tanto P(C) = = = 0,25
n(Ω3 ) 12

2.1.2. Principio de adición y multiplicación

1) Probabilidad de eventos mutuamente excluyentes

Dos eventos son mutuamente excluyentes si no ocurren de manera simultánea; es decir no hay
intersección de ambos eventos A ∩ B = ∅.

Entonces se cumple: P(A ∪ B) = P(A) + P(B)

Si los eventos no cumplen con ser mutuamente excluyentes aplicamos:


P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Ejemplo:

• Para este fin de semana Karina decidió viajar y la probabilidad de viajar al norte es 0,42;
mientras que, la probabilidad de viajar al sur es 0,25, ¿Cuál es la probabilidad de que Karina
viaje el fin de semana al norte o al sur?

Supongamos que:
A: viajar al norte
B: viajar al sur
entonces P(A) = 0,42 y P(B) = 0,25; además Karina no puede viajar a ambos lugares a la vez
⟹ P(A ∪ B) = P(A) + P(B) = 0,42 + 0,25 = 0,67.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 75

2) Probabilidad de eventos independientes

Dos eventos son independientes si el resultado al realizar uno de los eventos, no influye en el
resultado del otro evento; ello implica que los eventos se pueden realizar a la vez o uno a
continuación del otro.

Entonces se cumple: P(A ∩ B) = P(A) × P(B)

Ejemplo:

• El profesor de estadística decide lanzar un dado y una moneda, ¿Cuál es la probabilidad de


obtener número par en el dado y sello en la moneda?

Como los resultados que se obtienen de un dado no influyen en el resultado que se obtenga de
la moneda, entonces dichos eventos son independientes.

Supongamos que:
A: Número par en el dado
B: Sello en la moneda

Para el dado: Ω1 = {1, 2, 3, 4, 5, 6}; n(Ω1 ) = 6 y A = {2, 4, 6}; n(A) = 3


3
⟹ P(A) = 6.

Para la moneda: Ω2 = {C, S}; n(Ω2 ) = 2 y B = {S}; n(B) = 1


1
⟹ P(B) = .
2

Nos piden calcular


3 1 1
P(A ∩ B) = P(A) × P(B) = 6 × 2 = 4 = 0,25

Actividades Propuestas

1) Se lanza un dado y se observa el número de la cara superior. Calcule la probabilidad de que:


a) Se obtenga un puntaje de 3.
b) Se obtenga al menos 5 puntos.

2) Se extrae una bola de una urna que contiene 3 bolas rojas y 2 bolas azules. Determine la
probabilidad de que la bola extraída sea
a) roja.
b) azul.

3) Un lote consta de 10 artículos buenos, 4 con pequeños defectos y 2 con defectos graves. Se
elige un artículo al azar, encontrar la probabilidad de que:
a) No tenga defectos.
b) Tenga defectos graves.
c) Que sea bueno o que tenga un defecto grave.

4) En una habitación se encuentra un grupo de personas: 5 varones mayores de 21 años, 4


varones menores de 21, 6 mujeres mayores de 21 y 3 mujeres menores de 21. Se elige una
persona al azar. Se define los siguientes eventos A = {la persona es mayor de 21}; B = {la
persona es menor de 21}; C = {la persona es varón}; D = {la persona es mujer}.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 76

Evaluar:
a) P(B ∪ D)
b) P(A ∪ C)

5) Suponga que en un sorteo la probabilidad de ganar el primer premio es 2/5 y la probabilidad


de ganar de ganar el segundo premio es 3/8. Si la probabilidad de ganar al menos uno es
3/4, calcule la probabilidad de:
a) Ganar solo uno de los dos premios.
b) No ganar premio alguno.

6) Un sistema está formado por dos componentes A y B cuyas probabilidades de falla son 1/6
y 2/15 respectivamente. Si la probabilidad de que al menos una de las dos componentes
falle es 7/30, calcule la probabilidad de que
a) Ninguna de las dos componentes falle.
b) Solo una de las componentes falle.

7) Si se lanza un dado 2 veces consecutivas, cuál es la probabilidad de que:


a) Se obtenga 7 puntos en total.
b) Se obtenga 6 puntos solo en el segundo lanzamiento.
c) Se obtenga 7 puntos en total o 6 puntos solo en el segundo lanzamiento.
d) Se obtenga 7 puntos en total y 6 puntos solo en el segundo lanzamiento.

8) Un lote consiste de 15 objetos idénticos, 7 de los cuales se califican como E (éxito) y el resto
se califican como F (fracaso). Si se escogen 5 objetos a la vez, calcule la probabilidad de que
3 sean E y 2 sean F.

9) Una caja contiene 12 pernos, de los cuales 5 no tienen defectos, 4 tienen defectos leves y
3 tienen defectos graves. Si se eligen 6 pernos al azar y a la vez, calcule la probabilidad de
que 3 no tengan defectos, 2 tengan defectos leves y solo uno tenga defecto grave.

10) Una urna contiene 5 fichas similares de las cuales 3 son de color rojo y 2 de color azul.
a) Si se extraen 3 fichas a la vez, ¿Cuál es la probabilidad de que solo una sea de color
rojo?
b) Si se extraen 3 fichas, una por una sin reposición, ¿Cuál es la probabilidad que la tercera
sea de color rojo?
c) Si se extraen 3 fichas, una por una con reposición, ¿Cuál es la probabilidad que la
tercera sea de color rojo?

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 77

Resumen
1. La teoría de probabilidades tiene por objetivo principal la comprensión matemática de las
irregularidades de los fenómenos aleatorios.

2. Es necesario tener presente conceptos como experimento aleatorio (experimento que


depende del azar), espacio muestral (conjunto formado por todos los posibles resultados
del experimento aleatorio) y evento (todo subconjunto del espacio muestral).

3. La definición clásica de probabilidades establece que:

n(A) casos favorables


P(A) = =
n(Ω) casos totales

4. Para dos eventos son mutuamente A ∩ B = ∅, se tiene P(A ∪ B) = P(A) + P(B)

Si los eventos no cumplen con ser mutuamente excluyentes aplicamos:


P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

5. Para dos eventos independientes, se tiene que P(A ∩ B) = P(A) × P(B).

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://www.lifeder.com/probabilidad-clasica/
o https://www.monografias.com/trabajos89/adicion-probabilidades-eventos-
mutuamente/adicion-probabilidades-eventos-mutuamente.shtml
o https://calculo.cc/temas/temas_estadistica/probabilidad/teoria/depe_indepe.html

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 78

2.2. PROBABILIDAD CONDICIONAL


En algunos casos se desea calcular la probabilidad de que ocurra un evento sabiendo que ocurrió
otro evento antes.

Sean los eventos A y B en el espacio muestral Ω, tal como se muestra a continuación:

Figura 48: Eventos A y B en su espacio muestral


Fuente .- Elaboración Propia

Si queremos calcular la probabilidad del evento A, sabiendo que previamente ocurrió el evento
B, se denota por P(A/B).

Tendríamos:
n(A∩B)
n(A ∩ B) n(Ω) P(A ∩ B)
P(A/B) = = n(B)
=
n(B) P(B)
n(Ω)

2.2.1. Definición

Sean dos evento A y B de un mismo espacio muestral Ω. La probabilidad condicional de A dado


B, está definido por:

P(A ∩ B)
P(A/B) =
P(B)

La notación P(A/B) se lee: Probabilidad del evento A, dado que ocurrió B; o probabilidad del
evento A, sabiendo que ocurrió B; o probabilidad de A, si ocurrió B; etc.

2.2.2. Aplicaciones

Existe una variedad de casos en la que se presenta la probabilidad condicional, veamos algunos:

Aplicación 1:

• Si lanzamos un dado, ¿Cuál es la probabilidad de obtener en la cara superior un número


mayor que 4, sabiendo que inicialmente se obtuvo un valor par?

Como Ω1 = {1, 2, 3, 4, 5, 6}. Consideremos “B” el evento de obtener un valor par y “A” el
evento de obtener un resultado mayor que 4.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 79

⟹ B = {2; 4; 6}; donde n(B) = 3


⟹ A = {5; 6}; donde n(A) = 2

n(A∩B) 1
Por lo tanto P(A/B) = n(B)
=3

Aplicación 2:

• El profesor de estadística decide lanzar, primero un dado y luego una moneda, ¿Cuál es la
probabilidad de obtener sello en la moneda, sabiendo que en el dado primero salió un
número mayor o igual a 3?

Como:

Ω3 = {(1; C), (1; S), (2; C), (2; S), (3; C), (3; S), (4; C), (4; S), (5; C), (5, S), (6; C), (6; S)}.
Consideremos “C” el evento de obtener número mayor o igual a 3 y “D” el evento de
obtener sello en la moneda
⟹ C = {(3; C), (3; S), (4; C), (4; S), (5; C), (5; S), (6; C), (6; S)}; donde n(C) = 8
⟹ D = {(1; S), (2; S), (3; S), (4; S), (5; S), (6; S)}; donde n(D) = 6

n(D∩C) 4
Por lo tanto P(D/C) = = = 0,5
n(C) 8

Aplicación 3:

• En una reunión social se observa que asistieron 60 varones profesionales y 30 varones no


profesionales, 40 mujeres profesionales y 20 mujeres no profesionales. Si se elige al azar
una persona:

a) ¿Cuál es la probabilidad que sea varón dado que es profesional?


b) ¿Cuál es la probabilidad que sea profesional sabiendo que es mujer?

De los datos, construimos el siguiente diagrama:

Varones Mujeres

Profesionales 60 40

No profesionales 30 20

Consideremos los siguientes eventos:

A: La persona es varón. ⟹ n(A) = 90


B: La persona es profesional. ⟹ n(B) = 100
C: La persona es mujer. ⟹ n(C) = 60

a) ¿Cuál es la probabilidad que sea varón dado que es profesional?

n(A ∩ B) 60
P(A/B) = = = 0,6
n(B) 100

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 80

b) ¿Cuál es la probabilidad que sea profesional sabiendo que es mujer?

n(B ∩ C) 40
P(B/C) = = = 0,67
n(C) 60
Actividades Propuestas

1
1) Si A y B son dos eventos tales que P(B) = 3/15, P(B/A) = 1/5 y P(A ∩ B) = 15. Calcular
P(A ∩ B C ).

2) Si A y B son dos eventos tales que P(A) = 5/8, P(B) = 3/4 y P(A/B) = 2/3. Calcular P(A/B C ).

3) En una habitación se encuentra un grupo de personas: 5 varones mayores de 21 años, 4


varones menores de 21, 6 mujeres mayores de 21 y 3 mujeres menores de 21. Se elige una
persona al azar. Se define los siguientes eventos A = {la persona es mayor de 21}; B = {la
persona es menor de 21}; C = {la persona es varón}; D = {la persona es mujer}.
Evaluar:
a) P(A/D) + P(D/A)
b) P(C/B) − P(B/D)

4) Suponga que en un sorteo la probabilidad de ganar el primer premio es 2/5 y la probabilidad


de ganar de ganar el segundo premio es 3/8. Si la probabilidad de ganar al menos uno es
3/4, calcule la probabilidad de que una persona gane el segundo premio, sabiendo que
previamente había ganado el primer premio.

5) Un sistema está formado por dos componentes A y B cuyas probabilidades de falla son 1/6
y 2/15 respectivamente. Si la probabilidad de que al menos una de las dos componentes
falle es 7/30, calcule la probabilidad de que:
a) Calcular la probabilidad de que falle el componente A, sabiendo que había fallado B
previamente.
b) Calcular la probabilidad de que falle el componente B, si primero falló B.

6) Si se lanza un dado 2 veces consecutivas, cuál es la probabilidad de que:


a) Se obtenga un número par en el segundo lanzamiento, si primero salió menor que 4.
b) Se obtenga un número cuadrado perfecto, si primero salió número par.
c) Se obtenga 7 puntos en total, dado que salió 6 en el primer lanzamiento.
d) Se obtenga 6 en el segundo lanzamiento, sabiendo que se obtuvo más de 7 puntos en
total.

7) En cierta reunión se encuentran un grupo de estudiantes de “CIBERTEC” de todas las


escuelas, tal como se muestra en la tabla adjunta:

Masculino Femenino Total


TI 5 3 8
Gestión y
12 15 27
negocios
Diseño y
10 15 25
comunicaciones
Ingeniería 8 4 12
Total 35 37 72

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 81

Se elige aleatoriamente un estudiante, calcule:

a) La probabilidad de que sea de la escuela de gestión y negocios; dado que es del sexo
femenino.

b) La probabilidad de que sea del sexo femenino; si se sabe que es de la escuela de gestión y
negocios.

c) La probabilidad de que no sea de la escuela de ingeniería, ni de gestión y negocios; sabiendo


que es del sexo masculino.

8) En una muestra de 120 personas, se encontró que el 60% sufre alguna enfermedad, el 30%
tienen al menos 30 años, y el 20% del total son menores de 30 y sanos. Si una de las
personas es escogida al azar, cuál es la probabilidad de que
a) Sufra alguna enfermedad y tenga al menos 30 años.
b) Sufra alguna enfermedad, si tiene al menos 30 años.
c) Tenga menos de 30 años, dado que es una persona sana.

9) En una encuesta de opinión a 200 personas, se encontró que el 25% de los electores
votarían por el candidato E. De los que no votarían por E, el 20% son mujeres. Además, el
70% de los electores son hombres.
a) Si se elige un elector al azar, y resulta ser mujer, ¿Cuál es la probabilidad de que no
vote por E?
b) Si se elige un elector al azar, y resulta ser hombre, ¿Cuál es la probabilidad de que vote
por E?
c) Si se elige un elector al azar, y resulta no votará por E, ¿Cuál es la probabilidad de que
sea mujer?

10) Para ir a trabajar, un hombre toma ómnibus o el metro con probabilidades respectivas de
0,3 y 0,7. Cuando toma el ómnibus, llega tarde el 30% de los días; si toma el metro, llega
tarde el 20%. Si un día particular el hombre llega tarde al trabajo, ¿Cuál es la probabilidad
de que tomó ómnibus?

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 82

Resumen
1. Sean los eventos A y B en el espacio muestral Ω, tenemos:

n(A∩B)
n(A ∩ B) n(Ω) P(A ∩ B)
P(A/B) = = n(B)
=
n(B) P(B)
n(Ω)

2. La notación P(A/B) se lee: Probabilidad del evento A, dado que ocurrió B; o probabilidad del
evento A, sabiendo que ocurrió B; o probabilidad de A, si ocurrió B; etc.

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://nikobosk2017.wixsite.com/misitio/post/probabilidad-condicional
o https://lasmatesfaciles.com/2020/07/01/introduccion-a-la-probabilidad-condicional/
o https://es.slideshare.net/daliarosabotello/probabilidad-condicional-26850179

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 83

2.3. DISTRIBUCIÓN DE PROBABILIDAD


Para estudiar estadísticamente cierto experimento aleatorio es necesario realizar una
descripción numérica de los resultados de dicho experimento. Para ello definimos la variable
aleatoria, la cual se denomina así por ser una característica cuantitativa de una población
aleatoria.

Esta variable aleatoria asigna a cada resultado de experimento aleatorio un valor numérico.

2.3.1. Variable aleatoria discreta

Una variable aleatoria es una variable estadística cuantitativa definida en un espacio muestral
Ω; es decir, una variable aleatoria “X” es una función cuyo dominio está definido en el espacio
muestral Ω, donde cada elemento wi ∈ Ω y el rango es un subconjunto de los números reales,
donde X (wi) = xi .

Tenga presente que dicha variable aleatoria es discreta si el dominio presenta una cantidad finita
o infinita numerable de elementos; es decir, que se pueden enumerar sus elementos.

Entonces:

X ∶ Ω → ImX ⊆ ℝ
wi ⟼ X (wi) = xi

Ejemplos:

• Se lanza una moneda dos veces y se define la variable aleatoria X: número de caras. Indicar
el rango asociada a dicha variable aleatoria.

El dominio de X es Ω = {CC, CS, SC, SS}, como la variable aleatoria, cuenta el número de caras,
entonces:
CC ⟶ 2 caras
CS ⟶ 1 cara
SC ⟶ 1 cara
SS ⟶ 0 caras

Entonces el rango es ImX = {0,1, 2}

• En una casa de apuestas, se establece la premiación en el lanzamiento de un dado. Si se


obtiene un número primo se ganará 200 soles, si es un número compuesto se ganará 50
soles; pero, si no es ni primo ni compuesto se perderá 20 soles. Determine el rango asociado
a la variable aleatoria ganancia.

Sea la variable aleatoria “Y”, entonces su dominio es Ω = {1, 2, 3, 4, 5, 6}. La variable


aleatoria, es la ganancia en soles, entonces:
El 1 no es primo ni compuesto ⟶ pierde 20 soles ~ − 20
El 2 es primo ⟶ gana 200 soles ~ + 200
El 3 es primo ⟶ gana 200 soles ~ + 200
El 4 es compuesto ⟶ gana 50 soles ~ + 50
El 5 es primo ⟶ gana 200 soles ~ + 200

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 84

El 6 es compuesto ⟶ gana 50 soles ~ + 50


Por lo tanto ImY = {−20, 50, 200}

2.3.2. Probabilidad asociada a una variable aleatoria

Para describir completamente una variable aleatoria, es necesario indicar las probabilidades que
tome cada uno de sus valores posible. Sea una variable aleatoria X, cuyos valores del rango son
x1 , x2 , x3 , … , xk ; entonces se define la función f(xi ) = P(X = xi ) que indica la probabilidad de
cada valor xi del rango de la variable aleatoria “X”. Esta función de de probabilidad también se
denomina distribución de probabilidad de la variable aleatoria discreta “X”.

Entonces:

f ∶ ImX → [0; 1]
xi ⟼ f(xi ) = P(X = xi ) = pi

Donde se cumple que:

i. f(xi ) ≥ 0 ∀ xi ∈ ℝ

ii. ∑xi∈ImX f(xi ) = 1

Ejemplos:

• Se lanza una moneda dos veces y se define la variable aleatoria X: número de caras.
Construir una tabla de distribución de probabilidades.

El dominio de X es Ω = {CC, CS, SC, SS} y el rango es ImX = {0,1, 2}, entonces para la variable
aleatoria X, tenemos:

Ω SS SC CS CC

ImX o xi 0 1 2

En la tabla anterior agregamos la función de probabilidad y obtenemos:

Ω SS SC CS CC

ImX o xi 0 1 2

f(xi ) o pi 1 2 1
4 4 4

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 85

Finalmente, la tabla de distribución de probabilidad para una variable aleatoria discreta es:

ImX o xi 0 1 2

f(xi ) o pi 1 2 1
4 4 4

De la tabla se observa que

1 2 1
• P(X = 0) = , P(X = 1) = , P(X = 2) =
4 4 4

1 2 1
• ∑ f(xi ) = + + = 1
4 4 4

• En una casa de apuestas, se establece la premiación en el lanzamiento de un dado. Si se


obtiene un número primo se ganará 200 soles, si es un número compuesto se ganará 50
soles; pero, si no es ni primo ni compuesto se perderá 20 soles. Elabore la tabla de
distribución de probabilidades.

Consideremos la variable aleatoria discreta Y: ganancia. Entonces el dominio de Y es Ω =


{1, 2, 3, 4, 5, 6}. Como la variable aleatoria, es la ganancia en soles, entonces:
Entonces el rango es ImY = {−20, 50, 200}

Ω 1 4 6 2 3 5

𝑦𝑖 – 20 50 200

𝑝𝑖 1 2 3
6 6 6

De la tabla se observa que:

1 2 3
• P(Y = −20) = 6, P(Y = 50) = 6, P(Y = 200) = 6

1 2 3
• ∑ f(yi ) = + + = 1
6 6 6

2.3.3. Esperanza matemática y varianza asociadas a variables aleatorias discretas

De la misma forma en que se definían las medidas características de las distribuciones de


frecuencias, se pueden definir también medidas características de las distribuciones de una
variable aleatoria, así tenemos las medidas de centralización y las medidas de dispersión.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 86

Sea una variable aleatoria X, cuyos valores del rango son x1 , x2 , x3 , … , xk ; en la que se define la
función f(xi ) = pi . La media o también conocida como esperanza matemática de la variable
aleatoria discreta X, se denota por μ = E(X).

Si tenemos:

xi x1 x2 x3 … xk
pi p1 p2 p3 … pk

Entonces

μ = E(X) = ∑ xi pi
i=1

Ejemplos:

• Se lanza una moneda dos veces y se define la variable aleatoria X: Número de caras.
Determine el valor esperado de X.

Sabemos que nuestra tabla de distribución de probabilidad es:

Ω SS SC CS CC

xi 0 1 2

pi 1 2 1
4 4 4

1 2 1
Entonces la esperanza matemática es 𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑖 𝑝𝑖 = 0. 4 + 1. 4 + 2. 4 = 1
Por lo tanto, afirmamos que al lanzar una moneda dos veces, se obtiene en promedio 1 cara.

• En una casa de apuestas, se establece la premiación en el lanzamiento de un dado. Si se


obtiene un número primo se ganará 200 soles, si es un número compuesto se ganará 50
soles; pero, si no es ni primo ni compuesto se perderá 20 soles. Elabore la tabla de
distribución de probabilidades.

Sabemos que nuestra tabla de distribución de probabilidad es

Ω 1 4 6 5 4 6

yi – 20 50 200

pi

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 87

1 2 3
6 6 6

Entonces la esperanza matemática es:

1 2 3
𝜇 = 𝐸(𝑌) = ∑ 𝑦𝑖 𝑝𝑖 = −20. + 50. + 200. = 113,33
6 6 6

Por lo tanto, afirmamos que en dicho juego se gana en promedio 113,33 soles.

Actividades Propuestas

1) Consideremos el experimento aleatorio de lanzar un dado y anotar el puntaje obtenido en


la cara superior. Se define la variable aleatoria X como la cantidad de números naturales
que dividen exactamente al puntaje obtenido. ¿Cuál es el rango de X?

2) Se lanza una moneda 4 veces y se define la variable aleatoria X: número de caras. Indicar el
rango asociada a dicha variable aleatoria.

3) Una variable aleatoria discreta tiene la siguiente tabla de distribución de probabilidad.

X 1 2 3 4
2k − 3 3k 3k k −1
P(X)
14 14 14 14

a) Calcular el valor de k.
b) P(1 < X ≤ 3) − P(X = 1)

4) Dada la función de distribución de probabilidad de una variable aleatoria X.

X f(X)
–2 1/8
–1 1/4
0 1/8
1 1/4
2 K

a) Calcular el valor de k.
b) P(X ≤ 0) − P(X > 0)
c) P(X ≥ 0/−1 ≤ X ≤ 1)

5) Sea X una variable aleatoria cuya distribución de probabilidad está dada por

X 2 3 5 6
P(X) 1/9 3/9 2/9 3/9

Calcular: E(3X+2).

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 88

6) Sea X una variable aleatoria cuya distribución de probabilidad está dada por

X 4 6 7 9
P(X) 1/11 3/11 5/11 2/11

Calcular E(11X+2).

7) Una empresa ha medido el número de errores que cometen las secretarias recién
contratadas a lo largo de los últimos tres años y encontró que estas cometen hasta 5 errores
en una página de 20 líneas y que esta variable presenta la siguiente función de probabilidad:

X 0 1 2 3 4 5
P(X) 0,5 7a a+0,03 a+0,02 a+0,01 a

Halle lo siguiente:

a) El valor esperado de X.
b) La varianza de X.

8) La distribución de probabilidades de una variable aleatoria X se muestra en la siguiente


tabla:

xi 3 5 6 10
pi 2p 2q 3q 3p

Si p – q = 0,08, calcule:

a) La esperanza matemática de X.
b) La varianza de X.

9) Un juego consiste en lanzar un dado y si se obtiene un valor primo se gana S/.20 y si no


resulta primo se pierde S/.10. Si este juego se repite una cantidad suficiente de veces.
¿Cuántos soles se espera ganar o perder en el juego?

10) Un juego consiste en lanzar dos dados de diferente color, si se obtiene menos de 4 puntos
se pierde S/.20; si se obtiene más de 9 puntos se gana S/.100; en cualquier otro caso no se
gana ni se pierde. ¿Cuánto se espera ganar en este juego?

11) En una partida de 10 piezas hay 3 no estándares. Se escogen al azar 2 piezas. Hallar la
esperanza matemática de la magnitud aleatoria discreta “X”, es decir, el número de piezas
no estándares entre las dos escogidas.

12) Sea X un variable aleatoria que indica el número de tornillos defectuosos que se obtiene al
extraer una muestra aleatoria de 2 tornillos de una caja que contiene 2 tornillos
defectuosos y 4 tornillos no defectuosos. Halle el valor esperado de X.

13) La compañía PESCA-SUR compra diariamente pescado en un puerto a S/.3 el kilogramo y


luego vende cada kilogramo a S/.4,5. El pescado no vendido durante el día se remata al final

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 89

del día a S/.1 el kilogramo. Los técnicos de la empresa han elaborado la distribución de
probabilidades de la demanda diaria en kilogramos (Kg) la cual se muestra en la siguiente
tabla:

Demanda diaria: x (Kg) 500 1000 2000


Probabilidad: P(x) K/2 K K

Si el día de hoy la empresa ha comprado 1800 kg de pescado, ¿Cuánto espera ganar (en soles)?

14) En un comedor, se vende el menú a 8 soles, en el cual el costo por menú es 4 soles. Los
menús que quedan sin vender al final del día se rematan a 3 soles. El comerciante ha
establecido que la distribución de probabilidades de la demanda diaria del menú es:

Demanda 60 100 150 200 220 250


1 1 2 3 2 1
Probabilidad
10 10 10 10 10 10

Si comercializa 200 menús diarios, ¿Cuál es la utilidad esperada en soles?

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 90

Resumen
1. Una variable aleatoria “X” es una función cuyo dominio está definido en el espacio muestral
Ω, donde cada elemento wi ∈ Ω y el rango es un subconjunto de los números reales, donde
X (wi) = xi .

X ∶ Ω → ImX ⊆ ℝ
wi ⟼ X (wi) = xi

2. Se define la función f(xi ) = P(X = xi ) que indica la probabilidad de cada valor xi del rango
de la variable aleatoria “X”. Esta función de de probabilidad también se denomina
distribución de probabilidad de la variable aleatoria discreta “X”.

f ∶ ImX → [0; 1]
xi ⟼ f(xi ) = P(X = xi ) = pi

i. ∑xi∈ImX f(xi ) = 1

3. Sea una variable aleatoria X, cuyos valores del rango son x1 , x2 , x3 , … , xk ; en la que se define
la función f(xi ) = pi . La media o también conocida como esperanza matemática de la
variable aleatoria discreta X, se denota por μ = E(X).

Si tenemos:

𝑥𝑖 𝑥1 𝑥2 𝑥3 … 𝑥𝑘
𝑝𝑖 𝑝1 𝑝2 𝑝3 … 𝑝𝑘

Entonces

𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑖 𝑝𝑖
𝑖=1

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://www.youtube.com/watch?v=m_V0NsuVErk
o https://www.monografias.com/trabajos107/variable-aleatoria-discreta/variable-aleatoria-
discreta.shtml
o https://tada2019a.blogspot.com/2019/05/esperanza-matematica-14.html

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 91

UNIDAD

3
1
INFERENCIA ESTADÍSTICA
LOGRO DE LA UNIDAD DE APRENDIZAJE
Al término de la unidad, el estudiante, trabajando de manera individual, toma decisiones sobre
problemas reales, a partir de la interpretación de intervalos de confianza; utilizando como
herramienta básica de apoyo, el programa estadístico IBM SPSS de forma coherente.

TEMARIO
3.1 Tema 9 : Muestreo y tamaño de muestra
3.1.1 : Definición e importancia
3.1.2 : Tipos de muestreo
3.1.3 : Aplicaciones prácticas de muestreo aleatorio simple

3.2 Tema 10 : Intervalo de confianza


3.2.1 : Definición
3.2.2 : Aplicaciones prácticas

3.3 Tema 11 : Tópicos complementarios


3.3.1 : Proyección de ventas

3.4 Tema 12 : Herramientas básicas del programa IBM SPSS


3.4.1 : Ingreso y análisis de datos en IBM SPSS

ACTIVIDADES PROPUESTAS

• Los estudiantes pueden seleccionar el tamaño de una muestra y resolver


situaciones reales, usando las técnicas de muestreo.
• Los estudiantes realizan diferentes tipos de estimaciones de una o dos muestras.
• Los estudiantes realizan cálculos para la proyección de ventas, usando promedios
móviles.
• Los estudiantes manejan las herramientas básicas del IBM SPSS.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 92

1.1. MUESTREO Y TAMAÑO DE MUESTRA


La teoría del muestreo es un estudio de las relaciones existentes entre una población y muestras
extraídas de la misma. Tiene gran interés en muchos aspectos de la estadística. Por ejemplo,
permite estimar cantidades desconocidas de la población, llamadas parámetros poblacionales o
simplemente parámetros, a partir del conocimiento de las correspondientes cantidades
muestrales, llamados estadísticos muestrales o simplemente estadísticos.

En términos generales, se puede recopilar información sobre la población de dos maneras: o se


enumera cada unidad de la población (censo) o la enumeración se limita a solo una parte
seleccionada de la población (encuesta por muestreo).

3.1.1. Definición e importancia

1) El muestreo es el proceso de selección de una parte representativa de la población que


permita estimar los parámetros de la misma. Una técnica para obtener muestras
representativas de la población es el muestreo aleatorio, en el que cada elemento de la
población tiene la misma probabilidad de ser incluido en la muestra.

2) Importancia: La encuesta por muestreo tiene vital importancia porque permite resumir
información y orientar la administración; debido al manejo de datos inaccesibles, lejanos y
de gran cantidad; lo que finalmente permite tomar decisiones.

Por lo general

• Una encuesta por muestreo costará menos que un censo total.


• Requerirá menos tiempo recopilar y procesar los datos de una muestra que los de un
censo.
• Lo importante es si la exactitud de los resultados será adecuada para la finalidad
esperada.
• Comúnmente un censo completo requiere una organización grande y compleja y por lo
tanto surgen muchos errores que no pueden ser adecuadamente controlados.

En una encuesta por muestreo diseñada correctamente también es posible hacer una
estimación válida del margen de error y por lo tanto decidir si los resultados son lo
suficientemente exactos.

3.1.2. Tipos de muestreo

Las muestras aleatorias son de 4 tipo: Al azar simple, al azar sistemático, estratificado y por
grupos o conglomerados.

1) Muestra al azar simple: Es aquella cuyos elementos se seleccionan de la población uno por
uno con una oportunidad igual e independiente. Para escoger la muestra, por lo general, se
utiliza un paquete de cómputo.

Seleccionar una muestra al azar simple es un experimento similar a la que se realiza en la


extracción aleatoria de números en una lotería.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 93

2) Muestra al azar sistemática: Es aquella en que sus elementos se eligen de la población a


intervalos uniformes a partir de un listado ordenado. Donde el k – décimo elemento de la
muestra es:
𝑁
𝑘=
𝑛

Donde: n es el tamaño de la muestra y N es el tamaño de la población.

Por ejemplo, si queremos elegir una muestra de 100 estudiantes del nivel secundario de un
total de 500 estudiantes, entonces k = 500/100 = 5. El primer estudiante se elegirá en forma
aleatoria simple de los 5 primeros y los demás cada 5 estudiantes de la lista.

3) Muestreo aleatorio estratificado: Se clasifican a los elementos de la población en


subgrupos excluyentes de acuerdo con una o más características importantes, luego se
obtiene por separado una muestra aleatoria simple o sistemática en cada característica.

El tamaño de cada submuestra debe ser proporcional al tamaño de la característica para


asegurar representatividad.

Por ejemplo, si tenemos 500 estudiantes y observamos que son 300 varones y 200 mujeres,
entonces al elegir una muestra de 100 estudiantes, se deben elegir 60 varones y 40 mujeres.

4) Muestreo por conglomerados: El muestreo por conglomerados consiste en dividir primero


a los elementos de la población en grupos o conglomerados, luego se selecciona
aleatoriamente una o más conglomerados, pudiendo ser que estén todos del conglomerado
o por una muestra al azar de estos.

Por ejemplo, si los estudiantes de nivel secundario de una institución educativa están
clasificados por las secciones A, B y C de manera aleatoria, en los 5 nivel de estudio.
Podemos tomar como muestra a todas las secciones “B” o una parte de ella (submuestra).

3.1.3. Aplicaciones prácticas de muestreo aleatorio simple

Antes de plantear alguna aplicación, veamos cómo determinar el tamaño de una muestra.

Tamaño de una muestra: Calcularemos el tamaño de una muestra usando las siguientes
fórmulas

Variable Cualitativa Cuantitativa

Población Z(1−∝) 2 Z(1−∝) × S 2


2 2
infinita: No se n=( ) × PQ n=( )
conoce la E E
población N

Población finita: Z2 ∝ × NPQ Z2 ∝ × NS 2


(1− ) (1− )
Se conoce la n= 2
n= 2

población N (N − 1)E 2 + Z2 ∝ × PQ (N − 1)E 2 + Z2 ∝ S2


(1− ) (1− )
2 2

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 94

Donde:

n: Tamaño de la muestra.
N: Tamaño de la población.
P: Proporción de elementos que poseen la característica de interés (puede obtenerse de un
piloto, antecedente o se fija asumiendo máxima variabilidad p = 0,50).
E: % de estimador o en absoluto (unidades). Fijada por el investigador. Generalmente valores
del 1% al 10%.
1 – α: nivel de confianza (α: nivel de significación).
𝑍1−∝ : es el valor de la distribución normal estandarizada para un nivel de confianza fijado por
2
el investigador. De define según el nivel de confianza.
𝑆: desviación estándar de la variable fundamental del estudio o de interés para el
investigador. Obtenida por estudios anteriores.

A. Valor de Z: Es el valor de la abscisa de la distribución normal estandarizada teniendo en


cuenta el nivel de confianza fijado por el investigador; por lo tanto, este valor se encuentra
en las tablas estadísticas respectivas.

Presentamos a continuación los diferentes valores de Z.

Nivel de Valor de Z
confianza (1 – α)
90% 1,645
91% 1,695
92% 1,751
93% 1,812
94% 1,881
95% 1,960
96% 2,054
97% 2,170
98% 2,326
99% 2,576

B. Cálculo del valor de P: Se calcula este valor cuando la variable de estudio es cualitativa.

Comportamiento de P y Q

P Q=1–P P.Q
0,05 0,95 0,0475
0,10 0,90 0,090
0,20 0,80 0,160
0,30 0,70 0,210
0,40 0,60 0,240
0,50 0,50 0,250
0,60 0,40 0,240
0,70 0,30 0,210
0,80 0,20 0,160
0,90 0,10 0,090
0,95 0,05 0,0475

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 95

En caso de no conocer P, se asume P = 0,5.

Aplicación 1:

• Para estimar la media de una población de notas, de manera que el error de la estimación
no sea mayor a 1,5; con un nivel de confianza del 95% y se sabe que S = 4,25. Determine el
valor de la muestra; si
a) Considere una población de datos infinita.
b) Considere una población de datos 500 estudiantes.

Caso a): E = 1,5; S = 4,25; 1−∝ = 95% ⟹ 𝑍 = 1,96

Z(1−∝) × S 2
2
1,96 × 4,25 2
n=( ) =( ) = 30,83951
E 1,5

Entonces tomaremos como mínimo n = 31 estudiantes.

Caso b): E = 1,5; S = 4,25; N = 500; 1−∝ = 95% ⟹ 𝑍 = 1,96

Z2 ∝ × NS 2
(1− )
2
1,962 × 500 × 4,252
𝑛= = = 29,10
(N − 1)E 2 + Z2 ∝ S2 (500 − 1) × 1,52 + 1,962 × 4,252
(1− )
2
Entonces tomaremos como mínimo n = 30.

Aplicación 2:

• En un concurso de matemática, en Sudamérica, se desea conocer en qué proporción


participan las mujeres en dicho concurso. Si se considera E = 0,2; con un nivel de confianza
del 95%, determine el valor de la muestra en:
a) Una población de datos infinita.
b) Una población de datos 500 estudiantes.

Caso a): E = 0,2; 1−∝ = 95% ⟹ 𝑍 = 1,96; como no indican el valor de la proporción,
consideramos P = 0,5 y Q = 0.5

Z(1−∝) 2
2
1,96 2
n=( ) × PQ = ( ) × 0.5 × 0,5 = 24,01
E 0,2

Entonces tomaremos como mínimo n = 24 estudiantes.

Caso b): E = 0,2; N = 500; 1−∝ = 95% ⟹ 𝑍 = 1,96; como no indican el valor de la
proporción, consideramos P = 0,5 y Q = 0.5

Z2 ∝ × NPQ
(1− )
2
1,962 × 500 × 0,5 × 0,5
n= = = 22,95
(N − 1)E 2 + Z2 ∝ × PQ (500 − 1) × 0,22 + 1,962 × 0,5 × 0,5
(1− )
2

Entonces tomaremos como mínimo n = 23 estudiantes.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 96

Actividades Propuestas
1) Se desea estimar la media de una población de salarios en dólares, de manera que el error
de la estimación no sea mayor a $18 con un nivel de confianza del 95% si se sabe que S =
$100.
a) Determine el tamaño de la muestra, si consideramos una población infinita.
b) Determine el tamaño de la muestra, si consideramos una población de 500.

2) Estime el valor del error que se comete al seleccionar una muestra de 50 personas; S = 2,4
y un nivel de confianza del 93%.

3) En un lote de frascos para medicina, con una población de 8000 unidades, se desea estimar
la medida de la capacidad en centímetros cúbicos de los mismos. A través de un sondeo
piloto se ha estimado que la desviación estándar es de 2 cm 3. Si queremos tener una
precisión 0.25 cm3, y un nivel de confianza del 95%, ¿De qué tamaño debe ser la muestra?

4) Determine el nivel de confianza con el que se calculó una muestra de 100 personas al medir
la proporción de personas que están en contra de un proyecto de ley. Además, se obtuvo
un error de 0,1027.

5) Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento
en una industria. Se conoce que el peso de un saco que se llena con este instrumento es
una variable aleatoria con distribución normal. Si se supone que la desviación estándar del
peso es de 0.5 kg. Determine el tamaño de muestra aleatoria necesaria con un nivel de
confianza del 95% y el error máximo permitido en menos de 0.1 kg.

6) El administrador del hotel “Costa del Sol” en la ciudad de Cajamarca desea determinar la
proporción de turistas inconformes con las atenciones recibidas en los Baños del Inca ¿De
qué tamaño debe ser la muestra si se considera E = 0,05; nivel de confianza del 95%?

7) En la tabla adjunta se indica las horas de trabajo por día de un grupo de empleados. ¿Cuál
debe ser el tamaño de la muestra que se debe considerar para determinar el tiempo medio
de trabajo de los empleados de una empresa Textil?, de estudios anteriores se tiene que el
error de estimación es de 0,05 horas por día. Use un nivel de confianza del 95%.

12 11 4 8 1 7 7 7 11 7
18 9 11 8 11 7 8 14 7 3
11 9 10 2 7 3 10 2 9 8
7 6 1 6 9 8 9 13 6 7
8 4 6 6 6 7 9 4 7 7

8) De una población de 1176 adolescentes de una ciudad X, se desea conocer la aceptación


por los programas humorísticos televisivos y para ello se desea tomar una muestra por lo
que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una
información adecuada con error estándar menor de 0.015 al 90 % de confianza.

9) Una institución educativa cuenta con 1 546 estudiantes y se desea conocer la estatura
promedio de los estudiantes (en cm), ¿Cuál debe ser el tamaño adecuado de la muestra?,
sabiendo que se obtuvo una desviación estándar de 2,93 cm; un error de 1,05 y un nivel de
confianza del 94%.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 97

Resumen
1. Se puede recopilar información sobre la población de dos maneras: O se enumera cada
unidad de la población (censo) o la enumeración se limita a solo una parte seleccionada de
la población (encuesta por muestreo).

2. Por lo general:

• Una encuesta por muestreo costará menos que un censo total.


• Requerirá menos tiempo recopilar y procesar los datos de una muestra que los de un
censo.
• Lo importante es si la exactitud de los resultados será adecuada para la finalidad
esperada.
• Comúnmente un censo completo requiere una organización grande y compleja y por lo
tanto surgen muchos errores que no pueden ser adecuadamente controlados.

3. Las muestras aleatorias son de 4 tipos:

• Al azar simple.
• Al azar sistemático.
• Estratificado.
• Por grupos o conglomerados.

4. Tamaño de una muestra

Variable Cualitativa Cuantitativa


Población Z(1−∝) 2 Z(1−∝) × S 2
2 2
infinita: No se n=( ) × PQ n=( )
conoce la E E
población N
Población finita: Z2 ∝ × NPQ Z2 ∝ × NS 2
(1− ) (1− )
Se conoce la n= 2
n= 2

población N (N − 1)E 2 + Z2 ∝ × PQ (N − 1)E 2 + Z2 ∝ S2


(1− ) (1− )
2 2

5. Cálculo del valor de Z:

Nivel de Valor de Z
confianza (1 – α)
90% 1,645
91% 1,695
92% 1,751
93% 1,812
94% 1,881
95% 1,960
96% 2,054
97% 2,170
98% 2,326
99% 2,576

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 98

6. Cálculo del valor de P:

Comportamiento de P y Q
P Q=1–P P.Q
0,05 0,95 0,0475
0,10 0,90 0,090
0,20 0,80 0,160
0,30 0,70 0,210
0,40 0,60 0,240
0,50 0,50 0,250
0,60 0,40 0,240
0,70 0,30 0,210
0,80 0,20 0,160
0,90 0,10 0,090
0,95 0,05 0,0475

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://www.youtube.com/watch?v=oc8i9g144Y0
o https://www.questionpro.com/es/tama%C3%B1o-de-la-muestra.html
o https://enciclopediaeconomica.com/muestreo-probabilistico/

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 99

3.2. INTERVALO DE CONFIANZA


La estadística inferencial, tiene como pilares fundamentales a la estadística descriptiva y el
cálculo de probabilidades; quienes permitirán obtener conclusiones de la población, a partir del
estudio de una o más muestras representativas.

El estudio de la estadística inferencial nos permite realizar la estimación de parámetros y


contrastar hipótesis. Dentro de la estimación de parámetros, tenemos la estimación puntual y
por intervalos, veamos:

Estimación de parámetros: Es el proceso mediante el cual se aproxima el valor de un parámetro


de la población, a partir de la información de la muestra.
Sabemos que, cuando nos referimos a una población, la media, la varianza y la proporción, son
denominados parámetros (μ, σ2, P); en tanto que, para una muestra, son denominados
estadísticos (𝑋̅, S2, p).

Tenemos dos tipos de estimación: Estimación puntual y estimación por intervalo.

• Estimación puntual: Se obtiene un valor único calculado a partir de una muestra.

• Estimación por intervalos: Se obtiene al estimar dos valores calculados a partir de una
muestra. (a ≤ μ ≤ b; c ≤ σ2 ≤ d; e ≤ P ≤ f)

3.2.1. Definición

1) Intervalo de confianza para la media poblacional: Estimación de la media poblacional μ,


cuando σ es desconocida:

s s
x̅ − t 0 × ≤ μ ≤ x̅ + t 0 ×
√n √n

Donde:
t 0 se obtiene de la tabla “t Student” (figura 32), con n – 1 grados de libertad
t 0 = t (1−∝;n−1) .
2

2) Intervalo de confianza para la proporción poblacional: se tendría:

p̂ × (1 − p̂) p̂(1 − p̂)


p̂ − Z∝ × √ < p < p̂ + Z∝ × √
n n

Donde:
𝑍∝ : Valor asignado por nivel de confianza.
𝑝: Proporción.
𝑝̂ : Proporción muestral.
𝑛: Tamaño de la muestra.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 100

Figura 49: Tabla de distribución t de Student


Fuente - Tomado de https://www.slideshare.net/GOPPASUDD/tabla-t

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 101

3.2.2. Aplicaciones prácticas

Antes de plantear alguna aplicación, veamos cómo determinar el tamaño de una muestra.

Aplicación 1:

Se desea estimar el intervalo para la media de una población, sabiendo que para una muestra
de 30 estudiantes, 𝑥̅ = 11,025; S = 4,25; con un nivel de confianza del 95%.

Como:


1−∝ = 95% = 0,95 ⟹ ∝ = 0,05 ⟹ 1 − 2 = 0,975
𝑛 − 1 = 30 − 1 = 29

Entonces 𝑡0 = 𝑡(1−∝ ; 𝑛−1) = 𝑡(0,975 ; 29) ; buscando t0 en la tabla “t de Student” como se observa
2
en la figura adjunta:

Obtenemos t0 = 2,045.
Además, se tiene de datos: n = 30; 𝑥̅ = 11,025; S = 4,25. Reemplazando en:

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 102

𝑠 𝑠
𝑥̅ − 𝑡0 × ≤ 𝜇 ≤ 𝑥̅ + 𝑡0 ×
√𝑛 √𝑛

4,25 4,25
11,025 − 2,045 × ≤ 𝜇 ≤ 11,025 + 2,045 ×
√30 √30

9,4382 ≤ 𝜇 ≤ 12,6118

Por lo tanto, 𝜇 ∈ [9,4382; 12,6118] con un nivel de confianza del 95%.

Aplicación 2:

Se desea estimar el intervalo para la proporción de mujeres que participan en un concurso


internacional de matemáticas en Sudamérica, sabiendo que para una muestra de 30 estudiantes
hay 9 mujeres, con un nivel de confianza del 95%.

Se tiene
1−∝ = 95% ⟹ Z = 1,96
N° de mujeres 9
p̂ = = = 0,3
total de la muestra 30

Reemplazando en:

p̂ × (1 − p̂) p̂(1 − p̂)


p̂ − Z∝ × √ < p < p̂ + Z∝ × √
n n

0,3 × (1 − 0,3) 0,3(1 − 0,3)


0,3 − 1,96 × √ < p < 0,3 + 1,96 × √
30 30

0,136 < p < 0,464

Por lo tanto, la proporción de mujeres que participan en dicho concurso internacional de


matemáticas en Sudamérica está entre 0,136 y 0,464; con un nivel de confianza del 95%.

Actividades Propuestas

1) Al calcular el intervalo de confianza para la media, se encontró t0 = 1,729 de la tabla “t de


Student”. Determine:
a) El tamaño de la muestra.
b) El nivel de confianza.

2) De un grupo de estudiantes se desea estimar el intervalo de confianza de la media de las


estaturas. Se seleccionó a una muestra de 25 estudiantes, de quienes se sabe que la media
muestral es 1,70 m y una desviación estándar de 0,74 m. Considere:
a) Nivel de confianza 95%.
b) Nivel de confianza 99%.

3) A'Comer es una empresa de bienes de consumo en el Perú, la cual opera en toda América,
la gerencia de esta empresa desea información acerca del ingreso medio de los
colaboradores. Una muestra aleatoria de 25 de ellos revela una media muestral de 3042
soles. La desviación estándar de esta muestra es de 105 soles, ¿Cuál es un conjunto de

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 103

valores razonable de la media poblacional?

4) El área de atención al cliente de una reconocida marca de muebles está interesada en


determinar su nivel de satisfacción de sus clientes respecto a un modelo específico de
mueble, para ello ha tomado la información de 30 clientes a quienes se les pregunto si está
o no satisfecho por la compra (Satisfecho = 1; No satisfecho = 0). Obteniéndose la siguiente
información.

1 0 1 1 1 0
0 1 1 0 1 0
1 1 1 0 0 1
1 1 1 0 1 0
0 1 1 1 0 1

Determine e intérprete de manera confidencial la proporción de clientes que se encuentran


satisfechos, utilizar un 95% de confiabilidad.

5) El gerente del Hipermercado Metro, desea estimar la cantidad media que gastan los clientes
que visitan el hipermercado. Una muestra de 20 clientes revela las siguientes
cantidades.

481,6 422,2 468,3 541,3 238,4 418,5 548,6 379,8 523,6 498,3
508,2 469,4 618,3 616,9 491,5 615,4 515,5 585,4 438,8 687,1

Determine e interprete un intervalo de confianza que explique el comportamiento del gasto


promedio de los clientes que visitan el hipermercado, utilizar un 98% de confiabilidad.

6) Las medidas de los diámetros de una muestra de 200 cojinetes de bolas, hechos por una
determinada máquina durante una semana dieron una media de 0,824 pulgadas y una
desviación típica de 0,042 pulgadas. Hallar los límites de confianza para un nivel de
confianza del 95% y otro para el 99%.

7) Una muestra de 150 votantes elegidos al azar entre todos los de un distrito dado, indicó
que el 60% de ellos estaban a favor de un determinado candidato. Hallar el intervalo de
confianza para la proporción de todos los votantes que estaban a favor de dicho candidato.
Considere:
a) Nivel de confianza 95%.
b) Nivel de confianza 99%.

8) Para estimar el tiempo promedio que los niños de primer grado se demoran en armar un
rompecabezas, un investigador social desarrolló la tarea con 9 de tales niños escogidos al
azar de la población indicada. Los tiempos (en minutos) observados son:

28 25 32 30 35 33 29 28 36

a) Obtenga el intervalo de estimación del promedio de la población de todos los tiempos


que demoran en armar el rompecabezas con nivel de confianza del 95%. Asuma que la
población tiene distribución normal.
b) ¿Con qué nivel de confianza se estimó el tiempo promedio si los límites de confianza
inferior y superior son respectivamente 28,431 y 32,903?

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 104

Resumen
1. Con respecto a la estadística inferencial, se tiene:

Estadística descriptiva Probabilidades


Estadística inferencial
Estimación de parámetros Contraste de hipótesis
Estimación puntual Estimación por
intervalos

2. Intervalo de confianza para la media poblacional:

s s
x̅ − t 0 × ≤ μ ≤ x̅ + t 0 ×
√n √n

3. Intervalo de confianza para la proporción poblacional:

p̂ × (1 − p̂) p̂(1 − p̂)


p̂ − Z∝ × √ < p < p̂ + Z∝ × √
n n

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://es.wikipedia.org/wiki/Intervalo_de_confianza
o https://www.youtube.com/watch?v=VQJpcYPfEI4
o https://tumundoeconomia.com/empresas/que-es-el-intervalo-de-confianza/

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 105

3.3. TÓPICOS COMPLEMENTARIOS


Sabemos desde inicio del curso la gran amplitud y alcance de la estadística como ciencia aplicada
y la importancia sobre otras ciencias como en la administración, economía, entre otras; en la
que el tiempo juega un papel importante.

Cuando uno de los caracteres cuantitativos preponderantes es el tiempo, podemos hablar de


una serie de tiempo; y esta es una realización de un proceso, en forma secuencial y en intervalos
regulares en el tiempo, que tiene un inicio (t0) y un fin (tn). La serie estadística se denomina serie
cronológica.

Definición

Se llama serie cronológica o temporal a aquella sucesión de observaciones en la que alguno de


sus caracteres se mide en unidades de tiempo, la cual sabemos es un variable cuantitativa;
mientras que algún otro carácter puede ser cualitativa o cuantitativa.

Ejemplos:

• Series Económicas:

a) Venta mensual de pollo en Lima Metropolitana. Enero 1990 – diciembre 2009.


b) Volumen de Exportaciones Manufactureras. Perú. Enero 1990 – diciembre 2009.

• Series Demográficas:

a) Población anual. Perú. 1990 – diciembre 2011.


b) Total de nacimientos mensuales. Lima Metropolitana. Enero 2000 – julio 2011.

• Series Físicas:

a) Precipitaciones pluviométricas diarias. Cusco. Diciembre 2010 – enero 2011.


b) Temperatura promedio mensual. Ancash. Julio 2010 – Julio 2012.

Veamos el comportamiento de las ventas mensuales de un producto.

Mese En. Feb. Mar. Abr. May Jun. Jul. Ag. Set. Oct. Nov. Dic
s . .
Miles
de 275 138 242 567 684 328 285 295 254 502 635 32
soles 0 2 5 3 2 5 0 0 0 5 2 5

Los datos de la tabla nos permitir ver tendencias, hacer proyecciones y pronosticar ventas
futuras.

3.3.1. Proyección de ventas: Pronósticos básicos

1. Pronóstico: Es una estimación cuantitativa o cualitativa de uno o varios factores (variables)


que conforman un evento futuro, con base en información actual o del pasado ( Dávalos,
s.f.).

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 106

Los métodos de elaboración de pronósticos se clasifican como cuantitativos o cualitativos.


Los métodos cuantitativos se utilizan cuando:

• Se dispone de información pasada sobre la variable que se pronosticará.


• La información puede cuantificarse.
• Es razonable suponer que el patrón del pasado seguirá ocurriendo en el futuro. En estos
casos puede elaborarse un pronóstico con un método de series de tiempo o un método
causal.

2. Estudio de tendencia: La curva que describe la tendencia de una serie cronológica muestra
la evolución general de la serie y puede tomar diversas formas (lineal, parabólica,
exponencial, entre otros).

Entre los métodos que nos permiten estimar la tendencia, tenemos:

a) Método de mano alzada.


b) Método de los semipromedios.
c) Método de los promedios móviles.
d) Método de los mínimos cuadrados.

3. Método de los promedios móviles: Conocido también como movimiento móvil o medias
móviles. Este método permite suavizar la información de las series cronológicas.

Definición: Dada la sucesión x1, x2, x3, …, xn; definimos el promedio móvil de orden k (k < n); con
las siguientes medias aritméticas:

𝑥1 + 𝑥2 + ⋯ + 𝑥𝑘 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑘+1 𝑥3 + 𝑥4 + ⋯ + 𝑥𝑘+2
; ; ;…
𝑘 𝑘 𝑘

Ejemplos:

A continuación, se muestra las notas de grupo de amigos: 18, 12, 08, 13, 08, 10, 13. Calcular el
promedio móvil de orden 4.

El promedio móvil de orden 4, estaría formado por la sucesión:

18+12+08+13 12+08+13+08 08++13+08+10 13+08+10+13


4
= 12,75; 4
= 10,25; 4
= 9,75; 4
= 11

Entonces los valores son: 12,75; 10,25; 9,75 y 11.

Se muestra a continuación, la demanda anual es un producto. Estimar la tendencia por un


promedio móvil de orden 3; es decir, veamos la proyección de demanda mensual analizando la
demanda de cada trimestre.

Periodo En. Feb. Mar. Abr. May. Jun. Jul. Ag. Set. Oct. Nov. Dic.

Demanda 200 230 260 180 270 240 250 300 320 350 240 210

El promedio móvil de orden 3, estaría formado por la sucesión:

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 107

200+230+260 230+260+180 260+180+270 180+270+240


3
= 230; 3
≈ 223; 3
≈ 237; 3
= 230;
270+240+250 240+250+300 250+300+320 300+320+350
≈ 253; ≈ 263; = 290; ≈ 323;
3 3 3 3
320+350+240 350+240+210
3
≈ 303; 3
≈ 267

Comparemos ahora los valores proyectados y los valores reales de demanda:

Periodo En. Feb. Mar. Abr. May. Jun. Jul. Ag. Set. Oct. Nov. Dic.

Demanda 200 230 260 180 270 240 250 300 320 350 240 210

Proyección 230 223 237 230 253 263 290 323 303

Se observa que para el mes de abril se estimó una demanda de 230 productos; pero, la demanda
real fue de 180 productos. Asimismo, para el mes de mayo se proyectó una demanda de 223 en
tanto que la demanda real fue de 270. De igual forma ocurre cada mes.

Actividades Propuestas
1) Se tiene los siguientes datos: 2; 1; 6; 5; 4; 3; 8. Calcular el promedio móvil de orden 3 y de
orden 4.

2) Dado el siguiente conjunto de valores 2; 0; – 2; 0; 2; 0; – 2; 0; 2. Determine el promedio


móvil de orden 2, 3, 4 y 5.

3) Los envíos para el mercado nacional de tractores agrícolas en el periodo del 2000 al 2007
por la empresa “Máquinas y Herramientas”, figuran en la siguiente tabla:

Años 2000 2001 2002 2003 2004 2005 2006 2007


Unidades 106 112 94 97 103 109 85 94

Analizar la proyección de unidades usando un promedio móvil de orden 3.

4) Los gastos de una dependencia pública (en miles de soles), son:

En. Feb. Mar. Abr. May. Jun. Jul.


75 79 74 81 77 82 80

Ajuste la tendencia, a base de promedios móviles de orden 2 y 3.

5) El auditor del sistema educativo público ha estudiado los registros del inventario para
averiguar si el inventario actual de libros de texto es típico. Las siguientes existencias
corresponden a los 5 años precedente.

Año 2016 2017 2018 2019 2020


Inventario 4620 4910 5490 5730 5990

Ajuste la tendencia, usando promedios móviles determine el valor proyectado para el 2021, si
debe usar el promedio móvil cuyo orden genere menor error en esos 5 años.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 108

Resumen
1. Una serie de tiempo es una realización de un proceso, en forma secuencial y en intervalos
regulares en el tiempo, que tiene un inicio (t0) y un fin (tn). La serie estadística se denomina
serie cronológica.

2. Un pronóstico, es una estimación cuantitativa o cualitativa de uno o varios factores


(variables) que conforman un evento futuro, con base en información actual o del pasado.

3. Entre los métodos que nos permiten estimar la tendencia, tenemos:

a) Método de mano alzada.


b) Método de los semipromedios.
c) Método de los promedios móviles.
d) Método de los mínimos cuadrados.

4. Método de los promedios móviles: Dada la sucesión x1, x2, x3, …, xn; definimos el promedio
móvil de orden k (k < n); con las siguientes medias aritméticas:

x1 + x2 + ⋯ + xk x2 + x3 + ⋯ + xk+1 x3 + x4 + ⋯ + xk+2
; ; ;…
k k k

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o https://www.matematica.uns.edu.ar/uma2016/material/Introduccion_a_los_Modelos_de_
Pronosticos.pdf
o https://economipedia.com/definiciones/proyeccion-de-ventas.html
o https://www.gestiondeoperaciones.net/proyeccion-de-demanda/pronostico-de-demanda-
con-media-movil-simple/

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 109

3.4. HERRAMIENTAS BÁSICAS DEL PROGRAMA IBM SPSS


En su sentido original SPSS, era el acrónimo de Statistical Package for the Social Sciences. El
programa estadístico SPSS, es muy usado, tanto en las ciencias sociales como en el estudio de
mercado.

Dentro de su proceso, algunas de las versiones del SPSS, son:

• SPSS 1: en 1968 (primera versión).


• SPSS 5.0: en 1993.
• SPSS 6.1: en 1995.
• SPSS 10.0.7: en 2000.
• SPSS 13.0.1: en 2005.
• PASW Statistics 18.0.2: en 2010.
• IBM SPSS Statistics 24.0: en 2016.
• IBM SPSS Statistics 27.0: en 2020 (última versión).

IBM SPSS ofrece una gama de posibilidades para llevar a cabo todo el proceso de análisis de
información. Brinda la información que necesita el investigador para tomar decisiones
acertadas, utilizando procedimientos estadísticos y presentando los resultados en tablas y
gráficos.

3.4.1. Ingreso y análisis de datos en IBM SPSS

En casos prácticos se observa generalmente que casi nunca se encuentran gráficos (polígonos o
histogramas) perfectamente simétricos, de ahí que el grado de asimetría constituye el sesgo.

1. Ventanas del SPSS

Entre ellas, tenemos:

A. Ventana de edición (data editor): Contiene el archivo de datos con el que se va trabajar.
B. Ventana de salida (output): Donde aparecen los resultados de los análisis estadísticos.
Se pueden archivar para su utilización posterior.
C. Ventana de carrusel de gráficos: Se abre con el primer gráfico generado en una sesión
de SPSS.
D. Ventana de gráficos: Permite modificar y archivar gráficos.
E. Ventana de sintaxis: Se puede pegar en esta ventana la sintaxis de los comandos
seleccionados desde la ventana de diálogo de cualquier opción.

Siempre que hagamos un análisis con SPSS, los resultados irán a la ventana de salida
(output).

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 110

Figura 50: Ventanas IBM SPSS


Fuente - Tomado de http://wpd.ugr.es/~bioestad/guia-spss/practica-1/

2. Menú principal

Desde el menú se accede a la mayoría de las funciones del SPSS. Tenemos:

• File: Permite crear y abrir archivos SPSS. Grabar y leer datos creados con otras
aplicaciones.
• Edit: Contiene las opciones de Windows para copiar y buscar datos, etc.
• Data: Contiene opciones para hacer cambios que afectan a todo el archivo de datos.
• Transform: Permite cambios sobre variables seleccionadas, permite la creación de
nuevas variables.
• Analyze: Esta opción permite ejecutar todos los procedimientos estadísticos.
• Graphs: Esta opción permite realizar todos los gráficos estadísticos.
• Utilities: Esta opción permite cambiar fuente, obtener información completa del archivo
de datos.
• Windows: Permite ordenar, seleccionar, controlar atributos de las ventanas abiertas.
• Help: Permite abrir un archivo estándar de ayuda Windows.

3. Procedimientos básicos para un análisis estadístico con el SPSS

Para realizar cualquier análisis estadístico con el SPSS tenemos que realizar estas tres
operaciones básicas:

• Seleccionar una base de datos.


• Seleccionar del menú principal el procedimiento estadístico deseado.
• Seleccionar las variables a incluir en el análisis y otros parámetros adicionales.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 111

Figura 51: Procedimiento del análisis estadístico en SPSS


Fuente – Elaboración propia.

Actividades Propuestas

1) Las medidas de los diámetros de una muestra de 200 cojinetes de bolas, hechos por una
determinada máquina durante una semana dieron una media de 0,824 pulgadas y una
desviación típica de 0,042 pulgadas. Hallar los límites de confianza para un nivel de
confianza del 95% y otro para el 99%, usando IBM SPSS.

2) El área de atención al cliente de una reconocida marca de muebles está interesada en


determinar su nivel de satisfacción de sus clientes respecto a un modelo específico de
mueble, para ello ha tomado la información de 30 clientes a quienes se les pregunto si está
o no satisfecho por la compra (Satisfecho = 1; No satisfecho = 0). Obteniéndose la siguiente
información.

1 0 1 1 1 0
0 1 1 0 1 0
1 1 1 0 0 1
1 1 1 0 1 0
0 1 1 1 0 1

Determine e interprete de manera confidencial la proporción de clientes que se encuentran


satisfechos, utilizar un 95% de confiabilidad. Usar IBM SPSS.

3) Los datos que se muestran a continuación corresponden a las edades de 50 beneficiarios


de un programa de asistencia social del gobierno:

81 53 67 60 80 64 56 54 91 61
66 88 67 65 97 72 74 65 73 69
43 54 76 70 86 68 82 75 79 60
41 87 76 97 70 45 60 45 65 56
92 72 82 80 52 65 50 58 70 76

Analizar los datos usando IBM SPSS.

4) Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el


número de empleados que hay en cada una de ellas para un estudio posterior. Las
observaciones obtenidas han sido:

12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14,
12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 18, 18, 10, 11, 12, 12, 11, 13, 13, 15,
13, 11, 12.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 112

Analizar los datos en IBM SPSS

5) La empresa de investigación de mercado “Eléctrico” lleva a cabo un estudio para obtener


indicadores que le permitan inferir respecto al consumo de energía eléctrica mensual
(medido en kilovatios, redondeado al entero más próximo) de las familias en los
departamentos de Arequipa y Tacna. Dicho estudio, sustentado en el análisis de muestras
aleatorias tomadas en ambos departamentos, arrojó los siguientes resultados:

227 231 261 270 291 351 359 369 371 382 387 392 393 395
Arequipa 396 413 420 422 424 436 453 461 463 471 495 498 510 512
533 534 541 542 584 589 591 628 630 630 657 666

217 219 263 287 294 340 346 347 348 377 390 392
Tacna 395 396 397 408 418 424 426 429 438 438 442 446
447 450 456 481 496 508 511 533 549 583 609 636

Analizar los datos en IBM SPSS.

6) En la tabla adjunta se indica las horas de trabajo por día de un grupo de empleados. ¿Cuál
debe ser el tamaño de la muestra que se debe considerar para determinar el tiempo medio
de trabajo de los empleados de una empresa Textil?, de estudios anteriores se tiene que el
error de estimación es de 0,05 horas por día. Use un nivel de confianza del 95%.

12 11 4 8 1 7 7 7 11 7
18 9 11 8 11 7 8 14 7 3
11 9 10 2 7 3 10 2 9 8
7 6 1 6 9 8 9 13 6 7
8 4 6 6 6 7 9 4 7 7

Analizar los datos en IBM SPSS.

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 113

Resumen
1. IBM SPSS ofrece una gama de posibilidades para llevar a cabo todo el proceso de análisis
de información. Brinda la información que necesita el investigador para tomar decisiones
acertadas, utilizando procedimientos estadísticos y presentando los resultados en tablas y
gráficos.

2. Ventanas del SPSS

a) Ventana de edición (data editor).


b) Ventana de salida (output).
c) Ventana de carrusel de gráficos.
d) Ventana de gráficos.
e) Ventana de sintaxis.

3. Menú principal

• File.
• Edit.
• Data.
• Transform.
• Analyze.
• Graphs.
• Utilities.
• Windows.
• Help.

4. Procedimientos básicos para un análisis estadístico con el SPSS

i. Seleccionar una base de datos.


ii. Seleccionar del menú principal el procedimiento estadístico deseado.
iii. Seleccionar las variables a incluir en el análisis y otros parámetros adicionales.

Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:

o http://wpd.ugr.es/~bioestad/guia-spss/practica-1/
o https://www.youtube.com/watch?v=M3M1Vg0EL_U
o https://www.youtube.com/watch?v=DD8RU8_WyXM

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS


ESTADÍSTICA 114

Bibliografía
• Anderson, David R. (2016) Estadística para negocios y economía. 12a ed. México, D. F.:
Cengage Learning.

• Dávalos, Luis (s.f.) Presupuestos. Recuperado de


https://labcalidad.files.wordpress.com/2016/11/20-pronc3b3sticos-y-presupuestos-
2016.pdf

• Douglas A. Lind, William G. Marchal, Samuel A. Wathen (2015) Estadística aplicada a los
negocios y la economía. México, D.F.: McGraw-Hill.

• Gorgas, J.; Cardierl, N.; Zamorano, J. (2011) Estadística básica para estudiantes de
ciencias. Universidad complutense de Madrid.

• Johnson, Robert (2012) Estadística elemental. 11a ed. México, D. F.: Cengage Learning.
Centro de Información: Código 519.5 JOHN 2012

• Levin, Richard I. (2010) Estadística para administración y economía. 7a ed. rev.


Naucalpan de Juárez, México: Pearson.
Centro de Información: Código 519.5 LEVI 2010

• Lind, Douglas A. (2015) Estadística aplicada a los negocios y la economía. 16a ed. México,
D. F.: McGraw-Hill.
Centro de Información: Código 519.5 LIND 2015

• Marqués, Felicidad (2010) Estadística descriptiva a través de Excel. México, D.F.:


Alfaomega.
Centro de Información: Código 005.54E MARQ

• Medina Merino, Fátima (2011) Análisis de series cronológicas, aplicadas a series


económicas. INEI.

• Mendenhall, William (2010) Introducción a la probabilidad y estadística. 13a ed.


Recuperado de
https://www.fcfm.buap.mx/jzacarias/cursos/estad2/libros/book5e2.pdf

• Mitacc Meza, Máximo (2011) Tópicos de estadística descriptiva y probabilidad. 2a ed.


Lima: Edit. San Marcos.
Centro de Información: Código 519.5 MITA 2011

• Moya Calderón, Rufino (2019) Estadística descriptiva, conceptos y aplicaciones. Lima:


San Marcos.

• QDOC.TIPS (2011) Guía ejercicios 2011. Recuperado de https://qdoc.tips/guia-


ejercicios-2011-4-pdf-free.html

• Quezada Lucio, Nel (2017) Estadística con SPSS 24. Lima: Editorial Macro.
Centro de Información: Código 519.50285 QUEZ 2017

ESCUELA DE GESTIÓN Y NEGOCIOS IES CIBERTEC


ESTADÍSTICA 115

• Rendón-Macías, Mario Enrique (2016) Estadística descriptiva. Recuperado de


https://www.redalyc.org/pdf/4867/486755026009.pdf

• Rodríguez.; Pierdant, A.; Rodríguez, E. (2014) Estadística para administración. México,


D.F.: Patria.

• Rodríguez Franco, Jesús (2016) Estadística para administración. 2a ed. México, D.F.:
Patria.
Centro de Información: Código 519.5 RODR 2016

• Salinas, Hugo S. (2010) Estadística y probabilidades. Recuperado de


http://www.mat.uda.cl/hsalinas/probabilidades.htm

• Véliz Capuñay, Carlos (2014) Estadística para la administración y los negocios. 2a ed.
Naucalpan de Juárez: Prentice Hall.
Centro de Información: Código 519.5 VELI/E 2014

• Walpole, Ronald E.; Raymond, H. Myers; Myers, Sharon L.; Ye, Keying (2012)
Probabilidad y estadística para ingeniería y ciencias. México, D.F.: Pearson.

IES CIBERTEC ESCUELA DE GESTIÓN Y NEGOCIOS

También podría gustarte