Manual-Estadistica - CICLO2
Manual-Estadistica - CICLO2
ESTADÍSTICA 2
Índice
Presentación 5
Red de contenidos 6
Bibliografía 114
Presentación
Hoy, como en todas las épocas de la humanidad, el manejo de datos, su análisis e interpretación
ha sido, es y será de fundamental importancia para los diferentes estados y sus políticas a aplicar
en materia económica, salud, educación, entre otros aspectos de vital importancia para la
sociedad. Así como a ellos, al sector empresarial y/o de emprendimiento, e incluso en el aspecto
personal, también es imperiosa la necesidad de obtener datos, analizarlos e interpretarlos, y en
base a ello, sacar conclusiones y tomar decisiones.
El desarrollo del curso brindará las herramientas necesarias y suficientes, para que el futuro
profesional las aplique a los diferentes ámbitos de su vida laboral, con el rigor necesario que ella
demande. Profundizaremos los fundamentos teóricos y prácticos de la estadística descriptiva;
análisis, organización e interpretación de datos, mediante elaboración de tablas de frecuencias
y gráficos. Conoceremos la definición clásica de probabilidad, así como asociadas a variables
aleatorias discretas, las que nos darán la base a la estadística inferencial. Finalmente
conoceremos y aplicaremos los fundamentos e importancia de elegir una muestra adecuada,
sobre la cual se tomarán decisiones y se obtendrán conclusiones confiables que podremos
aplicar a una proyección de ventas.
Así también, durante el desarrollo del curso, nos apoyaremos en las herramientas del Excel como
aspecto fundamental en el manejo de datos, el cual será complementado con las herramientas
básicas del programa IBM SPSS, para el análisis de los datos.
Red de contenidos
Estadística
UNIDAD
1
ESTADÍSTICA DESCRIPTIVA
LOGRO DE LA UNIDAD DE APRENDIZAJE
Al término de la unidad, el estudiante, trabajando de manera individual, realiza un análisis
descriptivo a través del calcula e interpreta medidas de tendencia central, dispersión y medidas
de forma de distribución, sobre la base de un conjunto de datos no agrupados o agrupados en
una tabla de distribución de frecuencias.
TEMARIO
1.1 Tema 1 : Conceptos básicos sobre estadística
1.1.1 : Población y muestra
1.1.2 : Variables estadísticas y su clasificación
1.1.3 : Técnicas e instrumentos de recolección de datos
1.1.4 : Elaboración de tablas de distribución de frecuencias
1.1.5 : Interpretación y elaboración de gráficos estadísticos: Histograma,
polígono de frecuencias y diagrama circular
ACTIVIDADES PROPUESTAS
• Estadística inferencial: Es el área de la estadística que usa métodos apropiados con los que
es posible hacer una generalización o inferencia acerca de una o más características de la
población, basándose en la información contenida en la muestra. Debe señalarse que la
teoría de la probabilidad es el soporte de la Inferencia Estadística (Gómez – Cárdenas –
Condado, 2006, p.19).
Ejemplos:
Ejemplos:
1) Si la población es “los estudiantes del sistema escolar peruano”, entonces la muestra podría
ser “el 20% de los estudiantes del sistema escolar peruano”.
3) Si la población es “las madres gestantes de la región Lima”, la muestra podría ser “las
madres gestantes del distrito de San Juan de Lurigancho”.
• Variable cualitativa nominal: Son aquellas que establecen la distinción de los elementos en
las categorías sin implicar orden entre ellas.
• Variable cualitativa ordinal: Son aquellas que agrupan a los objetos, individuos, en categorías
ordenadas, para establecer relaciones comparativas; es decir, son susceptibles de
ordenación, pero no de medición cuantitativas.
• Variable cuantitativa discreta: Son aquellas que surgen por el procedimiento de conteo.
• Variable cuantitativa continua: Son aquellas que surgen por el procedimiento de medir
alguna característica.
En resumen:
Tabla 1: Variables estadísticas y su clasificación
VARIABLES ESTADÍSTICAS
VARIABLE CUALITATIVA VARIABLE CUANTITATIVA
NOMINAL ORDINAL DISCRETA CONTINUA
✓ Nacionalidad. ✓ Grado d ✓ Número de ✓ Estatura.
✓ Religión. instrucción. empleados de ✓ Nivel de
✓ Estado civil. ✓ Orden de una empresa. inflación
mérito. ✓ Número de mensual.
hijos.
Nota. Elaboración Propia
Las técnicas de recolección de datos son procedimientos que permiten al investigador obtener
información necesaria que le permita confirmar o replantear su hipótesis. Los instrumentos de
recolección de datos, dependerá del tipo de técnica que se desee aplicar.
TÉCNICA - INSTRUMENTO
✓ Análisis documental – Ficha de registro de datos
✓ Encuesta – Cuestionario
✓ Entrevista – Guía de entrevista
✓ Focus Goup – Guía de moderación
✓ Observación experimental – Ficha de observación
✓ Observación no experimental – Guía de observación
Donde:
Xmín: dato mínimo.
Xmáx: dato máximo.
De la tabla anterior, Xmín = 0 y Xmáx = 20, entonces el alcance sería [0; 20]
Donde:
En nuestro caso, de la tabla se observa N = 100, entonces K = 1 + 3,3 × log 100 = 7,6; como
“k” representa número de intervalos, debe ser un número natural, entonces tomamos
convenientemente K = 8
𝐑
4) Amplitud: 𝐀 = 𝐊
Recuerde que aquella fórmula se aplica cuando la amplitud es constante en todos los intervalos.
20
En nuestro caso, R = 20 y K = 8, entonces A = 8
= 2,5
𝐋í𝐦𝐢𝐭𝐞 𝐋í𝐦𝐢𝐭𝐞
5) Intervalo de clase: 𝑰𝒊 = [ ; ⟩
𝐢𝐧𝐟𝐞𝐫𝐢𝐨𝐫 𝐬𝐮𝐩𝐞𝐫𝐢𝐨𝐫
Así sucesivamente.
𝐋í𝐦𝐢𝐭𝐞 𝐋í𝐦𝐢𝐭𝐞
+
𝐢𝐧𝐟𝐞𝐫𝐢𝐨𝐫 𝐬𝐮𝐩𝐞𝐫𝐢𝐨𝐫
6) Marca de clase: 𝐦𝐢 = 𝟐
En nuestro caso:
0 + 2,5
𝑚1 = = 1,25
2
2,5 + 5
𝑚2 = = 3,75
2
5 + 7,5
𝑚3 = = 6,25
2
Así sucesivamente.
∑ 𝑓𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑘 = 𝑁
𝑖=1
F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
.
.
.
Fk = f1 + f2 + f3 + … + fk = N
𝐟𝐢
𝐡𝐢 =
𝐍
∑𝑘𝑖=1 ℎ𝑖 = ℎ1 + ℎ2 + ℎ3 + ⋯ + ℎ𝑘 = 1
H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
.
.
.
Hk = h1 + h2 + h3 + … + hk = 1
Además:
𝐅𝐢
𝐇𝐢 =
𝐍
Observamos que nuestra variable en estudio, son las notas de 100 estudiantes: Variable
cuantitativa continua.
• Veamos ahora, los datos obtenidos a un grupo de parejas, sobre el número de hijos y
respondieron conforme se muestra la tabla a continuación.
Observamos, en esta oportunidad, que nuestra variable en estudio es del tipo cuantitativa
discreta, y su tabla de frecuencias sería:
• Veamos ahora, los datos obtenidos a un grupo de estudiantes, sobre el país al que
representan en un concurso de matemáticas sudamericanas y respondieron conforme se
muestra la tabla a continuación.
Observamos, en esta oportunidad, que nuestra variable en estudio es del tipo cualitativa
nominal, y su tabla de frecuencias sería:
Si tenemos:
• Interpretación:
o f4: hay 13 estudiantes cuyas notas están desde 7,5 y menor que 10.
o F6: hay 83 estudiantes cuyas notas son menores a 15.
o h2: el 8% de estudiantes tienen notas mayores o iguales a 2,5 y menores que 5.
o H3: el 22% de los estudiantes tienen una nota menor que 7,5.
1. Diagrama de barras
2. Diagrama circular
3. Histograma
Este diagrama es la unión de varios rectángulos, cuyas bases corresponden a los intervalos de
clase y las alturas, a las frecuencias absolutas o relativas simples.
4. Polígono de frecuencias
Este diagrama se obtiene considerando en el eje horizontal, las marcas de clase y en el eje
vertical las frecuencias absolutas o relativas simples. La unión de cada punto mediante
segmentos genera dicho polígono.
5. Diagrama escalonado
Este diagrama es la unión de varios rectángulos, cuyas bases corresponden a los intervalos de
clase y las alturas, a las frecuencias absolutas o relativas acumuladas.
6. Ojiva
Este diagrama se obtiene considerando en el eje horizontal, los intervalos de clase y en el eje
vertical las frecuencias absolutas o relativas acumuladas. Unimos cada punto, empezando desde
el punto en el dato mínimo del eje horizontal con el punto conformado por el límite superior de
dicho intervalo y la altura, seguidamente con el punto formado por el límite superior del
siguiente intervalo y la altura, y así sucesivamente.
Con los datos obtenidos en la tabla se puede crear diversas gráficas como se muestra a
continuación.
Esta ojiva se obtiene con los datos de la marca de clase.
Actividades Propuestas
2) Aceros Arequipa ha estado buscando los factores que influyen en las ventas de varas de
acero (en millones de toneladas) que realiza en la ciudad de Lima. Tomó una muestra de
300 establecimientos en diferentes partes de Lima y Callao y después de realizar un estudio
de mercado, la administración de la empresa obtuvo los siguientes resultados:
5) La empresa OILGASA, empresa que produce aceites para consumo humano, tiene en el
mercado tres tipos de aceites: Aceite compuesto, aceite vegetal premium y aceite de olivo.
Este laboratorio, preocupado por los incrementos de la competencia, encarga a una
empresa de estudios de mercado realizar un estudio sobre las preferencias de las personas
de clase media de la ciudad de Lima acerca de dichos productos. Para el estudio, se tomó
una muestra aleatoria de 600 personas, obteniéndose lo siguiente:
• El 55% de los encuestados prefieren el aceite vegetal.
• El 13% de los encuestados no supo diferenciar entre el aceite compuesto y el vegetal
Premium.
• El 26% de los encuestados confunden la marca por el envase.
• El 70% está de acuerdo con el precio de dichos productos.
• Por el precio del aceite de oliva, solamente el 5% lo consume.
• El 85% de las personas paga por un litro de aceite vegetal entre 4.00 y 5.50 nuevos
soles.
• La utilidad que se encontraría es de 1.20 nuevos soles en el aceite Premium y en el
aceite compuesto 1.30 nuevos soles.
81 53 67 60 80 64 56 54 91 61
66 88 67 65 97 72 74 65 73 69
43 54 76 70 86 68 82 75 79 60
41 87 76 97 70 45 60 45 65 56
92 72 82 80 52 65 50 58 70 76
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14, 12,
11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 18, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11,
12.
227 231 261 270 291 351 359 369 371 382 387 392 393 395
Arequipa 396 413 420 422 424 436 453 461 463 471 495 498 510 512
533 534 541 542 584 589 591 628 630 630 657 666
217 219 263 287 294 340 346 347 348 377 390 392
Tacna 395 396 397 408 418 424 426 429 438 438 442 446
447 450 456 481 496 508 511 533 549 583 609 636
Usando la regla de Sturges, calcule los intervalos de clase y marcas de clase por cada
departamento.
Trabajadores Nº de Empresas
100 - 200 25
200 - 300 37
300 - 400 12
400 - 500 22
500 - 600 21
600 - 700 13
700 - 800 5
800 - 900 3
900 - 1000 2
10) Se ha aplicado un test a los empleados de una fábrica, obteniéndose la siguiente tabla:
Puntaje [38, 44> [44, 50> [50, 56> [56, 62> [62, 68> [68, 74> [74, 80]
Nº Trabajadores 7 8 15 25 18 9 6
11) La siguiente tabla corresponde a la distribución de frecuencias de los salarios del último
mes de los empleados de una empresa. Complete la tabla.
Frecuencia
Frecuencia Frecuencia
Marca de Frecuencia relativa
Clase Absoluta Acumulada
clase relativa (hi) Acumulada
(fi) (fi)
(hi)
[450 - > 8
750 10
33 0,3
12
12) Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los siguientes
resultados:
Plazas Nº de hoteles
[0 - 10> 25
[10 – 30> 50
[30 – 60> 55
[60 – 100> 20
13) Luis Vargas, asistente del Departamento de Finanzas de PC y Accesorios S.A., ha elaborado
el siguiente cuadro sobre la distribución de los montos pagados, en soles, en impuestos de
5ª. Categoría por los trabajadores de la empresa:
Montos pagados mi fi Fi
[ 150 – > 4
[ 250 – > 24
[ > 30
[ > 72
[ ] 8 80
TOTAL
Resumen
1. La estadística es la ciencia de los datos. Los conceptos fundamentales que debemos conocer
son: Población, muestra y variable.
Variables estadísticas
Variable cualitativa Variable cuantitativa
Nominal Ordinal Discreta Continua
o Nacionalidad. o Grado d o Número de o Estatura.
o Religión. instrucción. empleados o Nivel de
o Estado civil. o Orden de de una inflación
mérito. empresa. mensual.
o Número de
hijos.
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://es.slideshare.net/YeltzinGarcia/ojiva-11878140
o https://www.rbjlabs.com/probabilidad-y-estadistica/que-es-estadistica/
o https://www.universoformulas.com/estadistica/descriptiva/diagrama-circular/comment-
page-1/
Las llamadas medidas de tendencia central nos indicará el valor promedio de los datos, o en
torno a qué valor se distribuyen estos. Las medidas de localización están diseñadas para brindar
al analista algunos valores cuantitativos de la ubicación central o de otro tipo de los datos en
una muestra.
1. Media aritmética
Si los datos obtenidos son de una muestra, se denotará por x̅; en tanto que si son datos de toda
la población en estudio, se denota por μ.
2. Mediana
La mediana ocupa la posición central de los datos, cuyo valor depende de la cantidad de datos
y por consiguiente no es afectado por valores extremos (aislados).
3. Moda
Cuando todas las puntuaciones de un conjunto de datos tienen la misma frecuencia, éste no
tiene moda, entonces diremos que es amodal; si presenta una única moda, diremos unimodal;
así también pueden existir distribuciones bimodales; trimodales o incluso multimodales.
1. Media aritmética
Definición 1
N
x + x2 + x3 + ⋯ + xN 1
̅= 1
X = ∑ xi
N N
i=1
Donde N es el número total de observaciones.
Ejemplo: Diez amigos de una sección se reúnen luego de recibir sus calificaciones del curso de
estadística, cuyas notas fueron: 18, 12, 08, 13, 08, 10, 13, 15, 13 y 07. Calculemos el promedio o
media de dichas notas.
18 + 12 + 08 + 13 + 08 + 10 + 13 + 15 + 13 + 07 117
̅=
X = = 11,7
10 10
Definición 2
k k
x × f + x 2 × f2 + x 3 × f3 + ⋯ + x k × fk 1
̅= 1 1
X = ∑ x i × fi = ∑ x i × h i
f1 + f2 + f3 + ⋯ + fk N
i=1 i=1
f
De donde sabemos que f1 + f2 + f3 + ⋯ + fk = N y Ni = hi .
Ejemplo: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo siguiente:
Definición 3
k k
m1 × f1 + m2 × f2 + m3 × f3 + ⋯ + mk × fk 1
̅
X= = ∑ m i × fi = ∑ m i × h i
f1 + f2 + f3 + ⋯ + fk N
i=1 i=1
f
De donde sabemos que f1 + f2 + f3 + ⋯ + fk = N y Ni = hi .
1. Mediana
Definición 1
Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, una vez ordenados, la mediana
es el valor que supera al 50% de los datos y es superado por el 50% restante. Entonces:
Ordenamos los datos de manera ascendente: 05 08 10 11 14; como tenemos una cantidad
impar de datos, entonces la mediana es el dato central Me = 10.
Definición 2
Ejemplo: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo siguiente:
Como la mediana divide a los datos en el 50%, entonces como tenemos una cantidad par de
datos, la mediana sería:
2+2
Me = =2
2
Interpretación: El 50% de las parejas encuestadas, tienen una cantidad de hijos mayor o igual a
2.
Definición 3
N
2
− Fi−1
Me = Linf. + A × [ ]
fi
Donde:
La clase mediana es el primer intervalo cuya frecuencia absoluta acumulada es mayor o igual
que la mitad del total de datos.
Ejemplo: Con los datos de la figura, elaboramos la siguiente tabla de frecuencias y calculamos la
mediana:
N 100
i. Calculamos . Entonces = 50
2 2
N
ii. Hacemos Fi−1 ≤ < Fi . Entonces 35 ≤ 50 < 64, donde Fi−1 = F4 = 35 y Fi = F5 = 64.
2
iii. Identificamos la clase mediana. En nuestro caso sería el quinto intervalo I5 , entonces Linf. =
10, A = 2,5 y fi = f5 = 29
50−35
iv. Finalmente Me = 10 + 2,5 × [ 29
] = 11,29
1. Moda
Definición 1
Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, entonces la moda es el dato con
mayor frecuencia.
Definición 2
Ejemplo: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo siguiente:
Definición 3.
𝑑1
𝑀𝑜 = 𝐿𝑖𝑛𝑓. + 𝐴 × [ ]
𝑑1 + 𝑑2
Donde:
Linf. : Límite inferior de la clase modal.
A: Amplitud de la clase modal.
d1 = fi − fi−1
d2 = fi − fi+1
fi : Frecuencia absoluta simple del intervalo a la clase modal.
Actividades Propuestas
1) La empresa “A” tiene 100 empleados, con un sueldo promedio mensual por empleado de
$300, la empresa “B” tiene 400 empleados, con un sueldo medio mensual de $250, la
empresa “C” tiene 250 empleados y un sueldo promedio mensual de $280, ¿Determine cuál
es el sueldo medio mensual por empleado para las 3 empresas en conjunto?
4) Los siguientes datos son los puntajes de una muestra de adolescentes al realizar un test de
agudeza visual: 25; 12; 15; 23; 24; 39; 13; 31; 19; 16.
Determine la diferencia en módulo de su promedio y de su respectiva mediana.
5) Calcule la suma de la media, mediana y moda de las notas obtenidas por un grupo de
estudiantes: 15; 16; 18; 14; 15; 15; 14; 18; 16; 14; 14; 14; 16; 18; 20; 14; 14; 16.
6) Una muestra de 20 empleados de cierto centro comercial obtuvo como salario quincenal,
los siguientes datos: 340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280,
240, 280, 255, 265, 255, 265.
Calcule: La media, mediana y moda.
7) Diez lotes de 100 artefactos fueron probados. El resultado de esta prueba está dado en la
siguiente tabla:
8) En un hospital se les preguntó a las señoras sobre el número de hijos que tenían,
obteniéndose la siguiente respuesta en la tabla adjunta.
Nº de 4 8 10 6 12 14 6
señoras
Nº de 0 1 2 3 4 5 6
hijos
10) Para lanzar un nuevo producto al mercado, una empresa estudia el tiempo de publicidad,
en segundos, empleando en los medios audiovisuales por otra empresa que produce un
producto similar.
Duración Nº Anuncios
0-20 3
2025 17
25-30 13
30-40 9
40-60 8
11) El servicio de estudios de una importante entidad bancaria está llevando a cabo un análisis
de las exportaciones realizadas por las empresas del sector industrial en España.
Concretamente los datos recabados han sido los siguientes:
Número de
Exportaciones
empresas
(miles €)
(cientos)
0 – 10 4
10 – 20 20
20 – 40 16
40 – 50 10
12) En un aparcamiento cobran por cada minuto que está estacionado el vehículo 1,5 céntimos
de €. La ocupación del aparcamiento durante la semana pasada fue la siguiente:
Tiempo de
estacionamiento Nº de vehículos
(min.)
0 - 60 1240
60 - 120 3575
120 - 180 746
180 - 240 327
240 - 360 218
360 - 1440 44
Se pide:
13) Gonzalo Muñoz, encargado de compras de un gran centro comercial, ha obtenido muestras
de lámparas eléctricas de dos empresas proveedoras. Probó ambas muestras con respecto
de la duración de su vida útil con los resultados siguientes:
Empresa
Duración (horas) Marca de clase
A B
700 - 900 8 10
900 - 1100 14 22
1100 -1300 26 18
1300 -1500 6 4
Determine ¿Cuál de las dos empresas proveedoras se quedaría Gonzalo si su decisión la toma
basándose en el promedio de la duración del producto?
Resumen
1. Las medidas de tendencia central son indicadores que resumen el conjunto de datos. Entre
estas medidas descriptivas, denominadas estadígrafo o estadístico, tenemos los de posición
y entre ellos los estadígrafos de tendencia central y los de localización.
d1
Mo = Linf. + A × [ ]
d1 + d2
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://es.slideshare.net/griseldamedinaramos/medidas-de-tendencia-central-55218108
o https://www.lifeder.com/medidas-de-posicion/
o https://www.pinterest.com/pin/784681935064379222/
Las medidas de localización están diseñadas para brindar al analista algunos valores
cuantitativos de la ubicación central o de otro tipo de los datos en una muestra. En ese sentido,
basados en el concepto de mediana y dividir los datos en el 50% de la muestra, podemos ampliar
aquel concepto con otros estadígrafos o medidas conocidos como cuantiles, cuyo propósito es
describir el comportamiento de una población y los valores se expresan generalmente en tanto
por ciento. Los cuantiles más utilizados son los cuartiles, deciles y percentiles.
2. Cuartil
Los cuartiles son valores que dividen a un conjunto de datos ordenados (de manera ascendente
o descendente), en cuatro partes iguales.
Se les denota por Q1, Q2 y Q3.
3. Decil
Los deciles son valores que dividen a un conjunto de datos ordenados (de manera ascendente o
descendente), en diez partes iguales.
Se les denota por D1, D2, D3, …, D8 y D9.
4. Percentil
Los percentiles son valores que dividen a un conjunto de datos ordenados (de manera
ascendente o descendente), en cien partes iguales.
Se les denota por P1, P2, P3, …, P98 y P99.
2. Cuartil
Definición 1
Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, una vez ordenados, el primer
cuartil (Q1) es el valor que supera al 25% de los datos y es superado por el 75% restante. El
segundo cuartil coincide con la mediana (Q2 = Me). El tercer cuartil (Q3) es el valor que supera al
75% de los datos y es superado por el 25% restante. Entonces:
Ejemplo 1: Calcular e interpretar el Q1 y Q3, para las siguientes notas: 11, 05, 06, 19, 20, 16, 08,
10, 09, 08 y 13.
05 06 08 08 09 10 11 13 16 19 20
𝑁+1 11+1
1° Calculamos 4
= 4
= 3.
𝑁+1
2° como es entero, entonces 05 06 08 08 09 10 11 13 16 19 20
4
3° Q1 = 08, Q2 = 10 y Q3 = 16
Interpretación:
Ejemplo 2: Calcular e interpretar el Q1 y Q3, para las siguientes notas: 16, 05, 06, 08, 08, 12, 09,
14, 15, 07, 08 y 12.
05 06 07 08 08 08 09 12 12 14 15 16
N+1 12+1
1° Calculamos 4
= 4
= 3,25.
N+1
2° como 4
no es entero, entonces
05 06 07 08 08 08 09 12 12 14 15 16
3° Q1 = 07 + (08 − 07) × (0,25) = 7,25 y
Q 3 = 12 + (14 − 12) × (0,75) = 13,5.
Interpretación:
Definición 2.
t×N
4
− Fi−1
Q t = Linf. + A × [ ]
fi
Donde:
t: 1, 2, 3.
𝐿𝑖𝑛𝑓. : Límite inferior de la clase que contiene a su respectivo cuartil.
𝐴: Amplitud de la clase que contiene al cuartil.
𝐹𝑖−1 : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
cuartil.
𝑓𝑖 : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
cuartil.
La clase que contiene al respectivo cuartil es el primer intervalo cuya frecuencia absoluta
acumulada es mayor o igual que el 25%, o el 50% o el 75% del total de datos respectivamente
para los cuartiles Q1, Q2 y Q3.
Reemplazando t, tendríamos:
N
4
− Fi−1
Q1 = Linf. + A × [ ]
fi
2N
4
− Fi−1
Q 2 = Linf. + A × [ ] = Me
fi
3N
4
− Fi−1
Q 3 = Linf. + A × [ ]
fi
N 100
• Calculamos 4 . Entonces 4
= 25
N
• Hacemos Fi−1 ≤ 4
< Fi . Entonces 22 ≤ 25 < 35, donde Fi−1 = F3 = 22 y Fi = F4 = 35.
• Identificamos la clase Q1. En nuestro caso sería el cuarto intervalo I4 , entonces Linf. = 7,5;
A = 2,5 y fi = f4 = 13
25−22
• Finalmente Q1 = 7,5 + 2,5 × [ ] = 8,08
13
Interpretación: Q1: El 25% de las notas de los estudiantes, es menor o igual a 8,08.
3N 3×100
• Calculamos 4
. Entonces 4
= 75
3N
• Hacemos Fi−1 ≤ 4 < Fi . Entonces 64 ≤ 75 < 83, donde Fi−1 = F5 = 64 y Fi = F6 = 83.
• Identificamos la clase Q3. En nuestro caso sería el sexto intervalo I6 , entonces Linf. = 12,5;
A = 2,5 y fi = f6 = 19
75−64
• Finalmente Q 3 = 12,5 + 2,5 × [ ] = 13,95
19
Interpretación: Q3: El 75% de las notas de los estudiantes, es menor o igual a 13,95.
3. Decil
Definición 1
Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, una vez ordenados, el primer
decil (D1) es el valor que supera al 10% de los datos y es superado por el 90% restante. El segundo
decil (D2) es el valor que supera al 20% de los datos y es superado por el 80% restante y así
sucesivamente, el noveno decil (D9) es el valor que supera al 90% de los datos y es superado por
el 10% restante.
Definición 2
t×N
10
− Fi−1
Dt = Linf. + A × [ ]
fi
Donde:
t: 1, 2, 3, …, 8, 9.
Linf. : Límite inferior de la clase que contiene a su respectivo decil.
A: Amplitud de la clase que contiene al decil.
Fi−1 : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
decil.
fi : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
decil.
La clase que contiene al respectivo decil es el primer intervalo cuya frecuencia absoluta
acumulada es mayor o igual que el 10%, 20%, 30%, …, 90% del total de datos respectivamente
para los cuartiles D1, D2, D3, …, D9.
Reemplazando t, tendríamos:
N
10
− Fi−1
D1 = Linf. + A × [ ]
fi
2N
10
− Fi−1
D2 = Linf. + A × [ ]
fi
5N
10
− Fi−1
D5 = Linf. + A × [ ] = Me
fi
⋮
9N
10
− Fi−1
D9 = Linf. + A × [ ]
fi
3N 3×100
• Calculamos . Entonces = 30
10 10
3N
• Hacemos Fi−1 ≤ 10
< Fi . Entonces 22 ≤ 30 < 35, donde Fi−1 = F3 = 22 y Fi = F4 = 35.
• Identificamos la clase D3. En nuestro caso sería el cuarto intervalo I4 , entonces Linf. = 7,5;
A = 2,5 y fi = f4 = 13
30−22
• Finalmente D3 = 7,5 + 2,5 × [ 13
] = 9,04
Interpretación:
8N 8×100
• Calculamos 10 . Entonces 10
= 80
8N
• Hacemos Fi−1 ≤ < Fi . Entonces 64 ≤ 80 < 83, donde Fi−1 = F5 = 64 y Fi = F6 = 83.
10
• Identificamos la clase D8. En nuestro caso sería el sexto intervalo I6 , entonces Linf. = 12,5;
A = 2,5 y fi = f6 = 19
80−64
• Finalmente 𝐷8 = 12,5 + 2,5 × [ 19
] = 14,61
Interpretación:
4. Percentil
Definición 1
Si x1 , x2 , x3 , … , xN son los valores observados de una variable X, una vez ordenados, el primer
percentil (P1) es el valor que supera al 1% de los datos y es superado por el 99% restante. El
segundo percentil (P2) es el valor que supera al 2% de los datos y es superado por el 98% restante
y así sucesivamente, el noventa y nueve percentil (P99) es el valor que supera al 99% de los datos
y es superado por el 1% restante.
Definición 2
𝑡×𝑁
100
− 𝐹𝑖−1
𝑃𝑡 = 𝐿𝑖𝑛𝑓. + 𝐴 × [ ]
𝑓𝑖
Donde:
t: 1, 2, 3, …, 98, 99.
Linf. : Límite inferior de la clase que contiene a su respectivo decil.
A: Amplitud de la clase que contiene al decil.
Fi−1 : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
decil.
fi : Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene al respectivo
decil.
La clase que contiene al respectivo percentil es el primer intervalo cuya frecuencia absoluta
acumulada es mayor o igual que el 1%, 2%, 3%, …, 99% del total de datos respectivamente para
los percentiles P1, P2, P3, …, P99.
Reemplazando t, tendríamos:
N
100
− Fi−1
P1 = Linf. + A × [ ]
fi
2N
100
− Fi−1
P2 = Linf. + A × [ ]
fi
50N
100
− Fi−1
P50 = Linf. + A × [ ] = Me
fi
⋮
99N
100
− Fi−1
P99 = Linf. + A × [ ]
fi
18N 18×100
• Calculamos . Entonces = 18
100 100
18N
• Hacemos Fi−1 ≤ < Fi . Entonces 10 ≤ 18 < 22, donde Fi−1 = F2 = 10 y Fi = F3 =
100
22.
• Identificamos la clase P18. En nuestro caso sería el cuarto intervalo I3 , entonces Linf. = 5;
A = 2,5 y fi = f3 = 12
18−10
• Finalmente P18 = 5 + 2,5 × [ 12
] = 6,67
Interpretación:
79N 79×100
• Calculamos . Entonces = 79
100 100
79N
• Hacemos Fi−1 ≤ < Fi . Entonces 64 ≤ 79 < 83, donde Fi−1 = F5 = 64 y Fi = F6 =
100
83.
• Identificamos la clase P79. En nuestro caso sería el sexto intervalo I6 , entonces Linf. = 12,5;
A = 2,5 y fi = f6 = 19
79−64
• Finalmente P79 = 12,5 + 2,5 × [ 19
] = 14,47
Interpretación:
Actividades Propuestas
1) Calcule Q1 y Q3 e interprete.
Si las notas obtenidas por un grupo de estudiantes son:
15; 16; 18; 14; 15; 15; 14; 18; 16; 14; 14; 14; 16; 18; 20; 14; 14; 16.
2) Una muestra de 20 empleados de cierto centro comercial obtuvo como salario quincenal,
los siguientes datos:
340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280, 240, 280, 255, 265,
255, 265
• Calcule Q1 y Q3
• Interprete Q3
3) En un hospital se les preguntó a las señoras sobre el número de hijos que tenían,
obteniéndose la siguiente respuesta en la tabla adjunta.
Nº de 4 8 10 6 12 14 6
señoras
Nº de 0 1 2 3 4 5 6
hijos
4) En un aparcamiento cobran por cada minuto que está estacionado el vehículo 1,5 céntimos
de €. La ocupación del aparcamiento durante la semana pasada fue la siguiente:
Tiempo de
estacionamiento Nº de vehículos
(min.)
0 - 60 1240
60 - 120 3575
120 - 180 746
180 - 240 327
240 - 360 218
360 - 1440 44
Se pide:
a) Determine el tiempo de estacionamiento que es mayor o igual al 25% de los vehículos con
menos tiempo.
b) Calcular el valor de D3 + P83.
c) Interprete P29.
Montos pagados mi fi Fi
[ 150 – > 4
[ 250 – > 24
[ > 30
[ > 72
[ ] 8 80
TOTAL
4n
3n
2n
n
91,5 92,5 93,5 94,5 95,5 96,5 Pesos
• Calcule P67.
• Interprete Q1.
• Calcule el peso que supere el peso del 70% de los primeros pesos.
7) De la siguiente ojiva acerca de los sueldos de los empleados de una empresa. Halle el valor
P −D
de la expresión 91 4.
Q1
Fi
100
90
60
35
15
x
200 400 600 800 1000 1200
Resumen
1. Las medidas de posición son indicadores que resumen el conjunto de datos. Entre estas
medidas descriptivas, denominadas estadígrafo o estadístico, tenemos los de localización,
entre ellos los cuantiles.
3. Los cuartiles son valores que dividen a un conjunto de datos ordenados en cuatro partes
iguales. Se les denota por Q1, Q2 y Q3.
t×N
4
− Fi−1
Q t = Linf. + A × [ ]
fi
4. Los deciles son valores que dividen a un conjunto de datos ordenados en diez partes iguales.
Se les denota por D1, D2, …, D10.
t×N
10
− Fi−1
Dt = Linf. + A × [ ]
fi
5. Los percentiles son valores que dividen a un conjunto de datos ordenados en cien partes
iguales. Se les denota por P1, P2, …, P99.
t×N
100
− Fi−1
Pt = Linf. + A × [ ]
fi
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://lasmatesfaciles.com/2021/06/21/cuartiles-deciles-y-percentiles-para-datos-
agrupados/
o https://prezi.com/p/ro023noeos9p/cuartiles-deciles-y-percentiles/
El rango: El rango de variación o recorrido, es el número que resulta de la diferencia del valor
máximo y el mínimo.
El rango intercuartil: El rango intercuartil, es el número que resulta de la diferencia del cuartil
tres y el cuartil uno.
Además:
1. La varianza
Es una medida de dispersión y se define como la media o promedio de los cuadrados de las
diferencias de los datos con respecto a su media aritmética.
Si los datos obtenidos son de una muestra, se denotará por s 2 (varianza muestral); en tanto que
si son datos de toda la población en estudio, se denota por σ2 (varianza poblacional).
Al observar la definición de la varianza, nos percatamos que las unidades en los que se expresa
el resultado es el cuadrado de la variable en estudio, por ejemplo, si nuestra variable en estudio
es “el número de hijos por familia”, entonces en la varianza obtenida tendría por unidades hijos2.
Así también, si la variable en estudio es “años de servicio en una empresa”, la varianza tendrá
por unidad años2.
2. La desviación estándar
Si los datos obtenidos son de una muestra, se denotará por s; en tanto que si son datos de toda
la población en estudio, se denota por σ.
Tanto la varianza como la desviación estándar miden la dispersión de todos los valores de la
muestra con respecto a la media de la misma; pero para efectos de interpretación, la desviación
estándar es la más apropiada, pues presentará las mismas unidades en las que está la variable.
3. El coeficiente de variación
Esta medida de dispersión se define como la relación (el cociente) entre la desviación estándar
y la media aritmética.
Esta medida de dispersión se denotará por CV y se caracteriza por ser una medida de dispersión
relativa; es decir, es adimensional (no presenta unidades de medición). Por tal motivo se utiliza
para comparar la variabilidad de 2 o más grupo de datos con igual o diferente unidades de
medición en estudio.
Tenemos:
Q3 −Q1
El rango semi-intercuartil: Rango semi intercuartil =
2
Además:
1. La varianza
Definición 1
∑N
i=1(xi − μ)
2 ∑N 2
i=1 xi ∑N ̅ )2 ∑N
i=1(xi − x
2
̅2
i=1 xi − N. x
σ2 = = − μ2 s2 = =
N N N−1 N−1
Donde s2 es una estimación de la varianza, cuyo valor se muy similar al usar N en lugar de N – 1,
cuando el tamaño de la muestra es grande.
Ejemplo: Diez amigos de una sección se reúnen luego de recibir sus calificaciones del curso de
estadística, cuyas notas fueron: 18, 12, 08, 13, 08, 10, 13, 15, 13 y 07. Calculemos la varianza de
dichas notas.
x: 07 08 08 10 12 13 13 13 15 18 ⇒ 𝑥̅ = 11,7
∑10 2
̅2
i=1 xi −N.x 1477−10×11,72
Entonces s 2 = N−1
= 10−1
= 12,01
Interpretación: La varianza de las notas de los 10 amigos, tiene una dispersión de 12,01 con
respecto a su media.
Definición 2
∑N 2
i=1(xi − μ) × fi ∑N ̅)2 × fi ∑N
i=1(xi − x
2
̅2
i=1 xi × fi − N. x
σ2 = s2 = =
N N−1 N−1
∑N 2
i=1 i × fi
x
= − μ2
N
Donde s2 es una estimación de la varianza, cuyo valor se muy similar al usar N en lugar de N – 1,
cuando el tamaño de la muestra es grande.
Ejemplo: En una encuesta a un grupo de parejas sobre el número de hijos, se obtuvo lo siguiente
Como:
∑N 2
̅2
i=1 xi ×fi −N.x ∑N
i=1 xi ×fi
s2 = y x̅ =
N−1 N
40
De nuestra tabla de frecuencias tenemos: ∑N 2
i=1 xi × fi = 114, N = 20 y x
̅ = 20 = 2
114−20×22
Entonces s 2 = 20−1
= 1,79
Interpretación: La varianza del número de hijos para las 20 parejas, tiene una dispersión de 1,79
con respecto a su media.
Definición 3
∑N 2
i=1(mi − μ) × fi ∑N ̅)2 × fi
i=1(mi − x
σ2 = s2 =
N N−1
∑N 2
i=1 i × fi
m ∑N 2
̅2
i=1 mi × fi − N. x
= − μ2 =
N N−1
Donde s2 es una estimación de la varianza, cuyo valor se muy similar al usar N en lugar de N – 1,
cuando el tamaño de la muestra es grande.
Como:
∑N 2
̅2
i=1 mi ×fi −N.x ∑N
i=1 mi ×fi
s2 = N−1
y x̅ = N
Interpretación: La varianza de las notas para los 100 estudiantes, tiene una dispersión de 129,71
con respecto a su media.
2. La desviación estándar
Definición
Si los valores que obtenemos de una variable estadística son agrupados o no, el cálculo de la
desviación estándar es la raíz cuadrada positiva de la varianza
𝜎 = √𝜎 2 𝑠 = √𝑠 2
Ejemplo 1: Diez amigos de una sección se reúnen luego de recibir sus calificaciones del curso de
estadística, cuyas notas fueron: 18, 12, 08, 13, 08, 10, 13, 15, 13 y 07. Calculemos la desviación
estándar de dichas notas.
∑10 2
̅2
i=1 xi −N.x 1477−10×11,72
Como s 2 = = = 12,01
N−1 10−1
Interpretación: La desviación de las notas de los 10 amigos, con respecto a su media es 3,47 en
promedio.
114−20×22
Como s 2 = = 1,79
20−1
Interpretación: La desviación del número de hijos para las 20 parejas, con respecto a su media
es 1,34 en promedio.
13943,75−100×11,02502
Como s 2 = 100−1
= 18,07
Interpretación: La desviación de las notas para los 100 estudiantes, con respecto a su media es
4,25 en promedio.
Definición
Si los valores que obtenemos de una variable estadística son agrupados o no, el cálculo del
coeficiente de variación es:
s
CV = × 100%
x̅
A pesar de que el CV es una medida de dispersión que se utiliza para comparar la variabilidad de
2 o más grupo de datos con igual o diferente unidades de medición en estudio, podemos
considerar que sí.
Ejemplo 1: Diez amigos de una sección se reúnen luego de recibir sus calificaciones del curso de
estadística, cuyas notas fueron: 18, 12, 08, 13, 08, 10, 13, 15, 13 y 07. Calculemos el coeficiente
de variación de dichas notas.
3,47
Entonces CV = × 100% = 29,66%
11,7
Como s = 1,34 y x̅ = 2
1,34
Entonces CV = 2
× 100% = 67%
4,25
Entonces CV = 11,0250 × 100% = 38,55%
Debido a que el coeficiente de variación es una medida de dispersión relativa que permite
comparar la variabilidad de dos o más grupos de datos, veamos la interpretación de los tres
grupos de estudio estadístico que se realizó en los 3 ejemplos anteriores.
Interpretación: El grupo de 10 amigos poseen menor variabilidad (29,66%) con respecto a los
otros grupos; pues en los 100 estudiantes, tienen una variabilidad del 38,55% en sus notas; y las
20 parejas, respecto al número de hijos, presenta una variabilidad del 67%.
Actividades Propuestas
1) Los siguientes datos son los puntajes de una muestra de adolescentes al realizar un test de
agudeza visual: 25; 12; 15; 23; 24; 39; 13; 31; 19; 16.
15; 16; 18; 14; 15; 15; 14; 18; 16; 14; 14; 14; 16; 18; 20; 14; 14; 16.
3) Una muestra de 20 empleados de cierto centro comercial obtuvo como salario quincenal,
los siguientes datos: 340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280,
240, 280, 255, 265, 255, 265
Calcule: La varianza, la desviación estándar y el coeficiente de variación.
5) El sueldo promedio de 200 empleados de una empresa es S/1200 con una desviación
estándar de varianza de 10,02 soles. Se proponen dos alternativas de aumento: a) S/. 75 a
cada uno, b) 15% de su sueldo más 10 soles a cada uno. Determine la alternativa que
presenta mayor variabilidad.
6) En un hospital se les preguntó a las señoras sobre el número de hijos que tenían,
obteniéndose la siguiente respuesta en la tabla adjunta.
Nº de 4 8 10 6 12 14 6
señoras
Nº de 0 1 2 3 4 5 6
hijos
Ventas en Número de
Marca de clase
miles de dólares vendedores fi
5,0 - 7,8 3
7,8 - 10,6 10
10,6 - 13,4 28
13,4 - 16,2 9
Relaciones Proyección
Contabilidad Proyectos
Internacionales Social
Remuneración Media 1250 1500 1750 1300
Desviación estándar 150 250 100 200
N° empleados 8 5 12 25
Muestra
Vida útil en horas
Empresa “A” Empresa “B”
[700 - 900> 10 3
[900 - 1100> 16 36
[1100 -1300> 26 12
[1300 -1500] 8 3
11) La siguiente tabla muestra los resultados de una encuesta de sondeo realizada por un
operador de telefonía celular a los adolescentes de los distritos de Los Olivos y San Miguel
referente al uso del sistema prepago de telefonía celular. El estudio se refirió al tiempo de
uso del sistema telefónico y al gasto de los adolescentes en tarjetas prepago.
a. Determine ¿En cuál de los distritos el gasto de los adolescentes en tarjetas prepago es
mayor?
b. Determine ¿En qué distrito el tiempo que los adolescentes hacen uso del sistema de
telefonía celular es menor?
12) Los sueldos en soles de los ejecutivos de dos empresas A y B se dan en la siguiente tabla de
frecuencias:
13) El Ministerio de Trabajo ha recibido muchas quejas referidas al trato que las empresas
mineras están realizando con su personal. Uno de los grandes problemas son los sueldos,
que a pesar de que los trabajos son los mismos en diferentes unidades de la misma empresa
minera, los sueldos varían de una unidad a otra. El Ministerio de Trabajo ordena una
investigación a dicha empresa minera, y después de recoger toda la información tabula en
la siguiente tabla los sueldos de las dos unidades de trabajo de la empresa:
Resumen
1. Es fundamental medir la dispersión o la variabilidad de los datos con respecto a su centro
con la finalidad de ampliar la descripción de los datos o de comparar dos o más serie de
datos.
3. La varianza:
∑N
i=1(xi − μ)
2
2 ∑N 2
i=1 xi ∑N ̅)2 ∑N
i=1(xi − x
2
̅2
i=1 xi − N. x
σ = = − μ2 2
s = =
N N N−1 N−1
∑N 2
i=1(xi − μ) × fi ∑N ̅)2 × fi
i=1(xi − x
σ2 = s2 =
N N−1
∑N 2
i=1 i × fi
x ∑N 2
̅2
i=1 xi × fi − N. x
= − μ2 =
N N−1
2
∑N 2
i=1(mi − μ) × fi 2
∑N ̅)2 × fi
i=1(mi − x
σ = s =
N N−1
∑N 2
i=1 i × fi
m ∑N 2
̅2
i=1 mi × fi − N. x
= − μ2 =
N N−1
4. La desviación estándar:
σ = √σ2 s = √s 2
s
CV = × 100%
x̅
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://www.youtube.com/watch?v=z4ITT_xFFjo
o https://economipedia.com/definiciones/varianza.html
o https://matemovil.com/coeficiente-de-variacion-ejemplos-y-ejercicios/
En casos prácticos se observa generalmente que casi nunca se encuentran gráficos (polígonos o
histogramas) perfectamente simétricos, de ahí que el grado de asimetría constituye el sesgo.
1. Asimetría negativa
Una distribución de frecuencias unimodal presenta asimetría negativa o asimetría con sesgo a
la izquierda, si los datos mayores a la media son más frecuentes que aquellos por debajo a la
media. De donde se concluye que MEDIA < MEDIANA < MODA.
𝑥̅ < 𝑀𝑒 < 𝑀𝑜
2. Simétrica
Una distribución de frecuencias unimodal presenta una distribución simétrica, si las frecuencias
absolutas simples equidistantes son iguales; así también la amplitud. De donde se concluye que
MEDIA = MEDIANA = MODA.
𝑥̅ = 𝑀𝑒 = 𝑀𝑜
3. Asimetría positiva
Una distribución de frecuencias unimodal presenta asimetría positiva o asimetría con sesgo a la
derecha, si los datos menores a la media son más frecuentes que aquellos por encima a la media.
De donde se concluye que MODA > MEDIANA > MEDIA.
Mo > Me > x̅
∑(mi − ̅
X)3 × fi
As =
N × s3
De donde:
Interpretación: La distribución de las notas de los 100 estudiantes, presenta asimetría negativa.
Finalmente tendríamos:
En distribuciones simétricas, se cumple M0 = Me = x̅
En distribuciones asimétricas positivas ((As > 0), se cumple Mo < Me < x̅
1. Platicúrtica
Presenta un bajo grado de concentración alrededor de los valores centrales de la variable y por
lo tanto presenta una curva simétrica menor a la normal.
2. Mesocúrtica
3. Leptocúrtica
Presenta un alto grado de concentración alrededor de los valores centrales de la variable y por
lo tanto presenta una curva simétrica mayor a la normal.
∑(mi − ̅
X)4 × fi
Cr = −3
N × s4
De donde:
80684,726
Entonces Cr = 100×4,254 − 3 = −0,527
Interpretación: La distribución de las notas de los 100 estudiantes, presenta una distribución
platicúrtica.
Actividades Propuestas
1) Los siguientes datos son los puntajes de una muestra de adolescentes al realizar un test de
agudeza visual: 25; 12; 15; 23; 24; 39; 13; 31; 19; 16.
Determine si la distribución es simétrica o asimétrica. De ser asimétrica, indique el nivel de
asimetría.
2) Calcule el grado de curtosis para las notas obtenidas por un grupo de estudiantes:
15; 16; 18; 14; 15; 15; 14; 18; 16; 14; 14; 14; 16; 18; 20; 14; 14; 16.
3) Una muestra de 20 empleados de cierto centro comercial obtuvo como salario quincenal,
los siguientes datos: 340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280,
240, 280, 255, 265, 255, 265.
Calcule el grado de asimetría y curtosis.
4) En un hospital se les preguntó a las señoras sobre el número de hijos que tenían,
obteniéndose la siguiente respuesta en la tabla adjunta.
Nº de 4 8 10 6 12 14 6
señoras
Nº de 0 1 2 3 4 5 6
hijos
Montos pagados mi fi Fi
[ 150 – > 4
[ 250 – > 24
[ > 30
[ > 72
[ ] 8 80
TOTAL
a. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
[100, [110,
Peso [50, 60> [60, 70> [70, 80> [80,90> [90, 100>
110> 120>
fi 8 10 16 14 10 5 2
b. Los pagos diarios de los 125 empleados de una fábrica vienen dados por la siguiente tabla:
Peso [10, 20> [20, 30> [30, 40> [40,50> [50, 60> [60, 70> [70, 80>
fi 18 20 26 24 10 15 12
Resumen
1. Para completar la descripción de la información, respecto a la distribución de frecuencias,
estudiaremos las medidas que nos permitirán ver la dirección de la dispersión; es decir, la
forma en que se separan o aglomeran los datos respecto a su centro.
̅)3 × fi
∑(mi − X
As =
N × s3
De donde:
Si As > 0: Asimetría positiva.
Si As = 0: Distribución simétrica.
Si As < 0: Asimetría negativa.
̅)4 × fi
∑(mi − X
Cr = −3
N × s4
De donde:
Si Cr > 0: Distribución leptocúrtica.
Si Cr = 0: Distribución mesocúrtica o normal.
Si Cr < 0: Distribución platicúrtica.
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://smart-thinking.com.mx/usando-la-curtosis-y-asimetria/
o http://ocw.uv.es/ciencias-sociales-y-juridicas/estadistica-i/tema_3_3.pdf
o https://www.universoformulas.com/estadistica/descriptiva/curtosis/
UNIDAD
2
1
PROBABILIDADES
LOGRO DE LA UNIDAD DE APRENDIZAJE
Al término de la unidad, el estudiante, trabajando de manera individual, calcula e
interpreta la probabilidad de ocurrencia de un evento y una probabilidad condicional,
acorde con determinadas condiciones sobre la base de casos de estudio planteados.
TEMARIO
2.1 Tema 6 : Probabilidad clásica
2.1.1 : Definición
2.1.2 : Variables estadísticas y su clasificación
ACTIVIDADES PROPUESTAS
Es aquel proceso cuya ejecución se puede realizar una o más veces y el resultado es incierto,
vale decir, depende del azar.
Ejemplos:
Ejemplos:
Entonces el espacio muestral sería Ω2 = {CC, CS, SC, SS}; donde n(Ω2 ) = 4
• Para 𝜀3 : Lanzar un dado y una moneda, y observar el resultado en la cara superior del dado
y el de la moneda.
Ω3 = {(1; 𝐶), (1; 𝑆), (2; 𝐶), (2; 𝑆), (3; 𝐶), (3; 𝑆), (4; 𝐶), (4; 𝑆), (5; 𝐶), (5, 𝑆), (6; 𝐶), (6; 𝑆)}; donde
𝑛(Ω1 ) = 12
c) Eventos
Ejemplos:
• Para ε3 con
Ω3 = {(1; C), (1; S), (2; C), (2; S), (3; C), (3; S), (4; C), (4; S), (5; C), (5, S), (6; C), (6; S)};
donde n(Ω1 ) = 12
Consideremos el evento C: obtener número par en el dado y sello en la moneda.
⟹ C = {(2; S), (4; S), (6; S)}; donde n(C) = 3
2.1.1. Definición
Ejemplos:
• ¿Cuál es la probabilidad de obtener al menos una cara si lanzamos una moneda dos veces?
Como Ω2 = {CC, CS, SC, SS}; donde n(Ω2 ) = 4. Consideremos “B” el evento de obtener al
menos una cara ⟹ B = {CC, CS, SC}; donde n(B) = 3
n(B) 3
Por lo tanto P(B) = n(Ω ) = 4 = 0,75
2
Como:
Ω3 = {(1; C), (1; S), (2; C), (2; S), (3; C), (3; S), (4; C), (4; S), (5; C), (5, S), (6; C), (6; S)};
donde n(Ω1 ) = 12. Consideremos “C” el evento de obtener número par en el dado y sello
en la moneda ⟹ C = {(2; S), (4; S), (6; S)}; donde n(C) = 3
n(C) 3
Por lo tanto P(C) = = = 0,25
n(Ω3 ) 12
Dos eventos son mutuamente excluyentes si no ocurren de manera simultánea; es decir no hay
intersección de ambos eventos A ∩ B = ∅.
Ejemplo:
• Para este fin de semana Karina decidió viajar y la probabilidad de viajar al norte es 0,42;
mientras que, la probabilidad de viajar al sur es 0,25, ¿Cuál es la probabilidad de que Karina
viaje el fin de semana al norte o al sur?
Supongamos que:
A: viajar al norte
B: viajar al sur
entonces P(A) = 0,42 y P(B) = 0,25; además Karina no puede viajar a ambos lugares a la vez
⟹ P(A ∪ B) = P(A) + P(B) = 0,42 + 0,25 = 0,67.
Dos eventos son independientes si el resultado al realizar uno de los eventos, no influye en el
resultado del otro evento; ello implica que los eventos se pueden realizar a la vez o uno a
continuación del otro.
Ejemplo:
Como los resultados que se obtienen de un dado no influyen en el resultado que se obtenga de
la moneda, entonces dichos eventos son independientes.
Supongamos que:
A: Número par en el dado
B: Sello en la moneda
Actividades Propuestas
2) Se extrae una bola de una urna que contiene 3 bolas rojas y 2 bolas azules. Determine la
probabilidad de que la bola extraída sea
a) roja.
b) azul.
3) Un lote consta de 10 artículos buenos, 4 con pequeños defectos y 2 con defectos graves. Se
elige un artículo al azar, encontrar la probabilidad de que:
a) No tenga defectos.
b) Tenga defectos graves.
c) Que sea bueno o que tenga un defecto grave.
Evaluar:
a) P(B ∪ D)
b) P(A ∪ C)
6) Un sistema está formado por dos componentes A y B cuyas probabilidades de falla son 1/6
y 2/15 respectivamente. Si la probabilidad de que al menos una de las dos componentes
falle es 7/30, calcule la probabilidad de que
a) Ninguna de las dos componentes falle.
b) Solo una de las componentes falle.
8) Un lote consiste de 15 objetos idénticos, 7 de los cuales se califican como E (éxito) y el resto
se califican como F (fracaso). Si se escogen 5 objetos a la vez, calcule la probabilidad de que
3 sean E y 2 sean F.
9) Una caja contiene 12 pernos, de los cuales 5 no tienen defectos, 4 tienen defectos leves y
3 tienen defectos graves. Si se eligen 6 pernos al azar y a la vez, calcule la probabilidad de
que 3 no tengan defectos, 2 tengan defectos leves y solo uno tenga defecto grave.
10) Una urna contiene 5 fichas similares de las cuales 3 son de color rojo y 2 de color azul.
a) Si se extraen 3 fichas a la vez, ¿Cuál es la probabilidad de que solo una sea de color
rojo?
b) Si se extraen 3 fichas, una por una sin reposición, ¿Cuál es la probabilidad que la tercera
sea de color rojo?
c) Si se extraen 3 fichas, una por una con reposición, ¿Cuál es la probabilidad que la
tercera sea de color rojo?
Resumen
1. La teoría de probabilidades tiene por objetivo principal la comprensión matemática de las
irregularidades de los fenómenos aleatorios.
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://www.lifeder.com/probabilidad-clasica/
o https://www.monografias.com/trabajos89/adicion-probabilidades-eventos-
mutuamente/adicion-probabilidades-eventos-mutuamente.shtml
o https://calculo.cc/temas/temas_estadistica/probabilidad/teoria/depe_indepe.html
Si queremos calcular la probabilidad del evento A, sabiendo que previamente ocurrió el evento
B, se denota por P(A/B).
Tendríamos:
n(A∩B)
n(A ∩ B) n(Ω) P(A ∩ B)
P(A/B) = = n(B)
=
n(B) P(B)
n(Ω)
2.2.1. Definición
P(A ∩ B)
P(A/B) =
P(B)
La notación P(A/B) se lee: Probabilidad del evento A, dado que ocurrió B; o probabilidad del
evento A, sabiendo que ocurrió B; o probabilidad de A, si ocurrió B; etc.
2.2.2. Aplicaciones
Existe una variedad de casos en la que se presenta la probabilidad condicional, veamos algunos:
Aplicación 1:
Como Ω1 = {1, 2, 3, 4, 5, 6}. Consideremos “B” el evento de obtener un valor par y “A” el
evento de obtener un resultado mayor que 4.
n(A∩B) 1
Por lo tanto P(A/B) = n(B)
=3
Aplicación 2:
• El profesor de estadística decide lanzar, primero un dado y luego una moneda, ¿Cuál es la
probabilidad de obtener sello en la moneda, sabiendo que en el dado primero salió un
número mayor o igual a 3?
Como:
Ω3 = {(1; C), (1; S), (2; C), (2; S), (3; C), (3; S), (4; C), (4; S), (5; C), (5, S), (6; C), (6; S)}.
Consideremos “C” el evento de obtener número mayor o igual a 3 y “D” el evento de
obtener sello en la moneda
⟹ C = {(3; C), (3; S), (4; C), (4; S), (5; C), (5; S), (6; C), (6; S)}; donde n(C) = 8
⟹ D = {(1; S), (2; S), (3; S), (4; S), (5; S), (6; S)}; donde n(D) = 6
n(D∩C) 4
Por lo tanto P(D/C) = = = 0,5
n(C) 8
Aplicación 3:
Varones Mujeres
Profesionales 60 40
No profesionales 30 20
n(A ∩ B) 60
P(A/B) = = = 0,6
n(B) 100
n(B ∩ C) 40
P(B/C) = = = 0,67
n(C) 60
Actividades Propuestas
1
1) Si A y B son dos eventos tales que P(B) = 3/15, P(B/A) = 1/5 y P(A ∩ B) = 15. Calcular
P(A ∩ B C ).
2) Si A y B son dos eventos tales que P(A) = 5/8, P(B) = 3/4 y P(A/B) = 2/3. Calcular P(A/B C ).
5) Un sistema está formado por dos componentes A y B cuyas probabilidades de falla son 1/6
y 2/15 respectivamente. Si la probabilidad de que al menos una de las dos componentes
falle es 7/30, calcule la probabilidad de que:
a) Calcular la probabilidad de que falle el componente A, sabiendo que había fallado B
previamente.
b) Calcular la probabilidad de que falle el componente B, si primero falló B.
a) La probabilidad de que sea de la escuela de gestión y negocios; dado que es del sexo
femenino.
b) La probabilidad de que sea del sexo femenino; si se sabe que es de la escuela de gestión y
negocios.
8) En una muestra de 120 personas, se encontró que el 60% sufre alguna enfermedad, el 30%
tienen al menos 30 años, y el 20% del total son menores de 30 y sanos. Si una de las
personas es escogida al azar, cuál es la probabilidad de que
a) Sufra alguna enfermedad y tenga al menos 30 años.
b) Sufra alguna enfermedad, si tiene al menos 30 años.
c) Tenga menos de 30 años, dado que es una persona sana.
9) En una encuesta de opinión a 200 personas, se encontró que el 25% de los electores
votarían por el candidato E. De los que no votarían por E, el 20% son mujeres. Además, el
70% de los electores son hombres.
a) Si se elige un elector al azar, y resulta ser mujer, ¿Cuál es la probabilidad de que no
vote por E?
b) Si se elige un elector al azar, y resulta ser hombre, ¿Cuál es la probabilidad de que vote
por E?
c) Si se elige un elector al azar, y resulta no votará por E, ¿Cuál es la probabilidad de que
sea mujer?
10) Para ir a trabajar, un hombre toma ómnibus o el metro con probabilidades respectivas de
0,3 y 0,7. Cuando toma el ómnibus, llega tarde el 30% de los días; si toma el metro, llega
tarde el 20%. Si un día particular el hombre llega tarde al trabajo, ¿Cuál es la probabilidad
de que tomó ómnibus?
Resumen
1. Sean los eventos A y B en el espacio muestral Ω, tenemos:
n(A∩B)
n(A ∩ B) n(Ω) P(A ∩ B)
P(A/B) = = n(B)
=
n(B) P(B)
n(Ω)
2. La notación P(A/B) se lee: Probabilidad del evento A, dado que ocurrió B; o probabilidad del
evento A, sabiendo que ocurrió B; o probabilidad de A, si ocurrió B; etc.
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://nikobosk2017.wixsite.com/misitio/post/probabilidad-condicional
o https://lasmatesfaciles.com/2020/07/01/introduccion-a-la-probabilidad-condicional/
o https://es.slideshare.net/daliarosabotello/probabilidad-condicional-26850179
Esta variable aleatoria asigna a cada resultado de experimento aleatorio un valor numérico.
Una variable aleatoria es una variable estadística cuantitativa definida en un espacio muestral
Ω; es decir, una variable aleatoria “X” es una función cuyo dominio está definido en el espacio
muestral Ω, donde cada elemento wi ∈ Ω y el rango es un subconjunto de los números reales,
donde X (wi) = xi .
Tenga presente que dicha variable aleatoria es discreta si el dominio presenta una cantidad finita
o infinita numerable de elementos; es decir, que se pueden enumerar sus elementos.
Entonces:
X ∶ Ω → ImX ⊆ ℝ
wi ⟼ X (wi) = xi
Ejemplos:
• Se lanza una moneda dos veces y se define la variable aleatoria X: número de caras. Indicar
el rango asociada a dicha variable aleatoria.
El dominio de X es Ω = {CC, CS, SC, SS}, como la variable aleatoria, cuenta el número de caras,
entonces:
CC ⟶ 2 caras
CS ⟶ 1 cara
SC ⟶ 1 cara
SS ⟶ 0 caras
Para describir completamente una variable aleatoria, es necesario indicar las probabilidades que
tome cada uno de sus valores posible. Sea una variable aleatoria X, cuyos valores del rango son
x1 , x2 , x3 , … , xk ; entonces se define la función f(xi ) = P(X = xi ) que indica la probabilidad de
cada valor xi del rango de la variable aleatoria “X”. Esta función de de probabilidad también se
denomina distribución de probabilidad de la variable aleatoria discreta “X”.
Entonces:
f ∶ ImX → [0; 1]
xi ⟼ f(xi ) = P(X = xi ) = pi
i. f(xi ) ≥ 0 ∀ xi ∈ ℝ
Ejemplos:
• Se lanza una moneda dos veces y se define la variable aleatoria X: número de caras.
Construir una tabla de distribución de probabilidades.
El dominio de X es Ω = {CC, CS, SC, SS} y el rango es ImX = {0,1, 2}, entonces para la variable
aleatoria X, tenemos:
Ω SS SC CS CC
ImX o xi 0 1 2
Ω SS SC CS CC
ImX o xi 0 1 2
f(xi ) o pi 1 2 1
4 4 4
Finalmente, la tabla de distribución de probabilidad para una variable aleatoria discreta es:
ImX o xi 0 1 2
f(xi ) o pi 1 2 1
4 4 4
1 2 1
• P(X = 0) = , P(X = 1) = , P(X = 2) =
4 4 4
1 2 1
• ∑ f(xi ) = + + = 1
4 4 4
Ω 1 4 6 2 3 5
𝑦𝑖 – 20 50 200
𝑝𝑖 1 2 3
6 6 6
1 2 3
• P(Y = −20) = 6, P(Y = 50) = 6, P(Y = 200) = 6
1 2 3
• ∑ f(yi ) = + + = 1
6 6 6
Sea una variable aleatoria X, cuyos valores del rango son x1 , x2 , x3 , … , xk ; en la que se define la
función f(xi ) = pi . La media o también conocida como esperanza matemática de la variable
aleatoria discreta X, se denota por μ = E(X).
Si tenemos:
xi x1 x2 x3 … xk
pi p1 p2 p3 … pk
Entonces
μ = E(X) = ∑ xi pi
i=1
Ejemplos:
• Se lanza una moneda dos veces y se define la variable aleatoria X: Número de caras.
Determine el valor esperado de X.
Ω SS SC CS CC
xi 0 1 2
pi 1 2 1
4 4 4
1 2 1
Entonces la esperanza matemática es 𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑖 𝑝𝑖 = 0. 4 + 1. 4 + 2. 4 = 1
Por lo tanto, afirmamos que al lanzar una moneda dos veces, se obtiene en promedio 1 cara.
Ω 1 4 6 5 4 6
yi – 20 50 200
pi
1 2 3
6 6 6
1 2 3
𝜇 = 𝐸(𝑌) = ∑ 𝑦𝑖 𝑝𝑖 = −20. + 50. + 200. = 113,33
6 6 6
Por lo tanto, afirmamos que en dicho juego se gana en promedio 113,33 soles.
Actividades Propuestas
2) Se lanza una moneda 4 veces y se define la variable aleatoria X: número de caras. Indicar el
rango asociada a dicha variable aleatoria.
X 1 2 3 4
2k − 3 3k 3k k −1
P(X)
14 14 14 14
a) Calcular el valor de k.
b) P(1 < X ≤ 3) − P(X = 1)
X f(X)
–2 1/8
–1 1/4
0 1/8
1 1/4
2 K
a) Calcular el valor de k.
b) P(X ≤ 0) − P(X > 0)
c) P(X ≥ 0/−1 ≤ X ≤ 1)
5) Sea X una variable aleatoria cuya distribución de probabilidad está dada por
X 2 3 5 6
P(X) 1/9 3/9 2/9 3/9
Calcular: E(3X+2).
6) Sea X una variable aleatoria cuya distribución de probabilidad está dada por
X 4 6 7 9
P(X) 1/11 3/11 5/11 2/11
Calcular E(11X+2).
7) Una empresa ha medido el número de errores que cometen las secretarias recién
contratadas a lo largo de los últimos tres años y encontró que estas cometen hasta 5 errores
en una página de 20 líneas y que esta variable presenta la siguiente función de probabilidad:
X 0 1 2 3 4 5
P(X) 0,5 7a a+0,03 a+0,02 a+0,01 a
Halle lo siguiente:
a) El valor esperado de X.
b) La varianza de X.
xi 3 5 6 10
pi 2p 2q 3q 3p
Si p – q = 0,08, calcule:
a) La esperanza matemática de X.
b) La varianza de X.
10) Un juego consiste en lanzar dos dados de diferente color, si se obtiene menos de 4 puntos
se pierde S/.20; si se obtiene más de 9 puntos se gana S/.100; en cualquier otro caso no se
gana ni se pierde. ¿Cuánto se espera ganar en este juego?
11) En una partida de 10 piezas hay 3 no estándares. Se escogen al azar 2 piezas. Hallar la
esperanza matemática de la magnitud aleatoria discreta “X”, es decir, el número de piezas
no estándares entre las dos escogidas.
12) Sea X un variable aleatoria que indica el número de tornillos defectuosos que se obtiene al
extraer una muestra aleatoria de 2 tornillos de una caja que contiene 2 tornillos
defectuosos y 4 tornillos no defectuosos. Halle el valor esperado de X.
del día a S/.1 el kilogramo. Los técnicos de la empresa han elaborado la distribución de
probabilidades de la demanda diaria en kilogramos (Kg) la cual se muestra en la siguiente
tabla:
Si el día de hoy la empresa ha comprado 1800 kg de pescado, ¿Cuánto espera ganar (en soles)?
14) En un comedor, se vende el menú a 8 soles, en el cual el costo por menú es 4 soles. Los
menús que quedan sin vender al final del día se rematan a 3 soles. El comerciante ha
establecido que la distribución de probabilidades de la demanda diaria del menú es:
Resumen
1. Una variable aleatoria “X” es una función cuyo dominio está definido en el espacio muestral
Ω, donde cada elemento wi ∈ Ω y el rango es un subconjunto de los números reales, donde
X (wi) = xi .
X ∶ Ω → ImX ⊆ ℝ
wi ⟼ X (wi) = xi
2. Se define la función f(xi ) = P(X = xi ) que indica la probabilidad de cada valor xi del rango
de la variable aleatoria “X”. Esta función de de probabilidad también se denomina
distribución de probabilidad de la variable aleatoria discreta “X”.
f ∶ ImX → [0; 1]
xi ⟼ f(xi ) = P(X = xi ) = pi
i. ∑xi∈ImX f(xi ) = 1
3. Sea una variable aleatoria X, cuyos valores del rango son x1 , x2 , x3 , … , xk ; en la que se define
la función f(xi ) = pi . La media o también conocida como esperanza matemática de la
variable aleatoria discreta X, se denota por μ = E(X).
Si tenemos:
𝑥𝑖 𝑥1 𝑥2 𝑥3 … 𝑥𝑘
𝑝𝑖 𝑝1 𝑝2 𝑝3 … 𝑝𝑘
Entonces
𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑖 𝑝𝑖
𝑖=1
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://www.youtube.com/watch?v=m_V0NsuVErk
o https://www.monografias.com/trabajos107/variable-aleatoria-discreta/variable-aleatoria-
discreta.shtml
o https://tada2019a.blogspot.com/2019/05/esperanza-matematica-14.html
UNIDAD
3
1
INFERENCIA ESTADÍSTICA
LOGRO DE LA UNIDAD DE APRENDIZAJE
Al término de la unidad, el estudiante, trabajando de manera individual, toma decisiones sobre
problemas reales, a partir de la interpretación de intervalos de confianza; utilizando como
herramienta básica de apoyo, el programa estadístico IBM SPSS de forma coherente.
TEMARIO
3.1 Tema 9 : Muestreo y tamaño de muestra
3.1.1 : Definición e importancia
3.1.2 : Tipos de muestreo
3.1.3 : Aplicaciones prácticas de muestreo aleatorio simple
ACTIVIDADES PROPUESTAS
2) Importancia: La encuesta por muestreo tiene vital importancia porque permite resumir
información y orientar la administración; debido al manejo de datos inaccesibles, lejanos y
de gran cantidad; lo que finalmente permite tomar decisiones.
Por lo general
En una encuesta por muestreo diseñada correctamente también es posible hacer una
estimación válida del margen de error y por lo tanto decidir si los resultados son lo
suficientemente exactos.
Las muestras aleatorias son de 4 tipo: Al azar simple, al azar sistemático, estratificado y por
grupos o conglomerados.
1) Muestra al azar simple: Es aquella cuyos elementos se seleccionan de la población uno por
uno con una oportunidad igual e independiente. Para escoger la muestra, por lo general, se
utiliza un paquete de cómputo.
Por ejemplo, si queremos elegir una muestra de 100 estudiantes del nivel secundario de un
total de 500 estudiantes, entonces k = 500/100 = 5. El primer estudiante se elegirá en forma
aleatoria simple de los 5 primeros y los demás cada 5 estudiantes de la lista.
Por ejemplo, si tenemos 500 estudiantes y observamos que son 300 varones y 200 mujeres,
entonces al elegir una muestra de 100 estudiantes, se deben elegir 60 varones y 40 mujeres.
Por ejemplo, si los estudiantes de nivel secundario de una institución educativa están
clasificados por las secciones A, B y C de manera aleatoria, en los 5 nivel de estudio.
Podemos tomar como muestra a todas las secciones “B” o una parte de ella (submuestra).
Antes de plantear alguna aplicación, veamos cómo determinar el tamaño de una muestra.
Tamaño de una muestra: Calcularemos el tamaño de una muestra usando las siguientes
fórmulas
Donde:
n: Tamaño de la muestra.
N: Tamaño de la población.
P: Proporción de elementos que poseen la característica de interés (puede obtenerse de un
piloto, antecedente o se fija asumiendo máxima variabilidad p = 0,50).
E: % de estimador o en absoluto (unidades). Fijada por el investigador. Generalmente valores
del 1% al 10%.
1 – α: nivel de confianza (α: nivel de significación).
𝑍1−∝ : es el valor de la distribución normal estandarizada para un nivel de confianza fijado por
2
el investigador. De define según el nivel de confianza.
𝑆: desviación estándar de la variable fundamental del estudio o de interés para el
investigador. Obtenida por estudios anteriores.
Nivel de Valor de Z
confianza (1 – α)
90% 1,645
91% 1,695
92% 1,751
93% 1,812
94% 1,881
95% 1,960
96% 2,054
97% 2,170
98% 2,326
99% 2,576
B. Cálculo del valor de P: Se calcula este valor cuando la variable de estudio es cualitativa.
Comportamiento de P y Q
P Q=1–P P.Q
0,05 0,95 0,0475
0,10 0,90 0,090
0,20 0,80 0,160
0,30 0,70 0,210
0,40 0,60 0,240
0,50 0,50 0,250
0,60 0,40 0,240
0,70 0,30 0,210
0,80 0,20 0,160
0,90 0,10 0,090
0,95 0,05 0,0475
Aplicación 1:
• Para estimar la media de una población de notas, de manera que el error de la estimación
no sea mayor a 1,5; con un nivel de confianza del 95% y se sabe que S = 4,25. Determine el
valor de la muestra; si
a) Considere una población de datos infinita.
b) Considere una población de datos 500 estudiantes.
Z(1−∝) × S 2
2
1,96 × 4,25 2
n=( ) =( ) = 30,83951
E 1,5
Z2 ∝ × NS 2
(1− )
2
1,962 × 500 × 4,252
𝑛= = = 29,10
(N − 1)E 2 + Z2 ∝ S2 (500 − 1) × 1,52 + 1,962 × 4,252
(1− )
2
Entonces tomaremos como mínimo n = 30.
Aplicación 2:
Caso a): E = 0,2; 1−∝ = 95% ⟹ 𝑍 = 1,96; como no indican el valor de la proporción,
consideramos P = 0,5 y Q = 0.5
Z(1−∝) 2
2
1,96 2
n=( ) × PQ = ( ) × 0.5 × 0,5 = 24,01
E 0,2
Caso b): E = 0,2; N = 500; 1−∝ = 95% ⟹ 𝑍 = 1,96; como no indican el valor de la
proporción, consideramos P = 0,5 y Q = 0.5
Z2 ∝ × NPQ
(1− )
2
1,962 × 500 × 0,5 × 0,5
n= = = 22,95
(N − 1)E 2 + Z2 ∝ × PQ (500 − 1) × 0,22 + 1,962 × 0,5 × 0,5
(1− )
2
Actividades Propuestas
1) Se desea estimar la media de una población de salarios en dólares, de manera que el error
de la estimación no sea mayor a $18 con un nivel de confianza del 95% si se sabe que S =
$100.
a) Determine el tamaño de la muestra, si consideramos una población infinita.
b) Determine el tamaño de la muestra, si consideramos una población de 500.
2) Estime el valor del error que se comete al seleccionar una muestra de 50 personas; S = 2,4
y un nivel de confianza del 93%.
3) En un lote de frascos para medicina, con una población de 8000 unidades, se desea estimar
la medida de la capacidad en centímetros cúbicos de los mismos. A través de un sondeo
piloto se ha estimado que la desviación estándar es de 2 cm 3. Si queremos tener una
precisión 0.25 cm3, y un nivel de confianza del 95%, ¿De qué tamaño debe ser la muestra?
4) Determine el nivel de confianza con el que se calculó una muestra de 100 personas al medir
la proporción de personas que están en contra de un proyecto de ley. Además, se obtuvo
un error de 0,1027.
5) Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento
en una industria. Se conoce que el peso de un saco que se llena con este instrumento es
una variable aleatoria con distribución normal. Si se supone que la desviación estándar del
peso es de 0.5 kg. Determine el tamaño de muestra aleatoria necesaria con un nivel de
confianza del 95% y el error máximo permitido en menos de 0.1 kg.
6) El administrador del hotel “Costa del Sol” en la ciudad de Cajamarca desea determinar la
proporción de turistas inconformes con las atenciones recibidas en los Baños del Inca ¿De
qué tamaño debe ser la muestra si se considera E = 0,05; nivel de confianza del 95%?
7) En la tabla adjunta se indica las horas de trabajo por día de un grupo de empleados. ¿Cuál
debe ser el tamaño de la muestra que se debe considerar para determinar el tiempo medio
de trabajo de los empleados de una empresa Textil?, de estudios anteriores se tiene que el
error de estimación es de 0,05 horas por día. Use un nivel de confianza del 95%.
12 11 4 8 1 7 7 7 11 7
18 9 11 8 11 7 8 14 7 3
11 9 10 2 7 3 10 2 9 8
7 6 1 6 9 8 9 13 6 7
8 4 6 6 6 7 9 4 7 7
9) Una institución educativa cuenta con 1 546 estudiantes y se desea conocer la estatura
promedio de los estudiantes (en cm), ¿Cuál debe ser el tamaño adecuado de la muestra?,
sabiendo que se obtuvo una desviación estándar de 2,93 cm; un error de 1,05 y un nivel de
confianza del 94%.
Resumen
1. Se puede recopilar información sobre la población de dos maneras: O se enumera cada
unidad de la población (censo) o la enumeración se limita a solo una parte seleccionada de
la población (encuesta por muestreo).
2. Por lo general:
• Al azar simple.
• Al azar sistemático.
• Estratificado.
• Por grupos o conglomerados.
Nivel de Valor de Z
confianza (1 – α)
90% 1,645
91% 1,695
92% 1,751
93% 1,812
94% 1,881
95% 1,960
96% 2,054
97% 2,170
98% 2,326
99% 2,576
Comportamiento de P y Q
P Q=1–P P.Q
0,05 0,95 0,0475
0,10 0,90 0,090
0,20 0,80 0,160
0,30 0,70 0,210
0,40 0,60 0,240
0,50 0,50 0,250
0,60 0,40 0,240
0,70 0,30 0,210
0,80 0,20 0,160
0,90 0,10 0,090
0,95 0,05 0,0475
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://www.youtube.com/watch?v=oc8i9g144Y0
o https://www.questionpro.com/es/tama%C3%B1o-de-la-muestra.html
o https://enciclopediaeconomica.com/muestreo-probabilistico/
• Estimación por intervalos: Se obtiene al estimar dos valores calculados a partir de una
muestra. (a ≤ μ ≤ b; c ≤ σ2 ≤ d; e ≤ P ≤ f)
3.2.1. Definición
s s
x̅ − t 0 × ≤ μ ≤ x̅ + t 0 ×
√n √n
Donde:
t 0 se obtiene de la tabla “t Student” (figura 32), con n – 1 grados de libertad
t 0 = t (1−∝;n−1) .
2
Donde:
𝑍∝ : Valor asignado por nivel de confianza.
𝑝: Proporción.
𝑝̂ : Proporción muestral.
𝑛: Tamaño de la muestra.
Antes de plantear alguna aplicación, veamos cómo determinar el tamaño de una muestra.
Aplicación 1:
Se desea estimar el intervalo para la media de una población, sabiendo que para una muestra
de 30 estudiantes, 𝑥̅ = 11,025; S = 4,25; con un nivel de confianza del 95%.
Como:
∝
1−∝ = 95% = 0,95 ⟹ ∝ = 0,05 ⟹ 1 − 2 = 0,975
𝑛 − 1 = 30 − 1 = 29
Entonces 𝑡0 = 𝑡(1−∝ ; 𝑛−1) = 𝑡(0,975 ; 29) ; buscando t0 en la tabla “t de Student” como se observa
2
en la figura adjunta:
Obtenemos t0 = 2,045.
Además, se tiene de datos: n = 30; 𝑥̅ = 11,025; S = 4,25. Reemplazando en:
𝑠 𝑠
𝑥̅ − 𝑡0 × ≤ 𝜇 ≤ 𝑥̅ + 𝑡0 ×
√𝑛 √𝑛
4,25 4,25
11,025 − 2,045 × ≤ 𝜇 ≤ 11,025 + 2,045 ×
√30 √30
9,4382 ≤ 𝜇 ≤ 12,6118
Aplicación 2:
Se tiene
1−∝ = 95% ⟹ Z = 1,96
N° de mujeres 9
p̂ = = = 0,3
total de la muestra 30
Reemplazando en:
Actividades Propuestas
3) A'Comer es una empresa de bienes de consumo en el Perú, la cual opera en toda América,
la gerencia de esta empresa desea información acerca del ingreso medio de los
colaboradores. Una muestra aleatoria de 25 de ellos revela una media muestral de 3042
soles. La desviación estándar de esta muestra es de 105 soles, ¿Cuál es un conjunto de
1 0 1 1 1 0
0 1 1 0 1 0
1 1 1 0 0 1
1 1 1 0 1 0
0 1 1 1 0 1
5) El gerente del Hipermercado Metro, desea estimar la cantidad media que gastan los clientes
que visitan el hipermercado. Una muestra de 20 clientes revela las siguientes
cantidades.
481,6 422,2 468,3 541,3 238,4 418,5 548,6 379,8 523,6 498,3
508,2 469,4 618,3 616,9 491,5 615,4 515,5 585,4 438,8 687,1
6) Las medidas de los diámetros de una muestra de 200 cojinetes de bolas, hechos por una
determinada máquina durante una semana dieron una media de 0,824 pulgadas y una
desviación típica de 0,042 pulgadas. Hallar los límites de confianza para un nivel de
confianza del 95% y otro para el 99%.
7) Una muestra de 150 votantes elegidos al azar entre todos los de un distrito dado, indicó
que el 60% de ellos estaban a favor de un determinado candidato. Hallar el intervalo de
confianza para la proporción de todos los votantes que estaban a favor de dicho candidato.
Considere:
a) Nivel de confianza 95%.
b) Nivel de confianza 99%.
8) Para estimar el tiempo promedio que los niños de primer grado se demoran en armar un
rompecabezas, un investigador social desarrolló la tarea con 9 de tales niños escogidos al
azar de la población indicada. Los tiempos (en minutos) observados son:
28 25 32 30 35 33 29 28 36
Resumen
1. Con respecto a la estadística inferencial, se tiene:
s s
x̅ − t 0 × ≤ μ ≤ x̅ + t 0 ×
√n √n
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://es.wikipedia.org/wiki/Intervalo_de_confianza
o https://www.youtube.com/watch?v=VQJpcYPfEI4
o https://tumundoeconomia.com/empresas/que-es-el-intervalo-de-confianza/
Definición
Ejemplos:
• Series Económicas:
• Series Demográficas:
• Series Físicas:
Mese En. Feb. Mar. Abr. May Jun. Jul. Ag. Set. Oct. Nov. Dic
s . .
Miles
de 275 138 242 567 684 328 285 295 254 502 635 32
soles 0 2 5 3 2 5 0 0 0 5 2 5
Los datos de la tabla nos permitir ver tendencias, hacer proyecciones y pronosticar ventas
futuras.
2. Estudio de tendencia: La curva que describe la tendencia de una serie cronológica muestra
la evolución general de la serie y puede tomar diversas formas (lineal, parabólica,
exponencial, entre otros).
3. Método de los promedios móviles: Conocido también como movimiento móvil o medias
móviles. Este método permite suavizar la información de las series cronológicas.
Definición: Dada la sucesión x1, x2, x3, …, xn; definimos el promedio móvil de orden k (k < n); con
las siguientes medias aritméticas:
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑘 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑘+1 𝑥3 + 𝑥4 + ⋯ + 𝑥𝑘+2
; ; ;…
𝑘 𝑘 𝑘
Ejemplos:
A continuación, se muestra las notas de grupo de amigos: 18, 12, 08, 13, 08, 10, 13. Calcular el
promedio móvil de orden 4.
Periodo En. Feb. Mar. Abr. May. Jun. Jul. Ag. Set. Oct. Nov. Dic.
Demanda 200 230 260 180 270 240 250 300 320 350 240 210
Periodo En. Feb. Mar. Abr. May. Jun. Jul. Ag. Set. Oct. Nov. Dic.
Demanda 200 230 260 180 270 240 250 300 320 350 240 210
Proyección 230 223 237 230 253 263 290 323 303
Se observa que para el mes de abril se estimó una demanda de 230 productos; pero, la demanda
real fue de 180 productos. Asimismo, para el mes de mayo se proyectó una demanda de 223 en
tanto que la demanda real fue de 270. De igual forma ocurre cada mes.
Actividades Propuestas
1) Se tiene los siguientes datos: 2; 1; 6; 5; 4; 3; 8. Calcular el promedio móvil de orden 3 y de
orden 4.
3) Los envíos para el mercado nacional de tractores agrícolas en el periodo del 2000 al 2007
por la empresa “Máquinas y Herramientas”, figuran en la siguiente tabla:
5) El auditor del sistema educativo público ha estudiado los registros del inventario para
averiguar si el inventario actual de libros de texto es típico. Las siguientes existencias
corresponden a los 5 años precedente.
Ajuste la tendencia, usando promedios móviles determine el valor proyectado para el 2021, si
debe usar el promedio móvil cuyo orden genere menor error en esos 5 años.
Resumen
1. Una serie de tiempo es una realización de un proceso, en forma secuencial y en intervalos
regulares en el tiempo, que tiene un inicio (t0) y un fin (tn). La serie estadística se denomina
serie cronológica.
4. Método de los promedios móviles: Dada la sucesión x1, x2, x3, …, xn; definimos el promedio
móvil de orden k (k < n); con las siguientes medias aritméticas:
x1 + x2 + ⋯ + xk x2 + x3 + ⋯ + xk+1 x3 + x4 + ⋯ + xk+2
; ; ;…
k k k
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o https://www.matematica.uns.edu.ar/uma2016/material/Introduccion_a_los_Modelos_de_
Pronosticos.pdf
o https://economipedia.com/definiciones/proyeccion-de-ventas.html
o https://www.gestiondeoperaciones.net/proyeccion-de-demanda/pronostico-de-demanda-
con-media-movil-simple/
IBM SPSS ofrece una gama de posibilidades para llevar a cabo todo el proceso de análisis de
información. Brinda la información que necesita el investigador para tomar decisiones
acertadas, utilizando procedimientos estadísticos y presentando los resultados en tablas y
gráficos.
En casos prácticos se observa generalmente que casi nunca se encuentran gráficos (polígonos o
histogramas) perfectamente simétricos, de ahí que el grado de asimetría constituye el sesgo.
A. Ventana de edición (data editor): Contiene el archivo de datos con el que se va trabajar.
B. Ventana de salida (output): Donde aparecen los resultados de los análisis estadísticos.
Se pueden archivar para su utilización posterior.
C. Ventana de carrusel de gráficos: Se abre con el primer gráfico generado en una sesión
de SPSS.
D. Ventana de gráficos: Permite modificar y archivar gráficos.
E. Ventana de sintaxis: Se puede pegar en esta ventana la sintaxis de los comandos
seleccionados desde la ventana de diálogo de cualquier opción.
Siempre que hagamos un análisis con SPSS, los resultados irán a la ventana de salida
(output).
2. Menú principal
• File: Permite crear y abrir archivos SPSS. Grabar y leer datos creados con otras
aplicaciones.
• Edit: Contiene las opciones de Windows para copiar y buscar datos, etc.
• Data: Contiene opciones para hacer cambios que afectan a todo el archivo de datos.
• Transform: Permite cambios sobre variables seleccionadas, permite la creación de
nuevas variables.
• Analyze: Esta opción permite ejecutar todos los procedimientos estadísticos.
• Graphs: Esta opción permite realizar todos los gráficos estadísticos.
• Utilities: Esta opción permite cambiar fuente, obtener información completa del archivo
de datos.
• Windows: Permite ordenar, seleccionar, controlar atributos de las ventanas abiertas.
• Help: Permite abrir un archivo estándar de ayuda Windows.
Para realizar cualquier análisis estadístico con el SPSS tenemos que realizar estas tres
operaciones básicas:
Actividades Propuestas
1) Las medidas de los diámetros de una muestra de 200 cojinetes de bolas, hechos por una
determinada máquina durante una semana dieron una media de 0,824 pulgadas y una
desviación típica de 0,042 pulgadas. Hallar los límites de confianza para un nivel de
confianza del 95% y otro para el 99%, usando IBM SPSS.
1 0 1 1 1 0
0 1 1 0 1 0
1 1 1 0 0 1
1 1 1 0 1 0
0 1 1 1 0 1
81 53 67 60 80 64 56 54 91 61
66 88 67 65 97 72 74 65 73 69
43 54 76 70 86 68 82 75 79 60
41 87 76 97 70 45 60 45 65 56
92 72 82 80 52 65 50 58 70 76
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14,
12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 18, 18, 10, 11, 12, 12, 11, 13, 13, 15,
13, 11, 12.
227 231 261 270 291 351 359 369 371 382 387 392 393 395
Arequipa 396 413 420 422 424 436 453 461 463 471 495 498 510 512
533 534 541 542 584 589 591 628 630 630 657 666
217 219 263 287 294 340 346 347 348 377 390 392
Tacna 395 396 397 408 418 424 426 429 438 438 442 446
447 450 456 481 496 508 511 533 549 583 609 636
6) En la tabla adjunta se indica las horas de trabajo por día de un grupo de empleados. ¿Cuál
debe ser el tamaño de la muestra que se debe considerar para determinar el tiempo medio
de trabajo de los empleados de una empresa Textil?, de estudios anteriores se tiene que el
error de estimación es de 0,05 horas por día. Use un nivel de confianza del 95%.
12 11 4 8 1 7 7 7 11 7
18 9 11 8 11 7 8 14 7 3
11 9 10 2 7 3 10 2 9 8
7 6 1 6 9 8 9 13 6 7
8 4 6 6 6 7 9 4 7 7
Resumen
1. IBM SPSS ofrece una gama de posibilidades para llevar a cabo todo el proceso de análisis
de información. Brinda la información que necesita el investigador para tomar decisiones
acertadas, utilizando procedimientos estadísticos y presentando los resultados en tablas y
gráficos.
3. Menú principal
• File.
• Edit.
• Data.
• Transform.
• Analyze.
• Graphs.
• Utilities.
• Windows.
• Help.
Recursos
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o http://wpd.ugr.es/~bioestad/guia-spss/practica-1/
o https://www.youtube.com/watch?v=M3M1Vg0EL_U
o https://www.youtube.com/watch?v=DD8RU8_WyXM
Bibliografía
• Anderson, David R. (2016) Estadística para negocios y economía. 12a ed. México, D. F.:
Cengage Learning.
• Douglas A. Lind, William G. Marchal, Samuel A. Wathen (2015) Estadística aplicada a los
negocios y la economía. México, D.F.: McGraw-Hill.
• Gorgas, J.; Cardierl, N.; Zamorano, J. (2011) Estadística básica para estudiantes de
ciencias. Universidad complutense de Madrid.
• Johnson, Robert (2012) Estadística elemental. 11a ed. México, D. F.: Cengage Learning.
Centro de Información: Código 519.5 JOHN 2012
• Lind, Douglas A. (2015) Estadística aplicada a los negocios y la economía. 16a ed. México,
D. F.: McGraw-Hill.
Centro de Información: Código 519.5 LIND 2015
• Quezada Lucio, Nel (2017) Estadística con SPSS 24. Lima: Editorial Macro.
Centro de Información: Código 519.50285 QUEZ 2017
• Rodríguez Franco, Jesús (2016) Estadística para administración. 2a ed. México, D.F.:
Patria.
Centro de Información: Código 519.5 RODR 2016
• Véliz Capuñay, Carlos (2014) Estadística para la administración y los negocios. 2a ed.
Naucalpan de Juárez: Prentice Hall.
Centro de Información: Código 519.5 VELI/E 2014
• Walpole, Ronald E.; Raymond, H. Myers; Myers, Sharon L.; Ye, Keying (2012)
Probabilidad y estadística para ingeniería y ciencias. México, D.F.: Pearson.