0% encontró este documento útil (0 votos)
156 vistas60 páginas

CE86 - 202001 - Cuaderno de Trabajo PARTE 1 v2 PDF

Este documento presenta un cuaderno de trabajo para el curso de Estadística Aplicada 1. El curso busca que los estudiantes analicen datos estadísticos para tomar decisiones sobre problemas reales relacionados con su profesión. La unidad 1 introduce conceptos básicos como población, muestra, variable y escalas de medición, y explica cómo organizar y presentar datos en tablas y gráficos. También define la estadística descriptiva e inferencial.

Cargado por

Jhon
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
156 vistas60 páginas

CE86 - 202001 - Cuaderno de Trabajo PARTE 1 v2 PDF

Este documento presenta un cuaderno de trabajo para el curso de Estadística Aplicada 1. El curso busca que los estudiantes analicen datos estadísticos para tomar decisiones sobre problemas reales relacionados con su profesión. La unidad 1 introduce conceptos básicos como población, muestra, variable y escalas de medición, y explica cómo organizar y presentar datos en tablas y gráficos. También define la estadística descriptiva e inferencial.

Cargado por

Jhon
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 60

CUADERNO DE TRABAJO

EPE
CE86 ESTADÍSTICA APLICADA 1
EPE 1

EPE
CE86: ESTADÍSTICA APLICADA 1

Descripción breve
Material de trabajo para el curso:
Estadística Aplicada 1
EPE

[Escriba aquí]
2 CE86 Estadística Aplicada 1

Contenido
Estadística Aplicada 1 3
Logro del curso 3
Competencia: Razonamiento cuantitativo 3
Unidad 1. 5
Conceptos Básicos. Organización de datos. 5
Estadística ................................................................................................................................ 5
Subdivisión de la Estadística .................................................................................................... 5
Población ................................................................................................................................. 6
Muestra ................................................................................................................................... 6
Unidad elemental .................................................................................................................... 6
Encuesta .................................................................................................................................. 6
Dato ......................................................................................................................................... 7
Observación ............................................................................................................................. 7
Variable.................................................................................................................................... 8
Escalas de medición ............................................................................................................... 10
Organización y presentación de datos 16
Tabla de distribución de frecuencias para variables cualitativas 17
Representación gráfica de variables cualitativas ................................................................... 18
Tabla de distribución de frecuencias de variables cuantitativas discretas 21
Representación gráfica de variables cuantitativas discretas .................................................. 21
Tabla de distribución de frecuencias: variables cuantitativas continuas 24
Representación gráfica de variables cuantitativas continuas ................................................ 27
Ejercicios propuestos 32
Unidad 2. 36
Medidas de resumen: Medidas de tendencia central, de posición y de variación 36
Medidas de tendencia central 37
Media..................................................................................................................................... 37
Mediana ................................................................................................................................. 38
Moda ..................................................................................................................................... 39
Propiedades de la media aritmética ...................................................................................... 40
Medidas de posición o cuantiles 42
Percentil................................................................................................................................. 43
Medidas de dispersión o variabilidad 44
Varianza ................................................................................................................................. 45
Desviación estándar ............................................................................................................... 45
Coeficiente de variación ........................................................................................................ 45
Medida de asimetría 48
Coeficiente de asimetría de Fisher ......................................................................................... 48
Ejercicios propuestos 55

[Escriba aquí]
EPE 3

Estadística Aplicada 1

LOGRO DEL CURSO


Al finalizar el curso, el estudiante analiza datos estadísticos que le permitan tomar decisiones so-
bre problemáticas reales, propias de su profesión.

Competencia: Razonamiento cuantitativo


Es la capacidad para interpretar, representar, comunicar y utilizar información cuantitativa diversa
en situaciones de contexto real.
Implica calcular, razonar, emitir juicios y tomar decisiones con base en esta información cuantitati-
va.

Dimensiones Indicación sobre lo que hará el estudiante

Habilidad para identificar el problema a resolver en el contexto de la situa-


ción.

¿Qué significa?

Interpretación El estudiante redacta el problema, con un lenguaje sencillo, como pre-


gunta u objetivo

Habilidad para elegir la herramienta, fórmula o técnica estadística que


usará para resolver el problema.

¿Qué significa?

Representación El estudiante indica la variable, tabla, gráfico, medida y/o herramienta


estadística que utilizará en la solución del problema.

Habilidad de calcular para obtener los resultados.

¿Qué significa?

El estudiante muestra los cálculos realizados para dar respuesta al pro-


blema.

Cálculo

[Escriba aquí]
4 CE86 Estadística Aplicada 1

Habilidad de entender los resultados.

¿Qué significa?

Análisis El estudiante indica con que valor calculado responde el problema.

Habilidad de comunicar y sustentar la decisión final en base a su análisis.

¿Qué significa?

El estudiante redacta la decisión que tomará a partir del resultado de su


Argumentación análisis.

[Escriba aquí]
EPE 5

Unidad 1.
LOGRO
Al finalizar la unidad 1, el estudiante elabora y analiza datos organizados en tablas y gráficos.

Conceptos Básicos. Organización de datos.

Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, organizar,
presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Subdivisión de la Estadística

Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación de
datos, que permiten describirlos apropiadamente.
Comprende el uso de gráficos, tablas e indicadores de resumen obtenidos al
realizar algunos cálculos.

Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más características
de una población o tomar decisiones referentes a una población, basados Flash
en los resultados obtenidos del estudio de muestras elegidas adecuada- electoral
mente.

Estas conclusiones no tienen que ser totalmente válidas, pueden tener cier-
to margen de error, por eso se dan con una medida de confiabilidad o pro-
babilidad.

[Escriba aquí]
6 CE86 Estadística Aplicada 1

Población
Es el conjunto de todas las unidades elementales de interés en un determinado estudio.
Pueden ser personas, animales, objetos, conceptos, etc. de los cuales sacamos conclusiones a partir de una
o más características observables de naturaleza cualitativa o cuantitativa

Muestra
Es una parte o un subconjunto de la población que se selecciona adecuadamente para obtener información
acerca de la población de la cual proviene.
Una muestra será representativa si es elegida de forma aleatoria.

Unidad elemental
Es el objeto sobre el cual se hace la medición. También se le conoce como unidad de análisis, unidad esta-
dística o elemento
Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada
individuo.

Censo vs Encuesta
Un censo es un método para recopilar datos de toda una población. Los datos recopilados, sobre las varia-
bles de estudio, son precisos y detallados.
Una encuesta es un método de recopilación de datos de parte de una población que puede enfocarse en
conocer diferentes tipos de temas e información, como opiniones, comportamientos, preferencias de con-
sumidores, etc.

[Escriba aquí]
EPE 7

Ejercicio 1
La empresa SAI, Systems Artificial Intelligence, se dedica al desa-
rrollo de sistemas basados en inteligencia artificial y está confor-
mada por un equipo de especialistas de ingeniería industrial y de
sistemas. Para cumplir con las metas del próximo año, la empresa
actualmente se ha sometido a un proceso de evaluación. Por tal
motivo la empresa evaluadora ha seleccionado al azar 105 pro-
ductos de sistemas de inteligencia artificial desarrollados en los
últimos cinco años.
Determine la población, muestra, unidad elemental.

Población

Muestra

Unidad elemental

Ejercicio 2
La empresa constructora Concreto S.A., para realizar un control de calidad de sus instrumentos, está anali-
zando 158 teodolitos electrónicos actualmente en uso. El propósito es estimar la vida útil promedio de es-
tos instrumentos. Determine:

Población

Muestra

Unidad elemental

Ejercicio 3
Se desea estimar el promedio diario de clientes que ingresan a Promart, para lo cual se decide elegir cinco
días al azar del presente mes y registrar el número de clientes que ingresó cada día a la tienda. Determine:

Población

Muestra

Unidad elemental

Dato
Es el resultado de medir una característica de una unidad elemental.

Observación
Es el conjunto de datos obtenidos al medir las características de una unidad elemental.
La observación o registro se obtiene para cada unidad elemental.

[Escriba aquí]
8 Dato Dato 1
CE86 Estadística Aplicada

Observación o Registro
Variable
Se define así a una característica que presentan los elementos de una población y que puede asumir dife-
rentes valores cuando se realiza su medición.

Variables cualitativas

También son conocidas como categóricas. Son aquellas variables que al ser medidas quedan expresadas por
etiquetas o nombres que se utilizan para identificar una característica o atributo.

Variables cuantitativas

Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para identificar una
característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.

 Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o infinito numera-
ble, es decir, que sólo puede tomar ciertos valores en un intervalo determinado.
 Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no numerable, es decir,
que puede tomar cualquier valor en un intervalo determinado.

[Escriba aquí]
EPE 9

Ejercicio 4
La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la empresa
produce principalmente barras de acero dulce siendo su principal mercado el sector de la construcción. Al
departamento de control de calidad se le ha encargado realizar un estudio sobre las devoluciones. Al selec-
cionar una muestra aleatoria de 80 barras de aceros dulce de la sección de devoluciones del almacén, se
midieron las siguientes características:

1.- Uso más frecuente de barras de acero dulce:


 Estribos  Vigas cajón
 Tableros  Vigas
 Losas
3.- Resistencia a la tracción: ………………… (Kg/cm2)
4- Categoría del límite a afluencia
 Alta  Regular  Baja
5.- Tipo de defecto
 Pliegues  Marcas mecánicas  Porosidad
 Grietas  Fisuras  Corrosión

Considerando esta información, determine la población bajo estudio, la muestra analizada, la unidad ele-
mental y el tipo de variable.

Población

Muestra

Unidad elemental

Ejercicio 5
La empresa SAI, Systems Artificial Intelligence, se dedica al desarrollo de sistemas basados en inteligencia
artificial y está conformada por un equipo de especialistas de ingeniería industrial y de sistemas. Para
cumplir con las metas del próximo año, la empresa actualmente se ha sometido a un proceso de evalua-
ción. Por tal motivo la empresa evaluadora ha seleccionado al azar 105 productos de sistemas de inteli-
gencia artificial desarrollados en los últimos cinco años. Las características de interés auditadas son:
 Utilidades (en cientos de miles de soles)
 Tiempo de desarrollo (días)
 Número de programadores.
 Tipo de problemas: Falta de programadores, pocas capacitaciones, insuficientes reuniones de coordi-
nación, falta de diseñadores.
 Nivel de dificultad: Básico, promedio, avanzado.
Determine la población, muestra, unidad elemental, variables tipo de cada variable.

Población

Muestra

Unidad elemental

[Escriba aquí]
10 CE86 Estadística Aplicada 1

Variable Tipo

I.
II.
III.
IV.
V.

Escalas de medición
Otra forma común de clasificar las variables es mediante el uso de cuatro niveles de medición; nominal,
ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales el nivel de medición de
las variables es un factor importante para determinar el procedimiento a usar.

Escala nominal Escala ordinal Escala de interva- Escala de razón


Los diferentes valores La escala de medición lo La escala de medición
que toma una variable ordinal permite esta- Los datos son numéri- de razón tiene las pro-
medida en escala no- blecer un orden entre cos. La escala de medi- piedades de la escala
minal carecen de un los diferentes valores ción de intervalo tiene de intervalo con la
orden o de un signifi- que toma la variable. las propiedades de la propiedad adicional de
cado numérico, no En esta escala de medi- escala ordinal, pero tener un punto de par-
pueden utilizarse para ción no es posible de- con la característica tida natural o cero, que
realizar cálculos. A terminar las diferencias adicional que la dife- indica que nada de la
menudo se asignan entre los valores de la rencia entre dos valo- variable se encuentra
números a las diferen- variable o tales dife- res cualquiera de la presente. Para esta
tes categorías, pero no rencias carecen de variable tiene un signi- escala de medición
tienen significado sentido. ficado. Sin embargo, además de las diferen-
computacional y cual- los valores en esta es- cias, las proporciones
quier promedio que se cala no tienen un pun- también tienen signifi-
calcule carece de sen- to de partida natural o cado.
tido. cero.

[Escriba aquí]
EPE 11

Ejercicio 6
Las redes basadas en cableado de fibra óptica están muy extendidas en su uso dentro del entorno de las
telecomunicaciones y redes de área local. Poseen una gran capacidad para transmitir datos.
Habitualmente el profesional que demanda un cableado de fibra óptica lo hace para conectar puntos con
gran necesidad de caudal de información, o bien para establecer líneas de datos de alta seguridad.
Optical Network, empresa dedicada al cableado de fibra óptica, como parte de un estudio, analiza la infor-
mación recopilada correspondiente a las siguientes variables:

I. Tipos de instalación más solicitada (Aprovechando una canalización existente, Tendido aéreo, Tendido
por fachada, Realizando obra civil)
II. Cantidad de servidores por empresa.
III. Costo de instalación (en dólares)
IV. Modelo de pistola pasacable usada (EZ50, EZ100, EZ300). Ordenadas por orden cronológico y mejoras
realizadas.

Identifique el tipo de variable y la escala de medición correspondiente.

Variable Tipo Escala

I.
II.
III.
IV.

Ejercicio 7
Complete la siguiente tabla:

Variable Tipo Escala de medición

Número de celular

Longitud de cable de fibra óptica


usado en una instalación industrial
Marca de un medidor láser de distan-
cia

Tiempo de vida útil de una laptop.

Peso de un celular, en kilogramos

Grado en el ejército (general, coronel,


comandante, etc.)
Kilometraje de un auto
Tamaña de una bebida (personal,
mediana, grande)

[Escriba aquí]
Parámetro Estadístico
Un estadístico o estimador es un valor que repre-
Un parámetro es un valor que representa alguna
senta alguna característica de la muestra.
característica de la población.

Algunos parámetros y estadísticos que se pueden calcular son:

Ejemplo 1.
En este ejemplo, el parámetro es <porcentaje poblacional de votantes que lo hicieron por FREPAP> y su
valor es 9.66%. Es parámetro pues el porcentaje se calculó considerando todos los votos válidos.

Fuente: ONPE. Resultado de elecciones congresales al 100% de actas

Ejemplo 2.
En este ejemplo, el estadístico es <porcentaje muestral de electores que votarían a favor de los candidatos
del partido morado>. Es estadístico pues el porcentaje fue calculado de una muestra obtenida antes de la
votación. Su valor: 4%
EPE 13

Fuente: Ipsos-Perú

Ejercicio 8
El banco A estudió la información que dieron sus clientes en el presente mes al solicitar un préstamo vehi-
cular. Al analizar una muestra de 180 clientes se obtuvieron algunos resultados que se muestran:
• El 12% declaró tener un trabajo independiente.
• La media de la edad de los clientes al solicitar un préstamo fue de 41,3 años.
• El 50% declaró ser casado.
• La media del monto de las solicitudes fue de 3025 soles.
Identifique el estimador y el valor del estimador para cada una de las variables.
Solución

Variable Estimador Valor

Ejemplo 3.
El hotel La Posada es nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publici-
dad para incrementar la cantidad de huéspedes extranjeros en el hotel. Se desea conocer qué característi-
cas del hotel es conveniente resaltar en la publicidad, para ello aplicó una encuesta a una muestra aleatoria
de 56 mujeres y 64 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A conti-
nuación, se presenta parte de la base de datos:

Precio dispuesto Número de


País de
N° Edad Género a pagar por habi- acompañantes Criterio de selección del hotel
procedencia
tación en dólares por viaje

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio


2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio

[Escriba aquí]
14 CE86 Estadística Aplicada 1

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados


6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
… … … … … … …

Después de procesar la información se obtuvieron los siguientes resultados:


 El 34% de los huéspedes extranjeros procede de los Estados Unidos.
 La edad promedio de los huéspedes es de 35,2 años.
 El número de acompañantes por huésped extranjero más frecuente es de dos personas.
 El criterio de selección más frecuente es el precio.
Responda a las siguientes preguntas:
a. Determine la población, la muestra y la unidad elemental.
b. ¿Cuántas observaciones hay?
c. ¿Cuántos datos conforman una observación?
d. ¿Cuántos datos hay en total?
e. Proporcione un ejemplo de dato y uno de observación.
f. Indique la escala y el tipo de cada variable.
g. Identifique el estimador y el valor del estimador para cada variable de la base de datos.

Solución
a. Determine la población, la muestra y la unidad elemental.
Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada entre
Población
enero y mayo del presente año.
(Algunos) 120 huéspedes extranjeros que se hospedaron en el hotel La Posada
Muestra
entre enero y mayo del presente año.
Un huésped extranjero que se hospedó en el hotel La Posada entre enero y mayo
Unidad elemental
del presente año.

b. ¿Cuántas observaciones hay? Hay 120 observaciones


c. ¿Cuántos datos conforman una observación? Seis datos, pues hay seis variables.
d. ¿Cuántos datos hay en total? Hay 720 datos (6 x 120)
e. Proporcione un ejemplo de dato y uno de observación.

Dato X4 = 65 años
Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio
f. Indique la escala y el tipo de cada variable.

Variable Tipo de variable Escala de medición

Edad Cuantitativa continua Razón

Género Cualitativa Nominal

País de procedencia Cualitativa Nominal

Precio dispuesto a pagar por habitación Cuantitativa continua Razón

Número de acompañantes por viaje Cuantitativa discreta Razón

Criterio de selección del hotel Cualitativa Nominal

[Escriba aquí]
EPE 15

g. Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.

Variable Estimador Valor del estimador


Proporción de huéspedes que
Lugar de procedencia 0,34
procede de EEUU
Edad de los huéspedes Promedio 35,2 años
Número de acompañantes Moda 2
Criterio de selección del hotel Moda Precio

[Escriba aquí]
16 CE86 Estadística Aplicada 1

Organización y presentación de datos


Luego de aplicar una encuesta a una muestra de 30 empleados, una empresa obtiene la siguiente base de
datos. Se pide redactar un informe que resuma la información.

Base de datos sobre satisfacción laboral


Tiempo en Número de Promoción posi- Número de Relación con
Género Función Edad Ingreso anual
la empresa promociones ble capacitaciones la gerencia

Femenino Obrero 19 1 11 400 0 Improbable 1 Buenas


Masculino Profesional 31 5 210 600 2 No está seguro 2 Buenas
Masculino Profesional 34 8 193 400 1 Probable 2 Buenas
Masculino Servicios 36 15 30 800 1 Improbable 0 Buenas
Masculino Obrero 44 4 9 850 0 Improbable 1 Regulares
Masculino Obrero 44 10 9 800 0 Improbable 1 Regulares
Masculino Técnico/ventas 31 5 40 840 0 Improbable 3 Buenas
Femenino Profesional 37 8 93 700 1 No está seguro 2 Buenas
Masculino Obrero 45 23 10 150 0 Improbable 1 Regulares
Masculino Obrero 54 18 9 050 0 Muy improbable 1 Regulares
Femenino Profesional 26 2 62 200 2 No está seguro 2 Buenas
Masculino Obrero 44 14 10 200 0 Probable 0 Regulares
Masculino Técnico/ventas 31 2 40 335 0 Muy improbable 2 Buenas
Femenino Producción 28 10 30 990 1 Muy improbable 1 Buenas
Femenino Obrero 23 5 9 360 1 Muy improbable 1 Buenas
Femenino Producción 38 20 33 800 0 Muy improbable 1 Buenas
Masculino Producción 38 9 35 500 1 Muy improbable 2 Buenas
Masculino Técnico/ventas 32 2 40 540 0 Improbable 2 Buenas
Masculino Servicios 36 18 27 500 1 Muy improbable 1 Buenas
Femenino Obrero 48 25 10 200 0 Muy improbable 1 Buenas
Masculino Obrero 45 20 9 650 0 Improbable 1 Regulares
Femenino Técnico/ventas 22 2 44 000 0 No está seguro 2 Buenas
Masculino Técnico/ventas 32 6 48 560 1 Improbable 2 Buenas
Masculino Obrero 46 20 10 300 0 Muy improbable 1 Regulares
Masculino Profesional 28 1 108 700 3 Improbable 5 Buenas
Femenino Producción 27 5 30 550 1 Muy improbable 2 Buenas
Masculino Producción 38 14 32 300 0 Muy improbable 1 Buenas
Masculino Obrero 40 20 9 130 0 No está seguro 0 Regulares
Masculino Profesional 24 1 70 000 1 Probable 3 Buenas
Masculino Obrero 56 30 9 740 0 Muy improbable 1 Regulares

[Escriba aquí]
EPE 17

Tabla de distribución de frecuencias o tablas estadísticas

Frecuencias absolutas, relativas y porcentuales

 La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa clase.
 La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa clase.

frecuencia absoluta fi
Frecuencia relativa hi   
número de datos n
 La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.

Frecuencia porcentual pi   hi  100%

Tabla de distribución de frecuencias para variables cualitativas


Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la columna
de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la variable.

 Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias absolutas y relativas.
 Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias acumula-
das absolutas y relativas.

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi
f
Categoría 1 f1 h1  1 p1  h1  100
n
f
Categoría 2 f2 h2  2 p2  h2  100
n
… … … …
fk
Categoría k fk hk  pi  hi  100
n
Fuente: ……………………………………..

Título de una tabla de distribución de frecuencias

De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:


Distribución de <unidades elementales> según <variable>

[Escriba aquí]
18 CE86 Estadística Aplicada 1

Ejercicio 9
Motores S.A. es una empresa que brinda servicios de mantenimiento y reparación de autos. El último se-
mestre reporta se siguiente información sobre la función del trabajador dentro de la empresa:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional
a. Presente la tabla de distribución de frecuencias.
b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
c. Realice e interprete el gráfico de barras de frecuencias absolutas.

Solución
a. Presente la tabla de distribución de frecuencias.
Título: ……………………………………………………………………………………………………………………………………….
Función fi hi pi
Obrero
Producción
Profesional
Servicios
Técnico
Total
Fuente: ……………………………………………………………………………

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.


f1 = de un total de ……….………………... trabajadores, ………………..……. son ……………………..……………
p1 = el ………………….….……% de los trabajadores son ………………………………..………………………….……

Representación gráfica de variables cualitativas

Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de
ordenadas las frecuencias absolutas, relativas o porcentuales.

Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el
círculo que es proporcional a la frecuencia que representan. También se de-
nomina diagrama de sector circular, gráfico tipo torta o pastel.

Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de


barras.

Ejemplo 4.

[Escriba aquí]
EPE 19

La universidad A realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de co-
nocer sus preferencias profesionales. De los datos obtenidos se construyó la siguiente tabla:

Distribución de estudiantes según su preferencia profesional


Preferencia profesional fi hi pi
Administración 5 0.1667 16.67%
Gastronomía 6 0.2000 20.00%
Derecho 4 0.1333 13.33%
Deporte 3 0.1000 10.00%
Ingeniería 8 0.2667 26.67%
Periodismo 4 0.1333 13.33%
Total 30 1.0000 100.00%
Fuente: Universidad A

a. Presente el gráfico de barras de frecuencias porcentuales.

Interpretación
Del gráfico se puede observar que el 26.7% de los estudiantes prefieren la carrera de Ingeniería y solo el
10% prefiere la carrera de Deporte.

b. Presente el gráfico circular de frecuencias porcentuales.

Interpretación

[Escriba aquí]
20 CE86 Estadística Aplicada 1

Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y solo el
10% prefiere la carrera de Deporte.

Ejercicio 10
Motores S.A. es una empresa que brinda servicios de mantenimiento y reparación de autos. El último se-
mestre reporta la siguiente información sobre la función del trabajador dentro de la empresa:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional

Realice e interprete el gráfico de barras de frecuencias relativas.

Solución

Interprete:
La frecuencia relativa simple de la cuarta categoría

[Escriba aquí]
EPE 21

Tabla de distribución de frecuencias de variables cuantitativas discretas

Distribución de <unidades elementales> según <variable>


Valores de la variable Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
discreta absoluta fi relativa hi acumulada Fi acumulada Hi
f
x1 f1 h1  1 F1  f1 H1  h1
n
f
x2 f2 h2  2 F2  f2  F1 H2  h2  H1
n
… … … … …
fk
xk fk hk  Fk  fk  Fk 1 Hk  hk  Hk 1
n
Fuente:……………………………………………………………………………………..

Representación gráfica de variables cuantitativas discretas

Gráfico de bastones o de varas


Por lo general, el gráfico de bastones es utilizado cuando la variable cuantitativa es discreta.
Su uso es adecuado cuando existen muchas observaciones, pero pocos valores de la variable.

Ejemplo 5.
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores (trabajado-
res) de la empresa Creativa en lo que va del año.
1 2 2 0 1 1 3 2 1 1 2 0 2 1 1 1 2 2 1 1 1 2 2 1 5 2 1 0 3 1

a. Presente la tabla de distribución de frecuencias.


Distribución de colaboradores según número de capacitaciones recibidas
Número de capacitaciones fi hi Fi Hi
0 3 0.100 3 0.1000
1 14 0.467 17 0.5667
2 10 0.333 27 0.9000
3 2 0.067 29 0.9667
5 1 0.033 30 1.0000
Total 30 1.000
Fuente: Empresa Creativa

b. Interprete f2 , F2 , h3 y H2%

[Escriba aquí]
22 CE86 Estadística Aplicada 1

f2 = 14 De 30 colaboradores, 14 han recibido solo una capacitación al año


F2 = 17 De 30 colaboradores, 17 han recibido de una a menos capacitaciones al año
h2 = 0,467 La proporción de colaboradores que han recibido solo una capacitación al año es 0,467
H2%= 56,7% El 56,7% de los colaboradores han recibido de una a menos capacitaciones al año
c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.

Interpretación
De un total de treinta colaboradores, catorce de ellos han recibido una capacitación y solo un colaborador
ha recibido cinco capacitaciones en lo que va del año

Ejercicio 11

Calcule e interprete f2 y h1

Ejercicio 12
[Escriba aquí]
EPE 23

Luego de un periodo de tres meses de entrenamiento, los trabajadores que se integran a la empresa meta-
lúrgica Meppsa S.A. deben asistir a un máximo de 6 capacitaciones el primer año. A continuación, se mues-
tra el número de capacitaciones a las que asistieron los trabajadores incorporados a la empresa el último
año:

1 6 3 4 6 3 2 3 6 3 3 4 6 3 6 3 3 6 4 1
2 6 4 3 1 6 2 4 1 2 2 3 6 3 4 2 1 4 6 2

Solución
a. Presente la tabla de distribución de frecuencias.
Título: …………………………………………………………………..……………………………………………………………………………
fi hi Fi Hi

Fuente: …………………………………………………………………………………

b. Interprete los siguientes valores:

f3 = …………...

F2 = ………..…
h1 = …………..
H4 = …………..

c. Presente e interprete el gráfico de bastones.

[Escriba aquí]
24 CE86 Estadística Aplicada 1

Tabla de distribución de frecuencias: variables cuantitativas continuas

Cantidad de clases o intervalos


 Se recomienda usar entre 5 y 20 clases, inclusive.
 La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas, porque pue-
de ocurrir que varias contengan ningún o pocos elementos.
 Para determinar el número de clases se puede usar la regla de Sturges:
Regla de Sturges: k = 1 + 3,322 x log n
Si la estimación tiene decimales, se toma el entero más próximo (redondeo simple).

Amplitud o ancho de cada clase


 Usualmente se usa el mismo ancho para todas las clases.
 Se calcula de la siguiente manera:
rango r
Amplitud  w  
k k
 La amplitud del intervalo debe tener la misma cantidad de cifras decimales que tienen los datos origina-
les.
 El redondeo empleado es el redondeo a más (o por exceso).
Por ejemplo:
w
Si los datos tienen
(redondeo a más)
Cero decimales w = 50.2381 w = 51
Una cifra decimal w = 50.2381 w = 50.3
Dos cifras decimales w = 50.2381 w = 50.24
Dos cifras decimales w = 0.38000
Dos cifras decimales w = 0.38001

Marcas de clase
 Son los puntos medios de los límites de cada intervalo.
'
 Su notación es X i
 Se calcula de la siguiente manera:
Límite inf erior  Límite sup erior LI  LS
Xi'  
2 2
Límites de cada clase
 Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y sólo a
una.
 El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase y el límite supe-
rior de clase es el valor máximo posible de los datos que se asigna a la clase.

Ejemplo 6.

[Escriba aquí]
EPE 25

El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que pagan
los vecinos del distrito. Los datos de los pagos de impuestos, en soles, de 48 viviendas elegidas al azar en el
2015 son:
145.1 216.3 252.5 303.6 196.9 234.8 265.2 317.2 206.5 242.9 289.1 331.7
151.0 225.9 257.1 305.8 202.6 238.4 271.0 320.2 208.0 244.0 291.0 344.6
159.0 227.1 259.2 315.4 204.9 239.9 286.7 324.8 208.0 247.7 291.9 346.7
195.6 231.2 262.5 315.5 206.1 241.1 288.1 331.1 209.3 249.5 294.5 351.1
Elabore la tabla de frecuencias para la variable “Pago por impuestos municipales” para el presente año.

Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145,1 = 206

Número de intervalos es: k  1  3,322log10 n  1  3,322log10 (48)  6,585  7 (redondeo simple)

r 206
La amplitud se calcula por: w   29,429  29,5
k 7

Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un decimal.

A continuación, la tabla de distribución de frecuencias.

Distribución de viviendas según pago de impuesto municipal (en soles)


Pago de impuestos Marca de clase fi hi Fi Hi
[145.1 ; 174.6] 159.85 3 0.0625 3 0.0625
]174.6 ; 204.1] 189.35 3 0.0625 6 0.1250
]204.1 ; 233.6] 218.85 10 0.2084 16 0.3334
]233.6 ; 263.1] 248.35 12 0.2500 28 0.5834
]263.1 ; 292.6] 277.85 7 0.1458 35 0.7292
]292.6 ; 322.1] 307.35 7 0.1458 42 0.8750
]322.1 ; 351.6] 336.85 6 0.1250 48 1.0000
Total 48 1.000
Fuente: Oficina de Rentas de la Municipalidad

Interprete:

f2 = 3 En tres viviendas pagaron más de 174.60 soles y hasta de 204.10 soles

F2 = 6 En seis viviendas pagaron hasta 204.10 soles

h3 %= 20.84% El 20.84% de las viviendas pagaron más de 204.10 soles y hasta 233.6 soles

H3 %= 33.34% El 33.34% de las viviendas pagaron hasta 233.60 soles

Ejercicio 13
MetalTec es una empresa que brinda servicios de instalación, mantenimiento y reparación de estructuras
metálicas que viene operando desde el año 2005. La gerencia se ha propuesto evaluar la eficiencia para

[Escriba aquí]
26 CE86 Estadística Aplicada 1

atender los pedidos de sus clientes. Con este propósito selecciona aleatoriamente una muestra de registros
de ventas resaltando siguientes características:
 Tiempo que se tarda para atender un pedido.
 Nivel de satisfacción del cliente (completamente satisfecho, satisfecho, poco satisfecho nada satisfecho)
 Distrito en el que se encuentra el cliente.
Algunos de los resultados obtenidos luego de analizar la muestra, fueron:
 El tiempo promedio de atención es de 52 minutos.
 En cuanto al nivel de satisfacción el 31.5% estaban completamente satisfecho, 33.7% satisfecho, 29.2% poco
satisfecho y el resto nada satisfecho.
 El 30% de los pedidos son realizados en el distrito de Ate.
a) Determine la población, muestra, variables, tipo de variables, escalas de medición

Población

Muestra

Unidad elemen-
tal

Variable Tipo Escala

I.
II.
III.

b) Los tiempos en atender los pedidos (minutos), se presentan a continuación:


73.7 69.3 32.2 33.7 64.9 10 99.3
3.6 15 24.6 35 23.7 66 36.8
7.3 58.5 31.8 6.7 53.9 63.9 24.2
7.6 73.8 85.9 15.7 88.3 50.3 79.3
9.9 12.3 10.1 12.6 42 5.1 85.9
Presente los datos en una tabla de frecuencia.

Solución
Cálculo de los límites de los intervalos

Máximo =MAX(datos)
Mínimo =MIN(datos)
Rango =MAX(datos) – MIN(datos)
Cantidad de datos (n) =CONTAR(datos)
k (por regla de Sturges) =1+3,322*LOG10(n)
k (entero)
w (amplitud) =Rango/k (entero)
w (redondeada por exceso)

Distribución de ……………………… según ……………………..….


Tiempo de servicio Marca de clase fi hi Fi Hi

[Escriba aquí]
EPE 27

  
  
  
  
  
  
  

Fuente: …………………………….

Interprete:

f4 = …………..

F2 = ………….

h1 = …………..

H4 = ………….

Representación gráfica de variables cuantitativas continuas


Histograma

Este gráfico se realiza a partir de una tabla de frecuencias absolutas, relativas o porcentuales.
 Se traza colocando la variable sobre el eje horizontal y las frecuencias
sobre el eje vertical.
 Cada frecuencia de clase se representa trazando un rectángulo, cuya base
es el intervalo de clase sobre el eje horizontal y cuya altura es proporcio-
nal a la frecuencia correspondiente.
 Los rectángulos adyacentes se tocan entre sí.

Ejercicio 14
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa A.
Título: …………….………………………………………………………………………………………………………………………………
Marca de clase fi hi Fi Hi
[10 , 20 6
20 , 30 15
30 , 40 45
40 , 50 63
50 , 60 80
Total
Fuente: Empresa A

[Escriba aquí]
28 CE86 Estadística Aplicada 1

Grafique el histograma de frecuencias relativas.


Solución

Fuente: …………………………………………………………………….
Interpretación

Ejemplo 7.
La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el poco
monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de administración
que eligiera, del mes de enero, una muestra de clientes de Lima y registró el monto que costaron sus lla-
madas, en soles.

El encargado mostró los resultados en una tabla de distribución de frecuencias:

Distribución de clientes según monto de las llamadas (en soles)


Monto de llamadas Marca de clase fi hi Fi Hi
0  10  5 12 0.1000 12 0.1000
10 20  15 22 0.1833 34 0.2833
20 30  25 45 0.3750 79 0.6583
30 40  35 23 0.1917 102 0.8500
40 50  45 12 0.1000 114 0.9500
50 60  55 6 0.0500 120 1.0000
Total 120 1
Fuente: Área de Administración

Grafique el histograma de frecuencias porcentuales.

[Escriba aquí]
EPE 29

Solución

Interpretación
A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores a 20 y
como máximo de 30 soles y que solo el 5% de estos clientes tienen montos superiores a 50 y como máximo
de 60 soles.

Diagrama de Pareto
El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar en un determinado problema.
La regla de Pareto propone: “El 80% de los problemas que ocurren en cualquier actividad son ocasiona-
dos por el 20% de los elementos que intervienen en producirlos”. Esto también se conoce como “los
pocos vitales y muchos triviales”

Se usa principalmente para:


 Buscar causas principales que generan la mayoría de los problemas reportados
 Identificar oportunidades para mejorar
 Identificar productos para mejora de la calidad
 Evaluar los resultados de cambios en el proceso comparando diagramas sucesivos

Pasos para su construcción:

1. Construya la distribución de frecuencias ordenando las categorías en forma decreciente respecto


de la frecuencia absoluta simple. La categoría “Otros” es ubicada en la última posición sin importar
cuán grande sea su frecuencia
2. Dibujar un eje vertical derecho, un eje vertical izquierdo y un eje horizontal
3. En el eje vertical derecho: usar una escala de 0% a 100%
4. En el eje vertical izquierdo: usar una escala de 0 hasta el total de observaciones (n)
5. En el eje horizontal: considerar las categorías de la variable cualitativa ya ordenadas (paso 1)
6. Elaborar el gráfico de barras considerando el eje vertical izquierdo y el gráfico de líneas consideran-
do el eje vertical derecho (Curva de Pareto)

Ejemplo 8.
La siguiente tabla muestra información ordenada de Defensa Civil sobre los defectos observados con mayor
frecuencia en los puentes vecinales construidos en estructura de madera de cierta localidad del interior del
país:

[Escriba aquí]
30 CE86 Estadística Aplicada 1

Defectos fi hi Hi Hi%
Pandeos y rajaduras 40 0.32 0.32 32
Pudrimiento de las piezas 30 0.24 0.56 56
Efectos del desgaste 20 0.16 0.72 72
Deformaciones 15 0.12 0.84 84
Ataques de insectos 10 0.08 0.92 92
Acción de fuego 5 0.04 0.96 96
Otros 5 0.04 1 100
Total 125 1

Con la información mostrada construya un gráfico de Pareto y determine los principales defectos a ser
atendidos con prioridad que generan como máximo un 75% de los defectos reportados.

Fuente: Defensa civil

Gráfico de Pareto con Excel:

Elaborada la tabla de frecuencias, con


las categorías ya ordenadas, seleccione
la columna de categorías, la columna fi,
CTRL, columna Hi

[Escriba aquí]
EPE 31

Del menú principal elegir “Insertar”, “gráfi-


cos recomendados”, “Todos los gráficos”,
“Cuadro combinado”

 Luego, doble clic sobre la línea horizontal, elegir “Eje secundario”


 Doble clic sobre el eje vertical izquierdo: Máximo = número de datos, Mínimo = 0
 Doble clic sobre el eje vertical derecho: Máximo = 1, Mínimo = 0
 Finalmente se debe configurar el título principal y los títulos de los ejes verticales y horizontal

[Escriba aquí]
32 CE86 Estadística Aplicada 1

Ejercicios propuestos

1. El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el departamento de


Lima y por las consecuencias que esto podría generar, especialmente en algunos distritos como el Cer-
cado de Lima. Por esta razón Defensa Civil realizó un diagnóstico de la situación de las viviendas en el
mencionado distrito a través de una muestra de 1200 viviendas seleccionadas al azar. Se registraron
las siguientes variables:
I. Tiempo de construida la vivienda (años).
II. Tipo de material usado en la construcción (1 = Cemento, 2 = Adobe, 3 = Quincha, 4: Material prefa-
bricado)
III. Número de habitaciones por vivienda.
IV. Área del terreno en donde se construyó la vivienda.

a. De acuerdo al enunciado anterior identifique la población, la muestra y unidad elemental.


b. Identifique el tipo de variable y la escala de medición de cada variable.

2. Indique el tipo de variable y la escala de medición de las características observadas al analizar una
muestra de secciones de tuberías de agua.

Variable Tipo de variable Escala de medición


Diámetro de la tubería (pulgadas)
Material de la tubería
Año de instalación

Ubicación (subterránea, aérea)


Longitud de la tubería (pies)
Estabilidad del suelo circundante (inestable,
moderadamente estable o estable)

Corrosividad del suelo circundante (corrosivo o


no corrosivo)

3. Se encuestó a 245 estudiantes de la universidad A. Se sabe que en esta universidad el 72% del alum-
nado pertenece al área de Humanidades y el resto al área de Ciencias.
Después de procesar la información muestral se obtuvo que:
 56% eran mujeres,
 el 33,2% prefiere el rock como género musical,
 el 45,7% gusta de la emisora 104,7 VIVA F.M.
 la media del número de veces que un oyente llamó a la radio en el último mes fue de 2,86 llamadas
y la moda de esa misma variable fue igual a uno.
Identifique el estimador o parámetro y su valor para cada una de las variables.

4. A un grupo de compradores de auto tomados al azar, se les preguntó sobre el color de su auto. Los
resultados obtenidos fueron:
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde Blanco Azul
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul Verde Negro
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde Blanco Negro
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco Azul Blanco
[Escriba aquí]
EPE 33

a. Presente la tabla de distribución de frecuencias que resuma la información de la variable.


b. Realice un gráfico circular. ¿Qué puede observar acerca del color de auto?

5. “MeatProducts” es una empresa dedicada a la fabricación de embutidos cárnicos que enfoca su proce-
so de producción en mejorar y optimizar sus productos para qué de esta forma, puedan cumplir con
los estándares del mercado e incluso superarlos. A continuación, se muestran algunos gráficos obteni-
dos con el análisis de una muestra de la producción. Complete los espacios en blanco según corres-
ponda:

 La unidad de análisis es: ……………………


 La variable en estudio es: ………………….
 Tipo de variable es: ……………………………
 La escala es: ………………………………………
 El 40% representa: ……………………………

 Complete los títulos del gráfico


 El ____ % de los embutidos son
 producidos de carne de pavo.
 El mayor porcentaje de embutidos es
producido con carne de: ______

6. Complete la siguiente tabla de distribución de frecuencias que representa el número de fallas reporta-
das en el acabado de automóviles. Antes de salir al mercado el lote producido, se analizó una muestra
de 100 autos.

Número de fallas fi Fi hi % Hi %
1 5%
2 14% 19%
3 18
4 62
5 20
6 92%
7 97%
8
Total

a. Identificar la unidad de análisis, variable y su tipo.


b. Interprete los valores f3, h2%, F6, H5%

[Escriba aquí]
34 CE86 Estadística Aplicada 1

7. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas de aho-
rros cerradas por día. La información disponible para este fin se muestra a continuación:

0 3 1 2 1 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 2 5 4 0 1

a. Construya la tabla de distribución de frecuencias para la variable en estudio.


b. Construya el gráfico de bastones para representar la variable en estudio.

8. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del banco A.
5.25 7.22 8.53 9.27 9.54 10.21 10.32 10.45 10.52 10.76
10.85 11.25 11.56 12.42 13.27 14.65 15.72 16.85 17.22 18.56
19.32 20.56 21.72 22.85 23.12 24.32 25.65 26.72 28.72 29.65
31.42 32.71 33.55 34.28 35.21 37.45 38.32 39.65 41.22 43.28
45.72 47.32 49.45 51.27 52.38 54.75 55.81 56.27 57.45 58.22
59.32 61.45 63.75 65.72 66.85 69.32 69.54 72.30 75.81 77.42
a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges.
b. Interprete los valores de f2, h3 y H4.

9. “La Italiana” es una empresa dedicada a la fabricación


de embutidos cárnicos que enfoca su proceso de pro-
ducción en mejorar y optimizar sus productos para qué
de esta forma, puedan cumplir con los estándares del
mercado e incluso superarlos. La empresa está intere-
sada en identificar los problemas principales que afec-
tan la elaboración de embutidos crudos curados.

PROBLEMAS EN EL PROCESO DE FABRICA-


CIÓN DE EMBUTIDOS CRUDOS CURADOS En base a la información presentada construya el
diagrama de Pareto y determine los principales
Problema más importante fi
problemas a ser atendidos con prioridad por la
Embarrado 11 empresa.
Embutición 20
Nitrificación 12
Otros 10
Sabor 7
Textura 18

10. La tabla muestra la distribución del ingreso familiar diario correspondiente a 80 familias.

Ingreso familiar diario fi Fi hi


[160 – 170
170 – 180 48 60
180 – 190 0.125
190 – 200 0.075
200 – 210
Fuente: Ciudad A

a. Complete los elementos faltantes de la tabla de frecuencias.


[Escriba aquí]
EPE 35

b. Determine el número de familias que ganan hasta 190 soles.


c. Determine el porcentaje de familias que ganan más de 180 soles y hasta 190 soles.
d. Determine el porcentaje de familias que ganan más de 170 soles y hasta 200 soles.
e. Determine el porcentaje de familias que ganan más de 190 soles.

11. Se ha demostrado que el PH del café está relacionado con la acidez percibida del café. Un PH entre 4.5
y 5.5 es el rango preferido para una buena taza de café. A continuación, se presenta el PH de una
muestra de tazas de café instantáneo Buencafé tradición producido por la empresa:

3.0 3.1 3.3 3.5 3.8 3.9 3.9 4.2 4.3 4.4
4.4 4.5 4.5 4.5 4.6 4.7 4.7 4.8 4.9 4.9
5.0 5.1 5.1 5.2 5.3 5.3 5.3 5.4 5.4 5.5
5.5 5.6 5.6 5.7 5.7 5.8 5.8 5.8 5.9 5.9
5.9 5.9 6.0 6.0 6.0 6.1 6.1 6.2 6.3 6.5

a. Elabore una tabla de frecuencias para la variable involucrada.


b. Construya un histograma de frecuencias

12. DIFUNDE es una de las principales corporaciones empresariales mundiales líder en la promoción
y gestión de infraestructuras (construcción, industrial, agua y servicios) y energías renovables. Su ofer-
ta cubre toda la cadena de valor desde el diseño y la construcción, hasta la operación y el manteni-
miento. De los últimos proyectos realizados ha registrado las principales dificultades que se presenta-
ron en el desarrollo de cada uno de ellos:
Problema Número de proyectos
Dificultad para importar material 60
Otros 10
Atrasos en pagos por el inversionista 8
Accesibilidad a la zona 14
Falta de profesional calificado 28
Total 120
Determine los principales problemas a los que se debe dar solución para atender a lo más el 75% de
las dificultades presentadas en los proyectos realizados.

[Escriba aquí]
36 CE86 Estadística Aplicada 1

Unidad 2.
LOGRO
Al finalizar la unidad 2, el estudiante interpreta resultados obtenidos de medidas descriptivas.

Medidas de resumen: Medidas de tendencia central, de posición y de


variación

Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que constituyen
una muestra tomada de alguna población.

Podemos distinguir cuatro grupos de medidas de resumen:

[Escriba aquí]
EPE 37

Medidas de tendencia central


Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del cual tien-
den a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un valor que sea repre-
sentativo del conjunto total de datos que se está analizando.

Los ingresos, en dólares, para un grupo de per-


sonas son los siguientes:
2650, 2500, 2580, 2420, 2350
El ingreso promedio es $ 2500
¿Es éste un valor representativo del ingreso para
este grupo de personas?

Los ingresos, en dólares, para un grupo de per-


sonas son los siguientes:
2650, 2500, 2580, 2420, 15200
El ingreso promedio es $ 5070
¿Es éste un valor representativo del ingreso para
este grupo de personas?

Si el promedio no es representativo, ¿qué alternativas disponemos si se quiere hallar un valor central alre-
dedor del cual se distribuyen los demás?

Media
La media de un conjunto de valores de una variable es la suma de dichos valores dividida entre el número
de valores. También se le denomina media aritmética o promedio.

La fórmula para calcular la media es:


N

x i
 Media poblacional  i 1
N
n

x i
 Media muestral x i 1
n

En Excel, use la función =PROMEDIO(DATOS)


Analice la siguiente información:
Variación
Marzo-Abril- Marzo-Abril-
Absoluta Porcentual
Mayo 2018 Mayo 2019
(Soles) (%)
Total 1 650,0 1 723,7 73,7 4,5
Grupos de edad
De 14 a 24 años 1 030,0 1 083,8 53,8 5,2
De 25 a 44 años 1 746,0 1 778,6 32,6 1,9
De 45 y más años 1864,6 1 955,2 90,6 4,9
Fuente: Diario Gestión, junio 2019

[Escriba aquí]
38 CE86 Estadística Aplicada 1

Ejemplo 9.
Los siguientes datos corresponden al número de visitas al mes que una muestra de 30 estudiantes realizó a
la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1
5 5 5 3 1 3 1 4 1 1 2 4 1 4 1

Calcule e interprete la media de la variable en estudio.

Solución
La media del número de visitas de los 30 estudiantes es de 2,6 visitas al mes.
Esto significa que el número de visitas al mes a la cafetería de la universidad está alrededor de 2,6 veces al
mes.

Ejercicio 15
Los siguientes datos corresponden a la estatura, en metros, de una muestra aleatoria de hombres peruanos
de 18 años.

1.73 1.73 1.84 1.71 1.61 1.50 1.78 1.50 1.90 1.81 1.72 1.84 1.75 1.69 1.63
1.51 1.77 1.81 1.77 1.80 1.68 1.56 1.71 1.78 1.49 1.57 1.71 1.82 1.66 1.69

Calcule e interprete el promedio de la variable en estudio.

Solución
El promedio de la estatura de una muestra de hombres peruanos de 18 años es ………………………..….

Mediana
La mediana de un conjunto de datos observados de una variable es el valor que ocupa la posición central
una vez puestos los datos en orden de magnitud, es decir, ordenados de menor a mayor.
La mediana es el valor tal que aproximadamente el 50% de las observaciones son menores o iguales a su
valor. Se denota por Me.

En Excel, use la función =MEDIANA(DATOS)

Ejercicio 16
Interprete las siguientes afirmaciones.

La mediana de la edad de las peruanas que viven en Lima es 28 años.

[Escriba aquí]
EPE 39

La mediana de la edad de las peruanas que viven en Iquitos es 19 años.

19029 euros es el sueldo mediano de un español.

Características de la mediana

 Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.


 La mediana es una medida robusta, es decir, no se ve afectada por valores extremos. Por eso se le
utiliza cuando hay datos inusuales o la distribución de frecuencias no es simétrica.

Ejercicio 17
Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de estu-
diantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1 2 4 1 4 1
5 5 5 3 1 3 1 4 1 1 5 2 3 2 1 6 2 3 2 8

Calcule e interprete la mediana de la variable en estudio.

Solución
La mediana del número de visitas es igual a …………………. veces al mes, esto significa que ………………… de los
estudiantes visitaron la cafetería de la universidad ………………………………………………………………….

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor fre-
cuencia. Se denota por Mo.

Características de la moda

 La moda se puede calcular para cualquier escala de medición.


 El valor de la moda no se ve afectada por valores extremos.
 La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más de
dos modas (multimodal).
 Un conjunto de datos pudiera incluso no tener moda.
 La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.

En Excel, use la función =MODA.VARIOS(DATOS)

Ejercicio 18

[Escriba aquí]
40 CE86 Estadística Aplicada 1

Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de estu-
diantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1 2 4 1 4 1
5 5 5 3 1 3 1 4 1 1 5 2 3 2 1 6 2 3 2 8

Calcule e interprete la moda de la variable en estudio.

Solución
En este caso, el resultado es igual a ………………………… vez al mes.

Esto significa que los estudiantes visitan con mayor frecuencia la cafetería de la universidad
…………………………….. vez al mes.

Ejercicio 19
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la
carrera de Administración.

Edad (años) 15 19 21 31 21 24 30 26 22 31 31 28 31 31 24

Estatura (cm) 154 154 154 184 173 170 176 188 168 161 171 175 187 161 161

Calcule e interprete la moda de la edad y la moda de la estatura.


Solución

Propiedades de la media aritmética


 El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy grandes
o muy pequeños con respecto a los demás.
 Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constantes, entonces, la me-
dia de los n valores yi es: y  ax  b
 Si n1 datos tienen media x1 y n2 datos tienen media x2 , luego la media de los n1+ n2 datos es:

[Escriba aquí]
EPE 41

n1 x1  n2 x2
x
n1  n2

Ejercicio 20
En una negociación por aumento de salarios, la gerencia de la empresa A ofrece a sus empleados dos alter-
nativas.
 La primera consiste en un aumento general del 5%.
 La segunda consiste en un aumento general del 2% más un bono de 150 soles.
Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los sueldos es
actualmente de 3700 soles.

Solución
Alternativa 1

Alternativa 2

Decisión

Ejemplo 10.
Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa tienen un promedio de
2800 soles, determine el nuevo ingreso promedio que se obtendría luego de realizar los siguientes aumen-
tos:
a. los ingresos de los trabajadores se incrementan en 250 soles.
b. los ingresos se incrementan en un 7.5%.
c. los ingresos se incrementan en un 12.5% más una bonificación de 125 soles.

Solución
Definamos las variables:
X = antiguo ingreso de un trabajador
Y = nuevo ingreso de un trabajador
a. Y = X + 250, entonces y  x  250  2800  250  3050 soles
b. Y = X + .075X = 1.075X, entonces y  (1  0,075)x  1,075 2800  3010 soles
c. Y = X + 0.125X + 125. Entonces, y  (1  0,125)x  125  1,125 2800  125  3275 soles

[Escriba aquí]
42 CE86 Estadística Aplicada 1

Medidas de posición o cuantiles


Las medidas de posición o cuantiles son los valores que determinan la posición de un dato respecto a todos
los demás datos de una serie y que previamente ha sido ordenada de menor a mayor.

Los cuantiles más importantes dividen a los datos ordenados de menor a mayor en 4, 10 y 100 cantidades
iguales de datos, denominándose cuartiles, deciles y percentiles, respectivamente.

[Escriba aquí]
EPE 43

Percentiles
Los percentiles dividen el conjunto de datos en 100 partes porcentualmente iguales.

El percentil k, Pk, es el valor tal que aproximadamente el k% de los datos ordenados es menor o igual a ese
valor y el (100 – k)% de los datos es mayor a ese valor.

En Excel, use la función =PERCENTIL.EXC(datos; k/100)

Ejercicio 21
Interprete las siguientes afirmaciones.
Según el II Censo Nacional Universitario 2010, el percentil 57 de la edad de los estudiantes de pregrado es
22 años.

De acuerdo con un informe publicado en agosto del 2016 por la Oficina de Presupuesto del Congreso de
EEUU, el percentil 90 del ingreso anual de las familias en ese país es 942 000 dólares.

De acuerdo con la Organización Mundial de la Salud (OMS), el percentil 15 del peso de una niña de un año
en el mundo es ocho kilos.

Ejercicio 22
Indique, en los siguientes casos, el percentil adecuado:
50% de las observaciones 50% de las observaciones
P…..

30% de las observaciones 70% de las observaciones


P…..

60% de las observaciones 40% de las observaciones


P…..

22% de las observaciones 33% de las observaciones 45% de las observaciones


P…… P……..

[Escriba aquí]
44 CE86 Estadística Aplicada 1

Ejercicio 23
A continuación, se presentan los ingresos mensuales, en soles, de un grupo de trabajadores de la empresa
A.

2548 3120 1870 2458 3000 2890 1500 4005 1900 2410 2300 2870
2710 2955 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

a. Calcule e interprete el valor del percentil 25.


b. Calcule e interprete el valor del percentil 85.
c. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.
d. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más ganan.
Solución
a. Calcule e interprete el valor del percentil 25.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

b. Calcule e interprete el valor del percentil 85.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

c. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

d. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más ganan.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

Medidas de dispersión o variabilidad


Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero no
indican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de dispersión o variabilidad indican cuán alejados están los valores de una variable del valor
que los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.
Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la me-
dida de tendencia central, en cambio si la medida de dispersión tiene un valor grande, los datos no están
concentrados alrededor de la medida de tendencia central.

[Escriba aquí]
EPE 45

Varianza
La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su media
aritmética.

Se calcula usando la siguiente fórmula:


N

 x    i
2

Varianza poblacional 2  i 1
N
n

 x  x i
2

Varianza muestral s2  i 1
n 1
En Excel, use la función =VAR.S(datos)

Desviación estándar
Se define como la raíz cuadrada positiva de la varianza.

En Excel, use la función =DESVEST.M(datos)

Características de la varianza y la desviación estándar


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que la desviación
estándar es expresada en las mismas unidades de los datos.

Ejemplo 11.
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respuestas
mostradas en la siguiente tabla:
2 1 2 4 1 3 2 3 2 0 5 1

Calcule la varianza y la desviación estándar de la variable en estudio.


Solución
En Excel, use la función:
 =VAR.S para calcular la varianza muestral, s2 = 1,9697 hijos2.
 =DESVEST.M para calcular la desviación estándar muestral, s = 1,4035 hijos.

Coeficiente de variación
Las medidas de dispersión estudiadas son medidas de variación absolutas, pues se expresan en las mismas
unidades que la variable, excepto la varianza que se expresa en unidades al cuadrado.

Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales uni-
dades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones estándar no
es muy útil, por ejemplo, cuando las medias están muy distantes.

[Escriba aquí]
46 CE86 Estadística Aplicada 1

Al coeficiente de variación también se le denomina una medida de dispersión relativa.


El coeficiente de variación (CV) de un conjunto de datos indica el porcentaje que es la desviación estándar
en comparación con la media.
Se calcula en variables medidas en escala de razón.

Cálculo del coeficiente de variación


La fórmula para su cálculo es:

Coeficiente de variación poblacional CV   100%

s
Coeficiente de variación muestral CV   100%
x
En Excel, use la función =DESVEST.M(datos)/PROMEDIO(datos)

Ejercicio 24
Usando la opción <Análisis de datos> y la función =PERCENTIL.EXC(datos; k/100) de Excel se ha obtenido la
siguiente tabla de las respuestas obtenidas del tiempo de servicio en una encuesta realizada a una muestra
de 400 empleados de la empresa A realizada el presente año.
Estadísticos Casado Soltero Divorciado
Media 141.823 143.285 135.75
Mediana 132 112 128
Moda 94 #N/A 124
Desviación estándar 46.042 65.288 45.921
Varianza de la muestra 2119.904 4262.571 2108.733
Coeficiente de asimetría 1.612 1.958 0.059
Rango 180 181 139
Mínimo 94 99 61
Máximo 274 280 200
Cuenta 170 70 160
Percentil 25 120.2 110.6 128.6
Percentil 75 186.7 198.6 187.4
a. ¿En qué estado civil el tiempo de servicio presenta mayor dispersión?
b. ¿En qué estado civil el tiempo de servicio es más disperso en el 50% central?

Solución
a. ¿En qué estado civil, el tiempo de servicio presenta mayor dispersión?
Estado civil Media Desviación estándar Coeficiente de variación
Casado
Conviviente
Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el estado civil …………………………….….............


porque …………………………………………………………………………………………………………………………………………..

[Escriba aquí]
EPE 47

b. ¿En qué estado civil el tiempo de servicio es más dispersión en el 50% central?
Estado civil Q1 Q3 RIC
Casado
Soltero
Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el 50% central de los datos es en el estado civil
…………………………….. porque ………………………………………………………………………………………….…………

Ejercicio 25
Los datos presentados a continuación corresponden a los montos y el tipo de pago realizados por una
muestra de 100 clientes de una cadena de supermercados. Los directivos de esta empresa pidieron tomar
la muestra para conocer el comportamiento de los pagos de los clientes.
Cheque
5.00 17.87 18.77 21.11 22.67 25.96 30.60 31.07 31.74 34.67
35.38 36.09 36.48 37.20 37.60 37.94 38.58 39.55 40.51 41.10
41.58 42.69 42.83 43.14 48.95 49.21 50.58 51.66 52.04 52.87
54.84 55.40 57.59 58.11 58.64 58.75 59.78 69.22 72.46 78.16
Efectivo
1.09 1.27 1.85 2.44 2.87 2.96 3.31 3.65 4.34 4.75
5.08 5.15 5.91 5.98 6.93 7.02 7.17 7.22 7.40 7.41
7.88 8.81 8.85 9.00 11.17 11.54 11.77 12.07 13.09 14.28
15.07 15.10 15.57 16.28 16.38 16.69 18.09 20.48
Tarjeta
14.44 19.78 22.59 25.57 26.57 26.91 27.66 27.89 33.76 44.53
46.13 46.24 48.11 50.30 52.35 52.63 53.32 54.19 55.21 57.55
69.77 94.36
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?

Solución
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
Para calcular el coeficiente de variación use las funciones:
 =PROMEDIO(datos) para calcular la media
 =DESVEST.M(datos) para calcular la desviación estándar.
Luego, divida cada desviación estándar entre su respectiva media.

Forma de pago Media Desviación estándar Coeficiente de variación


Cheque
Efectivo
Tarjeta

Por lo tanto, la forma de pago más homogénea es…………………………………………………………….. porque


……………………………………………………………………………………………………………………………………………………..

b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?

[Escriba aquí]
48 CE86 Estadística Aplicada 1

Forma de pago
Cheque
Efectivo
Tarjeta

Por lo tanto, la forma de pago más homogénea en el 50% central es ……………………………….. porque
……………………………………………………………………………………………………………………………………………..

Ejemplo 12.
Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto artículo
que realizaron dos grupos de técnicos.
Grupo 1: Media = 3 y desviación estándar = 1,10 Grupo 2: Media = 5 y desviación estándar = 1,66
¿En cuál de los grupos el número de mediciones es más disperso?

Solución
Se usa como indicador el coeficiente de variación:

s1  1,10 
CV1   100%     100%  36,67%
x2  3 
s  1,66 
CV2  2  100%     100%  33,207%
x2  5 

El número de mediciones es más disperso en el grupo 1, puesto que su coeficiente de variación es mayor.

Medida de asimetría
Además de las medidas de tendencia central y dispersión, podemos estar interesados en saber la forma
que presenta un conjunto unimodal de datos.

 Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media, se
dice que la distribución es simétrica.
 Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media o
viceversa, se dice que la distribución es asimétrica.

Coeficiente de asimetría de Fisher

El coeficiente de asimetría de Fisher se define como:


3
 xi  x 
n


n
As   
n  1n  2 i 1  s 
Se tiene que:

[Escriba aquí]
EPE 49

En Excel, use la función =COEFICIENTE.ASIMETRIA(datos).

Ejercicio 26
Complete los siguientes textos:
 Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una concentra-
ción de datos en los valores …………………………………………
 Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una concentración
de datos en los valores …………………………………………
 En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asimetría
…………………..…….., porque ………………………………..…………………………………………
 En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tienen un
coeficiente de asimetría ……………………………………….………….., porque
………………………………..…………………………………………………………………………………………………

Ejercicio 27
La empresa A desea saber si la capacitación en una tarea ha reducido el tiempo en que se fabrica un cierto
producto. Para lo cual ha tomado una muestra de productos realizados por personas capacitadas y no ca-
pacitadas, encontrando el mismo tiempo medio de fabricación del producto para ambos grupos, sin em-
bargo, el coeficiente de asimetría de los tiempos de las personas capacitadas es positivo, mientras que, el
coeficiente de asimetría de los tiempos de las personas no capacitadas es negativo. ¿Parecen indicar los
datos que la capacitación sirve para reducir el tiempo de fabricación?

Solución

Ejercicio 28
Los datos presentados corresponden a la cantidad de dinero gastado, en soles, para comprar regalos navi-
deños entre un grupo de hombres y de mujeres durante el mes de diciembre pasado en Lima Metropolita-
na. Calcule e interprete el coeficiente de asimetría de Fisher en ambos grupos.

Mujeres
460 507 575 420 568 558 581 334 400 426 434 290 468 546 419 726 364 432 519 503
470 519 430 250 514 447 504 543 350 473 614 441 630 432 417 421 531 523 321 405
450 393 553 430 421 461 320 930 290 718 361 383 477 280 385 416 398 503 431 406
407 558 313 387 585 503 527 511 383 402 453 429 499 179 600 373 459 410 850 847

Hombres
[Escriba aquí]
50 CE86 Estadística Aplicada 1

498 349 185 80 324 616 680 355 352 648 696 308 581 481 297 205 285 175 447 603
626 368 275 149 100 254 540 279 275 200 538 604 575 600 137 734 436 284 198 610
767 80 266 537 358 624 120 244 341 724 425 305 75 688 253 514 236 475 606 475
271 230 466 120 398 60 429 517 268 580 431 173 612 317 529 647 542 544 464 610

Solución
Usando la función =COEFICIENTE.ASIMETRIA(datos), tendremos los siguientes resultados.

Sexo Coeficiente de asimetría de Fisher

Femenino

Masculino

Por lo tanto,
 el gasto de las mujeres presenta asimetría ……………………………………, sus valores están concentrados en
los valores ………………………….…………………..…
 el gasto de los hombres presenta asimetría ……………………………………, sus valores están concentrados en
los valores ………………………….…………………..…

Ejercicio 29 Caso: Natural Power Nutrition


Natural Power Nutrition es una empresa peruana líder en el mercado de vitaminas y complementos nutri-
cionales para la salud y el deporte. Son representantes de marcas mundialmente reconocidas. El gerente de
la empresa, preocupado por la baja demanda a inicios del año, desea identificar los principales problemas
que ocasionaron la migración de sus clientes a la competencia, realizó un estudio. En dicho estudio se en-
cuestó a 200 clientes, a los cuales se midió las siguientes variables:
 Edad: Edad del cliente, en años.
 Tipo de suplemento: Proteína, quemador de grasa, ganador de masa, preentreno y aminoácidos.
 Sexo: Sexo del cliente (Femenino, masculino).
 Nivel de satisfacción: Nivel de satisfacción del cliente respecto a la atención (Totalmente satisfecho,
satisfecho, insatisfecho, totalmente insatisfecho).
 Problemas reportados: Los productos no llegan a tiempo, error de envío de tipo de producto, consultor
desconoce los productos del catálogo, no responden a tiempo los reclamos presentados por Facebook,
muy pocos puntos de ventas, otros
 Tipo de compra: Compra por internet, compra directa de tienda, compra directo a consultor
 Monto de compra: Monto de compra del cliente durante al mes (en soles).
 Tipo de pago: Tipo de pago que el cliente realiza en su compra (Efectivo, tarjeta de débito, tarjeta de
crédito)
 Número de productos: Número de productos que compra el cliente al mes.
 Tiempo de demora: Es el tiempo que demora en llegar el producto a su casa (minutos)
Parte de la base de datos obtenida con la información de los clientes se muestra a continuación:
Monto de Tiempo
Tipo de suple- Nivel de Problema Tipo de Tipo de Número de
ID Edad Sexo compra de demo-
mento satisfacción reportado compra pago productos
unitario ra
1 23 Aminoácidos Femenino Satisfecho Ninguno Internet 153 Crédito 1 100
Pocos puntos de
2 21 Preentreno Femenino Insatisfecho Consultor 153 Crédito 1 50
venta
. . . . . . . . . . .
Totalmente
200 31 Ganador masa Masculino Ninguno Internet 150 Crédito 3 55
satisfecho

Parte 1: Conocimientos

[Escriba aquí]
EPE 51

1. Complete la información solicitada, indique:


Población
Muestra
Unidad elemental
2. Complete los espacios en la tabla considerando la información del estudio:

Nombre de la variable Tipo de variable Escala Dato Gráfico


Tipo de suplemento
Ordinal
149 soles
Cuantitativa discreta
3. Algunos resultados del estudio mostraron:
 El 37,5% de los clientes encuestados realizan su compra por Internet.
 El tiempo promedio de demora de productos al mes es de 1,2 horas.
 El 20% de los clientes realiza su pago con tarjeta de crédito.
 La edad promedio de los clientes es 22 años.
 El problema más común que los clientes manifiestan es que hay muy pocos puntos de ventas

Complete los espacios en blanco considerando los resultados del estudio.

Nombre de la variable Tipo de variable Estadístico Valor del estadístico

4. De la base de datos complete los siguientes espacios en blanco:


Cantidad total de datos
Cantidad total de observaciones
Cantidad de datos que conforman una observación
Un ejemplo de observación

Objetivo 1: Determinar el producto comprado con más preferencia por los clientes al mes.
Complete los datos faltantes en el gráfico y responda a los enunciados solicitados.

[Escriba aquí]
52 CE86 Estadística Aplicada 1

a. Responda al objetivo. ……………………………………………………………………………………………………………………


b. El número de clientes que han comprado quemador de grasa es: ………………………………….…………….
c. Interprete h2%...................................................................……………………………………………..……………...
d. Construya la tabla de frecuencia usando el gráfico de columnas.
Título: ……………………………………………………………………………………….

Tipo de suplemento Número de clientes hi

Fuente: …………………………………………

Objetivo 2: Identificar el tipo de pago de mayor preferencia entre los clientes para evaluar una estrategia
promocional por tipo de producto.
A continuación, se muestra la siguiente información obtenidas de los 200 clientes al momento de analizar el
tipo de suplemento y el turno de pago.

Tipo de suplemento Tipo de pago Total

[Escriba aquí]
EPE 53

Efectivo Tarjeta de crédito Tarjeta de débito


Proteína 3.75% 12.50% 7.50% 23.75%
Quemador de grasa 6.25% 10.00% 3.75% 20.00%
Ganador de masa 5.00% 8.75% 11.25% 25.00%
Preentreno 7.50% 5.63% 3.12% 16.25%
Aminoácidos 2.50% 7.50% 5.00% 15.00%
Total 25.00% 44.38% 30.62% 100.00%
Fuente: Natural Power Nutrition

a. Complete los elementos faltantes de la tabla y el gráfico mostrado.


 Título de la tabla
 Valor faltante del gráfico
 Valor faltante de la tabla
 El tipo de gráfico mostrado se denomina: ………………………..
b. Según lo observado en la tabla y el grafico llene los siguientes espacios en blanco:
 Del total de clientes, el …………% compran proteínas y realizan el pago de la compra con tarjeta de
crédito.
 Del total de clientes que compran proteínas, el ………….% realizan el pago de la compra con tarjeta
de crédito.
 De total de clientes, el número de clientes que compró el tipo de suplemento quemador de grasa
es: …………. clientes.
 Del total de clientes que pagan en efectivo, son ……….. clientes compran complemento ganador de
grasa.
 Los gráficos posibles para elaborar con la tabla 2 son: ……………………….. y …………………
c. Responda al objetivo.

Objetivo 3: Determinar el número de productos comprados menos frecuente por los clientes al mes
Complete el valor faltante en el gráfico y responda los enunciados solicitados.

a. Responda al objetivo.
b. El número de productos mínimo comprados por la mitad de sus clientes es: …………….
c. Interpretar h3%.
d. El porcentaje de clientes que compran más de tres productos es: ………………………………
e. Interprete F2.

Objetivo 4: Determinar la distribución de los clientes respecto al tiempo de demora que llega el producto a
su casa.

[Escriba aquí]
54 CE86 Estadística Aplicada 1

El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable estu-
diada en su objetivo. Para esto se extrajo una muestra al azar y se registró los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
a. Construya la tabla de distribución de frecuencias, use la regla de Sturges.
b. Interprete h2%.
c. Interprete F4.

Objetivo 5: Clasificar los montos de compras al mes de sus clientes.


a. Complete los elementos faltantes del histograma de frecuencias del monto de compra al mes.

Teniendo en cuenta el gráfico de frecuencia construye la tabla de frecuencias.

Objetivo 6: Identificar la concentración de los clientes respecto al tiempo de demora que llega el producto
a su casa.

El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable estu-
diada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:

68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168

a. A partir de los datos, calcule el indicador pertinente que permita responder al objetivo.
b. Responda al objetivo.
c. La empresa contratará más motorizados si se tardan mucho en enviar sus productos, ¿deben contratar
más motorizados?

Objetivo 7: Comparar el monto de compra entre los clientes de sexo femenino y los de sexo masculino.
Los datos representan el monto de compra de los clientes por sexo.
Femenino Masculino
Media Media 153,606
Mediana 154.000 Mediana 168.000
Moda 153.000 Moda 149.000
Desviación estándar 37.527 Desviación estándar
[Escriba aquí]
EPE 55

Varianza de la muestra Varianza de la muestra 1921.955


Coeficiente de asimetría -0.609 Coeficiente de asimetría -0.612
Rango 139 Rango 165
Suma 15436 Suma
Cuenta 101 Cuenta 99
a. Encuentre los valores faltantes de los clientes, tanto de sexo masculino como femenino.
b. Encuentre el valor del coeficiente de variación.
c. Indique el sexo con los montos de compra más homogéneos.
d. La empresa emprenderá una campaña promocional al sexo que presente mayor dispersión, ¿cuál es el
sexo que debe emprender la campaña?

Parte 2: Toma de decisión


Al gerente de Natural Power Nutrition le ha llegado información que las ventas de sus productos se ha
incrementado en estos últimos meses del año por el cual estaría pensando en abrir otra tienda siempre y
cuando se verifiquen al menos dos de las siguientes tres situaciones:

Situación 1.
Si por lo menos el 35% de clientes han comprado más de tres productos al mes. (Debe realizar la respectiva
tabla de frecuencias).
Situación 2.
Si el monto promedio de compra por las mujeres es mayor respecto al de los hombres.
Situación 3.
Si los montos de compra de las mujeres son más homogéneos respecto a los montos comprados por los
hombres.

Responda usando resultados anteriores y considerando las 5 dimensiones.

Ejercicios propuestos

13. Todos los vehículos que circulan en Lima Metropolitana deben pasar las revisiones técnicas. Inicial-
mente la empresa encargada de dichas revisiones contaba con dos plantas: Cono Norte y Cono Sur. Se
desea investigar si se necesitaba abrir más plantas, analizando el tiempo de atención por vehículo. Los
tiempos, en minutos, en ser atendidos a una muestra aleatoria de vehículos particulares que asistieron
a cada una de las plantas se presenta a continuación:

Cono Norte
12.6 12.6 12.6 12.8 12.9 12.9 13.1 13.1 13.5 13.5 13.7 13.8 13.8 14.1 14.1 14.3 15.1
Cono Sur
10.9 10.9 10.9 11.2 11.6 11.8 11.8 11.8 12.2 12.2 12.3 13.3 13.3 13.4 13.4 13.4 21.3

a. ¿En cuál de las plantas el tiempo medio de atención es mayor?


b. ¿En cuál de las plantas se tiene una mayor mediana? Interprete.
c. ¿Cuál es el tiempo de atención más frecuente en ambas plantas? Interprete.
d. ¿Cuál debe ser el tiempo de atención mínimo en la planta del Cono Norte para pertenecer al 25%
de los clientes que esperan más?
e. ¿Cuál debe ser el tiempo de atención máximo en la planta del Cono Sur para pertenecer al 25% de
los clientes que esperan menos?
f. ¿Se puede afirmar que el tiempo de atención es más homogéneo en el Cono Norte que en el Cono
Sur?
g. ¿Es posible afirmar que en el Cono Sur el tiempo de atención es más homogéneo en el 50% central
que en el Cono Norte?
[Escriba aquí]
56 CE86 Estadística Aplicada 1

h. Compare la simetría del tiempo que demoran en ser atendidos los vehículos particulares que asis-
tieron a las plantas del Cono Norte y Cono Sur usando el coeficiente de Fisher.

14. Los gastos semanales en transporte urbano (soles) que efectúan los habitantes de las ciudades en A y
B han sido estudiados mediante muestras aleatorias independientes. Los datos fueron:

Gastos semanales en movilidad en A Gastos semanales en movilidad en B


22.0 22.0 22.1 23.2 23.2 23.2 23.6 23.6 18.1 18.5 18.7 19.9 20.4 20.5 21.1
24.0 24.1 24.1 24.2 24.2 24.5 24.7 25.5 21.3 21.3 21.5 22.0 22.0 22.2 22.4
a. Estime e interprete las siguientes medidas de tendencia central: media, mediana y moda para los
gastos semanales en movilidad en la ciudad A.
b. Calcule e interprete Q3, P10 y P36 para los gastos semanales en movilidad en la ciudad B.
c. ¿En qué ciudad los gastos semanales en movilidad son más homogéneos?
d. Evalúe la asimetría de los gastos semanales en movilidad en las dos ciudades usando el coeficiente
de asimetría de Fisher.

15. Un agente de compras puso a prueba una muestra de 20 baterías de calculadoras de bolsillo de un
fabricante. Cada batería se probó en una calculadora programada para llevar a cabo un ciclo de cálcu-
los ordinarios. El tiempo de vida, en horas, de las baterías se muestra a continuación:

11.9 11.9 12.0 12.0 12.0 12.4 12.3 12.1 12.5 12.0 12.0 12.0 12.1 12.1 12.1 12.2 12.2 12.2 12.2 12.2
Si el agente de compras quiere encontrar un tiempo máximo para el 18% de las baterías que duran
menos y un tiempo mínimo para el 23% de los que duran más, ¿cuál serían esos tiempos de vida? Justi-
fique numéricamente su respuesta.

16. Un fabricante desea adquirir una máquina para el llenado de bolsas de 150 gramos. Se realizan 20
ensayos con la máquina obteniéndose los siguientes pesos, en gramos:

143 145 146 148 149 150 150 150 150 150 150 150 150 150 150 151 152 154 155 155

a. Calcule e interprete la media, mediana y moda del peso de las bolsas empaquetadas.
b. Si el equipo de medición que se empleó para medir los pesos de las bolsas producidas por la máquina
estaba descalibrada y los verdaderos pesos serían 10% menores a los pesos medidos y, además, con
una constante de menos dos gramos, ¿cuál es el peso promedio verdadero de bolsas de la máquina?

17. Un profesor de matemáticas tuvo a su cargo dos secciones el ciclo pasado. En la primera sección, don-
de tuvo 40 alumnos, la media de las notas del examen parcial fue 13 y en la segunda sección, con 35
alumnos, la media de dicho examen fue 12,5. Hallar la media de las notas de todos los estudiantes que
tuvo a su cargo.

18. Según una encuesta realizada por el INEI, se determinó que:


 de 80 pymes del sector maderas, la media del número de trabajadores era de 6 personas
 de 50 pymes del sector metales, la media del número de trabajadores era de 8 personas
 de 30 pymes del sector calzados, la media del número de trabajadores era de 7 personas.
¿Cuál es la media del número de trabajadores de los tres sectores?

19. El sueldo promedio de la empresa A es 4000 soles. Se proponen dos alternativas de aumento:
a. 275 soles a cada uno
b. 5% de su sueldo más 80 soles a cada uno.
Si los empleados quieren obtener el sueldo medio mayor, ¿cuál alternativa es más conveniente?

[Escriba aquí]
EPE 57

20. La empresa A tiene sucursales en dos países. En el primer país, el sueldo medio mensual es de 2500
dólares, con una desviación estándar de 500 dólares, mientras que, en el otro país, el sueldo medio es
de 2500 soles y una varianza de 10500 soles2. ¿En qué país los sueldos presentan mayor variabilidad?

21. En la Bolsa de Valores de Lima se analiza la cotización de las acciones de dos empresas. Las acciones de
la empresa A se cotizan en promedio a 4,50 soles con una desviación estándar de 0,50 soles, mientras
que las acciones de la empresa B se cotizan en promedio a 15 soles con una varianza de 0,85 soles2.
¿Qué empresa tiene las acciones más riesgosas, es decir, con mayor variabilidad?

22. La siguiente información corresponde al tiempo de servicio, en meses, de una muestra de publicistas
que laboran en dos conocidas agencias de la capital.
Agencia A Agencia B
Media 18.93 Media 19.64
Mediana 14.00 Mediana 15.00
Moda 6.00 Moda 11.00
Desviación estándar 15.78 Varianza 94.2841
Muestra 15 Muestra 25
a. ¿Qué tipo de asimetría presenta la distribución del tiempo de servicio de la agencia A?
b. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo?

23. Un conjunto de 20 valores tiene una media igual a 50; otro conjunto de 20 valores tiene una media
igual a 30, la desviación estándar de los 40 valores considerados conjuntamente es igual a 10. Calcular
el coeficiente de variación de los 40 números.

24. La constructora A está evaluando la posibilidad de expandir sus servicios de construcción de bloques
de departamentos en el norte (Piura, Tumbes). Para tal fin, realizó un estudio de las construcciones
realizadas por otras constructoras respecto a la ganancia obtenida en 300 departamentos construidos
en cada lugar. Asimismo, se detalló la ganancia según nivel socioeconómico del lugar. Los datos se en-
cuentran en miles de soles.

Cuadro 1: Resumen estadístico global


Ganancia (en miles soles) - Piura Ganancia (en miles soles) - Tumbes
Media 453.96 Media 256.22
Mediana 454.7 Mediana 233.57
Moda 459.1 Moda 140.4
Desviación estándar 90.01 Desviación estándar 112.45
Percentil 10 336.2 Percentil 10 100.24
Percentil 25 380.7 Percentil 25 140.96
Percentil 75 529 Percentil 75 335.74
Percentil 90 575.1 Percentil 90 480.01

Cuadro 2: Resumen estadístico por nivel socioeconómico del lugar en construcción


Nivel Ganancia - Piura Ganancia – Tumbes
socio-
económico Departamentos Media Desviación estándar Departamentos Media Varianza
A 100 556.12 30.34 60 430.25 658.95
B 120 447.54 24.52 90 315.64 927.2
C 80 335.91 50.98 150 150.96 1628.12

[Escriba aquí]
58 CE86 Estadística Aplicada 1

a. Tomando en cuenta la información presentada en el cuadro 2, ¿cuál es la ganancia media para los
niveles socioeconómicos de Piura?
b. ¿Cuál es la ganancia mínima (en miles de soles) que se obtiene para estar comprendido entre el
10% de las obras con mayores ganancias en Tumbes? Interprete.
c. ¿Cuál es la ganancia máxima (en miles de soles) que se obtiene para estar comprendido entre el
90% de las obras con menores ganancias en Piura? Interprete.
d. El jefe de finanzas, desea conocer en qué lugar deberá darle mayor prioridad en la ejecución de
obras. Ya que se busca mayor homogeneidad en el nivel de ganancias. Considerando la información
del cuadro 1, indique el estadístico que deberá utilizar el jefe de finanzas: varianza, media, rango in-
tercuartil, coeficiente de variación o mediana. ¿Cuál sería su valor?
e. ¿Cuál de los siguientes gráficos representa mejor la distribución de la ganancia en Tumbes?

f. Si se compara la información de clientes de los tres niveles socioeconómicos de Tumbes, ¿en cuál
nivel socioeconómico se observa que la ganancia es más heterogénea? Interprete.

25. La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una muestra
de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Ingreso mensual


ID Género Estado civil
(años) laboral (meses) de hijos (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
[Escriba aquí]
EPE 59

34 Masculino 38 Profesional 99 1 Conviviente 4978


35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

a. Calcule e interprete el valor de la mediana del tiempo de servicio para el grupo de hombres y para
el grupo de mujeres.
b. Calcule e interprete el valor de la moda del número de hijos para el grupo de hombres y para el
grupo de mujeres.
c. Calcule e interprete el valor de las medidas de tendencia central para el tiempo de servicio por ca-
tegoría laboral.

[Escriba aquí]

También podría gustarte