SlideShare una empresa de Scribd logo
UNIDAD 1
ESTADÍSTICA
Historia de la Estadística
Establecer
reparto de
tierras.
Se llevaban registros de
nacimientos, muertes y
matrimonios también se
registraban datos sobre
la población y riquezas
de los territorios
conquistados.
El constante uso de estas
herramientas dio origen al
término estadística, que se
refería a la información
socioeconómica o a los datos
demográficos de los estados.
Europa
Recoger
datos de
actividades
agrícolas o
industriales
Egipto China Grecia
Cuantificar,
organizar y
determinar el
voto del
ciudadano y
otras
actividades
Elaboración de los Censos
Edad Antigua
Método para la organización, recolección , para la cual se analiza los datos de una
muestra representativa de un total para realizar conclusiones de asociación y
clasificación.
Edad Media
Durante la Edad Media
(aprox. 476 – 1453 d.C.) la
estadística no experimentó
grandes avances, aunque
pueden citarse varios
censos, como el de
Carlomagno en 762, para
conocer la extensión de
tierras pertenecientes a la
Iglesia, o el registro de
propiedades.
Durante la Edad
Moderna (aprox. 1454
– 1789), al igual que en
los periodos anteriores,
se continúa con la
obtención de
información a través de
censos
Edad Moderna
Gaspar Neuman:
Teoría de probabilidad
y fenómenos aleatorios
Edad Contemporánea
Muestreo inferencia
estadística
Emplean los estudios
demográficos económicos y
sociales, se crean técnicas
analíticas
Científicos como Laplace, Gauss y
Legendre desarrollaron dos
conceptos muy usados en el
análisis estadístico: la teoría sobre
los errores en la observación, y el
método de los mínimos cuadrados.
Pierre de Fermat Fundador
de la teoría de probabilidades,
junto a Blaise Pascal
Importancia de la estadística:
• Permite una descripción más exacta.
• Nos obliga a ser claros y exactos en nuestros
procedimientos y en nuestro pensar.
• Permite resumir los resultados de manera significativa y
cómoda.
• Nos permite deducir conclusiones generales.
TIPOS DE ESTADÍSTICA
Estadística descriptiva o deductiva
Es un tipo de estadística que se emplea con la finalidad de poder
analizar y describir una serie de conjuntos de tipo numérico, tales series
numéricas buscan representar diversos niveles de fenómenos para el
mejor manejo de su análisis. En este tipo de estadística no es muy
factible llegar a conclusiones definitivas.
Características de las estadística descriptiva o deductiva
Se implementa cuando se requiere de la elaboración de un resumen que
abarque todo tipo de información que en su momento sea requerida.
Para eso, la información se asimilará en una serie de conjuntos
numéricos que permiten el manejo estadístico.
Estadística inferencial o inductiva
Se trabaja a través del manejo de una serie de datos que se obtienen en una
muestra predeterminada, con la finalidad específica de obtener una serie de
predicciones que permitan fundamentar las conclusiones a las que se ha
llegado en el objeto de estudio.
Características de las estadista inferencial o inductiva
En su tratamiento este tipo de estadística persigue los siguientes objetivos que
son:
Llegar a conclusiones validas en relación a la muestra que se definió para la
población objeto de estudio.
Presentar probables niveles de incertidumbre respecto a un escenario con su
respectiva explicación.
Estadística Aplicada
En este caso nos encontramos con dos tipos de estadística, una llamada
descriptiva o deductiva y otra conocida como diferencial o inductiva.
Para poder delimitar la población que será objeto de estudio, se recurre a
una serie de elementos que se consideran “estimadores”. Este tipo de
recursos de estudios son empleados en áreas del conocimiento como la
medicina, historia, psicología y sociología.
Características de las estadística aplicada
Este tipo de estadística busca explicar el resultado que se obtiene de una
muestra que explica el objeto de estudio conocido como el universo del
problema. Generalmente se emplean los estudios estadísticos de la
media, la moda y mediana de un fenómeno de las variables estadísticas.
Estadística Matemática
Es un formato de estadística en el que existe el trabajo formal de los
datos mediante la teoría que más se ajuste a las necesidades del objeto
de estudio. Dichas teorías tienen que ver con el tema de la probabilidad
y otras áreas de la matemática.
Características de las estadística matemática
Lo que se busca con este tipo de estadística es obtener información
relevante a través de la categorización de una serie de datos numéricos o
para tal fin se apega a la teoría de la probabilidad y estadística.
Tras la recogida de datos, el siguiente paso en un trabajo estadístico
consiste en una representación de estos datos de manera directa, concisa y
visualmente atractiva. Esto se hace en Estadística mediante la tabulación
de la variable estadística o del atributo. Realizar una tabulación consiste en
elaborar tablas simples, fáciles de leer y que de manera general ofrezcan
una acertada visión de las características más importantes de la
distribución estadística estudiada.
Tabulación de Datos
La tabulación de un carácter cualitativo es la más simple de todas. Como
norma general , para construir una tabla de un carácter cualitativo, debemos
tener en cuenta:
• Construir una tabla de tres columnas.
• En la primera columna se colocan los distintos atributos.
• En la segunda columna las frecuencias absolutas, (recuento de datos para
cada atributo).
• En la tercera columna las frecuencias relativas (división de frecuencia
absoluta entre el total de datos), o los porcentajes (para porcentajes se
multiplica por cien los valores de la frecuencia relativa).
Carácter Cualitativo
Estadística por Edison Iza
Tabulación de datos
Consiste en elaborar tablas simples,
fáciles de leer y que de manera general
ofrezcan una acertada visión de las
características más importantes de la
distribución estadística estudiada.
Tabulación para carácter cualitativo
• La tabulación de un carácter cualitativo es la más simple de todas.
Como norma general , para construir una tabla de un carácter
cualitativo, debemos tener en cuenta: Construir una tabla de tres
columnas.
• En la primera columna se colocan los distintos atributos.
• En la segunda columna las frecuencias absolutas, (recuento de
datos para cada atributo).
• En la tercera columna las frecuencias relativas (división de
frecuencia absoluta entre el total de datos), o los porcentajes (para
porcentajes se multiplica por cien los valores de la frecuencia
relativa).
Tabulación de carácter cuantitativo
• Para realizar una tabulación de una variable cuantitativa discreta, se
recomienda la siguiente disposición: En la primera columna colocar los
distintos valores ordenados de menor a mayor de la variable discreta.
• En la segunda columna los valores de las frecuencias absolutas (recuento de
datos).
• En la tercera columna los valores de las frecuencias relativas (división de la
frecuencia absoluta entre el total de datos) o de los porcentajes (para
porcentajes se multiplica por cien cada frecuencia relativa).
• En la cuarta columna los valores de las frecuencias absolutas acumuladas
(acumulación o suma de cada frecuencia absoluta con todas las anteriores).
• En la quinta columna los valores de las frecuencias relativas acumuladas o
porcentajes acumulados (lo mismo que para el caso de la frecuencia
relativa).
De una muestra de 9 estudiantes, se solicita el número de calzado que
utilizan:
Datos obtenidos: 42, 38, 37, 34, 35, 38, 42, 40, 42
1.- Se ordena los datos de menor a mayor.
34, 35, 37, 38, 38, 40, 42, 42, 42
2.- Se construye una tabla de datos
xi fi Fi hi fi/n Hi % hix100 Nº de grados= fi/n x360
34 1 1 1/9= 0,11 0,11 11% 1/9x360= 40º
35 1 2 1/9= 0,11 0,22 11% 1/9x360=40º
37 1 3 1/9=0,11 0,33 11% 1/9x360=40º
38 2 5 2/9=0,22 0,55 22% 2/9x360=80º
10 1 6 1/9=0,11 0,66 11% 1/9x360=40º
42 3 9 3/9=0,33 0,99-1 33% 3/9x360=120º
Total n=9 99% 360º
TABULACIÓN DE DATOS AGRUPADOS
1.- Se ordena los datos de mayor a menor
2.- Se identifica el límite superior e inferior
3.- Se calcula el rango
R= Ls -Li
4.- Se calcula el intervalo
K=1+3,322xlog(Nº de casos)
5.- Se calcula la amplitud
A=R/K
Nota: En el casillero de clase se colocan los datos obtenidos en la encuesta, según
corresponda.
Número de calzado de 10 estudiantes:
Datos obtenidos: 40,38,35,37,34,39,41,38,40,38
Se ordena los datos de menos a mayor:
34,35,37,38,38,38,39,40,40,41
Se calcula el rango:
R=Ls -Li R=41-34 R=7
Se calcula el intervalo:
K=1+3,322xlog(nº de casos) K=1+3,322xlog10 K=5
Se calcula la amplitud:
A=R/K A=7/5 A= 2
Se construye la tabla de datos.
xi Clase Marca
de clase
fi Fi hi fi/n Hi % hix100 Nº de grados= fi/n
x360
1 [34-36) 35 2 2 2/10= 0,2 0,2 20% 2/10x360= 72º
2 [36-38) 37 1 3 1/10= 0,1 0,3 10% 1/10x360=36º
3 [38-40) 40 4 7 4/10=0,4 0,7 40% 4/10x360=144º
4 [40-42) 41 3 10 3/10=0,3 1 30% 3/10x360=108º
Total n=10 1 100% 360º
CUADRO DE DISTRIBUCIÓN
DE FRECUENCIAS
Es una tabla estadística que recoge datos de
frecuencias y los analiza
¿Qué es una frecuencia?
• Es lo mismo que un conteo, es el número que resulta de contar
las veces que se repite un término en una lista de números.
Ejemplo: 5 5 5 5 5 5 5 5 5 5
El número 5 se repite 10 veces, por lo que su frecuencia
absoluta es 10
¿Qué es frecuencia absoluta?
• Es la frecuencia como tal, se la hace con un conteo manual, además de
la cantidad que resulta del conteo, se lo representa con las letras fi.
• Ejemplo: 222222
Xi Conteo fi
1 |||||| 6
¿Qué que es frecuencia absoluta acumulada?
• Es una estrategia para asegurarse que el conteo esta bien hecho, se lo
hace tal que el último término debe ser el mismo que la cantidad total
de términos.
Se van sumando las frecuencias absolutas de cada piso, una después de
la otra, se lo representa con las letras Fi.
fi Fi Procedimiento
3 3 Se mantiene el mismo número
4 7 4+3
5 12 7+5
N=12
¿Qué es frecuencia relativa?
• Es la frecuencia acumulada de cada término, pero dividida por el total
de términos (n), esta relacionada con el porcentaje. Se la representa
con las letras hi.
fi hi Procedimiento
4 0.4 4/10
2 0.2 2/10
4 0.4 4/10
n= 10
¿Qué es la frecuencia relativa acumulada?
• Es el mismo procedimiento de revisión si esta bien hecho
el conteo de la frecuencia absoluta, solo que con la
frecuencia relativa.
• Igualmente se calcula sumando cada espacio, uno por uno,
de todas las frecuencias relativas.
• Se suman de tal forma que al final debe dar 1
Porcentaje
• Usando la frecuencia relativa se puede calcular el
porcentaje
• Se multiplica a la frecuencia relativa por 100
• También es lo mismo que la división de la frecuencia
absoluta por el total de términos (n) todo multiplicado por
100
•
𝑓𝑖
𝑛
∗ 100 = ℎ𝑖 ∗ 100 = %
Grados
• Para construir un gráfico tipo pastel, se necesitan los
porcentajes de cada frecuencia, para dibujarlo necesitamos
calcular cuantos grados tiene cada parte del pastel.
• Se calcula con la multiplicación del porcentaje por 3.6, o la
frecuencia relativa por 360
𝑋° =
360
100
∗ %
𝑋° = 360 ∗ ℎ𝑖
Ejemplo 1
• Le preguntamos a 67 estudiantes de la
facultad cual es su materia favorita
Xi fi Fi hi Hi
Biología 20 20 0.29850746 0.298507
Lenguaje 17 37 0.25373134 0.55223834
Estadística 10 47 0.14925373 0.70149207
Matemática 5 52 0.07462687 0.77611894
Química 3 55 0.04477612 0.82089506
Investigación 5 60 0.07462687 0.89552193
Psicología 4 64 0.05970149 0.95522342
Zoología 2 66 0.02985075 0.98507416
Pedagogía 1 67 0.01492537 0.99999954
n= 67
Cuadro de barras
0.00
5.00
10.00
15.00
20.00
25.00
30.00
35.00
Biología Lenguaje Estadística Matemática Química Investigación Psicología Zoología Pedagogía
Chart Title
CUADRO DE PASTEL
Biología
30%
Lenguaje
25%
Estadística
15%
Matemática
7%
Química
5%
Investigación
7%
Psicología
6%
Zoología
3%
Pedagogía
2%
MATERIA FAVORITA
Ejemplo 2
• Le preguntamos a 135 estudiantes de la facultad cual es su sabor
favorito
Xi fi Fi hi Hi
Vainilla 34 34 0.25 0.25185185
Chocolate 21 55 0.16 0.40740741
Mora 20 75 0.15 0.55555555
Guanábana 17 92 0.13 0.68148148
Chicle 16 108 0.12 0.8
Café 14 122 0.10 0.9037037
Ron con pasas 10 132 0.07 0.97777778
Oreo 2 134 0.01 0.99259259
Fresa 1 135 0.01 1
n= 135
Cuadro de barras
0
5
10
15
20
25
30
35
40
Vainilla Chocolate Mora Guanábana Chicle Café Ron con pasas Oreo Fresa
Sabor favorito
Cuadro de pastel
Vainilla
25%
Chocolate
16%
Mora
15%
Guanábana
13%
Chicle
12%
Café
10%
Ron con pasas
7%
Oreo
1%
Fresa
1%
SABOR FAVORITO
Ejemplo 3
• Se les preguntó a 524 estudiantes su videojuego favorito
Xi fi Fi hi Hi
Supermario 70 70 0.13 0.13358779
GTA V 70 140 0.13 0.26717558
Minecraft 66 206 0.13 0.39312977
GTA San andreas 64 270 0.12 0.51526718
Mortal Kombat 60 330 0.11 0.629771
Resident Evil 58 388 0.11 0.74045802
Call of duty 54 442 0.10 0.84351145
FIFA 52 494 0.10 0.9427481
Leyend of zelda 30 524 0.06 1
n= 524
Cuadro de barras
0
10
20
30
40
50
60
70
80
Supermario GTA V Minecraft GTA San andreas Mortal Kombat Resident Evil Call of duty FIFA Leyend of zelda
Título del gráfico
CUADRO DE PASTEL
Supermario
13%
GTA V
13%
Minecraft
13%
GTA San andreas
12%
Mortal Kombat
12%
Resident Evil
11%
Call of duty
10%
FIFA
10%
Leyend of zelda
6%
Media, mediana, moda, varianza,
desviación estándar y punto z
Ejercicio 1
• Se tienen los siguientes 30 datos de 30 estudiantes, respecto a las veces que
se les reprendió de forma disciplinaria, separándolos por sus notas.
intervalo x fi Fi fixi (x-ẋ)ʌ2 fi*(x-ẋ)ʌ2
0 4 2 4 4 8 87.1111111 348.444444
4 8 6 5 9 30 28.4444444 142.222222
8 12 10 7 16 70 1.77777778 12.4444444
12 16 14 5 21 70 7.11111111 35.5555556
16 20 18 9 30 162 44.4444444 400
Sumatoria 30 340 938.666667
Mediana, Moda, Varianza, Desviación
estándar, Coeficiente de variación, Puntaje z
Mediana 11.4285714
Moda 10
Varianza 31.2888889
Desviación estándar 5.59364719
Coeficiente de variación 276.078431
Puntaje z -0.04261364
Gráfico de pastel
0-4
13%
4-8
17%
8-12
23%
12-16
17%
16-20
30%
INDISCIPLINA DE LOS ESTUDIANTES POR SUS PROMEDIOS DE NOTA
Ejemplo 2
• Se tienen los siguientes 30 datos de 30 afiliados del IESS que cuentan las
veces que sacaron turnos, diferenciados por sus edades.
intervalo x fi Fi fixi (x-ẋ)ʌ2 fi*(x-ẋ)ʌ2
40 44 42 5 5 210 70.56 352.8
44 48 46 6 11 276 19.36 116.16
48 52 50 7 18 350 0.16 1.12
52 56 54 5 23 270 12.96 64.8
56 60 58 7 30 406 57.76 404.32
Sumatoria 30 1512 939.2
Mediana, Moda, Varianza, Desviación estándar,
Coeficiente de variación, Puntaje z
Mediana 50.2857143
Moda 49.3333333
Varianza 31.3066667
Desviación estándar 5.59523607
Coeficiente de variación 62.1164021
Puntaje Z -0.01277683
GRÁFICO DE PASTEL
17%
20%
23%
17%
23%
Turnos de afiliados del IESS por edad
40-44 44-48 48-52 52-56 56-60
Ejemplo 3
• Se tienen los siguientes 75 datos de 75 trabajadores en una empresa que
cuentan las veces que dieron permisos al año, diferenciados por sus edades.
intervalo x fi Fi fixi (x-ẋ)ʌ2 fi*(x-ẋ)ʌ2
20 24 22 5 5 110 92.16 460.8
24 28 26 10 15 260 31.36 313.6
28 32 30 20 35 600 2.56 51.2
32 36 34 30 65 1020 5.76 172.8
36 40 38 10 75 380 40.96 409.6
Sumatoria 75 2370 1408
Mediana, Moda, Varianza, Desviación
estándar, Coeficiente de variación, Puntaje z
Mediana 32.5
Moda 30
Varianza 18.7733333
Desviación estándar 4.33282048
Coeficiente de
variación
59.4092827
Puntaje Z -0.08522727
Gráfico de pastel
7%
13%
27%40%
13%
Permisos de los trabajadores por edades
20-24 24-28 28-32 32-36 36-40
MEDIDAS DE
TENDENCIA CENTRAL
Medidas de Posición: son aquellos valores numéricos que nos
permiten o bien dar alguna medida de tendencia central, dividiendo el
recorrido de la variable en dos, o bien fragmentar la cantidad de datos
en partes iguales. Las más usuales son la media, la mediana, la moda,
los cuartiles, quintiles, deciles y percentiles. Pueden ser de dos tipos:
de tendencia central o de tipismo.
Medidas de Dispersión: se llaman medidas de dispersión aquellas que
permiten retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentración de los datos
en un cierto sector del recorrido de la variable. Se trata de
coeficientes para variables cuantitativas. Las más usuales son el
desvío estándar y la varianza.
Medidas de tendencia central
La media de un conjunto de números, algunas veces
simplemente llamada el promedio , es la suma de los
datos divididos entre el número total de datos.
La Media
El cálculo de la Media
Dado un conjunto de observaciones
la media se representa mediante y se obtiene dividiendo la suma de todos los datos por el número de ellos,
es decir:
La interpretación de la media como centro (o punto de equilibrio) de los datos se apoya en una propiedad que
afirma que la suma de las desviaciones
de un conjunto de observaciones a su media es igual a cero; es decir, puede probarse que
Cálculo de la media aritmética cuando los datos se repiten.
Ejemplo. Las notas de un grupo de alumnos fueron:
Notas Frecuencia
absoluta
Notas x
F. absoluta
3 5 15
5 8 40
6 10 60
7 2 14
Total 25 129
1,5
25
129
Media 
Datos por frecuencias
Total de datos
1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2º. El resultado se divide por el total de datos.
Media aritmética (II)
Mediana
La mediana, a diferencia de la media no busca el valor central del recorrido de
la variable según la cantidad de observaciones, sino que busca determinar el
valor que tiene aquella observación que divide la cantidad de observaciones
en dos mitades iguales. Por lo tanto es necesario atender a la ordenación de
los datos, y debido a ello, este cálculo depende de la posición relativa de los
valores obtenidos. Es necesario, antes que nada, ordenar los datos de menor a
mayor (o viceversa).
En caso que N sea impar
La mediana de un conjunto de datos es un valor del mismo tal que el número de
datos menores que él es igual al número de datos mayores que él.
Los pesos, en kilogramos, de 7 jugadores de un
equipo de fútbol son:
Ejemplo:
72, 65, 71, 56, 59, 63, 72
1º. Ordenamos los datos: 56, 59, 63, 65, 71, 72, 72
2º. El dato que queda en el centro es
65.
La mediana vale 65.
Si el número de datos fuese par, la mediana es la
media aritmética de los dos valores centrales.
Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es:
64
2
6563


Caso:
La mediana
Moda
La moda, es aquel dato, aquel valor de la
variable que más se repite; es decir, aquel
valor de la variable (que puede no ser un
único valor) con una frecuencia mayor.
La moda de un conjunto de datos es el dato que más se repite.
Una zapatería ha vendido en una semana los zapatos
que se reflejan en la tabla:
Ejemplo.
La moda es 41.
Nº de calzado 38 39 40 41 42 43 44 45
Nº de personas 16 21 30 35 29 18 10 7
El número de zapato más
vendido, el dato con mayor
frecuencia absoluta, es el 41.
Lo compran 35 personas
La moda
Medidas de Dispersión
El desvío estándar
Es posible identificar conjuntos de datos que a pesar de ser muy
distintos en términos de valores absolutos, poseen la misma media.
Una medida diferencial para identificar esos conjuntos de datos es la
concentración o dispersión alrededor de la media.
Una manera de evitar que los distintos signos se compensen es
elevarlas al cuadrado, de manera que todas las desviaciones sean
positivas. La raíz cuadrada del promedio de estas cantidades recibe el
nombre de desvío estándar, o desviación típica y es representada por
la siguiente fórmula:
La Varianza
El cuadrado de la desviación estándar recibe el nombre de varianza y se representa
por
La suma de los cuadrados de los desvíos de la totalidad de las observaciones,
respecto de la media aritmética de la distribución, es menor que la suma de los
cuadrados de los desvíos respecto de cualquier otro valor que no sea la media
aritmética.
Si observamos, veremos que la varianza no es más que el desvío estándar al
cuadrado. Precisamente la manera de simbolizarla es.
Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la
varianza
8 cm.
Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos
tienen la misma base).
¿Existe alguna variación respecto de su altura entre estos rectángulos?
¿Cuál es el promedio de la altura de estos rectángulos?
8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8
9
=
72
9
= 8
El quinto rectángulo y el octavo rectángulo en un acto de rebeldía
cambiaron su altura. El quinto rectángulo, ahora de color rojo, mide 10
centímetros, y el octavo rectángulo, de color azul, mide 6 centímetros?
¿Cuál es el nuevo promedio de estos 9 rectángulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9
=
72
9
= 8
... ¡el mismo promedio! Pero... ¿ha habido variación?
8 cm.
10 cm
6 cm
El rectángulo rojo tiene +2 centímetros sobre el promedio, y el
rectángulo azul tiene –2 centímetros bajo el promedio. Los otros
rectángulos tienen cero diferencia respecto del promedio.
8 cm.
10 cm
6 cm
Si sumamos estas diferencias de la altura respecto del promedio,
tenemos
0 + 0 + 0 + 0 + 2 + 0 + 0 – 2 + 0 = 0
Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variación.
8 cm.
10 cm
6 cm
Una forma de eliminar los signos menos de aquellas diferencias que
sean negativas, esto es de aquellos mediciones que estén bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectángulos, es decir lo
dividimos por el número de rectángulos que es 9
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 =
9 9
8
= 0,89
8 cm.
10 cm
6 cm
Se dice entonces que la varianza fue de 0,89
Observemos que las unidades involucradas en el cálculo de la varianza
están al cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados.
De manera que se define
0,89 0,943
La raíz cuadrada de la varianza se llama desviación estándar
8 cm.
10 cm
6 cm
Que la desviación estándar haya sido de 0,943 significa que en promedio la
altura de los rectángulos variaron (ya sea aumentando, ya sea
disminuyendo) en 0,943 centímetros.
Es claro que esta situación es “en promedio”, puesto que sabemos que
los causantes de la variación fueron los rectángulos quinto y octavo.
Esta variación hace repartir la “culpa” a todos los demás rectángulos
que se “portaron bien”.
La desviación estándar mide la dispersión de los datos respecto del
promedio
8 cm.
10 cm
6 cm
4 cm
8 cm. 8 cm. 8 cm.
7 cm.
8 cm.
¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?
En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
9
= 7,44
Luego debemos calcular la varianza
8 cm.
10 cm
6 cm
4 cm
8 cm. 8 cm. 8 cm.
7 cm.
8 cm.
Promedio
7,44
0,56
-3,44
0,56 0,56 2,56 0,56 -0,44 -1,44
0,56
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 +
0,562
9
22,2224
9
=
= 2,469Este es el valor de la varianza
10 cm
8 cm.
6 cm
4 cm
8 cm. 8 cm. 8 cm.
7 cm.
8 cm.
Promedio
7,44
Si la varianza fue de 2,469, entonces la desviación estándar es de...
2,469 1,57
Lo que significa que, en promedio, los rectángulos se desviaron más o
menos (más arriba o más abajo) en 1,57 centímetros.
Para entender la varianza necesariamente debe saber:
•Sumar
•Restar
•Multiplicar
•Dividir
•Potencia de orden 2
•Raíz cuadrada
Y es claro que esto no es suficiente (salvo que queramos que aprenda de
memoria los cálculos). Necesitamos estimular su imaginación para que
“vea” la variabilidad existente en la naturaleza.
Entregue una lista de fenómenos en que un mismo atributo tenga
variabilidad si se mide este atributo a un número de individuos u objetos.
MEDIDAS DE
DISPERSIÓN
• La Dispersión hace referencia a la forma en que se dispersan o alejan las
puntuaciones de una distribución o lista de puntajes
0
1
2
3
4
5
6
7
5 6 7 8 9 10 11 12
No.DEPERSONAS
EDADES
EDAD
0
2
4
6
8
10
12
14
5 6 7 8 9 10 11 12
MEDIA: 8.5 años
MEDIDAS DE DISPERSION
• RANGO (Símbolo: R)
• DESVIACIÓN MEDIA (Símbolo Dx)
• DESVIACIÓN ESTÁNDAR O TÍPICA (Símbolo σ ó S)
• VARIANZA (σ2 ó S2)
RANGO
 El Rango corresponde a la distancia entre el puntaje
mayor (llamado valor máximo) y el puntaje menor
(llamado valor mínimo).
Rango = XMax – XMin
La siguiente tabla representa la
pérdida de peso en libras, de un
grupo de personas que se
sometieron a un tratamiento durante
el último año.
Valor Máximo: 60 Valor Mínimo: 10
Rango = XMax – XMin
= 60 - 10
= 50
3- 73
10
13
22
26
16
23
35
53
17
32
41
35
24
23
27
16
20
60
48
EJEMPLO
DESVIACIÓN MEDIA
La desviación media es la media aritmética de los
valores absolutos de las desviaciones respecto a la
La desviación media se representa por Dx
Varianza: Corresponde a la
Desviación Estándar al
cuadrado.
Desviación Estándar o Típica:
Indica cómo se dispersan los datos
con respecto a la media.
3- 75
DESVIACION ESTANDAR Y VARIANZA
Varianza: La media aritmética de
las desviaciones cuadradas de la
media.
Desviación Estándar: Corresponde a la
Raíz Cuadrada de la Varianza.
EJEMPLO
• Calcular varianza y desviación estándar
para los siguientes puntajes
• 10 – 12 – 15 – 18 - 20
 (X - )2
N

=  2
EJEMPLO X
10 -5 25
12 -3 9
15 0 0
18 3 9
20 5 25
2
)( XX XX 
15X
6,13
5
682

69,36,13 
Varianza en Muestras (s2)
s2 =
(X - X)2
n-1
Desviación Estándar en Muestras (s) 2
ss 
3- 78
VARIANZA Y DESVIACIÓN ESTÁNDAR EN MUESTRAS
RANGO
En estadística, el rango representa la diferencia entre el valor
máximo y el valor mínimo de un conjunto de datos. El rango
nos muestra la distribución de los valores en una serie. Si el
rango es un número muy alto, entonces los valores de la
serie están bastante distribuidos. En cambio, si se trata de un
número pequeño, quiere decir que los valores de la serie
están muy cerca entre sí.
Cómo calcular el rango estadístico
1.- Haz una lista con los elementos de tu conjunto de datos. Para encontrar
el rango de un conjunto, debes hacer una lista con todos los elementos para
que puedas identificar los números más altos y los más bajos. Escribe
todos los elementos. Los números de este conjunto son: 14, 19, 20, 24, 25
y 28. Puede ser más sencillo identificar el valor máximo y el valor mínimo
en el conjunto si pones los números en orden ascendente.
• En este ejemplo, acomodaremos los números de esta manera: 14, 19, 20,
24, 24, 25, 28. Al poner los elementos en orden también se te facilitarán
otro tipo de cálculos, como encontrar la moda, la media o la mediana del
conjunto.
2.- Identifica los valores mínimo y máximo del
conjunto. En este caso, el número más bajo del
conjunto es 14 y el más grande es 25.
3.- Réstale el valor mínimo del valor máximo. Ahora que has
identificado el número más grande y el número más chico en el
conjunto, lo único que debes hacer es restarlos. Resta 14 de 25
(25 - 14) para obtener 11, el rango del conjunto.
• 4.- Etiqueta claramente tu rango. Una vez que hayas encontrado
el rango, etiquétalo con claridad. Esto te ayudará a evitar
confundirlo con algún otro cálculo estadístico que tengas que
hacer, como la media, la moda o la mediana.
Fórmula
Intervalo
• menciona la distancia o el espacio que hay de un lugar a otro o de un
tiempo a otro.
• Es la clasificación de los datos de una muestra en grupos definidos,
también se le llama clase:
• Ii = [a;b[
• donde a es el Límite inferior y b es el Límite superior.
A este intervalo de clase pertenecen los datos x que cumplen la
condición:
a <= x <b
• NÚMEROS DE INTERVALOS DE CLASE (k)
Para obtener un valor aproximado, podemos emplear la regla de
¨STURGES¨.
• k = 1 + 3,3logN
• donde N es el número de elementos de la muestra.
• AMPLITUD DE IN INTERVALO DE CLASE (C)
Es la diferencia entre el límite superior e inferior de cada intervalo
determinado.
• Ii = [a;b[, entonces C = b – a
• También podemos aplicar:
• Donde:
R: Rango
k: número de intervalos de clase
Amplitud
• La amplitud total (AT) es la diferencia entre la puntuación de mayor
valor y la de menor valor:
La amplitud total es un estadístico muy sencillo y fácil de calcular,
pero a menudo esta simplicidad es un inconveniente. Consideremos el
siguiente ejemplo:
Los grupos A y B son bastante semejantes, pero no los coeficientes de
amplitud. La diferencia en los coeficientes es ocasionada por la variación
introducida por una sola puntuación con valor extremo, el 1000. Por esta
razón es conveniente disponer de otras medidas más adecuadas.
Principales características: Además de la ya señalada, el coeficiente de
amplitud total no tiene en cuenta los valores entre extremos, que son los
que determinan su valor.
Marca de clase
La marca de clase es el punto medio de cada intervalo. La
marca de clase es el valor que representa a todo el intervalo para
el cálculo de algunos parámetros como la media aritmética o la
desviación típica.
¿Como calcular la marca de clase ?
• Se calcula la marca de clase (Xi), que es el valor medio o promedio de cada
intervalo, el cual sirve para facilitar el cálculo de algunas medidas de posición y de
dispersión.
• Una vez escogido el número de intervalos se determina la amplitud de cada clase o
intervalo (C).
• Esta amplitud es igual al rango de los datos dividida en el número de intervalos.
• El primer intervalo debe contener el menor valor de los datos y el último intervalo
debe contener el mayor valor de los datos.
• Se determina el número de intervalos o clase (K) que se utilizan para agrupar los
datos.
• En general se recomienda tener, hasta donde sea posible, tener entre 5 y 20
intervalos o clases.
En consideración
• Sin embargo, si no se tiene seguridad del número de intervalos a
utilizar, se puede aplicar la regla de Sturges, con la cual se obtiene una
aproximación aceptable sobre el número de intervalos necesarios para
agruparlos.
• La regla de Sturges es una regla que permite calcular el numero de
clase cuando se conoce el tamaño de la población o muestra.
Estadística por Edison Iza
Estadística por Edison Iza
Estadística por Edison Iza
Estadística por Edison Iza
Hallar la media de la distribución estadística que
viene dada por la siguiente tabla:
Intervalos Marca de
clase
( xi )
Frecuencia
absoluta (fi )
xi · fi
[10, 15) 12.5 3 37.5
[15, 20) 17.5 5 87.5
[20, 25) 22.5 7 157.5
[25, 30) 27.5 4 110
[30, 35) 32.5 2 65
21 457.5
Estadística por Edison Iza
Intervalos Marca de clase
( xi )
Frecuencia
absoluta (fi )
xi · fi
[0-10) 5 3 15
[10-20) 15 6 90
[20-30) 25 7 175
[30-40) 35 12 420
[40-50) 45 3 135
31 835
Intervalos Marca de clase
( xi )
Frecuencia absoluta (fi ) xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60) 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que
muestra la tabla. Calcula la puntuación media.
Resolución de la mediana
1.-Ordenamos los datos de menor a
mayor.
2.-Si la serie tiene un número impar de medidas la
mediana es la puntuación central.
2, 3, 4, 4, 5, 5, 5, 6, 6 Mediana = 5
Si la serie tiene un número par de puntuaciones la
mediana es la media entre las dos puntuaciones
centrales.
7, 8, 9, 10, 11, 12 Me = 9,5
Existen dos métodos para el cálculo de la mediana:
• Considerando los datos en forma individual, sin
agruparlos.
• Utilizando los datos agrupados en intervalos de
clase.
• En los datos no agrupados la formula para calcular la Me= n/2 o Me=(n+1)/2
• En los datos agrupados la formula es
Mediana
1.- Encuesta a 179 estudiantes de su clase.
2.- Encuesta de las edades de 250 alumnos, determinar la mediana.
Resolución de la mediana
• Me = Mediana
• L i - 1 = Límite inferior de la clase de la mediana.
• ni = Frecuencia de la clase de la mediana
• N = Total de datos o frecuencias.
• N i - 1 = Frecuencia acumulada anterior a la mediana.
Moda
1.Escribe los números de la serie de datos.
2.Ordena los números de menor a mayor.
3.Cuenta el número de veces que se repite cada número.
4.Identifica el valor (o valores) que aparecen con mayor
frecuencia ese será la moda.
• Ejemplo de moda para datos agrupados.
De la tabla de distribución de frecuencias anterior
calcular la moda de inasistencias

Más contenido relacionado

DOCX
Trabajo de estadistica
DOCX
Trabajo de estadistica n°1
PPTX
Luis venzales presentacion
PPTX
Estadistica descriptiva
DOCX
Estadistica basica I .doc
PDF
Organización de datos (estadística)
PPTX
Estadística elemental
PPTX
Tema 2 Organización de los datos
Trabajo de estadistica
Trabajo de estadistica n°1
Luis venzales presentacion
Estadistica descriptiva
Estadistica basica I .doc
Organización de datos (estadística)
Estadística elemental
Tema 2 Organización de los datos

La actualidad más candente (20)

PPTX
Ordenamiento de datos
PPTX
Estadistica
ODP
Estadistica Univariada
PPTX
Estadistica descriptiva
PPTX
Distribucion de Frecuecia
DOCX
Distribucion de frecuencias
PPTX
Grupo n 1 de estadistica
PPT
Técnicas estadísticas básicas
DOCX
Estadistica descriptiva
PPTX
Tabulación y distribución de frecuencia. histograma, polígono de frecuencia e...
PPTX
Organización y presentación de datos
PPT
Principios de estadística
PPTX
Evolucion de la estadistica s2
PDF
Veter 2da clase tablas y gráficos
PPTX
Ordenamiento de datos en estadistica iv (1)
PPTX
Kate presentacionm
PPTX
organización de datos (estadística)
PPT
Estadistica desciptiva 1
PPTX
Presentacion de datos estadisticos en ciencias de la salud
Ordenamiento de datos
Estadistica
Estadistica Univariada
Estadistica descriptiva
Distribucion de Frecuecia
Distribucion de frecuencias
Grupo n 1 de estadistica
Técnicas estadísticas básicas
Estadistica descriptiva
Tabulación y distribución de frecuencia. histograma, polígono de frecuencia e...
Organización y presentación de datos
Principios de estadística
Evolucion de la estadistica s2
Veter 2da clase tablas y gráficos
Ordenamiento de datos en estadistica iv (1)
Kate presentacionm
organización de datos (estadística)
Estadistica desciptiva 1
Presentacion de datos estadisticos en ciencias de la salud
Publicidad

Similar a Estadística por Edison Iza (20)

PPT
Estadistica DS
PDF
Estadistica
PPT
ESTADÍSTICA APLICADA A LA INTELIGENCIA ARTIFICIAL
DOCX
Proyec mate
PPTX
Sesion_1_Estadística.pptx
PPTX
Clase estadistica ejercicios resueltos,
PPT
Estadistica
PPT
Estadística Descriptiva
PPT
Estadistica
PPT
Estadistica
PPT
Estadistica
PPT
Estadistica
PPT
Estadistica
PPT
Estadistica
PPTX
PARAMETROS ESTADISTICOS en estadistica descriptiva
PPT
Estadistica 1
PDF
ESTADISTICA DESCRIPTIVA .pdf
PDF
Informe EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.
PDF
Informe Excel Avanzado Liceo Departamental.pdf
PPTX
Presentación1
Estadistica DS
Estadistica
ESTADÍSTICA APLICADA A LA INTELIGENCIA ARTIFICIAL
Proyec mate
Sesion_1_Estadística.pptx
Clase estadistica ejercicios resueltos,
Estadistica
Estadística Descriptiva
Estadistica
Estadistica
Estadistica
Estadistica
Estadistica
Estadistica
PARAMETROS ESTADISTICOS en estadistica descriptiva
Estadistica 1
ESTADISTICA DESCRIPTIVA .pdf
Informe EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.
Informe Excel Avanzado Liceo Departamental.pdf
Presentación1
Publicidad

Más de EdisonIza7 (6)

PPTX
Proposisiones por Edison Iza
PPTX
Paradigma Conductista por Edison Iza
PPTX
Proposición Simple y Compuesta - conjuntos por Edison Iza
PPTX
Cifras significativas y redondeo por Edison Iza
PPTX
Justicia: Idealismo-Materialismo por Edison Iza
PPTX
Los Ecosistemas por Edison Iza
Proposisiones por Edison Iza
Paradigma Conductista por Edison Iza
Proposición Simple y Compuesta - conjuntos por Edison Iza
Cifras significativas y redondeo por Edison Iza
Justicia: Idealismo-Materialismo por Edison Iza
Los Ecosistemas por Edison Iza

Último (20)

PDF
IPERC...................................
PDF
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
PDF
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
PDF
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
PDF
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
PDF
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
PDF
TOMO II - LITERATURA.pd plusenmas ultras
PDF
Integrando la Inteligencia Artificial Generativa (IAG) en el Aula
PDF
2.0 Introduccion a processing, y como obtenerlo
PDF
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
PDF
Aumente su Autoestima - Lair Ribeiro Ccesa007.pdf
PDF
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
PDF
Introducción a la historia de la filosofía
DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
DOCX
PLANES DE área ciencias naturales y aplicadas
PDF
Unidad de Aprendizaje 5 de Educacion para el Trabajo EPT Ccesa007.pdf
PPTX
Doctrina 1 Soteriologuia y sus diferente
PDF
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
DOC
Manual de Convivencia 2025 actualizado a las normas vigentes
PDF
Atencion prenatal. Ginecologia y obsetricia
IPERC...................................
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
TOMO II - LITERATURA.pd plusenmas ultras
Integrando la Inteligencia Artificial Generativa (IAG) en el Aula
2.0 Introduccion a processing, y como obtenerlo
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
Aumente su Autoestima - Lair Ribeiro Ccesa007.pdf
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
Introducción a la historia de la filosofía
PLAN DE CASTELLANO 2021 actualizado a la normativa
PLANES DE área ciencias naturales y aplicadas
Unidad de Aprendizaje 5 de Educacion para el Trabajo EPT Ccesa007.pdf
Doctrina 1 Soteriologuia y sus diferente
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
Manual de Convivencia 2025 actualizado a las normas vigentes
Atencion prenatal. Ginecologia y obsetricia

Estadística por Edison Iza

  • 3. Historia de la Estadística Establecer reparto de tierras. Se llevaban registros de nacimientos, muertes y matrimonios también se registraban datos sobre la población y riquezas de los territorios conquistados. El constante uso de estas herramientas dio origen al término estadística, que se refería a la información socioeconómica o a los datos demográficos de los estados. Europa Recoger datos de actividades agrícolas o industriales Egipto China Grecia Cuantificar, organizar y determinar el voto del ciudadano y otras actividades Elaboración de los Censos Edad Antigua Método para la organización, recolección , para la cual se analiza los datos de una muestra representativa de un total para realizar conclusiones de asociación y clasificación.
  • 4. Edad Media Durante la Edad Media (aprox. 476 – 1453 d.C.) la estadística no experimentó grandes avances, aunque pueden citarse varios censos, como el de Carlomagno en 762, para conocer la extensión de tierras pertenecientes a la Iglesia, o el registro de propiedades. Durante la Edad Moderna (aprox. 1454 – 1789), al igual que en los periodos anteriores, se continúa con la obtención de información a través de censos Edad Moderna Gaspar Neuman: Teoría de probabilidad y fenómenos aleatorios Edad Contemporánea Muestreo inferencia estadística Emplean los estudios demográficos económicos y sociales, se crean técnicas analíticas Científicos como Laplace, Gauss y Legendre desarrollaron dos conceptos muy usados en el análisis estadístico: la teoría sobre los errores en la observación, y el método de los mínimos cuadrados. Pierre de Fermat Fundador de la teoría de probabilidades, junto a Blaise Pascal
  • 5. Importancia de la estadística: • Permite una descripción más exacta. • Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar. • Permite resumir los resultados de manera significativa y cómoda. • Nos permite deducir conclusiones generales.
  • 6. TIPOS DE ESTADÍSTICA Estadística descriptiva o deductiva Es un tipo de estadística que se emplea con la finalidad de poder analizar y describir una serie de conjuntos de tipo numérico, tales series numéricas buscan representar diversos niveles de fenómenos para el mejor manejo de su análisis. En este tipo de estadística no es muy factible llegar a conclusiones definitivas. Características de las estadística descriptiva o deductiva Se implementa cuando se requiere de la elaboración de un resumen que abarque todo tipo de información que en su momento sea requerida. Para eso, la información se asimilará en una serie de conjuntos numéricos que permiten el manejo estadístico.
  • 7. Estadística inferencial o inductiva Se trabaja a través del manejo de una serie de datos que se obtienen en una muestra predeterminada, con la finalidad específica de obtener una serie de predicciones que permitan fundamentar las conclusiones a las que se ha llegado en el objeto de estudio. Características de las estadista inferencial o inductiva En su tratamiento este tipo de estadística persigue los siguientes objetivos que son: Llegar a conclusiones validas en relación a la muestra que se definió para la población objeto de estudio. Presentar probables niveles de incertidumbre respecto a un escenario con su respectiva explicación.
  • 8. Estadística Aplicada En este caso nos encontramos con dos tipos de estadística, una llamada descriptiva o deductiva y otra conocida como diferencial o inductiva. Para poder delimitar la población que será objeto de estudio, se recurre a una serie de elementos que se consideran “estimadores”. Este tipo de recursos de estudios son empleados en áreas del conocimiento como la medicina, historia, psicología y sociología. Características de las estadística aplicada Este tipo de estadística busca explicar el resultado que se obtiene de una muestra que explica el objeto de estudio conocido como el universo del problema. Generalmente se emplean los estudios estadísticos de la media, la moda y mediana de un fenómeno de las variables estadísticas.
  • 9. Estadística Matemática Es un formato de estadística en el que existe el trabajo formal de los datos mediante la teoría que más se ajuste a las necesidades del objeto de estudio. Dichas teorías tienen que ver con el tema de la probabilidad y otras áreas de la matemática. Características de las estadística matemática Lo que se busca con este tipo de estadística es obtener información relevante a través de la categorización de una serie de datos numéricos o para tal fin se apega a la teoría de la probabilidad y estadística.
  • 10. Tras la recogida de datos, el siguiente paso en un trabajo estadístico consiste en una representación de estos datos de manera directa, concisa y visualmente atractiva. Esto se hace en Estadística mediante la tabulación de la variable estadística o del atributo. Realizar una tabulación consiste en elaborar tablas simples, fáciles de leer y que de manera general ofrezcan una acertada visión de las características más importantes de la distribución estadística estudiada. Tabulación de Datos
  • 11. La tabulación de un carácter cualitativo es la más simple de todas. Como norma general , para construir una tabla de un carácter cualitativo, debemos tener en cuenta: • Construir una tabla de tres columnas. • En la primera columna se colocan los distintos atributos. • En la segunda columna las frecuencias absolutas, (recuento de datos para cada atributo). • En la tercera columna las frecuencias relativas (división de frecuencia absoluta entre el total de datos), o los porcentajes (para porcentajes se multiplica por cien los valores de la frecuencia relativa). Carácter Cualitativo
  • 13. Tabulación de datos Consiste en elaborar tablas simples, fáciles de leer y que de manera general ofrezcan una acertada visión de las características más importantes de la distribución estadística estudiada.
  • 14. Tabulación para carácter cualitativo • La tabulación de un carácter cualitativo es la más simple de todas. Como norma general , para construir una tabla de un carácter cualitativo, debemos tener en cuenta: Construir una tabla de tres columnas. • En la primera columna se colocan los distintos atributos. • En la segunda columna las frecuencias absolutas, (recuento de datos para cada atributo). • En la tercera columna las frecuencias relativas (división de frecuencia absoluta entre el total de datos), o los porcentajes (para porcentajes se multiplica por cien los valores de la frecuencia relativa).
  • 15. Tabulación de carácter cuantitativo • Para realizar una tabulación de una variable cuantitativa discreta, se recomienda la siguiente disposición: En la primera columna colocar los distintos valores ordenados de menor a mayor de la variable discreta. • En la segunda columna los valores de las frecuencias absolutas (recuento de datos). • En la tercera columna los valores de las frecuencias relativas (división de la frecuencia absoluta entre el total de datos) o de los porcentajes (para porcentajes se multiplica por cien cada frecuencia relativa). • En la cuarta columna los valores de las frecuencias absolutas acumuladas (acumulación o suma de cada frecuencia absoluta con todas las anteriores). • En la quinta columna los valores de las frecuencias relativas acumuladas o porcentajes acumulados (lo mismo que para el caso de la frecuencia relativa).
  • 16. De una muestra de 9 estudiantes, se solicita el número de calzado que utilizan: Datos obtenidos: 42, 38, 37, 34, 35, 38, 42, 40, 42 1.- Se ordena los datos de menor a mayor. 34, 35, 37, 38, 38, 40, 42, 42, 42 2.- Se construye una tabla de datos xi fi Fi hi fi/n Hi % hix100 Nº de grados= fi/n x360 34 1 1 1/9= 0,11 0,11 11% 1/9x360= 40º 35 1 2 1/9= 0,11 0,22 11% 1/9x360=40º 37 1 3 1/9=0,11 0,33 11% 1/9x360=40º 38 2 5 2/9=0,22 0,55 22% 2/9x360=80º 10 1 6 1/9=0,11 0,66 11% 1/9x360=40º 42 3 9 3/9=0,33 0,99-1 33% 3/9x360=120º Total n=9 99% 360º
  • 17. TABULACIÓN DE DATOS AGRUPADOS 1.- Se ordena los datos de mayor a menor 2.- Se identifica el límite superior e inferior 3.- Se calcula el rango R= Ls -Li 4.- Se calcula el intervalo K=1+3,322xlog(Nº de casos) 5.- Se calcula la amplitud A=R/K Nota: En el casillero de clase se colocan los datos obtenidos en la encuesta, según corresponda.
  • 18. Número de calzado de 10 estudiantes: Datos obtenidos: 40,38,35,37,34,39,41,38,40,38 Se ordena los datos de menos a mayor: 34,35,37,38,38,38,39,40,40,41 Se calcula el rango: R=Ls -Li R=41-34 R=7 Se calcula el intervalo: K=1+3,322xlog(nº de casos) K=1+3,322xlog10 K=5 Se calcula la amplitud: A=R/K A=7/5 A= 2 Se construye la tabla de datos.
  • 19. xi Clase Marca de clase fi Fi hi fi/n Hi % hix100 Nº de grados= fi/n x360 1 [34-36) 35 2 2 2/10= 0,2 0,2 20% 2/10x360= 72º 2 [36-38) 37 1 3 1/10= 0,1 0,3 10% 1/10x360=36º 3 [38-40) 40 4 7 4/10=0,4 0,7 40% 4/10x360=144º 4 [40-42) 41 3 10 3/10=0,3 1 30% 3/10x360=108º Total n=10 1 100% 360º
  • 21. Es una tabla estadística que recoge datos de frecuencias y los analiza
  • 22. ¿Qué es una frecuencia? • Es lo mismo que un conteo, es el número que resulta de contar las veces que se repite un término en una lista de números. Ejemplo: 5 5 5 5 5 5 5 5 5 5 El número 5 se repite 10 veces, por lo que su frecuencia absoluta es 10
  • 23. ¿Qué es frecuencia absoluta? • Es la frecuencia como tal, se la hace con un conteo manual, además de la cantidad que resulta del conteo, se lo representa con las letras fi. • Ejemplo: 222222 Xi Conteo fi 1 |||||| 6
  • 24. ¿Qué que es frecuencia absoluta acumulada? • Es una estrategia para asegurarse que el conteo esta bien hecho, se lo hace tal que el último término debe ser el mismo que la cantidad total de términos. Se van sumando las frecuencias absolutas de cada piso, una después de la otra, se lo representa con las letras Fi. fi Fi Procedimiento 3 3 Se mantiene el mismo número 4 7 4+3 5 12 7+5 N=12
  • 25. ¿Qué es frecuencia relativa? • Es la frecuencia acumulada de cada término, pero dividida por el total de términos (n), esta relacionada con el porcentaje. Se la representa con las letras hi. fi hi Procedimiento 4 0.4 4/10 2 0.2 2/10 4 0.4 4/10 n= 10
  • 26. ¿Qué es la frecuencia relativa acumulada? • Es el mismo procedimiento de revisión si esta bien hecho el conteo de la frecuencia absoluta, solo que con la frecuencia relativa. • Igualmente se calcula sumando cada espacio, uno por uno, de todas las frecuencias relativas. • Se suman de tal forma que al final debe dar 1
  • 27. Porcentaje • Usando la frecuencia relativa se puede calcular el porcentaje • Se multiplica a la frecuencia relativa por 100 • También es lo mismo que la división de la frecuencia absoluta por el total de términos (n) todo multiplicado por 100 • 𝑓𝑖 𝑛 ∗ 100 = ℎ𝑖 ∗ 100 = %
  • 28. Grados • Para construir un gráfico tipo pastel, se necesitan los porcentajes de cada frecuencia, para dibujarlo necesitamos calcular cuantos grados tiene cada parte del pastel. • Se calcula con la multiplicación del porcentaje por 3.6, o la frecuencia relativa por 360 𝑋° = 360 100 ∗ % 𝑋° = 360 ∗ ℎ𝑖
  • 29. Ejemplo 1 • Le preguntamos a 67 estudiantes de la facultad cual es su materia favorita Xi fi Fi hi Hi Biología 20 20 0.29850746 0.298507 Lenguaje 17 37 0.25373134 0.55223834 Estadística 10 47 0.14925373 0.70149207 Matemática 5 52 0.07462687 0.77611894 Química 3 55 0.04477612 0.82089506 Investigación 5 60 0.07462687 0.89552193 Psicología 4 64 0.05970149 0.95522342 Zoología 2 66 0.02985075 0.98507416 Pedagogía 1 67 0.01492537 0.99999954 n= 67
  • 30. Cuadro de barras 0.00 5.00 10.00 15.00 20.00 25.00 30.00 35.00 Biología Lenguaje Estadística Matemática Química Investigación Psicología Zoología Pedagogía Chart Title
  • 32. Ejemplo 2 • Le preguntamos a 135 estudiantes de la facultad cual es su sabor favorito Xi fi Fi hi Hi Vainilla 34 34 0.25 0.25185185 Chocolate 21 55 0.16 0.40740741 Mora 20 75 0.15 0.55555555 Guanábana 17 92 0.13 0.68148148 Chicle 16 108 0.12 0.8 Café 14 122 0.10 0.9037037 Ron con pasas 10 132 0.07 0.97777778 Oreo 2 134 0.01 0.99259259 Fresa 1 135 0.01 1 n= 135
  • 33. Cuadro de barras 0 5 10 15 20 25 30 35 40 Vainilla Chocolate Mora Guanábana Chicle Café Ron con pasas Oreo Fresa Sabor favorito
  • 35. Ejemplo 3 • Se les preguntó a 524 estudiantes su videojuego favorito Xi fi Fi hi Hi Supermario 70 70 0.13 0.13358779 GTA V 70 140 0.13 0.26717558 Minecraft 66 206 0.13 0.39312977 GTA San andreas 64 270 0.12 0.51526718 Mortal Kombat 60 330 0.11 0.629771 Resident Evil 58 388 0.11 0.74045802 Call of duty 54 442 0.10 0.84351145 FIFA 52 494 0.10 0.9427481 Leyend of zelda 30 524 0.06 1 n= 524
  • 36. Cuadro de barras 0 10 20 30 40 50 60 70 80 Supermario GTA V Minecraft GTA San andreas Mortal Kombat Resident Evil Call of duty FIFA Leyend of zelda Título del gráfico
  • 37. CUADRO DE PASTEL Supermario 13% GTA V 13% Minecraft 13% GTA San andreas 12% Mortal Kombat 12% Resident Evil 11% Call of duty 10% FIFA 10% Leyend of zelda 6%
  • 38. Media, mediana, moda, varianza, desviación estándar y punto z
  • 39. Ejercicio 1 • Se tienen los siguientes 30 datos de 30 estudiantes, respecto a las veces que se les reprendió de forma disciplinaria, separándolos por sus notas. intervalo x fi Fi fixi (x-ẋ)ʌ2 fi*(x-ẋ)ʌ2 0 4 2 4 4 8 87.1111111 348.444444 4 8 6 5 9 30 28.4444444 142.222222 8 12 10 7 16 70 1.77777778 12.4444444 12 16 14 5 21 70 7.11111111 35.5555556 16 20 18 9 30 162 44.4444444 400 Sumatoria 30 340 938.666667
  • 40. Mediana, Moda, Varianza, Desviación estándar, Coeficiente de variación, Puntaje z Mediana 11.4285714 Moda 10 Varianza 31.2888889 Desviación estándar 5.59364719 Coeficiente de variación 276.078431 Puntaje z -0.04261364
  • 42. Ejemplo 2 • Se tienen los siguientes 30 datos de 30 afiliados del IESS que cuentan las veces que sacaron turnos, diferenciados por sus edades. intervalo x fi Fi fixi (x-ẋ)ʌ2 fi*(x-ẋ)ʌ2 40 44 42 5 5 210 70.56 352.8 44 48 46 6 11 276 19.36 116.16 48 52 50 7 18 350 0.16 1.12 52 56 54 5 23 270 12.96 64.8 56 60 58 7 30 406 57.76 404.32 Sumatoria 30 1512 939.2
  • 43. Mediana, Moda, Varianza, Desviación estándar, Coeficiente de variación, Puntaje z Mediana 50.2857143 Moda 49.3333333 Varianza 31.3066667 Desviación estándar 5.59523607 Coeficiente de variación 62.1164021 Puntaje Z -0.01277683
  • 44. GRÁFICO DE PASTEL 17% 20% 23% 17% 23% Turnos de afiliados del IESS por edad 40-44 44-48 48-52 52-56 56-60
  • 45. Ejemplo 3 • Se tienen los siguientes 75 datos de 75 trabajadores en una empresa que cuentan las veces que dieron permisos al año, diferenciados por sus edades. intervalo x fi Fi fixi (x-ẋ)ʌ2 fi*(x-ẋ)ʌ2 20 24 22 5 5 110 92.16 460.8 24 28 26 10 15 260 31.36 313.6 28 32 30 20 35 600 2.56 51.2 32 36 34 30 65 1020 5.76 172.8 36 40 38 10 75 380 40.96 409.6 Sumatoria 75 2370 1408
  • 46. Mediana, Moda, Varianza, Desviación estándar, Coeficiente de variación, Puntaje z Mediana 32.5 Moda 30 Varianza 18.7733333 Desviación estándar 4.33282048 Coeficiente de variación 59.4092827 Puntaje Z -0.08522727
  • 47. Gráfico de pastel 7% 13% 27%40% 13% Permisos de los trabajadores por edades 20-24 24-28 28-32 32-36 36-40
  • 49. Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la cantidad de datos en partes iguales. Las más usuales son la media, la mediana, la moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser de dos tipos: de tendencia central o de tipismo. Medidas de Dispersión: se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables cuantitativas. Las más usuales son el desvío estándar y la varianza. Medidas de tendencia central
  • 50. La media de un conjunto de números, algunas veces simplemente llamada el promedio , es la suma de los datos divididos entre el número total de datos. La Media
  • 51. El cálculo de la Media Dado un conjunto de observaciones la media se representa mediante y se obtiene dividiendo la suma de todos los datos por el número de ellos, es decir: La interpretación de la media como centro (o punto de equilibrio) de los datos se apoya en una propiedad que afirma que la suma de las desviaciones de un conjunto de observaciones a su media es igual a cero; es decir, puede probarse que
  • 52. Cálculo de la media aritmética cuando los datos se repiten. Ejemplo. Las notas de un grupo de alumnos fueron: Notas Frecuencia absoluta Notas x F. absoluta 3 5 15 5 8 40 6 10 60 7 2 14 Total 25 129 1,5 25 129 Media  Datos por frecuencias Total de datos 1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y se suman. 2º. El resultado se divide por el total de datos. Media aritmética (II)
  • 53. Mediana La mediana, a diferencia de la media no busca el valor central del recorrido de la variable según la cantidad de observaciones, sino que busca determinar el valor que tiene aquella observación que divide la cantidad de observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenación de los datos, y debido a ello, este cálculo depende de la posición relativa de los valores obtenidos. Es necesario, antes que nada, ordenar los datos de menor a mayor (o viceversa). En caso que N sea impar
  • 54. La mediana de un conjunto de datos es un valor del mismo tal que el número de datos menores que él es igual al número de datos mayores que él. Los pesos, en kilogramos, de 7 jugadores de un equipo de fútbol son: Ejemplo: 72, 65, 71, 56, 59, 63, 72 1º. Ordenamos los datos: 56, 59, 63, 65, 71, 72, 72 2º. El dato que queda en el centro es 65. La mediana vale 65. Si el número de datos fuese par, la mediana es la media aritmética de los dos valores centrales. Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es: 64 2 6563   Caso: La mediana
  • 55. Moda La moda, es aquel dato, aquel valor de la variable que más se repite; es decir, aquel valor de la variable (que puede no ser un único valor) con una frecuencia mayor.
  • 56. La moda de un conjunto de datos es el dato que más se repite. Una zapatería ha vendido en una semana los zapatos que se reflejan en la tabla: Ejemplo. La moda es 41. Nº de calzado 38 39 40 41 42 43 44 45 Nº de personas 16 21 30 35 29 18 10 7 El número de zapato más vendido, el dato con mayor frecuencia absoluta, es el 41. Lo compran 35 personas La moda
  • 57. Medidas de Dispersión El desvío estándar Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media. Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el nombre de desvío estándar, o desviación típica y es representada por la siguiente fórmula:
  • 58. La Varianza El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética. Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la manera de simbolizarla es. Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza
  • 59. 8 cm. Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos tienen la misma base). ¿Existe alguna variación respecto de su altura entre estos rectángulos? ¿Cuál es el promedio de la altura de estos rectángulos? 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 9 = 72 9 = 8
  • 60. El quinto rectángulo y el octavo rectángulo en un acto de rebeldía cambiaron su altura. El quinto rectángulo, ahora de color rojo, mide 10 centímetros, y el octavo rectángulo, de color azul, mide 6 centímetros? ¿Cuál es el nuevo promedio de estos 9 rectángulos? 8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8 9 = 72 9 = 8 ... ¡el mismo promedio! Pero... ¿ha habido variación? 8 cm. 10 cm 6 cm
  • 61. El rectángulo rojo tiene +2 centímetros sobre el promedio, y el rectángulo azul tiene –2 centímetros bajo el promedio. Los otros rectángulos tienen cero diferencia respecto del promedio. 8 cm. 10 cm 6 cm Si sumamos estas diferencias de la altura respecto del promedio, tenemos 0 + 0 + 0 + 0 + 2 + 0 + 0 – 2 + 0 = 0 Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin embargo, ante nuestros ojos, sabemos que hay variación.
  • 62. 8 cm. 10 cm 6 cm Una forma de eliminar los signos menos de aquellas diferencias que sean negativas, esto es de aquellos mediciones que estén bajo el promedio, es elevar al cuadrado todas las diferencias, y luego sumar... 02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8 Y este resultado repartirlo entre todos los rectángulos, es decir lo dividimos por el número de rectángulos que es 9 02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 9 9 8 = 0,89
  • 63. 8 cm. 10 cm 6 cm Se dice entonces que la varianza fue de 0,89 Observemos que las unidades involucradas en el cálculo de la varianza están al cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados. De manera que se define 0,89 0,943 La raíz cuadrada de la varianza se llama desviación estándar
  • 64. 8 cm. 10 cm 6 cm Que la desviación estándar haya sido de 0,943 significa que en promedio la altura de los rectángulos variaron (ya sea aumentando, ya sea disminuyendo) en 0,943 centímetros. Es claro que esta situación es “en promedio”, puesto que sabemos que los causantes de la variación fueron los rectángulos quinto y octavo. Esta variación hace repartir la “culpa” a todos los demás rectángulos que se “portaron bien”. La desviación estándar mide la dispersión de los datos respecto del promedio
  • 65. 8 cm. 10 cm 6 cm 4 cm 8 cm. 8 cm. 8 cm. 7 cm. 8 cm. ¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos? En primer lugar debemos calcular el promedio 8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8 9 = 7,44 Luego debemos calcular la varianza
  • 66. 8 cm. 10 cm 6 cm 4 cm 8 cm. 8 cm. 8 cm. 7 cm. 8 cm. Promedio 7,44 0,56 -3,44 0,56 0,56 2,56 0,56 -0,44 -1,44 0,56 0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 9 22,2224 9 = = 2,469Este es el valor de la varianza
  • 67. 10 cm 8 cm. 6 cm 4 cm 8 cm. 8 cm. 8 cm. 7 cm. 8 cm. Promedio 7,44 Si la varianza fue de 2,469, entonces la desviación estándar es de... 2,469 1,57 Lo que significa que, en promedio, los rectángulos se desviaron más o menos (más arriba o más abajo) en 1,57 centímetros.
  • 68. Para entender la varianza necesariamente debe saber: •Sumar •Restar •Multiplicar •Dividir •Potencia de orden 2 •Raíz cuadrada Y es claro que esto no es suficiente (salvo que queramos que aprenda de memoria los cálculos). Necesitamos estimular su imaginación para que “vea” la variabilidad existente en la naturaleza. Entregue una lista de fenómenos en que un mismo atributo tenga variabilidad si se mide este atributo a un número de individuos u objetos.
  • 70. • La Dispersión hace referencia a la forma en que se dispersan o alejan las puntuaciones de una distribución o lista de puntajes 0 1 2 3 4 5 6 7 5 6 7 8 9 10 11 12 No.DEPERSONAS EDADES EDAD 0 2 4 6 8 10 12 14 5 6 7 8 9 10 11 12 MEDIA: 8.5 años
  • 71. MEDIDAS DE DISPERSION • RANGO (Símbolo: R) • DESVIACIÓN MEDIA (Símbolo Dx) • DESVIACIÓN ESTÁNDAR O TÍPICA (Símbolo σ ó S) • VARIANZA (σ2 ó S2)
  • 72. RANGO  El Rango corresponde a la distancia entre el puntaje mayor (llamado valor máximo) y el puntaje menor (llamado valor mínimo). Rango = XMax – XMin
  • 73. La siguiente tabla representa la pérdida de peso en libras, de un grupo de personas que se sometieron a un tratamiento durante el último año. Valor Máximo: 60 Valor Mínimo: 10 Rango = XMax – XMin = 60 - 10 = 50 3- 73 10 13 22 26 16 23 35 53 17 32 41 35 24 23 27 16 20 60 48 EJEMPLO
  • 74. DESVIACIÓN MEDIA La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la La desviación media se representa por Dx
  • 75. Varianza: Corresponde a la Desviación Estándar al cuadrado. Desviación Estándar o Típica: Indica cómo se dispersan los datos con respecto a la media. 3- 75 DESVIACION ESTANDAR Y VARIANZA Varianza: La media aritmética de las desviaciones cuadradas de la media. Desviación Estándar: Corresponde a la Raíz Cuadrada de la Varianza.
  • 76. EJEMPLO • Calcular varianza y desviación estándar para los siguientes puntajes • 10 – 12 – 15 – 18 - 20  (X - )2 N  =  2
  • 77. EJEMPLO X 10 -5 25 12 -3 9 15 0 0 18 3 9 20 5 25 2 )( XX XX  15X 6,13 5 682  69,36,13 
  • 78. Varianza en Muestras (s2) s2 = (X - X)2 n-1 Desviación Estándar en Muestras (s) 2 ss  3- 78 VARIANZA Y DESVIACIÓN ESTÁNDAR EN MUESTRAS
  • 79. RANGO En estadística, el rango representa la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos. El rango nos muestra la distribución de los valores en una serie. Si el rango es un número muy alto, entonces los valores de la serie están bastante distribuidos. En cambio, si se trata de un número pequeño, quiere decir que los valores de la serie están muy cerca entre sí.
  • 80. Cómo calcular el rango estadístico 1.- Haz una lista con los elementos de tu conjunto de datos. Para encontrar el rango de un conjunto, debes hacer una lista con todos los elementos para que puedas identificar los números más altos y los más bajos. Escribe todos los elementos. Los números de este conjunto son: 14, 19, 20, 24, 25 y 28. Puede ser más sencillo identificar el valor máximo y el valor mínimo en el conjunto si pones los números en orden ascendente. • En este ejemplo, acomodaremos los números de esta manera: 14, 19, 20, 24, 24, 25, 28. Al poner los elementos en orden también se te facilitarán otro tipo de cálculos, como encontrar la moda, la media o la mediana del conjunto.
  • 81. 2.- Identifica los valores mínimo y máximo del conjunto. En este caso, el número más bajo del conjunto es 14 y el más grande es 25.
  • 82. 3.- Réstale el valor mínimo del valor máximo. Ahora que has identificado el número más grande y el número más chico en el conjunto, lo único que debes hacer es restarlos. Resta 14 de 25 (25 - 14) para obtener 11, el rango del conjunto.
  • 83. • 4.- Etiqueta claramente tu rango. Una vez que hayas encontrado el rango, etiquétalo con claridad. Esto te ayudará a evitar confundirlo con algún otro cálculo estadístico que tengas que hacer, como la media, la moda o la mediana. Fórmula
  • 84. Intervalo • menciona la distancia o el espacio que hay de un lugar a otro o de un tiempo a otro. • Es la clasificación de los datos de una muestra en grupos definidos, también se le llama clase: • Ii = [a;b[ • donde a es el Límite inferior y b es el Límite superior. A este intervalo de clase pertenecen los datos x que cumplen la condición: a <= x <b
  • 85. • NÚMEROS DE INTERVALOS DE CLASE (k) Para obtener un valor aproximado, podemos emplear la regla de ¨STURGES¨. • k = 1 + 3,3logN • donde N es el número de elementos de la muestra. • AMPLITUD DE IN INTERVALO DE CLASE (C) Es la diferencia entre el límite superior e inferior de cada intervalo determinado. • Ii = [a;b[, entonces C = b – a • También podemos aplicar: • Donde: R: Rango k: número de intervalos de clase
  • 86. Amplitud • La amplitud total (AT) es la diferencia entre la puntuación de mayor valor y la de menor valor: La amplitud total es un estadístico muy sencillo y fácil de calcular, pero a menudo esta simplicidad es un inconveniente. Consideremos el siguiente ejemplo:
  • 87. Los grupos A y B son bastante semejantes, pero no los coeficientes de amplitud. La diferencia en los coeficientes es ocasionada por la variación introducida por una sola puntuación con valor extremo, el 1000. Por esta razón es conveniente disponer de otras medidas más adecuadas. Principales características: Además de la ya señalada, el coeficiente de amplitud total no tiene en cuenta los valores entre extremos, que son los que determinan su valor.
  • 88. Marca de clase La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros como la media aritmética o la desviación típica.
  • 89. ¿Como calcular la marca de clase ? • Se calcula la marca de clase (Xi), que es el valor medio o promedio de cada intervalo, el cual sirve para facilitar el cálculo de algunas medidas de posición y de dispersión. • Una vez escogido el número de intervalos se determina la amplitud de cada clase o intervalo (C).
  • 90. • Esta amplitud es igual al rango de los datos dividida en el número de intervalos. • El primer intervalo debe contener el menor valor de los datos y el último intervalo debe contener el mayor valor de los datos. • Se determina el número de intervalos o clase (K) que se utilizan para agrupar los datos. • En general se recomienda tener, hasta donde sea posible, tener entre 5 y 20 intervalos o clases.
  • 91. En consideración • Sin embargo, si no se tiene seguridad del número de intervalos a utilizar, se puede aplicar la regla de Sturges, con la cual se obtiene una aproximación aceptable sobre el número de intervalos necesarios para agruparlos. • La regla de Sturges es una regla que permite calcular el numero de clase cuando se conoce el tamaño de la población o muestra.
  • 96. Hallar la media de la distribución estadística que viene dada por la siguiente tabla: Intervalos Marca de clase ( xi ) Frecuencia absoluta (fi ) xi · fi [10, 15) 12.5 3 37.5 [15, 20) 17.5 5 87.5 [20, 25) 22.5 7 157.5 [25, 30) 27.5 4 110 [30, 35) 32.5 2 65 21 457.5
  • 98. Intervalos Marca de clase ( xi ) Frecuencia absoluta (fi ) xi · fi [0-10) 5 3 15 [10-20) 15 6 90 [20-30) 25 7 175 [30-40) 35 12 420 [40-50) 45 3 135 31 835
  • 99. Intervalos Marca de clase ( xi ) Frecuencia absoluta (fi ) xi · fi [10, 20) 15 1 15 [20, 30) 25 8 200 [30,40) 35 10 350 [40, 50) 45 9 405 [50, 60) 55 8 440 [60,70) 65 4 260 [70, 80) 75 2 150 42 1 820 En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.
  • 100. Resolución de la mediana 1.-Ordenamos los datos de menor a mayor. 2.-Si la serie tiene un número impar de medidas la mediana es la puntuación central. 2, 3, 4, 4, 5, 5, 5, 6, 6 Mediana = 5
  • 101. Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me = 9,5 Existen dos métodos para el cálculo de la mediana: • Considerando los datos en forma individual, sin agruparlos. • Utilizando los datos agrupados en intervalos de clase.
  • 102. • En los datos no agrupados la formula para calcular la Me= n/2 o Me=(n+1)/2 • En los datos agrupados la formula es
  • 103. Mediana 1.- Encuesta a 179 estudiantes de su clase.
  • 104. 2.- Encuesta de las edades de 250 alumnos, determinar la mediana.
  • 105. Resolución de la mediana
  • 106. • Me = Mediana • L i - 1 = Límite inferior de la clase de la mediana. • ni = Frecuencia de la clase de la mediana • N = Total de datos o frecuencias. • N i - 1 = Frecuencia acumulada anterior a la mediana.
  • 107. Moda 1.Escribe los números de la serie de datos. 2.Ordena los números de menor a mayor.
  • 108. 3.Cuenta el número de veces que se repite cada número. 4.Identifica el valor (o valores) que aparecen con mayor frecuencia ese será la moda.
  • 109. • Ejemplo de moda para datos agrupados. De la tabla de distribución de frecuencias anterior calcular la moda de inasistencias