INTRODUCCIÓN
La estadística seocupa de recoger, resumir,
representar y analizar los datos obtenidos de un
conjunto de personas o cosas con la finalidad de
extraer consecuencias de tipo práctico.
Es la parte de las Matemáticas que estudia como
recopilar y resumir gran cantidad de información
para extraer conclusiones.
3.
POBLACIÓN Y MUESTRA:
Población:Es el conjunto de todos los elementos cuyo
conocimiento nos interesa.
Ejemplo:
Deseamos estudiar el número de hermanos, la estatura y el
lugar de procedencia de los alumnos del curso matemática 6.
Muestra: Es un subconjunto, extraído de la población, cuyo
estudio sirve para inferir características de toda la población.
Ejemplo:
Es muy laborioso entrevistar a todos los estudiantes del curso
de matemática 6 por lo que seleccionaríamos una muestra
representativa.
4.
VARIABLES ESTADÍSTICAS:
Se llamavariable estadística a cada una de las
características que se estudian en una población.
Las variables estadísticas se clasifican en:
Cualitativas: son las que no toman valores numéricos.
Por ejemplo: el color del pelo, el lugar de nacimiento, el
signo del Zodiaco,…
Cuantitativa: son las que toman valores numéricos. Entre
ellas distinguimos dos tipos:
Discretas: cuando sólo puede tomar valores aislados.
Por ejemplo el número de hermanos en una familia.
Continua: es una variable que puede tomar cualquier
valor dentro de un intervalo. Por ejemplo el peso o la
estatura de los alumnos.
En el siguientecuadro se muestran algunos ejemplos de estudios
estadísticos:
Estudio
estadístico
Población: ¿Es
necesario
tomar
muestra?
Variable
estadística:
Tipo de
variable.
Color del auto
de los
ciudadanos.
Autos de los
ciudadanos.
Sí. Color. Cualitativa.
Altura de los
alumnos de la
clase.
Alumnos de la
clase.
No. Altura. Cuantitativa
continua.
Edad de los
miembros de
una familia.
Miembros de
la familia.
No. Edad. Cuantitativa
discreta.
7.
Pasos en unestudio estadístico:
Selección de caracteres dignos de estudio.
Selección de la muestra.
Recogida de datos.
Ordenación de datos.
Recuento de frecuencias.
Agrupación de datos.
Elaboración de tablas estadísticas.
Representación gráfica de la distribución.
Cálculo de parámetros.
Sacar consecuencias válidas para la población, a partir
de la muestra. Estadística inferencial.
8.
Frecuencias absolutas:
Lafrecuencia absoluta fi de un valor xi de una variable
estadística es el número de veces que tomamos dicho valor.
Ejemplo: xi: número de hijos
fi: número de parejas que tienen ese número
de hijos
xi fi
0
1
2
3
4
5
6
4
18
41
32
11
3
1
9.
Frecuencias relativas
Lafrecuencia relativa, hi, de
un valor xi determinado de
una variable estadística es
igual al cociente entre la
frecuencia absoluta fi del
valor y el número n de
individuos de la población o
muestra:
100
%
i
i
i
h
n
f
h
xi fi hi %
0
1
2
3
4
5
6
4
18
41
32
11
3
1
0.036
0.164
0.373
0.291
0.1
0.027
0.009
3.6
16.4
37.3
29.1
10.0
2.7
0.9
110 1.000 100
10.
Frecuencias absolutas acumuladas:
Lafrecuencia absoluta acumulada, Fi
correspondiente a un valor xi es la suma
de las frecuencias absolutas de los
valores menores o iguales que el dado:
Fi = f1+f2+…fn =
La frecuencia relativa acumulada, Hi
correspondiente a un valor xi es la suma
de las frecuencias relativas de los
valores menores o iguales que el dado:
Hi = h1+h2+…+hn=
i
f
i
h
11.
Tabla de distribuciónde frecuencias:
xi fi Fi hi Hi %
0
1
2
3
4
5
6
4
18
41
32
11
3
1
4
22
63
95
106
109
110
0.036
0.164
0.373
0.291
0.1
0.027
0.009
0.036
0.2
0.573
0.864
0.964
0.991
1
3.6
16.4
37.3
29.1
10.0
2.7
0.9
110 1.000 100
12.
Tabla con datosagrupados en intervalos:
Variable continua.
Número de valores que
toma la variable es muy
numeroso.
1.-Determinamos el número de
intervalos:
2.- Localizamos los valores
extremos y se halla su
diferencia:
r = b – a
3.- Amplitud del intervalo:
4.- Marca de clase, es el punto
medio del intervalo.
N
ervalos
de
n
recorrido
int
º
Pasos para
construir la
tabla:
13.
Ejemplo:
Construir una tablade frecuencias agrupadas en intervalos
con los datos siguientes.
Estatura de 40 adolescentes:
168 160 167 175 175
167 168 158 149 160
178 166 158 163 171
162 165 163 156 174
160 165 154 163 165
161 162 166 163 159
170 165 150 167 164
165 173 164 169 170
Dato menor = 149
Dato mayor = 178
Rango(R) = 178 – 149 = 29
Nº de intervalos:
Redondeamos al entero más
próximo.
Tomamos 6 intervalos.
Amplitud = 29/6
Redondeamos = 5
40
Mediana:
La mediana esel dato que ocupa la
posición intermedia de la distribución,
está después del 50% de los datos y
precediendo al otro 50%
Medidas de centralización:
Media:
Es la medida de posición central
más utilizada. Para calcularla se utiliza la
siguiente expresión:
Moda:
La moda es el valor de la variable que
tiene más frecuencia, es decir, que
se ha obtenido más veces.
n
f
x
x i
i ·
i
i
i
i a
f
F
N
L
Me
1
2
i
i
i
i
i
i
i
i a
f
f
f
f
f
f
L
Mo
)
(
)
(
)
1
1
1
20.
Ejemplo:
A un grupode 20 personas se les preguntó por su edad y se ordenó la
información en la siguiente tabla de intervalos. Hallar la media, la mediana y la
moda.
Edades: xi fi F
[13 - 15] 14 4 4
[15 - 17] 16 9 13
[17 - 19] 18 3 16
[19 - 21] 20 3 19
[21 - 23] 22 1 20
Intervalos: Marca de clase Frecuencia
absoluta
Frecuencia
absoluta acumulada
21.
Media:
n
f
x
x i
i ·
En la fórmula nos
piden hallar la
sumatoria de los
xi y las fi
Pero en la tabla
anterior no
aparece dicha
categoría, por lo
que agregaremos
a la tabla dicha
parte.
Por tanto…
22.
La tabla entoncesquedaría así:
Edades: xi fi F
[13 - 15] 14 4 4
[15 - 17] 16 9 13
[17 - 19] 18 3 16
[19 - 21] 20 3 19
[21 - 23] 22 1 20
xi fi
56
144
54
60
22
336
Por tanto:
n
f
x
x i
i·
8
.
16
20
336
R/
23.
Mediana:
i
i
i
i a
f
F
N
L
Me
1
2
Recordemos que la mediana es el dato del
medio.
Existen dos formas de hallar el dato del
medio:
Si el número de datos es impar:
2
1
n
Si el número de datos es par:
2
n
24.
Como en estecaso el número de
datos es PAR utilizaremos la
segunda opción y tenemos:
2
n
10
2
20
Posteriormente…
25.
Edades: xi fiF
[13 - 15] 14 4 4
[15 - 17] 16 9 13
[17 - 19] 18 3 16
[19 - 21] 20 3 19
[21 - 23] 22 1 20
Buscamos el valor 10 obtenido en la
columna de las frecuencias
absolutas acumuladas…pero vemos
que no aparece…en ese caso,
escogemos el valor mayor más
próximo, es decir, 13.
Ahora escogeremos el renglón en
donde se encuentra nuestro valor
para trabajar…
De aquí
obtendremos
los datos para
trabajar en la
fórmula.
26.
i
i
i
i a
f
F
N
L
Me
1
2
2
9
4
2
20
15
Me
33
.
16
Me
Amplitud del
intervalo
Límite inferior
Frecuencia
absoluta
acumulada
anterior.
Frecuencia
absoluta.
R/
27.
Moda:
i
i
i
i
i
i
i
i a
f
f
f
f
f
f
L
Mo
)
(
)
(
)
1
1
1
Recordemosque la moda es el
dato que más se repite, por lo
que para trabajar buscaremos el
valor más grande en las columna
de las fi.
Edades: xi fi F
[13 - 15] 14 4 4
[15 - 17] 16 9 13
[17 - 19] 18 3 16
[19 - 21] 20 3 19
[21 - 23] 22 1 20
El valor escogido fue el número 9
y nos podemos dar cuenta que el
dato queda ubicado en el segundo
renglón…igual que para trabajar
la mediana. Pero no siempre será
así…en muchos casos, para
trabajar la moda no se trabaja
con los mismos datos que para la
mediana.
Medidas de tendenciacentral vs.
Medidas de dispersión.
Las medidas de tendencia central tienen como objetivo el sintetizar los
datos en un valor representativo, las medidas de dispersión nos dicen
hasta que punto estas medidas de tendencia central son
representativas como síntesis de la información.
Las medidas de dispersión cuantifican la separación, la dispersión, la
variabilidad de los valores de la distribución respecto al valor central.
31.
Medidas de dispersión:
Seutilizan para conocer la distancia de los valores de la variable a un
cierto valor central. Permiten identificar la concentración de los datos en
un cierto sector del recorrido de la variable.
32.
Desviación estándar y
Varianza:
Seutilizan para hacer generalizaciones estadísticas a partir de la
muestra y aplicarlas a la población de donde se extrajeron.
• La varianza: es la desviación cuadrada de la media. Nunca
puede ser negativa.
• La desviación estándar: es la raíz cuadrada de la varianza.
33.
Desviación Estándar (S):
Esuna medida de la cantidad típica en la que los valores del
conjunto de datos difieren de la media. Es la medida de
dispersión más utilizada, se le llama también desviación típica.
• La desviación estándar es siempre un valor no negativo S
será siempre > 0 por definición. Cuando S = 0 e X = xi
(para todo i).
• Es la medida de dispersión óptima por ser la más pequeña.
• La desviación estándar toma en cuenta las desviaciones de
todos los valores de la variable .
34.
Varianza (S2
):
La varianzaes una medida de dispersión relativa a algún punto de
referencia. Ese punto de referencia es la media aritmética de la
distribución.
Más específicamente, la varianza es una medida de que tan cerca, o
que tan lejos están los diferentes valores de su propia media
aritmética.
• Cuando más lejos están las Xi de su propia media aritmética, mayor
es la varianza.
• Cuando más cerca estén las Xi a su media menos es la varianza.
• S siempre un valor no negativo, que puede ser igual o distinta de 0.
Será 0 solamente cuando Xi= X
• La varianza es la medida de dispersión cuadrática óptima por ser la
menor de todas.
35.
Desviación Estándar (S):
Mayorvalor del coeficiente Mayor dispersión de los
datos del desvío estándar con respecto a su
media
Menor valor del coeficiente Menor dispersión de los
datos del desvío estándar (Mayor
Homogeneidad)
#2 Hacer referencia a la importancia actual de la Estadística asís como al origen de ésta.
#3 Hacer la aclaración de lo que es una muestra representativa:
- Alumnado de diferentes, edades, diferentes sexos, procedentes del medio rural y del medio urbano,…
#9 Al multiplicar la frecuencia relativa por 100 obtenemos el porcentaje