Unidad 2 - Fase 4 - Medidas estadísticas
Presentado por:
Angie Arango
Fernando enrique Vásquez Betancourt
Oscar Lifardo Amador
José Leonel Juagibioy
Jhon Carlos Silva Ruiz
Presentado a:
Rubén Darío Herrera
Estadística Descriptiva - (511004a764) _10
Universidad nacional abierta y a distancia
Programa de licenciatura en matemáticas
20 de noviembre, 2020
INTRODUCCION
A través de los tiempos el hombre ha sentido la necesidad de poder interpretar todos los
fenómenos que se desarrollan en su entorno para entenderlos y tener un control absoluto de cada
uno de ellos, lo cual lo ha llevado a desarrollar diferentes estudios e investigaciones que le han
exigido el análisis de datos.
Es por ello por lo que la estadística se ha convertido en una herramienta importante para
analizar e interpretar los datos contenidos en la información que recopila. En la actualidad el
hombre aplica el uso de la Estadística en los casos que van desde el cálculo más sencillo hasta el
más complejo conocimiento científico. La Estadística se encuentra relacionada con diferentes
ámbitos de la sociedad como político, investigativo, educativo, etc.
DEFINICIONES.
1. Defina y de un ejemplo de:
a) MEDIDAS DE DISPERSIÓN
Las medidas de dispersión son números que indican si una variable se mueve mucho,
poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer de manera
resumida una característica de la variable estudiada. En este sentido, deben acompañar a las
medidas de tendencia central. Juntas, ofrecen información de un sólo vistazo que luego
podremos utilizar para comparar y, si fuera preciso, tomar decisiones.
LAS MEDIDAS DE DISPERSIÓN MÁS CONOCIDAS SON:
El rango: Es un valor numérico que indica la diferencia entre el valor máximo y
el mínimo de una población o muestra estadística. Su fórmula es:
R = Máx – Mínx
Donde:
R → Es el rango.
Máx → Es el valor máximo de la muestra o población.
Mín → Es el valor mínimo de la muestra o población estadística.
x → Es la variable sobre la que se pretende calcular esta medida.
EJEMPLO:
Supongamos que tenemos una empresa que produce microchips para luego venderlos a
las principales marcas de computadoras. Esta empresa encarga a un economista que realice un
estudio sobre la evolución de las ventas (últimos 4 años) para, posteriormente, ofrecer consejos
que mejoren los resultados empresariales. Entre otras muchas métricas, se pide que se calcule el
rango de producción de microchips. A continuación, se muestra la siguiente tabla de datos:
Año 1 ….. 44.347
Año 2 ….. 12.445
Año 3 ….. 26.880
Año 4 ..... 23.366
R = Máx – Mínx
R = 44.347 – 12.445
R = 31.902
El mes que más microchips produjo la empresa (MÁXIMO) fue el Año 01 con 44.347
microchips producidos. Por su parte, el momento que menos microchips produjo tuvo lugar en el
Año 02 con 12.445 microchips producidos. Por tanto, el rango estadístico que es la diferencia
(44.347 – 12.445) se sitúa en 31.902
¿Cómo se interpreta esto? Esto quiere decir, que durante los últimos 4 años la variación
máxima que ha habido ha sido de 31.902microchips producidos.
La varianza: Es una medida de dispersión que representa la variabilidad de una
serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones. Su fórmula es la siguiente:
X → Variable sobre la que se pretenden calcular la varianza
xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
N → Número de observaciones.
x̄ → Es la media de la variable X.
EJEMPLO:
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con
un salario diferente:
Juan: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +
1.700 + 1.300 + 1.800) /5) 1.500 euros.
Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:
Obtendremos que se debe calcular tal que:
El resultado es de 52.000 euros al cuadrado. Es importante recordar que siempre que
calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros, en este
caso tendríamos que realizar la desviación típica. El resultado aproximado sería de 228 euros.
Esto quiere decir que, en media, la diferencia entre los salarios de las distintas personas será de
228 euros.
La desviación típica:Es otra medida que ofrece información de la dispersión
respecto a la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz
cuadrada de su resultado. Es decir, la desviación típica es la raíz cuadrada de la varianza.
X → Variable sobre la que se pretenden calcular la varianza
xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
N → Número de observaciones.
x̄ → Es la media de la variable X.
EJEMPLO:
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con
un salario diferente:
Juan: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +
1.700 + 1.300 + 1.800) /5) 1.500 euros.
Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:
Obtendremos que se debe calcular tal que:
El resultado es de 52.000 euros al cuadrado. Es importante recordar que siempre que
calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros, en este
caso tendríamos que realizar la desviación típica. El resultado aproximado sería de 228 euros.
Esto quiere decir que, en media, la diferencia entre los salarios de las distintas personas será de
228 euros.
El coeficiente de variación: Su cálculo se obtiene de dividir la desviación típica
entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su
mejor comprensión.
X → Variable sobre la que se pretenden calcular la varianza
σx → Desviación típica de la variable X.
| x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0
EJEMPLO:
Vamos a comprobar cómo, con cualquiera de las dos fórmulas expuestas, el resultado de
la desviación típica o desviación media es el mismo.
Según la fórmula de la varianza (raíz cuadrada):
Según la fórmula del valor absoluto:
Tal como dictaba el cálculo intuitivo. La desviación media es de 1. Pero, ¿no habíamos
dicho que la fórmula del valor absoluto y de la desviación típica daban valores diferentes? Así
es, pero hay una excepción. El único caso en que la desviación estándar y la desviación respecto
de la media ofrecen el mismo resultado es el caso en que todas las desviaciones son igual a 1.
b) MEDIDAS DE POSICIÓN
Son indicadores usados para señalar que porcentaje de datos dentro de una distribución
de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas
de Tendencia Central ". Pero estas medidas de posición de una distribución de frecuencias han de
cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a
la que resumen. Toda síntesis de una distribución se considerará como operativa si intervienen en
su determinación todos y cada uno de los valores de la distribución, siendo única para cada
distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación, se
describen las medidas de posición más comunes utilizadas en estadística, como lo son:
Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero,
segundo y tercer cuartil.
Formula de Q1 para series de Datos Agrupados en Clase.
Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil). El
decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10
partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el
90% restante),
Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero a
los noventa y nueve percentiles).
El percentil supera al uno por ciento de los valores y es superado por el noventa y nueve
por ciento restante para series de Datos Agrupados en Clase.
EJEMPLO:
En una serie de 32 términos se desea localizar el 4° sextil, 8° decil y el 95° percentil.
Esto significa que el 4° textil se encuentra localizado en el término número 21, es decir,
el que ocupa la 21° posición; el 8° decil se encuentra localizado entre el termino número 25° y
26° y el 95° percentil entre la posición 30° y 31°.
c) CORRELACIÓN LINEAL
La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es
una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables. Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que toman dos
variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el grado de
intensidad y el sentido de la relación entre dos variables.
Siendo:
Cov (x;y): la covarianza entre el valor «x» e «y».
σ(x): desviación típica de «x».
σ(y): desviación típica de «y».
Valores que puede tomar la correlación
ρ = -1 Correlación perfecta negativa
ρ = 0 No existe correlación
ρ = +1 Correlación perfecta positiva
Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y» sube, y
además con la misma intensidad (+1). En el caso opuesto, si siempre que el valor «x» sube, y el
valor «y» baja, y además con la misma intensidad, entonces estamos hablando de correlación
negativa (-1). Es importante saber que esto no quiere decir que lo hagan en la misma proporción
(salvo que tengan la misma desviación típica).
Representación gráfica de la correlación
Correlación perfecta positiva:
No hay correlación:
Correlación perfecta negativa:
Consejo: en muchas ocasiones, no tenemos los medios o los datos suficientes para utilizar
esta fórmula. Por ello, si tenemos dos series de precios, podemos calcular el coeficiente de
correlación en Excel, usando la siguiente función: coef.de.correl(serie de precios x;serie de
precios y).
d) REGRESIÓN LINEAL
La regresión lineal es quizás el método más conocido para “predecir” el comportamiento
de los datos o intentar hacerlo. Es como el caballito de batalla en los métodos predictivos, en
Machine Learning (ML) es considerada como una de la técnica central del aprendizaje
supervisado.
Hago un ejemplo fácil con datos de la temperatura global. Los datos se pueden descargar
desde la página de Robert H. Shumway.
#Cargamos los datos
temperaturas.globales<-scan("data/globtemp.dat")
x=temperaturas.global[45:142]
#Asignamos los tiempos de nuestros datos
t=1900:1997
#Estimamos la recta que describe "mejor" nuestros datos
fit=lm(x~t)
plot(t,x,type="o",col="2",xlab="Años",ylab="Temperaturas globales",main="Ejemplo de
Regresión Lineal")
abline(fit)
e) DIAGRAMAS POSIBLES EN LA REGRESIÓN Y CORRELACIÓN
LINEAL.
En un estudio sobre el sexismo en el trabajo se contrastaron las variables sexo y nivel de
ingresos. Los resultados obtenidos sobre una muestra de 528 individuos se presentan en una tabla
de doble entrada:
Se pide:
a) Representar gráficamente las variables en estudio.
b) Calcular una medida descriptiva del nivel de asociación entre ambas variables.
Realizar un análisis gráfico y analizar los resultados.
EJERCICIOS RESUELTOS
2. A continuación, se presentan las puntuaciones de un examen de matemáticas
realizadas a 64 estudiantes de un determinado colegio:
65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 65, 64, 72, 68, 66, 55, 57, 60, 62, 64, 65, 64, 71,
68, 66, 56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62,
50, 51, 67, 70, 54, 72, 65, 59, 60, 70, 66, 57, 71, 53
a. REALIZAR LA TABLA DE FRECUENCIA
PUNTUAION F
EXAMEN
50 1
51 1
53 2
54 1
55 1
56 1
57 3
58 2
59 3
60 4
61 4
62 4
63 5
64 6
65 6
66 5
67 4
68 2
69 2
70 3
71 2
72 2
4025
RANGO INTERVALOS AMPLITUD
R =72 – 50 K = 1+3,322Log n A = 22/7
R = 22 K = 1+3,322 Log 64 A=4
K=7
PUNTUACIO X f fr F
N EXAMENES
50 54 52 4 0,062 4
54 58 56 6 0,093 10
58 62 60 13 0,203 23
62 66 64 21 0,328 44
66 70 68 13 0,203 57
70 74 72 7 0,109 64
74 78 76 0 0
TOTAL 64 1
b. HALLAR LA MEDIA, MODA Y MEDIANA
MEDIA MEDIANA MODA
Xi
Me = ∑ Me = N/2 DATO QUE MAS SE
n
4025
∑ Me = 64/2 REPITE 63
64
Me = 62,89 Me = 32
c. HALLAR EL PRIMER Y TERCER CUANTIL
1∗64
=16 POSICION
4
F i -1 = 10 Li = 58
Fi = 23 A= 62 – 58 A=4
k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
Q 1=¿¿ 58+ 4 ( 16−10
23−10 )
Q
1=58+4 ( 136 )
Q 1=58+4∗0,461
Q 1=58+1,84
Q 1=59,8
Tercer cuartil
64
3* =48 POSICION
4
Fi -1 = 44 Li = 66
Fi = 57 A = 70 -66 A=4
k .n
Qk =Li + A
4
−f i−1
f i −f i−1 ( )
48−44
Q 3= 66+ 4 ( 57−44 )
Q 3=66 +4 ( 134 )
Q 3=66 +4∗0,30
Q 3=66 +1,2
Q 3=67,2
d. HALLAR EL CUARTO DECIL
64
4* =25,6 POSICION
10
Fi – 1 = 44 Li = 66
Fi = 57 A=4
k .n
Dk = Li + A (
10
−f i−1
f i −f i −1 )
D 4 =66+ 4 ( 25,6−44
57−44 )
D 4 =66+ 4 ( 18,4
13 )
D4 =66+ 4∗1,41
D4 =66+5,64
D4 =71,64
e. HALLAR EL 70 PERCENTIL
64
70* = 44 POSICION
100
P10=LS
P10=¿66
f. GRAFICA DE RESULTADOS EN EXCEL
3. Los siguientes datos representan la razón de precio-ganancia de un producto
determinado en una empresa.
3.46 8.90 8.64 3.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.60
7.64 8.82 5.64 10.08 2.81 6.81 7.49 4.56 7.16 9.61 3.86 6.78 9.02 8.65 6.72 6.26 7.90 6.65 7.25
6.26 6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.77 6.25 7.63 6.73 7.60 8.14 6.93
7.82 6.76 7.75 7.36 8.52 7.23 7.63 6.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 8.10 4.01 6.00 7.98
10.00
a. REALICE LA TABLA DE FRECUENCIA
Primero hallamos el rango
R=X max −X Min
R=10,34−2,81
R=7,53
Hallamos los intervalos con la regla de Sturges
K=1+ 3,322. log n
K=1+ 3,322log 76
K=7,25≃ 7
K=7
Hallamos la amplitud
R
A=
K
7,53
A=
7
A=1,07
Hallamos la marca de clase
Li + L s
x i=
2
2,81+ 3,91
x i= =3,36
2
3,91+ 5,01
x i= =4.46
2
5,01+ 6,11
x i= =5,56
2
6,11+7,21
x i= =6,66
2
7,21+ 8,31
x i= =7,76
2
8,31+9,41
x i= =8.86
2
9,41+10,51
x i= =9.96
2
Clase
xi f fr F
Li Ls
2,81 3,91 3,36 4 0,05 4
3,91 5,01 4,46 2 0,03 6
5,01 6,11 5,56 7 0,09 13
6,11 7,21 6,66 22 0,29 35
7,21 8,31 7,76 24 0,32 59
8,31 9,41 8,86 12 0,16 71
9,41 10,51 9,96 5 0,07 76
∑ 76 1
b. HALLE LA MEDIANA Y MODA
Clase
xi f fr F xi . f
Li Ls
2,81 3,91 3,36 4 0,05 4 13,44
3,91 5,01 4,46 2 0,03 6 8,92
5,01 6,11 5,56 7 0,09 13 38,92
6,11 7,21 6,66 22 0,29 35 146,52
7,21 8,31 7,76 24 0,32 59 186,24
8,31 9,41 8,86 12 0,16 71 106,32
9,41 10,51 9,96 5 0,07 76 49,8
∑ 76 1 550,16
Hallamos la media
x́=
∑ x1 . f
n
550,16
x́=
76
x́=7 , 24
Media x́=7 , 24 razón de precio-ganancia
Hallamos la moda
f i−f i−1
M o=Li + . Ai
( f i−f i−1 ) + ( f i−f i +1)
Buscamos el número mayor de la frecuencia M o=24
Clase
xi f fr F xi . f
Li Ls
2,81 3,91 3,36 4 0,05 4 13,44
3,91 5,01 4,46 2 0,03 6 8,92
5,01 6,11 5,56 7 0,09 13 38,92
6,11 7,21 6,66 22 0,29 35 146,52
7,21 8,31 7,76 24 0,32 59 186,24
8,31 9,41 8,86 12 0,16 71 106,32
9,41 10,51 9,96 5 0,07 76 49,8
∑ 76 1 550,16
24−22
M o=7,21+ . 1,1
( 24−22 ) + ( 24−12 )
2
M o=7,21+ . 1,1
2+12
2
M o=7,21+ . 1,1
2+12
2
M o=7,21+ .1,1
14
M o=7,21+(0,14 . 1,1)
M o=7,21+0.15
M o=7,36
Moda M o=7,36 razón de precio-ganancia
c. HALLE EL PRIMER CUARTIL
Hallamos la posición del cuartil
k .n
Posición
4
k .n 1 .76 76
p= ⟹ p= ⟹ p= ⟹ p=19
4 4 4
k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
f i−1=13
f 1=35
Li=6,11
A=Ls−Li=7,21−6,11=1,1
Q 1=6,11+ 1,1 ( 19−13
35−13 )
Q 1=6,11+ 1,1 ( 226 )
Q1=6,11+(1,1 . 0,27)
Q 1=6,11+ 0,3
Q1=6,41
d. HALLE EL SEGUNDO CUARTIL
Hallamos la posición del cuartil
k .n
Posición
4
k .n 2 .76 152
p= ⟹ p= ⟹ p= ⟹ p=38
4 4 4
k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
f i−1=35
f 1=59
Li=7,21
A=Ls−Li=8,31−7,21=1,1
Q 2=7,21+1,1 ( 38−35
59−35 )
Q 2=7,21+1,1 ( 243 )
Q 2=7,21+(1,1. 0,125)
Q 2=7,21+0,1375
Q 2=7,35
e. HALLE EL COEFICIENTE DE VARIACIÓN
Hallamos la varianza para la muestra
2 ∑ ( x−x́ )2 . f
S=
n−1
x́=
∑ x1 . f
n
550,16
x́=
76
x́=7 , 24
Clase
xi f fr F xi . f ( x− x́ )2 ( x− x́ )2 . f
Li Ls
2,81 3,91 3,36 4 0,05 4 13,44 15,05 60,22
3,91 5,01 4,46 2 0,03 6 8,92 7,73 15,46
5,01 6,11 5,56 7 0,09 13 38,92 2,82 19,76
146,5
6,11 7,21 6,66 22 35
0,29 2 0,34 7,40
186,2
7,21 8,31 7,76 24 59
0,32 4 0,27 6,49
106,3
8,31 9,41 8,86 12 71
0,16 2 2,62 31,49
9,41 10,51 9,96 5 0,07 76 49,8 7,40 36,99
550,1
∑ 76 1 6 177,81
2
S2=
∑ ( x−x́ ) . f
n−1
177,81
S2 =
76−1
177,81
S2 =
75
S2=2,37
Hallamos la desviación estándar
S= √ S2
S= √2.37 ⟹ S=1,54
Hallamos coeficiente de variación
s
C v = .100
x́
1,54
C v= . 100
7,24
C v =0,2127 . 100
C v =21,27 %
El coeficiente de variación nos indica que los datos son homogéneos
f. COMPARE LOS VALORES DADOS ANTERIORMENTE EN UN
SOFTWARE (GEOGEBRA, EXCEL, R, RSTUDIO)
4. Una compañía asigna diferentes precios a un equipo de sonido particular en
ocho regiones diferentes del país.
Tabla
Numero de ventas y precios
Ventas 402 381 350 430 441 380 405 420 421
Precio 45 66 70 90 75 45 65 70 65
Nota: La tabla adjunta muestra el número de unidades vendidas y los precios
correspondientes (en miles de pesos).
a) ESTIMAR LA ECUACIÓN DE REGRESIÓN LINEAL DE LAS VENTAS
SOBRE EL PRECIO QUE MEJOR SE AJUSTE.
Se denomina regresión lineal cuando la función es lineal, es decir, requiere la
determinación de dos parámetros: la pendiente y la ordenada en el origen de la recta de
regresión.[CITATION Reg \p 1 \l 9226 ]
Fórmula
y=ax+ b
Tabla 2
Datos en ventas y precios de la compañía
Y X X*Y X2
402 45 18.090 2025
381 66 25.146 4356
350 70 24.500 4900
430 90 38.700 8100
441 75 33.075 5625
380 45 17.100 2025
405 65 26.325 4225
420 70 29.400 4900
421 65 27.365 4225
SUMATORIA 3.630 591 239.701 40.381
N: 9
Nota: Para completar la información se obtienen los siguientes valores ( x∗y ), ( x 2 ¿ y la
sumatoria.
Para encontrar el valor de a y b de la fórmula y=ax+ b se utilizan las siguientes
fórmulas:
n ∑ xi y i−∑ x i ∑ y i
a= 2
n ∑ x 2i −( ∑ x i )
b=¿ ¿
Por lo que
n ∑ xi y i−∑ x i ∑ y i
a= 2
n ∑ x 2i −( ∑ x i )
9(239.701)−(591)(3,630)
a=
9 ( 40381 )−(591)2
2.157.309−2.145 .330
a=
363.429−349.281
11.979
a=
14.148
a=0.846692112
b=¿ ¿
(3.630)(40.381)−(591)(239.701)
b=
9 ( 40.381 )−( 591)2
146.583 .030−141.663.291
b=
363.429−349,281
4.919 .739
b=
14.148
b=347.73
Ecuación lineal que se aproxima a la relación precio-ventas:
y=ax+ b
y=0.846692112 x +347.73
b) DETERMINAR LAS VENTAS SI EL PRECIO ES DE 55, 58, 68, Y 70
MILES DE PESOS.
X =55
y=0.846692112(55)+ 347.73
y=394.2980662
X =58
y=0.846692112(58)+ 347.73
y=396.8381425
X =68
y=0.846692112(68)+347.73
y=405.3050636
X =70
y=0.846692112(70)+ 347.73
y=406.9984478
c) DETERMINAR R Y DAR UNA INTERPRETACIÓN
Tabla 3: Valores de y elevados al cuadrado
Y2
161.604
145.161
122.500
184.900
194.481
144.400
164.025
176.400
177.241
1.470.712
Nota: Se elevan los valores de Y para encontrar R
R=n ¿ ¿
9 ( 239.701 )−(591)( 3630)
R=
√ 9 ( 40.381 ) −(591)2 √ 9(1.470 .712)−(3.630)2
11.979
R=
(−228.138)(−8.764 .764)
11.979
R=
1.999575729
R=0.00000599077
d) COMPARE LOS VALORES DADOS ANTERIORMENTE EN UN SOFTWARE
(GEOGEBRA, EXCEL, R, RSTUDIO)
Figura 1
Valores anteriores en Excel
Nota: Se grafica en Excel los calores dados para corroborar la información.
5. Los datos de la siguiente tabla representan las alturas (X) cm. y los pesos (Y)
kg. de varios hombres.
a. ESTIMAR LA ECUACIÓN QUE MEJOR SE AJUSTE DE MODO QUE EL
PESO DEPENDA DE LA ALTURA.
Organizando los datos en una gráfica nos muestra que los puntos se ubican cerca de una
recta lo cual tenemos correlación lineal
90
80
70
60
50
40
30
20
10
0
120 130 140 150 160 170 180 190 200
Fórmula y=ax+ b
Datos para desarrollar ecuación
ALTURA PES X*Y X2 Y2
X O
Y
126 53,5 6741 15876 2862,25
152 51,5 7828 23104 2652,25
155 56,5 8757,5 24025 3192,25
172 62,5 10750 29584 3906,25
185 40 7400 34225 1600
185 53,5 9897,5 34225 2862,25
187 82 15334 34969 6724
196 58 11368 38416 3364
SUMATORI
A 1358 457,5 78076 234424 209306,25
N=8
Para encontrar el valor de a y b de la fórmula y=ax+ b se utilizan las siguientes
fórmulas:
n ∑ xi y i − ∑ x i ∑ y i
a= 2
b=¿ ¿
n ∑ x 2i −( ∑ x i )
n ∑ xi y i−∑ x i ∑ y i 8(78076)−(1358)(457.5) 624608−621285 3323
a= 2 a= 2 a= a=
2
n ∑ x −( ∑ x i )
i
8 ( 234424 )−(1358) 1875392−1844164 31228
(457.5)(234424)−(1358)(78076) 107248980−106027208 1221772
a=0.1064b=¿ ¿b= 2 b= b=
8 ( 234424 )−(1358) 1875392−1844164 31228
b=39.124
Ecuación lineal:
y=ax+ b
y=0.1064 x+39.124
b. DETERMINAR EL PESO SI LA ALTURA ES DE 150, 153 Y 175 CM
x=150 y=0.1064∗150+ 39.124 y=15.96+ 39.124 y=55.084
x=153 y=0.1064∗153+ 39.124 y=16.2792+39.124 y=55.4032
x=175 y=0.1064∗175+ 39.124 y=18.62+39.124 y=57.744
c. DETERMINAR R Y DAR UNA INTERPRETACIÓN
8 ( 78076 )−(1358)(457.5)
R=n ¿ ¿ R=
√ 8 ( 234424 ) −(1358)2 √8 (209306.25)−( 457.5)2
624608−621285 3323
R= R=
√ 1875392−1844164 √ 1674450−209306.25 √ 30628 √ 1465143.75
3323 3323
R= R= R=0.5404
175.008∗1210.431 211835.108
REFERENCIA BIBLIOGRAFICA
Espejo, I., Fernández, F., López, M., Muñoz, M., Rodríguez, A., Sánchez, A., & Valero, C.
(2011). Estadística Descriptiva y Probabilidad: (Teoría y problemas). Cádiz : Universidad
de Cádiz, 2009. Recuperado de https://bibliotecavirtual.unad.edu.co/login?
url=http://search.ebscohost.com/login.aspx?
direct=true&db=edsbas&AN=edsbas.D638568B&lang=es&site=eds-live&scope=site
ey Graña, C., & Ramil Díaz, M. (2007). Introducción a la estadística descriptiva. Netbiblo.
Recuperado de https://bibliotecavirtual.unad.edu.co/login?
url=http://search.ebscohost.com/login.aspx?
direct=true&db=edsbas&AN=edsbas.94806AF0&lang=es&site=eds-live&scope=site
Leal-Cornejo, F., López-García, R. E., Martínez-Montiel, M. G., Tapia-Castillo, D. I., & León-
Vázquez, I. I. de. (2019). Regression and Linear Correlation Analysis ; Análisis de
Regresión y Correlación Lineal. https://doi-
org.bibliotecavirtual.unad.edu.co/10.29057/xikua.v7i13.3558
Gracia Cano, A., & González Herrera, A. (2018). Cálculo e interpretación del coeficiente de
correlación lineal. Recuperado de https://bibliotecavirtual.unad.edu.co/login?
url=http://search.ebscohost.com/login.aspx?
direct=true&db=edsbas&AN=edsbas.96DDFB2C&lang=es&site=eds-live&scope=site
Universidad Autónoma de Aguadulces (2015) México. Apuntes Definiciones Estadística
Descriptiva. MATEMÁTICAS IV. Estadística y Principios de Probabilidad. Recuperado
de https://www.uaa.mx/centros/cem/dmf/wp-
content/uploads/2015/apuntes/4.%20Estadistica%20y%20Principios%20de
%20Probabilidad/Apuntes%20Estadistica.pdf
González R., María Camila (2020). Implementación de la herramienta RStudio en estadística
[Archivo de video]. Recuperado de https://repository.unad.edu.co/handle/10596/30914
1.1. Historia—ESTADÍSTICA. (s. f.). Recuperado 19 de noviembre de 2020, de
https://sites.google.com/site/iniciacionestadistica/introduccion/1-1-historia
La estadística—Monografias.com. (s. f.). Recuperado 19 de noviembre de 2020, de
https://www.monografias.com/trabajos84/definicion-estadistica/definicion-
estadistica.shtml