ESTATÍSTICA
ANO LECTIVO 2024/2025
Curso: LMPRP (3º Ano)
Docente: Maria de Lurdes Rocha da Fonseca Torres
1
ESTATÍSTICA
INTRODUÇÃO
• Resenha histórica
• Importância da estatística na actualidade
Tomar decisões → Recolher factos relevantes → Conclusões
(organizada dados)
• Aplicações da Estatística nos diversos campos da
actividade humana (Demografia; Economia;
Contabilidade/Gestão; Marketing, Psicologia; Engenharia,
Medicina…)
2
FASES DO TRABALHO ESTATÍSTICO
Como se define a Estatística?
Um número! Estatísticas: colecção de dados
Conjunto de técnicas/ou instrumentos apropriados para:
* Recolher
* Classificar Conjuntos dados numéricos
* Apresentar
* Interpretar
Método Quantitativo
FONTES DE DADOS:
Dados primários: obtidos directamente pelo analista
(experimentação, questionário, observação…).
Dados secundários: publicados por outra organização.
3
Este processo pressupõe previamente:
• Objectivo da análise e definição da população;
• Procedimento adequado para a selecção da amostra
(amostragem).
AMOSTRAGEM
Processo de selecção de uma amostra a partir de uma
população.
Amostra: subconjunto finito, supostamente representativo, de
elementos de uma população.
TIPOS DE AMOSTRAS
4
Inferência estatística com rigor amostragem probabilística (cada
elemento da população tem hipóteses de ser incluído na amostra,
sendo possível medir essa probabilidade através do cálculo da
respectiva probabilidade).
PROCESSO DE AMOSTRAGEM ALEATÓRIA: garante que todos os
elementos da população têm as mesmas hipóteses de serem
integrados na amostra.
Evita o enviesamento de selecção
Evita qualquer tendência para sub-representar ou sobre-representar na
amostra alguns elementos da população.
PROCESSOS DE AMOSTRAGEM NÃO PROBABILÍSTICA:
quando não haja preocupação de rigor na representatividade da
amostra (por exemplo, em análises preliminares).
Não permite definir com rigor a probabilidade de inclusão dos diferentes
elementos da população na amostra.
• AMOSTRAGEM POR CONVENIÊNCIA: a conveniência é o
critério que preside à escolha;
5
• AMOSTRAGEM SUBJECTIVA: com base num critério
pessoal.
ERRO DE AMOSTRAGEM: reflecte heterogeneidade entre
amostras.
Outros erros: falta de resposta, erro de medida…
6
DIVISÕES DA ESTATÍSTICA
ESTATÍSTICA DESCRITIVA VS ESTATÍSTICA INDUTIVA
Estatística Descritiva
Permite classificar os dados e fornecer características
sumárias (da população ou da amostra)
Estatística Indutiva
Inferir propriedades do universo estatístico (população) a
partir de propriedades verificadas na amostra.
Algo de provável e acompanhada de alguma incerteza.
Para controlo do erro técnicas da teoria das
probabilidades.
7
UTILIZADORES DA ESTATÍSTICA
- Estado
- Organizações Sociais (Empresas) e Profissionais
- Cidadão comum
OBS: INE; EUROSTAT
Estatística Versus Matemática?
A análise estatística intervém em casos de fenómenos aleatórios, todo o
fenómeno em que intervém o acaso são fenómenos que interessam à Estatística,
e não só fenómenos determinísticos como os da matemática.
ALGUNS CONCEITOS
• POPULAÇÃO ou UNIVERSO (fonte de observação)
Constituída por um conjunto de elementos (indivíduos ou objectos) com
uma ou mais características comum. Constitui a fonte de observação.
• AMOSTRA: subconj. população (supõe representativa)
• UNIDADE ESTATÍSTICA: elemento da população ou da
amostra.
8
• CENSO / SONDAGEM
Censo: incide sobre todos os elementos (população), são observados todos os
indivíduos da população relativamente aos diferentes atributos que estão a ser
objecto do estudo.
Sondagem: incide sobre amostras, o estudo estatístico baseia-se numa parte da
população (supõe-se que a amostra é representativa da população).
VANTAGENS NA UTILIZAÇÃO DAS AMOSTRAS
*Económicas
*Comodidade
*Tempo
*Inutilização de todos os elementos
9
NATUREZA DAS VARIÁVEIS ESTATÍSTICAS
VARIÁVEL ESTATÍSTICA: característica ou atributo
Símbolo que representa determinada característica ou atributo da população ou
da amostra. (Simbolicamente: X, Y Z....)
VARIÁVEL QUALITATIVA: associa uma modalidade
Associa a cada indivíduo do universo considerado uma modalidade.
VARIÁVEL QUANTITATIVA: associa um número.
Associa a cada indivíduo do universo considerado um número.
VARIÁVEL QUANTITATIVA DISCRETA: número finito de valores
VARIÁVEL QUANTITATIVA CONTÍNUA: quaisquer valores dentro do
seu intervalo de variação
10
PRINCIPAIS ESCALAS
(formas de medir atributos qualitativos e quantitativos)
NOMINAL: dados classificados por categorias não ordenadas (é
apenas atribuído um nome). Classes mutuamente exclusivas.
ORDINAL: dados classificados por categorias ordenadas, segundo
algum critério.
INTERVALO / RÁCIOS: dados diferenciados e ordenados por nºs.
NOMINAL / ORDINAL Dados qualitativos, não métricos.
São mais limitados em termos de técnicas estatísticas disponíveis. A
maioria dos métodos estatísticos requer a utilização de dados métricos.
INTERVALO / RÁCIOS Dados quantitativos, métricos
11
ATENÇÃO A TER COM AS ESCALAS:
Codificação numérica:
• Escala nominal: não são valores quantitativos!
• Escala ordinal, os códigos numéricos não são dados de
forma arbitrária mas sim de modo que as categorias às quais
foram dados o 1º e últimos códigos são as que mais distam e
mais se diferenciam entre si.
ATENÇÃO AOS MÉTODOS ESTATÍSTICOS USADOS!
(E TAMBÉM SOFTWARE!)
12
CARACTERIZAÇÃO DE AMOSTRAS UNIVARIADAS
INDIVÍDUOS; VARIÁVEIS; DIMENSÃO DA AMOSTRA
Cada dado que a integra mede apenas um atributo, numa escala
qualquer.
Distribuição de frequências: conjunto de todos os valores de uma
variável e das frequências correspondentes.
Simbologia:
n = total de elementos observados (na população ou na amostra).
Frequência absoluta simples (ni): nº de vezes que um fenómeno ou
acontecimento foi observado, isto é, é o nº de vezes que se repete cada valor da
variável.
Frequência absoluta acumulada (Ni): obtêm-se adicionado as frequências
absolutas simples até ao valor considerado da variável estatística.
Frequência relativa simples (fi): quociente entre a frequência absoluta simples
do valor da variável e o nº total de observações. ni
fi =
n
Propriedades:
13
k
* A soma frequências absolutas simples é o nº total de observações: ni = n
i =1
k
* A soma frequências relativas simples é igual à unidade (100%). fi = 1
i =1
Frequência relativa acumulada (Fi): obtém-se adicionado as frequências
relativas
14
Tabela de Frequências: Variáveis discretas
Frequência Frequência Frequência Frequência
Variável Absoluta Absoluta Relativa Relativa
Xi Simples Acumulada Simples Acumulada
ni Ni fi Fi
X1 n1 N1 = n1 f1 = n1/n F 1 = f1
X2 n2 N2 = n1+n2 f2 = n2/n F2 = f1 +f2
X3 n3 N3 = N2+n3 f3 = n3/n F 3 = f1 + f2 + f3 = F2 + f3
... ... ... ... ...
Xk nk Nk = Nk-1+nk fk = nk/n Fk = f1 + f2 + .....+ fk = Fk-1 + fk
k k
ni
i =1
=n Nk=n
fi = 1 Fk=1
i =1
15
Tabela de Frequências: Dados agrupados em classes
(Variáveis Contínuas)
Centro Frequência Frequência Frequência Frequência
Variável da Classe Absoluta Absoluta Relativa Relativa
Xi Ci Simples Acumulada Simples Acumulada
ni Ni fi Fi
a1 , a2 C1 n1 N1 = n1 f1 = n1/n F 1 = f1
a2 , a3 C2 n2 N2 = n1+n2 f2 = n2/n F2 = f1 +f2
a3 , a4 C3 n3 N3 = N2+n3 f3 = n3/n F 3 = f1 + f2 + f3 = F 2 + f3
... ... ... ... ...
ak, ak+1 CK nk Nk = Nk-1+nk fk = nk/n Fk = f1 + f2 +.....+ fk = Fk-1 + fk
k k
ni = n
i =1
fi = 1
Nk=n i =1 Fk=1
16
REPRESENTAÇÃO GRÁFICA DAS DISTRIBUIÇÕES DE
FREQUÊNCIA
Variáveis discretas
▪ Gráfico de Barras ou Diagrama Diferencial
▪ Função cumulativa das frequências relativas
➢ Função descontínua nos pontos em que a variável pode
assumir, apresentando nesses pontos um salto igual à
respectiva frequência:
➢ Entre os pontos de descontinuidade a função é constante.
Variáveis contínuas
▪ Histograma; Polígono de Frequências
▪ Polígono de Frequências Acumuladas ou Polígono Integral
17
MEDIDAS DESCRITIVAS
Qualidades das medidas descritivas:
• Objectividade
• Dependência de todas as observações;
• Significado concreto, interpretação simples e imediata;
• Serem pouco sensíveis aos valores extremos;
• Prestarem-se facilmente ao cálculo algébrico
TIPOS DE MEDIDAS
• Localização
• Dispersão
• Concentração
• Forma: assimetria e achatamento
18
MEDIDAS DE LOCALIZAÇÃO DE TENDÊNCIA CENTRAL
MÉDIA ARITMÉTICA→ X
(apenas escalas quantitativas)
• Variáveis Discretas
n
x i
Dados não Classificados: X = i =1
i=1,2,3,......,n
n
k
n x i i k
Dados Classificados: X = i =1
= f i x i i=1,2,3,......,k
n i =1
• Dados agrupados em classes (Variáveis Contínuas)
k
n C i i k
X= i =1
= f i Ci i = 1,2,3,......,k
n i =1
em que:
k = nº classes
Ci = Centro da classe
Algumas propriedades da média:
“A média dos desvios dos valores da variável em relação à média
é nula”: fi ( xi − x ) = 0
“A média do quadrado dos desvios dos valores da variável em
relação à média é mínima”: fi (x i − x)2 é mínima
MÉDIA APARADA A 100%
19
É obtida eliminando as 100% das menores observações e 100% das
maiores observações e calculando a média aritmética simples das
restantes observações.
MEIA-MÉDIA
Corresponde à média aritmética da metade central das estatísticas
ordinais.
20
MEDIANA→ Me (Observação central)
(escalas quantitativas e ordinais)
• Variável Quantitativa discreta:
Dados não classificados, com as observações dispostas por ordem
crescente: X1 X2 X3 ............ Xn
x ( N +1 ) se N Ímpar
2
Me =
x ( N2 ) + x ( N2+ 2 )
se N par
2
• Dados agrupados em classes (Variáveis Contínuas)
A mediana é o valor da variável associada aos 50% da frequência
acumulada: F(me) = 0,5
n
− N ( Me −1)
M e = l( Me ) + 2
h( Me )
n( Me )
n = total de elementos
l(Me) = limite inferior da classe mediana
N(Me-1) = Frequência absoluta acumulada até à classe anterior à classe mediana
h(Me) = amplitude da classe mediana
n(Me) = frequência absoluta simples da classe mediana
OBS: Calculada por leitura gráfica no polígono de frequências acumuladas.
21
MODA→ Mo
Valor da variável com maior número de efectivos (ni) ou (fi).
• Dados agrupados em classes (Variáveis contínuas)
Fórmula de King:
f (M O +1) n (M O +1)
MO = l(M O ) + h (M O ) = l(M O ) + h (M O )
f (M O −1) + f (M O +1) n (M O −1) + n (M O +1)
n = total de elementos
l(Mo) = limite inferior da classe modal
n(Mo+1) = Frequência absoluta simples da classe posterior à classe modal
n(Mo-1) = Frequência absoluta simples da classe anterior à classe modal
h(Mo) = amplitude da classe modal
f(Mo+1) = Frequência relativa simples da classe posterior à classe modal
f(Mo-1) = Frequência relativa simples da classe anterior à classe modal
h(Mo) = amplitude da classe modal
22
MEDIDAS DE LOCALIZAÇÃO DE TENDÊNCIA NÃO CENTRAL
Quartis
Mín Q1 Q2 Q3 Máx
Fi 25% 50% 75% 100%
i n
− N ( Qi −1)
Qi = l( Qi ) + h( Qi )
4
n( Qi )
1º Quartil (Q1): à esquerda do 1º quartil estão 25% das observações
2º Quartil (Q2): à esquerda do 2º quartil estão 50% das observações (coincide com a
mediana)
3º Quartil (Q3): à esquerda do 3º quartil estão 75% das observações
Decis
Mín D1 D2 … D9 Máx
Fi 10% 20% .... .... 90% 100%
Percentis
Mín P1 P2 … P99 Máx
23
MEDIDAS DE DISPERSÃO
Permitem identificar o modo como os valores observados se afastam das medidas de
tendência central.
• INTERVALO DE VARIAÇÃO OU AMPLITUDE TOTAL:
I = máx(Xi) - min(Xi)
• AMPLITUDE INTER-QUARTIS
IQ = Q3 − Q1
• VARIÂNCIA E DESVIO PADRÃO
Variância Variância =s2 Variância=2 Variância =VarX
Desvio Padrão
s = desvio padrão =desvio padrão = Var ( X ) = 2
n n
(x
i =1
i − x) 2 x
i =1
2
i
Dados discretos: s= ou s= −x2
n n
n
k
( xi − x) 2
f
i k
i =1
s= = i ( xi − x) 2
n i =1
24
Dados agrupados em classes (variáveis contínuas):
n
k
(C i − x ) 2
f
i k
i =1
s= = i (C i − x ) 2
n i =1
NOTA:
Em amostras de populações normais (com distribuição Normal) a média e o desvio
padrão caracterizam bem a localização e a dispersão. Tem-se os seguintes intervalos:
x − s; x + s 68,3%
x − 2s; x + 2s 95,5%
x − 3s; x + 3s 99,7%
25
MEDIDAS RELATIVAS DE DISPERSÃO
Coeficiente de variação:
S
CV = 100
X
26
DIAGRAMA DE EXTREMOS E QUARTIS
(ou “Caixa de Bigodes”)
Uma forma gráfica que permite facilmente interpretar a localização e a
dispersão.
Exemplo:
Diagramas de extremos e quartis referentes à distribuição das classificações das
disciplinas de estatística, informática e inglês de 12 alunos de determinada
Escola.
18
16
14
12
10
2
N= 12 12 12
Estatística Informática INGLÊS
27
ÍNDICE DE CONCENTRAÇÃO E CURVA DE LORENZ
O fenómeno da concentração está relacionado com a variabilidade ou dispersão
dos valores observados.
Objectivo: medir a forma como determinada característica de uma população
se distribui pelos seus elementos.
Nota: Só é possível quando faz sentido acumular a característica em estudo
num maior ou menor número de elementos da população (isto é, cujos valores
sobre um conjunto de indivíduos são susceptíveis de ser serem adicionados).
Exemplos de aplicação: Rendimento familiar, salário, lucros, facturação…
Duas situações extremas:
• Um só elemento da população detém todo o atributo concentração
máxima;
• Cada elemento da população detém igual parcela do atributo
concentração mínima)
Análise do grau de concentração:
- Graficamente: Curva de Lorenz:
100%
90%
80%
70%
60%
(qi)
50%
40%
30%
20%
10%
0%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100
%
(pi)
28
- Indicador numérico: Índice de Gini
k −1 k −1
( pi − qi ) q i
IG = i =1
k −1
IG = 1 − i =1
k −1
p
i =1
i p
i =1
i
pi: representa a proporção de elementos que possuem o atributo com uma
intensidade que não excede o limite superior da i-ésima classe;
qi: representa a proporção da totalidade do atributo possuída pelos mesmos
elementos
Nota: pi qi ; 0 pi 1 ; 0 qi 1
IG = 0 Igual distribuiç ão (p i = q i ), i = 1, 2, ..., k
IG = 1 Concentraç ão máxima, (q i = 0, i = 1,..., k − 1)
0 IG 1
0 IG 1 cresce com o aumento da concentraç ão da caracterís tica em estudo
29
ASSIMETRIA E ACHATAMENTO
MEDIDAS DE ASSIMETRIA
X − MO
Coeficiente assimetria de Pearson C.P. =
s
• C.P.=0 Distribuição simétrica): média=mediana=moda
• C.P.<0 Distribuição assimétrica negativa: média<mediana<moda
• C.P.>0 Distribuição assimétrica positiva: média>mediana>moda
(Q3 − M e ) − (M e − Q1 )
Coeficiente de assimetria de Bowley: C.B =
(Q3 − M e ) + (M e − Q1 )
• C.B.=0 Distribuição simétrica
• C.B.<0 Distribuição assimétrica negativa(enviesada à direita)
• C.B.>0 Distribuição assimétrica positiva(enviesada à esquerda)
MEDIDA DE ACHATAMENTO
Coeficiente de achatamento:
As medidas de curtose (ou grau de achatamento) fornecem uma indicação da intensidade das
frequências na vizinhança dos valores centrais.
Q3 − Q1
Grau de curtose: K=
2(P90 − P10 )
• K=0,263 Distribuição mesocúrtica (achatamento idêntico à distribuição Normal)
• K>0,263 Distribuição platicúrtica (mais achatada que a distribuição Normal)
K<0,263 Distribuição leptocúrtica (menos achatada que a Normal)
30