0% acharam este documento útil (0 voto)
22 visualizações30 páginas

Caracterizacao de Amostras Univariadas LMPRP 2024 2025

O documento aborda a estatística no contexto do curso LMPRP, enfatizando sua importância na tomada de decisões e suas aplicações em diversas áreas. Ele detalha as fases do trabalho estatístico, incluindo a definição de estatística, tipos de amostragem, e as divisões entre estatística descritiva e indutiva. Além disso, discute variáveis estatísticas, escalas de medição, e medidas descritivas como média, mediana e moda.

Enviado por

261514
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
22 visualizações30 páginas

Caracterizacao de Amostras Univariadas LMPRP 2024 2025

O documento aborda a estatística no contexto do curso LMPRP, enfatizando sua importância na tomada de decisões e suas aplicações em diversas áreas. Ele detalha as fases do trabalho estatístico, incluindo a definição de estatística, tipos de amostragem, e as divisões entre estatística descritiva e indutiva. Além disso, discute variáveis estatísticas, escalas de medição, e medidas descritivas como média, mediana e moda.

Enviado por

261514
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 30

ESTATÍSTICA

ANO LECTIVO 2024/2025

Curso: LMPRP (3º Ano)

Docente: Maria de Lurdes Rocha da Fonseca Torres

1
ESTATÍSTICA

INTRODUÇÃO

• Resenha histórica

• Importância da estatística na actualidade

Tomar decisões → Recolher factos relevantes → Conclusões

(organizada  dados)

• Aplicações da Estatística nos diversos campos da

actividade humana (Demografia; Economia;

Contabilidade/Gestão; Marketing, Psicologia; Engenharia,

Medicina…)

2
FASES DO TRABALHO ESTATÍSTICO

Como se define a Estatística?

Um número! Estatísticas: colecção de dados

Conjunto de técnicas/ou instrumentos apropriados para:

* Recolher

* Classificar  Conjuntos dados numéricos

* Apresentar

* Interpretar

Método Quantitativo

FONTES DE DADOS:

Dados primários: obtidos directamente pelo analista

(experimentação, questionário, observação…).

Dados secundários: publicados por outra organização.

3
Este processo pressupõe previamente:

• Objectivo da análise e definição da população;

• Procedimento adequado para a selecção da amostra

(amostragem).

AMOSTRAGEM

Processo de selecção de uma amostra a partir de uma

população.

Amostra: subconjunto finito, supostamente representativo, de

elementos de uma população.

TIPOS DE AMOSTRAS

4
Inferência estatística com rigor  amostragem probabilística (cada

elemento da população tem hipóteses de ser incluído na amostra,

sendo possível medir essa probabilidade através do cálculo da

respectiva probabilidade).

PROCESSO DE AMOSTRAGEM ALEATÓRIA: garante que todos os

elementos da população têm as mesmas hipóteses de serem

integrados na amostra.

Evita o enviesamento de selecção

Evita qualquer tendência para sub-representar ou sobre-representar na

amostra alguns elementos da população.

PROCESSOS DE AMOSTRAGEM NÃO PROBABILÍSTICA:

quando não haja preocupação de rigor na representatividade da

amostra (por exemplo, em análises preliminares).

Não permite definir com rigor a probabilidade de inclusão dos diferentes

elementos da população na amostra.

• AMOSTRAGEM POR CONVENIÊNCIA: a conveniência é o

critério que preside à escolha;

5
• AMOSTRAGEM SUBJECTIVA: com base num critério

pessoal.

ERRO DE AMOSTRAGEM: reflecte heterogeneidade entre

amostras.

Outros erros: falta de resposta, erro de medida…

6
DIVISÕES DA ESTATÍSTICA

ESTATÍSTICA DESCRITIVA VS ESTATÍSTICA INDUTIVA

Estatística Descritiva

Permite classificar os dados e fornecer características

sumárias (da população ou da amostra)

Estatística Indutiva

Inferir propriedades do universo estatístico (população) a

partir de propriedades verificadas na amostra.

Algo de provável e acompanhada de alguma incerteza.

Para controlo do erro  técnicas da teoria das

probabilidades.

7
UTILIZADORES DA ESTATÍSTICA

- Estado

- Organizações Sociais (Empresas) e Profissionais

- Cidadão comum

OBS: INE; EUROSTAT

Estatística Versus Matemática?

A análise estatística intervém em casos de fenómenos aleatórios, todo o

fenómeno em que intervém o acaso são fenómenos que interessam à Estatística,

e não só fenómenos determinísticos como os da matemática.

ALGUNS CONCEITOS

• POPULAÇÃO ou UNIVERSO (fonte de observação)

Constituída por um conjunto de elementos (indivíduos ou objectos) com

uma ou mais características comum. Constitui a fonte de observação.

• AMOSTRA: subconj. população (supõe representativa)

• UNIDADE ESTATÍSTICA: elemento da população ou da

amostra.

8
• CENSO / SONDAGEM

Censo: incide sobre todos os elementos (população), são observados todos os

indivíduos da população relativamente aos diferentes atributos que estão a ser

objecto do estudo.

Sondagem: incide sobre amostras, o estudo estatístico baseia-se numa parte da

população (supõe-se que a amostra é representativa da população).

VANTAGENS NA UTILIZAÇÃO DAS AMOSTRAS

*Económicas

*Comodidade

*Tempo

*Inutilização de todos os elementos

9
NATUREZA DAS VARIÁVEIS ESTATÍSTICAS

VARIÁVEL ESTATÍSTICA: característica ou atributo

Símbolo que representa determinada característica ou atributo da população ou

da amostra. (Simbolicamente: X, Y Z....)

VARIÁVEL QUALITATIVA: associa uma modalidade

Associa a cada indivíduo do universo considerado uma modalidade.

VARIÁVEL QUANTITATIVA: associa um número.

Associa a cada indivíduo do universo considerado um número.

VARIÁVEL QUANTITATIVA DISCRETA: número finito de valores

VARIÁVEL QUANTITATIVA CONTÍNUA: quaisquer valores dentro do

seu intervalo de variação

10
PRINCIPAIS ESCALAS

(formas de medir atributos qualitativos e quantitativos)

NOMINAL: dados classificados por categorias não ordenadas (é

apenas atribuído um nome). Classes mutuamente exclusivas.

ORDINAL: dados classificados por categorias ordenadas, segundo

algum critério.

INTERVALO / RÁCIOS: dados diferenciados e ordenados por nºs.

NOMINAL / ORDINAL Dados qualitativos, não métricos.

São mais limitados em termos de técnicas estatísticas disponíveis. A

maioria dos métodos estatísticos requer a utilização de dados métricos.

INTERVALO / RÁCIOS  Dados quantitativos, métricos

11
ATENÇÃO A TER COM AS ESCALAS:

Codificação numérica:

• Escala nominal: não são valores quantitativos!

• Escala ordinal, os códigos numéricos não são dados de

forma arbitrária mas sim de modo que as categorias às quais

foram dados o 1º e últimos códigos são as que mais distam e

mais se diferenciam entre si.

ATENÇÃO AOS MÉTODOS ESTATÍSTICOS USADOS!

(E TAMBÉM SOFTWARE!)

12
CARACTERIZAÇÃO DE AMOSTRAS UNIVARIADAS

INDIVÍDUOS; VARIÁVEIS; DIMENSÃO DA AMOSTRA

Cada dado que a integra mede apenas um atributo, numa escala

qualquer.

Distribuição de frequências: conjunto de todos os valores de uma

variável e das frequências correspondentes.

Simbologia:

n = total de elementos observados (na população ou na amostra).

Frequência absoluta simples (ni): nº de vezes que um fenómeno ou


acontecimento foi observado, isto é, é o nº de vezes que se repete cada valor da
variável.

Frequência absoluta acumulada (Ni): obtêm-se adicionado as frequências


absolutas simples até ao valor considerado da variável estatística.

Frequência relativa simples (fi): quociente entre a frequência absoluta simples


do valor da variável e o nº total de observações. ni
fi =
n

Propriedades:

13
k
* A soma frequências absolutas simples é o nº total de observações:  ni = n
i =1

k
* A soma frequências relativas simples é igual à unidade (100%).  fi = 1
i =1

Frequência relativa acumulada (Fi): obtém-se adicionado as frequências


relativas

14
Tabela de Frequências: Variáveis discretas

Frequência Frequência Frequência Frequência

Variável Absoluta Absoluta Relativa Relativa

Xi Simples Acumulada Simples Acumulada

ni Ni fi Fi

X1 n1 N1 = n1 f1 = n1/n F 1 = f1

X2 n2 N2 = n1+n2 f2 = n2/n F2 = f1 +f2

X3 n3 N3 = N2+n3 f3 = n3/n F 3 = f1 + f2 + f3 = F2 + f3

... ... ... ... ...

Xk nk Nk = Nk-1+nk fk = nk/n Fk = f1 + f2 + .....+ fk = Fk-1 + fk

k k
 ni
i =1
=n Nk=n
 fi = 1 Fk=1
i =1

15
Tabela de Frequências: Dados agrupados em classes

(Variáveis Contínuas)

Centro Frequência Frequência Frequência Frequência

Variável da Classe Absoluta Absoluta Relativa Relativa

Xi Ci Simples Acumulada Simples Acumulada

ni Ni fi Fi

a1 , a2 C1 n1 N1 = n1 f1 = n1/n F 1 = f1

a2 , a3 C2 n2 N2 = n1+n2 f2 = n2/n F2 = f1 +f2

a3 , a4 C3 n3 N3 = N2+n3 f3 = n3/n F 3 = f1 + f2 + f3 = F 2 + f3

... ... ... ... ...

ak, ak+1 CK nk Nk = Nk-1+nk fk = nk/n Fk = f1 + f2 +.....+ fk = Fk-1 + fk

k k
 ni = n
i =1
 fi = 1
Nk=n i =1 Fk=1

16
REPRESENTAÇÃO GRÁFICA DAS DISTRIBUIÇÕES DE
FREQUÊNCIA

Variáveis discretas

▪ Gráfico de Barras ou Diagrama Diferencial

▪ Função cumulativa das frequências relativas

➢ Função descontínua nos pontos em que a variável pode

assumir, apresentando nesses pontos um salto igual à

respectiva frequência:

➢ Entre os pontos de descontinuidade a função é constante.

Variáveis contínuas

▪ Histograma; Polígono de Frequências

▪ Polígono de Frequências Acumuladas ou Polígono Integral

17
MEDIDAS DESCRITIVAS

Qualidades das medidas descritivas:

• Objectividade

• Dependência de todas as observações;

• Significado concreto, interpretação simples e imediata;

• Serem pouco sensíveis aos valores extremos;

• Prestarem-se facilmente ao cálculo algébrico

TIPOS DE MEDIDAS

• Localização

• Dispersão

• Concentração

• Forma: assimetria e achatamento

18
MEDIDAS DE LOCALIZAÇÃO DE TENDÊNCIA CENTRAL

MÉDIA ARITMÉTICA→ X

(apenas escalas quantitativas)

• Variáveis Discretas
n

x i
Dados não Classificados: X = i =1
i=1,2,3,......,n
n
k

n x i i k
Dados Classificados: X = i =1
=  f i x i i=1,2,3,......,k
n i =1

• Dados agrupados em classes (Variáveis Contínuas)


k

n C i i k
X= i =1
=  f i Ci i = 1,2,3,......,k
n i =1

em que:
k = nº classes
Ci = Centro da classe

Algumas propriedades da média:

“A média dos desvios dos valores da variável em relação à média


é nula”:  fi ( xi − x ) = 0

“A média do quadrado dos desvios dos valores da variável em


relação à média é mínima”: fi (x i − x)2 é mínima

MÉDIA APARADA A 100%

19
É obtida eliminando as 100% das menores observações e 100% das
maiores observações e calculando a média aritmética simples das
restantes observações.

MEIA-MÉDIA
Corresponde à média aritmética da metade central das estatísticas
ordinais.

20
MEDIANA→ Me (Observação central)

(escalas quantitativas e ordinais)

• Variável Quantitativa discreta:


Dados não classificados, com as observações dispostas por ordem

crescente: X1  X2  X3  ............  Xn

 x ( N +1 ) se N Ímpar
 2

Me = 
 x ( N2 ) + x ( N2+ 2 )
 se N par
 2

• Dados agrupados em classes (Variáveis Contínuas)


A mediana é o valor da variável associada aos 50% da frequência

acumulada: F(me) = 0,5


n
− N ( Me −1)
M e = l( Me ) + 2
 h( Me )
n( Me )

n = total de elementos

l(Me) = limite inferior da classe mediana

N(Me-1) = Frequência absoluta acumulada até à classe anterior à classe mediana

h(Me) = amplitude da classe mediana

n(Me) = frequência absoluta simples da classe mediana

OBS: Calculada por leitura gráfica no polígono de frequências acumuladas.

21
MODA→ Mo

Valor da variável com maior número de efectivos (ni) ou (fi).

• Dados agrupados em classes (Variáveis contínuas)

Fórmula de King:

f (M O +1) n (M O +1)
MO = l(M O ) +  h (M O ) = l(M O ) +  h (M O )
f (M O −1) + f (M O +1) n (M O −1) + n (M O +1)

n = total de elementos
l(Mo) = limite inferior da classe modal
n(Mo+1) = Frequência absoluta simples da classe posterior à classe modal
n(Mo-1) = Frequência absoluta simples da classe anterior à classe modal
h(Mo) = amplitude da classe modal

f(Mo+1) = Frequência relativa simples da classe posterior à classe modal


f(Mo-1) = Frequência relativa simples da classe anterior à classe modal
h(Mo) = amplitude da classe modal

22
MEDIDAS DE LOCALIZAÇÃO DE TENDÊNCIA NÃO CENTRAL

Quartis

Mín Q1 Q2 Q3 Máx

Fi 25% 50% 75% 100%

i n
− N ( Qi −1)
Qi = l( Qi ) +  h( Qi )
4

n( Qi )

1º Quartil (Q1): à esquerda do 1º quartil estão 25% das observações


2º Quartil (Q2): à esquerda do 2º quartil estão 50% das observações (coincide com a
mediana)
3º Quartil (Q3): à esquerda do 3º quartil estão 75% das observações

Decis

Mín D1 D2 … D9 Máx

Fi 10% 20% .... .... 90% 100%

Percentis

Mín P1 P2 … P99 Máx

23
MEDIDAS DE DISPERSÃO

Permitem identificar o modo como os valores observados se afastam das medidas de

tendência central.

• INTERVALO DE VARIAÇÃO OU AMPLITUDE TOTAL:

I = máx(Xi) - min(Xi)

• AMPLITUDE INTER-QUARTIS

IQ = Q3 − Q1

• VARIÂNCIA E DESVIO PADRÃO

Variância Variância =s2 Variância=2 Variância =VarX

Desvio Padrão

s = desvio padrão =desvio padrão  = Var ( X ) =  2

n n

 (x
i =1
i − x) 2 x
i =1
2
i
Dados discretos: s= ou s= −x2
n n

 n 
k
 ( xi − x) 2
 f 
i k
i =1
s= = i  ( xi − x) 2
n i =1

24
Dados agrupados em classes (variáveis contínuas):

 n 
k
 (C i − x ) 2
 f 
i k
i =1
s= = i  (C i − x ) 2
n i =1

NOTA:

Em amostras de populações normais (com distribuição Normal) a média e o desvio

padrão caracterizam bem a localização e a dispersão. Tem-se os seguintes intervalos:

x − s; x + s  68,3%
x − 2s; x + 2s  95,5%
x − 3s; x + 3s  99,7%

25
MEDIDAS RELATIVAS DE DISPERSÃO

Coeficiente de variação:

S
CV =  100
X

26
DIAGRAMA DE EXTREMOS E QUARTIS

(ou “Caixa de Bigodes”)

Uma forma gráfica que permite facilmente interpretar a localização e a

dispersão.

Exemplo:
Diagramas de extremos e quartis referentes à distribuição das classificações das
disciplinas de estatística, informática e inglês de 12 alunos de determinada
Escola.
18

16

14

12

10

2
N= 12 12 12

Estatística Informática INGLÊS

27
ÍNDICE DE CONCENTRAÇÃO E CURVA DE LORENZ

O fenómeno da concentração está relacionado com a variabilidade ou dispersão


dos valores observados.

Objectivo: medir a forma como determinada característica de uma população


se distribui pelos seus elementos.

Nota: Só é possível quando faz sentido acumular a característica em estudo


num maior ou menor número de elementos da população (isto é, cujos valores
sobre um conjunto de indivíduos são susceptíveis de ser serem adicionados).

Exemplos de aplicação: Rendimento familiar, salário, lucros, facturação…

Duas situações extremas:


• Um só elemento da população detém todo o atributo  concentração
máxima;
• Cada elemento da população detém igual parcela do atributo 
concentração mínima)

Análise do grau de concentração:

- Graficamente: Curva de Lorenz:

100%

90%

80%

70%

60%
(qi)

50%

40%

30%

20%

10%

0%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100
%
(pi)

28
- Indicador numérico: Índice de Gini
k −1 k −1

 ( pi − qi ) q i
IG = i =1
k −1
IG = 1 − i =1
k −1

p
i =1
i p
i =1
i

pi: representa a proporção de elementos que possuem o atributo com uma


intensidade que não excede o limite superior da i-ésima classe;

qi: representa a proporção da totalidade do atributo possuída pelos mesmos


elementos

Nota: pi  qi ; 0  pi  1 ; 0  qi  1

 IG = 0  Igual distribuiç ão (p i = q i ), i = 1, 2, ..., k




 IG = 1  Concentraç ão máxima, (q i = 0, i = 1,..., k − 1)
0  IG  1 

0  IG  1 cresce com o aumento da concentraç ão da caracterís tica em estudo

29
ASSIMETRIA E ACHATAMENTO

MEDIDAS DE ASSIMETRIA

X − MO
Coeficiente assimetria de Pearson C.P. =
s

• C.P.=0 Distribuição simétrica): média=mediana=moda

• C.P.<0 Distribuição assimétrica negativa: média<mediana<moda

• C.P.>0  Distribuição assimétrica positiva: média>mediana>moda

(Q3 − M e ) − (M e − Q1 )
Coeficiente de assimetria de Bowley: C.B =
(Q3 − M e ) + (M e − Q1 )
• C.B.=0 Distribuição simétrica
• C.B.<0 Distribuição assimétrica negativa(enviesada à direita)
• C.B.>0  Distribuição assimétrica positiva(enviesada à esquerda)

MEDIDA DE ACHATAMENTO

Coeficiente de achatamento:
As medidas de curtose (ou grau de achatamento) fornecem uma indicação da intensidade das
frequências na vizinhança dos valores centrais.

Q3 − Q1
Grau de curtose: K=
2(P90 − P10 )

• K=0,263  Distribuição mesocúrtica (achatamento idêntico à distribuição Normal)


• K>0,263  Distribuição platicúrtica (mais achatada que a distribuição Normal)
K<0,263 Distribuição leptocúrtica (menos achatada que a Normal)

30

Você também pode gostar