Aula 1 Técnicas de coleta de dados
1. Introdução A estatística envolve técnicas para coletar,
organizar, descrever, analisar e interpretar dados, ou
provenientes de experimentos, ou vindos de estudos
observacionais. Os dados podem provir de estudos
observacionais ou de experimentos planejados. Ao
acompanhar o desempenho de um processo produtivo
em sua forma natural, estamos fazendo um estudo
observacional; ao alterar de forma proposital as
variáveis do processo para verificar seus efeitos nos
resultados, estamos realizando um experimento.
Nesta primeira parte da disciplina, veremos técnicas de amostragens e de planejamento de
experimentos. O principal objetivo é obter informações (ou dados) que são capazes de
responder a um problema.
As informações relevantes contidas nos dados precisam ser realçadas (com uso de
gráficos e tabelas apropriadas), e para isso fazemos uso da análise exploratória de
dados.
Obviamente, esses dados sempre carregam erros. Determinar a origem desses erros é
uma tarefa extremamente difícil e para isso, fazemos uso da probabilidade (parte da
matemática que se ocupa em modelar fenômenos aleatórios).
E finalmente, aquilo os resultados obtidos do estudo podem ser generalizados para
uma população a partir do que chamamos de inferência estatística.
As pessoas normalmente associam o termo estatística a números, tabelas e gráficos, mas a
importância da estatística fica melhor representada por dois ingredientes comuns em nosso
dia a dia: dados e variabilidade.
Dados consistem em informações que vêm de observações, contagem, medições ou
respostas (questionários).
Os modelos podem ser considerados como alguma representação da realidade em
estudo, destacando aspectos relevantes e desprezando detalhes insignificantes. Em
geral, eles servem para simplificar, descrever e facilitar a interpretação daquilo que se
está estudando.
Um modelo é determinístico quando tem um conjunto de entradas conhecido e do
qual resultará um único conjunto de saídas (em geral se origina de deduções
analíticas).
O modelo probabilístico (ou estocástico) se origina de observações.
2. Conceitos básicos
População: conjunto de elementos que formam o universo de nosso estudo que são passíveis
de serem observados, sob as mesmas condições.
Amostra: parte dos elementos de uma população.
Amostragem: processo de seleção da amostra.
Amostragem aleatória simples: o processo de seleção dos elementos é feito por sorteios,
fazendo com que todos os elementos da população tenham a mesma chance de ser escolhidos
e, além disso, todo subconjunto de n elementos tenha a mesma chance de fazer parte da
amostra.
3. Planejamento de uma pesquisa
Para que os resultados de uma análise estatística de dados produzam informações úteis, os
dados precisam ser coletados de forma planejada.
Em função do problema e dos objetivos da pesquisa, devemos decidir entre uma pesquisa
observacional e uma pesquisa experimental. Numa pesquisa observacional (ou de
levantamento) as características de uma população são levantadas (observadas ou medidas),
mas sem manipulação. É o caso de um censo demográfico, pesquisas eleitorais, pesquisas de
mercado, inspeção da qualidade etc. Em todos esses casos, quer-se ter ideia de certa
população tal qual ela é na natureza ou no processo. Nas pesquisas experimentais, grupos de
indivíduos (ou animais, ou objetos) são manipulados para se avaliar o efeito de diferentes
tratamentos. É o caso de se verificar o rendimento de um processo químico para diferentes
temperaturas de reação, que são manipuladas de acordo com o interesse prático.
Problema de pesquisa: Para se iniciar qualquer processo de pesquisa, deve-se ter bem
definido o problema a ser pesquisado. Isto normalmente envolve uma boa revisão da
literatura sobre o tema em questão.
https://www.sciencedirect.com
https://www.mdpi.com
https://link.springer.com
https://www.tandfonline.com
Objetivos: devem ser elaborados de forma bastante clara, já que as demais etapas da pesquisa
tomam como base esses objetivos.
Vejamos o exemplo traduzido (tradução livre):
Sujeito (o trabalho, a pesquisa, Verbo no Infinitivo: delimita a ação que será
o artigo, o relatório...) executada no trabalho de pesquisa
Este estudo tem como objetivo entender as características dos
anúncios em vídeos de curta duração que atraem a atenção dos
consumidores, aumentam sua confiança o conteúdo e promovem
seu comportamento de compra.
O complemento do verbo que
indica o objeto de pesquisa
Como definir o objetivo do contexto abaixo?
Historicamente, a Fazenda Palmarito tem sido administrada de maneira tradicional, seguindo
métodos conservadores. No entanto, com o advento de uma nova era na agricultura e na
pecuária, caracterizada pela crescente importância do marketing e da comercialização, a
fazenda está diante de uma oportunidade única de modernizar suas estratégias e adaptar-se
às demandas do mercado atual. Essa Fazenda é uma propriedade familiar, situada em Santa
Cruz de la Sierra, na Bolívia, na atualidade, não presenta nenhuma estratégia de marketing, já
que é gerida de maneira tradicional e conservadora, além de que se encontra inserida em um
ambiente em que a implementação de práticas mercadológicas ainda está em estágio inicial na
região.
Para podermos dar sequência a esta pesquisa, precisamos especificar melhor o que queremos
conhecer da população de funcionários, ou seja, os objetivos específicos. Vejamos o exemplo:
Objetivo geral: conhecer o perfil de trabalho dos funcionários de determinada empresa para
orientar políticas de recursos humanos.
a) Conhecer o tempo médio de serviço dos funcionários na empresa;
b) Conhecer a distribuição do nível de instrução dos funcionários;
c) Verificar o interesse dos funcionários em participar de programas de treinamento; d) Avaliar
o nível de satisfação dos funcionários com o trabalho que exercem na empresa; e) Verificar se
existe associação entre o nível de satisfação do funcionário com a sua produtividade.
A elaboração dos objetivos específicos deve ser feita de tal forma que forneça uma
primeira indicação das características que precisamos observar ou medir nos indivíduos a
serem pesquisados. Por exemplo, para atingir os objetivos do problema em questão,
precisamos levantar as seguintes características de cada funcionário da empresa: tempo de
serviço, nível de instrução, interesse em participar de programas de treinamento, nível de
satisfação com o trabalho e produtividade.
Um outro passo importante no delineamento da pesquisa consiste na decisão de quem se
vai pesquisar.
População-alvo é o conjunto de elementos que queremos abranger em nosso estudo. São os
elementos para os quais desejamos que as conclusões oriundas da pesquisa sejam válidas.
População acessível, ou simplesmente população, é o conjunto de elementos que queremos
abranger em nosso estudo e que são passíveis de serem observados, com respeito às
características (variáveis) que pretendemos levantar.
Depois de definirmos os objetivos e a população a ser estudada, precisamos pensar como
será a coleta de dados. Em muitas situações não precisamos ir até aos elementos da população
para obter os dados, porque eles já existem em alguma publicação ou arquivo. É o que
chamamos de dados secundários. Quando os dados forem levantados diretamente dos
elementos da população, é necessário construir um instrumento para que sua coleta seja feita
de forma organizada. Chamaremos este instrumento de Questionário.
As variáveis surgem quando perguntamos o que vamos observar ou medir nos elementos
de uma população ou amostra. A observação (ou medida) de uma variável num elemento da
população deve gerar um e apenas um resultado.
Na população de funcionários de uma empresa, podemos definir variáveis, tais como: tempo
de serviço, estado civil, etc. Podemos observá-las com perguntas do tipo:
Há quanto tempo o Sr. (ou Sra.) trabalha nesta empresa? __
Há quanto tempo o Sr. (ou Sra.) trabalha nesta empresa? ____ anos completos.
Quando os possíveis resultados de uma variável são números de uma certa escala, dizemos
que esta variável é quantitativa. Quando os possíveis resultados são atributos ou qualidades, a
variável é dita qualitativa. Na descrição das variáveis envolvidas na pesquisa, devemos incluir a
escala (ou unidade) em que serão mensuradas as variáveis quantitativas e as categorias
(possíveis respostas) das variáveis qualitativas. Sempre que uma característica puder ser
adequadamente medida sob forma quantitativa, devemos usar este tipo de mensuração,
porque as medidas quantitativas são, em geral, mais informativas do que as qualitativas. Por
exemplo, dizer que um funcionário trabalha há 30 anos na empresa é mais informativo do que
dizer que ele trabalha há muito tempo na empresa.
4. Atividade em sala
Considerando os objetivos abaixo, quais variáveis precisam ser levantadas para atingi-los?
Essas variáveis são qualitativas ou quantitativas?
a) Conhecer o tempo médio de serviço dos funcionários na empresa;
b) Conhecer a distribuição do nível de instrução dos funcionários;
c) Verificar o interesse dos funcionários em participar de programas de treinamento;
d) Avaliar o nível de satisfação dos funcionários com o trabalho que exercem na empresa;
e) Verificar se existe associação entre o nível de satisfação do funcionário com a sua
produtividade.
5. Elaboração de um questionário
Na condução de uma pesquisa, a construção de um questionário é uma etapa longa que
deve ser executada com muita cautela. Tendo em mãos os objetivos da pesquisa claramente
definidos, bem como a população a ser estudada.
Separar as características (variáveis) a serem levantadas.
Fazer uma revisão bibliográfica para verificar formas de mensurar as variáveis em
estudo.
Estabelecer a forma de mensuração das variáveis a serem levantadas.
Elaborar uma ou mais perguntas para cada variável a ser observada.
Verificar se a pergunta está suficientemente clara.
Verificar se a forma da pergunta não está induzindo alguma resposta.
Verificar s e a resposta da pergunta não é óbvia.
Um aspecto fundamental nesta fase da pesquisa é o planejamento de como usar as respostas
dos diversos itens para responder às indagações de nossa pesquisa. O questionário também
deve ser feito de forma a facilitar a análise dos dados. O questionário deve ser completo, no
sentido de abranger as características necessárias para atingir os objetivos da pesquisa; ao
mesmo tempo, não deve conter perguntas que fujam desses objetivos, pois, quanto mais
longo o questionário, menor tende a ser a confiabilidade das respostas.
A escala Likert ou escala de Likert é um tipo de escala de resposta psicométrica usada
habitualmente em questionários, e é a escala mais usada em pesquisas de opinião.
6. Aplicação do questionário
Um questionário propriamente dito é respondido pelo próprio elemento da população,
sem que algum encarregado da pesquisa observe o respondente no momento do
preenchimento. Numa entrevista estruturada, o entrevistado responde verbalmente as
perguntas e o entrevistador as transcreve para uma ficha. Nesta segunda situação, o
entrevistador pode ou não interferir, sob forma de esclarecimento de algum item, anotando
aspectos que julgar relevantes, mas nunca influenciando na resposta do entrevistado. Deve
sempre haver homogeneidade na forma de aplicação dos questionários. Em pesquisas que
envolvem vários entrevistadores, toma-se necessário um prévio treinamento para garantir a
homogeneidade na aplicação.
7. Estudo piloto (pré-testagem)
Antes de iniciar a coleta de dados através de um questionário, precisamos verificar se o
instrumento está bom. Nesse contexto, torna-se fundamental a realização de um pré-teste,
aplicando o questionário em alguns indivíduos com características similares aos indivíduos da
população em estudo. Somente pela aplicação efetiva do questionário é que podemos
detectar algumas falhas que tenham passado despercebidas em sua elaboração, tais como:
ambiguidade de alguma pergunta, resposta que não havia sido prevista, não variabilidade de
respostas em alguma pergunta, etc. O pré-teste também pode ser usado para estimar o tempo
de aplicação do questionário.
8. Exemplo
Objetivo geral: Conhecer melhor a relação entre o aluno e o seu curso (curso de Administração
da UDESC), para servir de subsídio nas políticas de melhoria do curso.
Objetivos específicos:
1) Avaliar o nível de satisfação do aluno com o curso que está realizando.
2) Verificar se existe associação entre o nível de satisfação do aluno com o seu desempenho no
curso.
3) Levantar os aspectos positivos e negativos do curso, na visão do aluno.
9. Noções de amostragem
De modo geral, os levantamentos abrangem um universo de elementos tão grande que se
torna impossível considerá-los em sua totalidade. Por essa razão, o mais frequente é trabalhar
com uma amostra, ou seja, com uma pequena parte dos elementos que compõem o universo.
Quando essa amostra é rigorosamente selecionada, os resultados obtidos no levantamento
tendem a aproximar-se bastante dos que seriam obtidos caso fosse possível pesquisar todos os
elementos do universo. E, com o auxílio de procedimentos estatísticos, torna-se possível até
mesmo calcular a margem de segurança dos resultados obtidos.
Amostragem aleatória simples Consiste basicamente em atribuir a cada elemento do universo
um número único para, depois, selecionar alguns desses elementos de maneira casual. Para
realizar essa seleção são utilizadas as tábuas de números aleatórios, que estão disponíveis na
maioria dos livros de Estatística Descritiva, mas que também podem ser geradas por
programas estatísticos, como o Excel. Esse procedimento, embora seja o que mais se ajusta
aos princípios da teoria das probabilidades, nem sempre é o de mais fácil aplicação, sobretudo
porque exige que se atribua a cada elemento da população um número único. Além disso,
despreza o conhecimento prévio da população que porventura o pesquisador possa ter.
Amostragem sistemática É uma variação da amostragem aleatória simples. Sua aplicação
requer que a população seja ordenada de modo tal que cada um de seus elementos possa ser
unicamente identificado pela posição. Apresenta condições para satisfação desse requisito
uma população identificada a partir de uma lista que englobe todos os seus elementos, uma
fila de pessoas ou o conjunto de candidatos a um concurso identificados pela ficha de
inscrição. O primeiro elemento é selecionado aleatoriamente e os demais subsequentes em
intervalos fixos.
Amostragem estratificada Caracteriza-se pela seleção de uma amostra de cada subgrupo da
população considerada. O fundamento para delimitar os subgrupos ou estratos pode ser
encontrado em propriedades como gênero, idade ou classe social. Muitas vezes, essas
propriedades são combinadas, originando uma matriz de classificação. Por exemplo, quando
se combinam homem e mulher com “maior de 18 anos” e “menor de 18 anos” , resultam
quatro estratos: “homem menor de 18 anos” , “mulher menor de 18 anos” , “homem maior de
18 anos” e “mulher maior de 18 anos”.
Amostragem por conglomerados É indicada em situações em que é bastante difícil a
identificação de seus elementos. É o caso, por exemplo, de pesquisas cuja população seja
constituída por todos os habitantes de uma cidade. Em casos desse tipo, é possível proceder-
se à seleção da amostra a partir de conglomerados. Conglomerados típicos são quarteirões,
famílias, organizações, edifícios, fazendas etc.
Amostragem por cotas Esse tipo de amostragem é muito utilizado em pesquisas eleitorais e de
mercado, tendo como principal vantagem seu baixo custo. De modo geral, é desenvolvida em
três fases:
1) classificação da população em função de propriedades tidas como relevantes para o
fenômeno a ser estudado;
2) determinação da proporção da população a ser colocada em cada classe com base na
constituição conhecida ou presumida da população; e
3) fixação de cotas para cada entrevistador encarregado de selecionar elementos da população
a ser pesquisada de modo tal que a amostra total seja composta em observância à proporção
das classes consideradas.
Para que os dados obtidos num levantamento sejam significativos, é necessário que a amostra
seja constituída por um número adequado de elementos. A estatística dispõe de
procedimentos que possibilitam estimar esse número. Para tanto, são realizados cálculos
diversos. Entretanto, uma razoável estimativa pode ser feita consultando-se a Tabela a seguir.