1
INTRODUÇÃO
Estudantes de ciências sociais e do comportamento acostumam-se rapidamente a usar
palavras familiares de formas inicialmente não-familiares. Muito cedo em seus estu-
dos, eles aprendem que um cientista do comportamento falando de sociedade não está
referindo-se àquele grupo de pessoas cujos nomes aparecem nas páginas sociais de
nossos jornais. Eles sabem que a denotação científica do termo personalidade pouco
ou nada tem em comum com o significado dado pelos adolescentes. Apesar de um
adolescente poder, desdenhosamente, romper com algum de seus amigos por ele “não
ter personalidade”, o cientista do comportamento raramente pode conceber tal condi-
ção. Os estudantes aprendem que o termo cultura, quando usado tecnicamente, abrange
muito mais do que refinamento estético. E eles não cometeriam o erro de dizer que
um vendedor “usa” psicologia para persuadir um cliente a comprar um certo produto.
De forma semelhante, os estudantes descobrem que o campo da estatística é
bastante diferente da concepção comum dada a ele. Nos jornais, no rádio e na televi-
são, o estatístico é apresentado como aquele que coleta grandes quantidades de infor-
mações quantitativas e então as resume, as manipula e as divulga. Somos todos fami-
liarizados com a noção de que a determinação do salário médio em uma indústria ou
do número médio de crianças nas famílias urbanas americanas é trabalho para um
estatístico. Mais familiar para alguns é o papel do estatístico em descrever eventos
esportivos. Mas os estudantes, mesmo tendo feito somente um curso introdutório em
estatística, sabem que a descrição é somente uma das funções da estatística.
Uma função central da estatística moderna é a inferência estatística. A inferência
estatística está relacionada com dois tipos de problemas: estimação de parâmetros
populacionais e testes de hipóteses. É o último deles, testes de hipóteses, que será
nosso maior interesse neste livro.
O dicionário Webster nos diz que o verbo inferir significa “obter como uma conse-
qüência, conclusão, probabilidade”. Quando vemos uma mulher que não usa aliança
no segundo dedo de sua mão esquerda, podemos inferir que ela não é casada. Entre-
tanto, essa inferência poderia ser incorreta. Por exemplo, a mulher poderia ter vindo
da Europa onde a aliança de casamento freqüentemente é usada na mão direita. Ou
ela poderia simplesmente ter optado por não usar aliança.
24 SIDNEY SIEGEL & N. JOHN CASTELLAN, JR.
Em inferência estatística, estamos preocupados em extrair conclusões sobre um
grande grupo de objetos ou com eventos que estão ainda por ocorrer, com base na
observação de poucos objetos ou de fatos que tenham ocorrido no passado. A estatís-
tica fornece ferramentas que formalizam e padronizam nossos procedimentos para
obter tais conclusões. Por exemplo, podemos querer determinar qual entre três varie-
dades de suco de tomate é mais popular com cozinheiros americanos. Informalmente,
poderíamos obter informações sobre essa questão ficando parados próximo da seção
de sucos de tomates em um supermercado, contando o número de latas de cada varie-
dade que são compradas ao longo de um dia. É quase certo que o número de compras
das três variedades será desigual. Mas podemos inferir que aquela variedade mais
freqüentemente escolhida naquele dia e naquele mercado por aqueles clientes do dia é
realmente a mais popular entre os cozinheiros americanos? Para fazermos tal inferência,
precisamos considerar a margem de popularidade mantida pela marca mais freqüen-
temente comprada, a representatividade do supermercado escolhido e também a
representatividade do grupo de compradores que observamos.
Os procedimentos de inferência estatística introduzem ordem em qualquer ten-
tativa de extrair conclusões da evidência proporcionada por amostras. A lógica dos
procedimentos estabelece algumas das condições sobre as quais a evidência precisa
ser coletada, e testes estatísticos determinam se, a partir da evidência que coletamos,
podemos ter confiança no que concluímos sobre o grande grupo do qual somente
poucos objetos foram observados.
Um problema comum de inferência estatística é determinar, em termos de uma
probabilidade, se diferenças observadas entre duas amostras significam que as popu-
lações correspondentes são realmente diferentes entre si. Agora, mesmo se coletar-
mos dois grupos de escores tomando amostras aleatórias da mesma população, é pro-
vável que ainda encontremos diferenças nos escores. Diferenças podem ocorrer sim-
plesmente porque a escolha das amostras é feita ao acaso. Como podemos determinar
em qualquer caso considerado se as diferenças observadas entre duas amostras são
devidas meramente ao acaso ou se são causadas por outros fatores? Os procedimentos
de inferência estatística nos tornam capazes de determinar se as diferenças observa-
das estão dentro de um domínio que facilmente poderia ter ocorrido devido ao acaso
ou não. Outro problema comum é determinar se uma amostra de escores provém de
uma população específica. Um outro problema ainda é decidir se podemos legitima-
mente inferir que vários grupos diferem entre si. Neste livro, estaremos preocupados
com esses problemas em inferência estatística.
No desenvolvimento dos métodos da estatística moderna, as primeiras técnicas
de inferência que apareceram foram as que fizeram muitas boas suposições sobre a
natureza das populações das quais as observações ou os dados foram extraídos. Essas
técnicas estatísticas são chamadas paramétricas. Por exemplo, uma técnica de inferência
pode ser baseada na suposição de que os dados foram extraídos de uma população
denominada população normalmente distribuída. Ou uma técnica de inferência pode
ser baseada na suposição de que dois conjuntos de dados foram extraídos de popula-
ções tendo a mesma variância (σ2) ou dispersão de escores. Tais técnicas produzem
conclusões contendo restrições, por exemplo: “Se as suposições com relação à forma
da(s) distribuição(ões) da(s) população(ões) são válidas, então podemos concluir
que...”. Devido às suposições serem comuns à maioria dos testes, tais testes são facil-
mente sistematizados e, portanto, são mais fáceis de ser ensinados e aplicados.
Um pouco mais recentemente assistimos ao desenvolvimento de um grande nú-
mero de técnicas de inferência, as quais não fazem suposições numerosas ou restrin-
gentes sobre a população da qual os dados são extraídos. Essas técnicas não-paramétricas
ESTATÍSTICA NÃO-PARAMÉTRICA PARA CIÊNCIAS DO COMPORTAMENTO 25
ou livres de distribuição resultam em conclusões que requerem menos qualificações.
Ao usar uma delas, poderemos ser capazes de dizer que “desconsiderando a forma
da(s) população(ões), podemos concluir que...”. São essas as técnicas com as quais
estaremos preocupados neste livro.
Algumas técnicas não-paramétricas são testes de postos ou testes de ordenação,
e estas formas de identificação sugerem outro aspecto em que testes não-paramétricos
diferem de testes paramétricos. Quando usamos um teste estatístico, implicitamente
fazemos certas suposições sobre as atribuições numéricas feitas aos objetos observa-
dos. Como veremos no Capítulo 3, as regras para atribuições numéricas constituem
uma mensuração por escala. As regras de atribuição que usamos (isto é, a escala)
colocam restrições nos tipos de interpretação e de operações que são apropriadas a
essas atribuições. Quando a aplicação de um teste estatístico transforma valores de
escala de maneiras inadequadas, torna-se difícil interpretar o resultado. Apesar de
podermos calcular um teste estatístico paramétrico para dados de qualquer tipo, a
facilidade de interpretação do teste depende da maneira como as observações são
transformadas em números para análise. Muitos testes não-paramétricos, por outro
lado, têm foco na ordem ou nos postos dos escores, e não em seu valor “numérico”, e
outras técnicas não-paramétricas são úteis com dados nos quais mesmo uma ordena-
ção é impossível (por exemplo, com dados classificatórios). Enquanto um teste
paramétrico pode focalizar sobre a diferença entre as médias de duas populações, o
teste não-paramétrico análogo pode focalizar sobre a diferença das medianas. As van-
tagens de estatísticas baseadas em ordenação de dados em ciências do comportamen-
to (na qual escores “numéricos” podem ser precisamente numéricos somente na apa-
rência) devem ser aparentes. Discutiremos este ponto detalhadamente no Capítulo 3,
no qual testes paramétricos e não-paramétricos são contrastados.
Dos nove capítulos deste livro, seis são dedicados à apresentação dos vários tes-
tes estatísticos não-paramétricos. Os testes são colocados nos capítulos de acordo com
o tipo de pesquisa para o qual eles são apropriados. O Capítulo 4 contém testes que
podem ser usados quando se quer determinar se uma única amostra provém de uma
população específica. Dois capítulos contêm testes que podem ser usados quando se
deseja comparar os escores dados por duas amostras: o Capítulo 5 considera testes
para duas amostras relacionadas e o Capítulo 6 considera testes para duas amostras
independentes. De forma similar, dois capítulos são dedicados a testes de significância
para três ou mais amostras: o Capítulo 7 apresenta testes para três ou mais amostras
relacionadas e o Capítulo 8 apresenta testes para três ou mais amostras independen-
tes. As medidas não-paramétricas de associação e testes de significância para elas são
descritas no Capítulo 9.
Além disso, tentamos tornar o livro compreensível para o leitor cujo conheci-
mento em matemática está limitado à álgebra elementar. Essa orientação impediu a
apresentação de muitas derivações mais complexas. Quando possível, tentamos trans-
mitir uma compreensão intuitiva da lógica subjacente ao teste, pois acreditamos que
essa compreensão será mais útil do que a tentativa de seguir as deduções matemáti-
cas. O leitor mais sofisticado matematicamente desejará seguir os tópicos desenvolvi-
dos neste livro recorrendo a fontes às quais fizemos referência.
Os leitores cuja experiência em matemática é limitada, e especialmente aqueles
cuja experiência educacional tem sido tal que tenham desenvolvido respostas emocio-
nais negativas aos símbolos, muitas vezes acham difíceis os livros de estatística devido
ao extensivo uso de símbolos. Tais leitores poderão verificar que muita de sua dificul-
dade desaparecerá se ele ler mais lentamente do que de costume e relacionar a apre-
sentação textual à apresentação tabular dos dados. Além disso, o leitor é encorajado a
26 SIDNEY SIEGEL & N. JOHN CASTELLAN, JR.
aprender a ler equações e fórmulas como se fossem sentenças, substituindo os nomes
das variáveis pelos nomes dos símbolos. Não se espera que um leitor especialista em
ciências sociais ou do comportamento possa manter a mesma rapidez de percepção ao
ler um livro de estatística e ao ler um livro sobre, digamos, personalidade, ou sobre
hostilidade entre grupos, ou sobre o papel da geografia nas diferenças culturais. As
redações em estatística são mais condensadas do que a maioria das redações sociais
científicas – usamos símbolos tanto para simplificar como para dar maior precisão – e,
portanto, ela requer uma leitura mais lenta. O leitor que considera os símbolos difíceis
pode também recorrer ao glossário que está incluído no livro. O glossário sintetiza os
significados dos vários símbolos usados no texto. Uma razão para que o uso extensivo
de símbolos torne o material mais difícil é que os símbolos são termos gerais e abstra-
tos, os quais adquirem uma variedade de significados específicos em uma variedade
de casos específicos. Assim, quando falamos de k amostras queremos dizer um núme-
ro qualquer de amostras – 3, 4, 8, 5 ou qualquer outro número. Nos exemplos, é claro,
cada símbolo adquire um valor numérico específico e, assim, os exemplos podem ser-
vir para “concretizar” a discussão para o leitor.
Muitos leitores possuem calculadoras eletrônicas em que podem ser calculadas a
maioria das estatísticas descritas neste livro. Outros têm acesso fácil a “pacotes” esta-
tísticos para uso em computadores. Apesar de os computadores reduzirem ao mínimo
o trabalho de análise de dados, é importante que o usuário entenda a estatística – suas
suposições e o que ela faz com os dados. A melhor maneira de se entender as técnicas
estatísticas é calculá-las com seus próprios dados. Em nossa apresentação das técni-
cas, preferimos descrever os procedimentos de uma maneira amena para agilizar a
análise de dados. Apesar de os pacotes informáticos poderem ser usados (e devem ser
usados em muitos casos), muitas vezes é mais rápido analisar conjuntos pequenos de
dados com uma calculadora. Para algumas das estatísticas mais complicadas, incluí-
mos listas de programas informáticos simples que ajudarão a analisar os dados se o
procedimento não for facilmente encontrado em outros pacotes.
Finalmente, o leitor com treinamento matemático limitado também poderá con-
siderar os exemplos especialmente úteis. É dado um exemplo do uso na pesquisa para
cada um dos testes estatísticos apresentados neste livro. Os exemplos também servem
para ilustrar o papel e a importância da Estatística na pesquisa do cientista do compor-
tamento. Esta pode ser sua função mais útil, já que este livro é dirigido para o pesqui-
sador cujo interesse primordial está no conteúdo ou em tópicos da ciência social e
comportamental, e não tanto em sua metodologia. Os exemplos demonstram a íntima
inter-relação do conteúdo e do método nessas ciências.