METODOLOGIA DA INVESTIGAÇÄO
EM
PSICOLOGIA E EDUCAÇÄO
LEANDRO S. ALMEIDA
TERESA FREIRE,
COIMBRA
APPORT - Associaçäo dos Psicólogos Portugueses
Ficha Técnica:
Título: Metodologia da Investigaçäo em Psicologia e Educaçäo
Autores: Leandro S. Almeida & Teresa Freire
Data da 1? ediçäo: Maio, 1997
Propriedade editorial: Autores
Tiragem da 1.2 ediçäo: 750 exemplares
Impressäo: LUSOGRAFE - BRAGA
Depósito Legal: 112375/97
ISBN: 972-97388-0-7
Nota prévia
Apresentamos, neste livro, conhecimentos, competências e reflexöes
construídas no âmbito da nossa actividade docente e experiência de
investigaçäo, tanto no contexto da Psicologia da Educaçäo como da
Psicologia Social, respectivamente. O texto, em si, aproveita parte do
trabalho produzido pelo primeiro autor no quadro do relatório apresen-
tado nas provas públicas de Agregaçäo em Psicologia na Universidade do
Minho. A experiência acumulada, sobretudo na docência de disciplinas
afins à temática deste livro, fez-nos sentir a necessidade e a pertinência
desta publicaçäo. O objectivo foi, entäo, editar um manual que sistema-
tize, numa linguagem que se julga próxima dos principais destinatários,
os vários momentos na delimitaçäo e concretizaräo de uma investigaçäo.
Agradecemos ao Doutor Eduardo Ribeiro dos Santos e ao Doutor
Joaquim Armando Ferreira, respectivamente Presidente e Vice-Presidente
da APPORT, a chancela desta Associaçäo. Como eles, e também como
associados, achámos que fazia sentido o aparecimento do nome da
APPORT neste livro. Acreditamos que um livro deste tipo serve quem
mais de perto produz conhecimento, assim como aqueles que, no seu
quotidiano profissional, säo cada vez mais chamados, numa lógica de
acçäo-investigaçäo, a uma prática reflexiva ou à utilizaçäo crítica de
modelos e instrumentos disponíveis. A complexificaçäo da sociedade
dos nossos dias, e da Educaçäo em particular, carece cada vez mais de
profissionais com essa postura interventiva.
Os autores
INDICE GERAL
Introduçäo...................................................... 11
Capítulo 1: A investigaçäo em psicologia e educaçäo............. 17
O conhecimento científico....................................... 19
Características do conhecimento científico............. 21
Produçäo do conhecimento científico.................... 22
A investigaçäo científica....................................... 24
Objectivos da investigaçäo............................. 24
Modelos de investigaçäo................................ 26
O processo de produçäo do conhecimento científico............... 30
Capítulo 2: Problema, hipótese(s) e variável(eis)............... 35
Definiçäo de um problema........................................ 37
Passos na definiçäo de um problema................... 38
Revisäo bibliográfica................................ 42
A(s) hipótese(s)................................................ 43
Classificaçäo das hipóteses.......................... 44
Aceitaçäo e rejeiçäo estatística das hipóteses....... 47
As variáveis.................................................... 49
Estatuto das variáveis na investigaçäo............... 51
Parâmetros de medida das variáveis................... 56
Natureza da medida das variáveis..................... 56
Escalas de medida das variáveis...................... 58
As variáveis no quadro dos modelos de investigaçäo... 64
Capítulo 3: Procedimentos: planos e amostras.................... 69
Planos de investigaçäo.......................................... 72
Validade interna e externa........................... 73
Factores que afectam a validade interna...... 74
Factores que afectam a validade externa...... 77
8 índice Geral
Grupos e momentos num plano....................... 78
Grupos de sujeitos....................... 78
Momentos da avaliaçäo.................... 80
Grupos e momentos da avaliaçäo........... 81
Método experimental.......................................... 82
Planos factoriais................................. 86
Classificaçäo dos planos.......................... 88
Método correlacional......................................... 92
Métodos qualitativos......................................... 94
Populaçäo e amostras......................................... 96
Conceito de populaçäo, amostra e sujeito.......... 96
Processos e tipos de amostras..................... 97
Amostras aleatórias simples.............. 99
Amostras aleatórias estratificadas....... 101
Representatividade e significância das amostras... 102
Estudos de grupo e caso único..................... 104
Os sujeitos na investigaçäo....................... 107
Capítulo 4: Recolha dos dados: procedimentos e instrumentos.................. 111
Procedimentos de construçäo............................................................ 114
Recolha dos itens................................................................ J14
Ambito da prova........................... 115
Formulaçäo dos itens...................... 117
Análise e selecçäo dos itens....................... 120
Análises qualitativas...................... 120
Análises quantitativas................ 1... 122
índice de dificuldade...................... 123
Poder discriminatívo....................... 128
Validade externa........................... 131
Teoria da resposta ao item(TRI)............ 133
Organizaçäo dos itens na prova..................... 136
Administraçäo da prova............................. 138
Aferiçäo dos resultados....................................... 141
Características metrológicas dos resultados........ 142
Sensibilidade dos resultados............... 1,4
Fidelidade dos resultados.................. 145
Metodologia da Investigaçäo em Psicologia e Educaçäo 9
Erro padräo da medida................................................ 152
Validade dos resultados.............................................. 153
Normalizaçäo dos resultados................................................. 161
Correcçäo dos resultados............................................. 162
Necessidade de normas................................................ 163
Cálculo das normas.......................................................... 163
Normas centradas na média e desvio-padräo............................ 164
Normas centradas na frequência....................................... 165
Classes normalizadas................................................. 167
Notas de idade...................................................... 168
Interdependência e sentido das normas....................................... 170
Capítulo 5: Resultados: Análise e discussäo............................................ 177
Os dados, as análises e as conclusöes.................................................. 179
O tratamento dos dados........................................................ 180
Dimensionalidade das escalas.................................................. 181
Significância dos dados....................................................... 186
Generalizaçäo, explicaçäo e prediçäo.......................................... 191
Consideraçöes éticas da investigaçäo................................................... 193
Aspectos éticos na investigaçäo e na observaçäo psicológica................195
Aspectos a considerar num relatório científico.......................................... 198
Conclusäo................................................................................... 204
Introduçäo
r-
t
1' ffl 'v
I
lt N
"- 1 , -
Pensado para alunos e profissionais da Psicologia e Educaçäo, este livro
descreve as fases e procedimentos de uma investigaçäo. Trata-se de uma área näo
muito versada na sua formaçäo acadêmica e profissional, sendo certo também que a
falta de manuais em língua portuguesa näo favorece a sua capacitaräo e desenvolvi-
mento autónomo nesta área. Assim se poderäo explicar as percepçöes frequentes de
dificuldade ou as expectativas antecipadas de fracasso na abordagem destes assuntos.
No entanto, e numa lógica de práticos-investigadores, psicólogos e técnicos de
educaçäo beneficiam profissionalmente de uma melhor preparaçäo nesta área. Estes
conhecimentos e competências promovem quer as atitudes de investigaçäo e de
reflexäo nas suas práticas profissionais, quer as atitudes críticas face aos dados da
investigaçäo a que têm acesso. Tais competências servem simultaneamente os papéis
de produtores e consumidores de conhecimentos. A aproximaçäo desejável entre
acadêmicos e profissionais da Psicologia e Educaçäo sairá mais facilmente viabilizada
através da maior disseminaçäo deste tipo de competências pelos profissionais.
Ao longo deste volume centrar-nos-emos nos momentos que estruturam um
projecto de investigaçäo. Tais momentos devem ser considerados quer numa lógica
de delimitaçäo de informaçäo e procedimentos, quer numa lógica de sequencializaçäo
ou interdependência das decisöes. Os capítulos seguem essa sequencializaçäo, o que
nos parece também justificável pela maior clareza de exposiçäo.
Assim, no primeiro capítulo, caracteriza-se a investigaçäo e o conhecimento
científico, especificando algumas das suas características e formas assumidas na
Psicologia e Educaçäo, como aliás nas demais Ciências Sociais e Humanas. Alguns
paralelismos com as Ciências Exactas permitem-nos descrever tipos diversos de
investigaçöes e níveis diversos Ule análise.
O segundo capítulo centra-se na formulaçäo de um projecto de investigaçäo.
Trata-se do primeiro passo a dar neste processo, sendo a clareza dessa formulaçäo
decisiva para os vários momentos e decisöes posteriores. Desde já, podemos pensar
que a facilidade desta formulaçäo cresce na razäo inversa do número de problemas
e múltiplos contornos que rodeiam as nossas ciências e práticas. Assim importa
definir, delimitar e clarificar o problema a investigar, precisando-o de uma forma
14 Introduçäo
mais clara aquando da formulaçäo de uma hipótese e definiçäo das variáveis a
considerar, bem como os respectivos papéis na investigaçäo em causa.
No terceiro capítulo, descrevemos o plano de recolha dos dados. Incluem-se
neste tópico a resposta a questöes como: quando se vai avaliar; quem vai ser avaliado;
quem avalia; e em que condiçöes essa avaliaçäo vai ocorrer. Os procedimentos de
recolha dos dados devem estar bem definidos de forma a garantir a validade interna
(significaçäo) e externa (generalizaçäo) dos resultados empíricos obtidos, sendo
decisiva a definiçäo dos sujeitos a avaliar e dos comportamentos a registar. Os dados
recolhidos podem estar fortemente influenciados pelo tipo de comportamentos que
se decide observar, pelas características dos sujeitos que integram a amostra do estudo
ou pelas circunstâncias em que ocorre a avaliaçäo.
No quarto capítulo, centrar-nos-emos nos instrumentos de avaliaçäo.
Como nem sempre estes instrumentos se encontram disponíveis, ou se existem
poderäo estar em versöes menos actualizadas ou adequadas às populaçöes que nos
interessam considerar na investigaçäo, apresentamos procedimentos de análise mais
centrados nos itens (importantes na construçäo e adaptaçäo de instrumentos) e
procedimentos mais centrados nos resultados finais. De novo, a qualidade dos dados
e das conclusöes a postular no final da investigaçäo encontra-se fortemente condi-
cionada pela qualidade dos instrumentos usados. Mais tarde, e pensando desdejá num
outro volume a editar, julgamos necessário descrever alguns dos modelos
caracterizadores da avaliaçäo psicológica e educacional, bem como alguns dos
instrumentos mais usados na investigaçäo e na prática. Referimo-nos, a título de
exemplo, a formas mais características das abordagens psicométricas, comportamentais
ou naturalísticas de proceder à observaçäo dos comportamentos e das variáveis
associadas.
No quinto capítulo, um capítulo a merecer uma abordagem própria numa
eventual publicaçäo posterior em face da sua especificidade e abrangência, referimo-
nos aos cuidados a ter iih análise e discussäo dos resultados, assim como na elaboi a,;äo
e apresentaçäo das conclusöes da investigaçäo. Neste livro, este assunto é abordado
em termos muito gerais, quando comparado com o pormenor a que se chega no
capítulo anterior. De salientar que as opçöes metodológicas ao nível dos métodos
qualitativos e quantitativos disponíveis para a análise dos resultados säo múltiplas e
complexas, exigindo e justificando um esforço particular na sua abordagem. Neste
primeiro livro centramo-nos mais na planificaçäo da investigaçäo e na avaliaçäo,
Metodologia da Investígaçäo em Psicologia e Educaçäo is
esperando que futuros trabalhos possam ser mais dirigidos às análises de dados e às
correntes de observaçäo em Psicologia e Educaçäo.
Com a ediçäo deste livro, esperamos ajudar todos aqueles que no âmbito de
uma formaçäo inicial ou especializada, ou no âmbito da sua prática profissional, se
sentem muitas vezes "impotentes" face ao formalismo exagerado com que certos
assuntos metodológicos surgem abordados, para além da necessidade da sua consulta
numa língua estrangeira. Redigimos este livro com uma preocupaçäo didáctica.
Fizemos um esforço em o tornar claro e recorremos a alguns esquemas, resumos e
exemplifícaçöes. Mesmo assim, julgamos que a nossa formaçäo em Psicologia pode
explicar o maior recurso a exemplos nesta área. Também procurámos näo descurar
as consideraçöes práticas e as aplicaçöes da informaçäo metodológica em análise.
Caberá, agora, ao leitor a avaliaçäo do grau em que tais preocupaçöes foram
traduzidos ao longo do livro, aliás muito apreciaremos comentários e sugestöes nesse
sentido. Importa clarificar que näo pensámos neste livro como um compêndio de
receitas". As opçöes metodológicas näo se impoem, apenas moldam um projecto de
investigaçäo. Caberá ao investigador a liberdade e a responsabilidade das decisöes a
tomar.
Capítulo 1
A investigaçäo em Psicologia e Educaçäo
1,
k I" - - .
1t
A investigaçäo em psicologia e educaçäo
* conhecimento científico
Características do conhecimento científico
Produçäo do conhecimento científico
* investigaçäo científica
Objectivos da investigaçäo
Modelos de investigaçäo
* processo de produçäo do conhecimento científico
O presente capítulo aborda os aspectos relativos à investigaçäo psicológica,
centrando-se nas questöes relativas ao conhecimento científico em geral, como sejam
as características do conhecimento científico, e à própria produçäo do conhecimento
científico. Estas questöes permitem-nos, de algum modo, um maior enquadramento
dos aspectos relativos à investigaçäo científica já que está em causa a cientificidade
de uma área do conhecimento. Assim, consideraremos os objectivos da investigaçäo,
os modelos de investigaçäo existentes e, também, a apologia das investigaçöes em
Psicologia e Educaçäo.
Estes säo assuntos essenciais a que qualquer investigador deve atender
quando pensa executar uma investigaçäo científica. Desde logo o investigador deve
estar consciente que a sua investigaçäo obedece a determinados requisitos científicos
que devem ser ponderados.
O conhecimento científico
Falar em conhecimento científico é falar em ciência. Certamente que nem
todo o conhecimento que possuímos, e que diariamente utilizamos, se pode incluir
dentro da classificaçäo de conhecimento científico. No entanto, as nossas decisöes
mais pensadas, e sobretudo enquanto profissionais, seräo tanto mais adequadas
quanto mais validadas pelo conhecimento científico. Certamente que, as grandes
alteraçöes sociais näo passam apenas pelos resultados das investigaçöes, pelo menos
na sua explicaçäo mais próxima, contudo é impossível dissociar os avanços
civilizacionais da investigaçäo e do aproveitamento dos seus produtos mais directos.
O termo ciência, do latim scientia, significa "conhecimento, doutrina, erudi-
çäo ou prática" (Arnal et aL, 1992). Progressivamente foi acrescentado o carácter
sistemático ou organizado de tal conhecimento. Hoje podemos definir ciência por
44 conjunto organizado de conhecimentos sobre a realidade e obtidos mediante o
método científico" (Bravo, 1985). Na descriçäo deste método importa salvaguardar
o seu carácter empírico, diferenciando este conhecimento das especulaçöes ou
abstracçöes puras.
20 A investigaçäo psicológica
Mais recentemente, ainda, o termo ciência surge usado como o "conhecimen-
to em si" e como determinada maneira de produzir conhecimento. Neste último caso,
ciência define-se por um modo de conhecimento rigoroso, metódico e sistemático que
pretende optímizar a informaçäo disponível em torno de problemas de origem teórica
e/ou prática (Arnal et aL, 1992), sendo a sua principal funçäo a compreensäo, expli-
caçäo, prediçäo e controlo dos fenômenos. Assim, e cada vez mais, a ciência apoia
a tomada de decisöes e os processos de mudança da realidade.
No caso da Psicologia, podemos afirmar que, enquanto ciência, procura
descrever, explicar, predizer e controlar o comportamento humano. Neste sentido,
podemos definir três tipos de investigaçäo: a investigaçäo descritiva, a investigaçäo
correlacional e, ainda, a investigaçäo experimental, cujas características podem ser
visualizadas no quadro que se segue (quadro I.1):
Quadro 1.1 - Tipos de investigaçäo
Tipos de Investigaçäo
Desc[-itiva Cori-clacional 1-@'.xpei-iiiient,-tl
Descrever um
Iderilificar v,,iri@1-,,-cis
Inventariar macio.,,
Relacionar efeitos de variáveis
Apreciar iiitcr@iccc)es
Diferencíar grupo,,
Procurar relacöes caus.ais
Predizer e emilrolar fenômew%
l`stabelecer leis
Alguns dos conhecimentos disponíveis quer na Psicologia, quer nas demais
Ciências Sociais e Humanas, poderäo näo se enquadrar numa definiçäo restrita de
conhecimento científico. Por exemplo, é possível a coexistência de teorias diversas
para explicar um mesmo fenômeno, o que já näo é täo frequente nas ciências ditas
44 naturais" ou "exactas", sobretudo quando está em causa a replicaräo de um
fenômeno. Isto explica, aliás, que nas Ciências Sociais e Humanas duas teorias
distintas se apoiem em dados de investigaçäo para se afirmarem como verídicas ou
explicaçöes plausíveis. Nesta altura, e ao contrário das ciências mais exactas,
Metodologia da Investigaçäo em Psicologia e Educaçäo 21
podemos afirmar que os dados empíricos näo säo utilizados para a recusa de uma
teoria, aspecto que segundo Popper delimita as teorias científicas das näo científicas
(Popper, 1987).
A singularidade dos objectos nas Ciências Sociais e Humanas, aparece
indubitavelmente associado aos condicionalismos que para uns é a fraqueza e para
outros a nobreza do estatuto científico destas ciências. Falaremos, ao longo deste
capítulo, da especificidade deste objecto e das possibilidades ou exigências do seu
estudo segundo uma metodologia científica. Começaremos, no entanto, por caracte-
rizar o que se pode entender por conhecimento científico.
Características do conhecimento científico
O nosso conhecimento sobre a realidade que nos circunda pode apresentar
diferentes origens e assumir diferentes características. Por exemplo, podemos possuir
um conhecimento vulgar ou comum sobre as coisas que mais povoam o nosso
quotidiano. Muita da informaçäo que nos legam os nossos antepassados e educadores
exemplificam esse tipo de conhecimento. Ao mesmo tempo, a manipulaçäo que
vamos fazendo sobre os objectos físicos e o mundo que nos rodeia, perm'íte-nos um
conhecimento prático sobre os mesmos. Ambos os conhecimentos säo conhecimen-
tos espontâneos ou integram o que se designa por "conhecimento comum". Eles
fazem parte do nosso quotidiano e, por norma, säo conhecimentos pouco sistemáticos
e pouco críticos. Mesmo assim, fazem parte do nosso quotidiano e podem assumir-
se como fundamentais em grande número das nossas decisöes.
O conhecimento científico é, por inerência, mais organizado, mais sistemá-
tico e preciso na sua fundamentaçäo. Assiste-lhe, ainda, características de nacionalidade
e objectividade. É um conhecimento obtido através do método científico, e de entre
as suas características, podemos salientar as seguintes:
(i) o@jecffi,o: descreve a realidade conio ela é ou podes-cr, niesmo que falível e ap-1nk
temporariamente correcto. rilas nunca conio (_,()s(@irí@ir-nos que fosse,
(ii) empírico: sempre bascado na exl)ei-lêiicli. n(N,@ fenômenos e factos
22 A investigaçäo psicológica
. .. ............
fifi) racional: mais assente na razao e na lógica do que na intuiçäo;
..........
...............
...........
. . .. .. .. . ......
. .......... ..
... .. ... .. ..
iv) replicável: as mesmas condiçöes, em diferentes locais e com diferentes
experimentadores, devem replicar os resultados, ou a sua comprovaçäo pode ser
feita por pessoas distintas e em circunstâncias diversas;
sistemático: conhecimento organizado, ordenado, consistente e coerente nos seus
elementos, os quais formam uma totalidade coerente e i integrada num sistema mais
amt)lo:
&i@ metódico: conhecimento obtido através de procedimentos e estratégias fiáveis,
mediante planos metodológicos rigorosos;
@<vii) comunicável: conhecimento elaro e preciso na sua significaçäo, reconhecido e
aceite Ia comunidade científica;
PC
... . .. .....
analítico: procura ir além das aparências, procura entrar na complexidade e na
Qlobalidade dos fenômenos; e
(ix) cumulativo conhecimento quew ensaia, constrói e estrutura a partir cios conhe-
cimentos científicos anteriores.
Produçäo do conhecimento científico
A Ciência assenta em alguns conceitos básicos, ou seja, a sua realidade e
linguagem própria. Neles se inclui a cadeia: factos (realidades), fenômenos (ocor-
rências) e dados. Factos säo tudo aquilo que se conhece ou se supöe a propósito da
realidade, os quais circunscritos no espaço ou no tempo se denominam acontecimentos.
Estes quando säo percebidos pelo investigador designam-se fenômenos, sendo a in-
formaçäo deles extraída designada por dados. Os dados identificam-se, entäo, com
todo o tipo de informaçäo descritiva da realidade, como por exemplo, enunciados,
afirmaçöes e negaçöes.
Sempre que possível uma ciência apoia os seus postulados teóricos em dados
observáveis e replicáveis. Contudo, e isto em qualquer ciência, parte da sua área de
conhecimento científico näo foi nem é directamente observável. Nas Ciências Sociais
e Humanas, inclusive, aceita-se que só uma parte dos factos que ocorrem säo
directamente observáveis. Importa, entäo, cuidar dos procedimentos metodológicos
Metodologia da Investigaçäo em Psicologia e Educaçäo 23
e das afirmaçöes que se produzam neste processo de construçäo de conhecimento.
O investigador, partindo das relaçöes entre fenômenos, procura evidências
para afirmar, descrever ou negar factos. Por exemplo, será que o consumo de álcool
no trabalho pode estar associado à desmotivaçäo dos trabalhadores e às condiçöes
menos agradáveis onde exercem as suas funçöes? Aqui, importa apreciar as relaçöes
ou as conexöes que se podem estabelecer entre os fenômenos antes de se formularem
ilaçöes conclusivas. Uma atitude correcta, e a única do ponto de vista da "investigaçäo
científica", procura aprofundar quais säo os fenômenos e as relaçöes que mantêm com
os factos, nomeadamente apreciando a cadeia ou tipo de relaçöes, antes de se
estabelecerem ilaçöes.
Existem diferentes tipos de relaçöes. Quando as relaçöes säo gerais, necessá-
rias e constantes elas constituem-se em leis. Uma lei consiste numa relaçäo constante
numa estrutura, independente das mudanças nas suas partes ou nas propriedades dos
fenômenos. A ciência procura relaçöes constantes e invariáveis, ou seja, leis. Na
investigaçäo científica uma lei é precedida de urna conjectura ou seja uma resposta
ou explicaçäo provisória de um dado problema descrito sob a forma de relaçöes entre
fenômenos (veremos mais à frente o conceito de hipótese aqui envolvido).
As relaçöes que se possam estabelecer entre factos e fenômenos têm um papel
importante no processo de investigaçäo científica. Este processo e a própria ciência
säo movidos pelas tentativas de compreensäo, explicaçäo e prediçäo de tais relaçöes.
Quanto mais geral, constante e necessária uma relaçäo, melhor capacidade preditiva
apresenta em relaçäo aos fenômenos implicados. Para poder explicar e predizer os
fenômenos é necessário um sistema de relaçöes, contrastadas mediante dados
empíricos. Tal sistema é designado por teoria, ou seja, sistema ou quadro descritivo,
e se possível explicativo, predictor e controlador (muitas vezes provisório) dos
fenômenos.
Na descriçäo de uma teoria, devemos considerar os seus elementos constitutivos
(Kerlinger, 1979): os conceitos ou variáveis que descrevem os fenômenos (com
frequência construtos hipotéticos), as relaçöes entre os conceitos ou variáveis que
descrevem os fenômenos, as explicaçöes dos fenômenos descritos e suas relaçöes, e
as prediçöes de umas variáveis a partir das outras.
Uma teoria possui várias características. Em primeiro lugar é um sistema
24 A investigaçäo psicológica
relacional de leis gerais, necessárias e constantes capazes de descrever, explicar e
predizer os fenômenos em estudo. Em segundo lugar, uma teoria deve permitir a
formulaçäo de deduçöes dentro do seu âmbito específico (sistema hipotético-
dedutivo). Em terceiro lugar, uma teoria é sempre provisória (a história tem progres-
sivamente demonstrado a falsidade de teorias que em dado momento eram dadas
como certas), embora isso näo impeça a sua utilidade.
Finalmente, enquanto aceites pela comunidade científica, as teorias têm
várias vantagens. Elas permitem-nos ter um sentido global do que é conhecido sobre
fenômenos disperses, simplificar múltiplos dados através da consideraçäo dos seus
aspectos e relaçöes mais pertinentes, e manter a tensäo inerente à testagem de novas
hipóteses em face do seu sentido heurístico (Pinto, 1990, 17-18).
A investigaçäo científica
A expressäo "investigaçäo científica" é, de alguma forma, tautológica. Com
efeito, a investigaçäo ou é científica ou näo é investigaçäo. Os dois termos estäo
indubitavelmente associados. A expressäo, aqui, pretende apenas vincar algumas
exigências do método científico.
Objectivos da investigaçäo
Na conduçäo de uma investigaçäo, o investigador é orientado por determina-
dos objectivos operacionais. Estes väo depender da natureza dos fenômenos e das
variáveis em presença, bem como das condiçöes de maior ou menor controlo em que
a investigaçäo vai ocorrer. Tais objectivos podem ser apresentados de uma forma
mais descritiva ou mais explicativa (Arnal et al., 1992, 98-9).
Assim a uni nível mais descritivo, podemos identificar um primeiro
objectivo da investigaçäo, como sendo o da "inventariaçäo" das características
num grupo ou dos valores que pode assumir uma variável. Incluem-se aqui,
os estudos centrados na descriçäo de grupos populacionais, os levantamentos,
os recenseamentos ou estudos epiderniológicos. Geralmente o investigador
centra-se na quantificaçäo do número de elementos que descrevem uma ou mais
situaçöes ou uma ou mais variáveis. Numa escala poderemos, por exemplo,
Metodologia da Investigaçäo em Psicologia e Educaçäo 25
tentar descrever a proveniência sócio-cutural dos alunos considerando a profissäo
dos pais, o meio mais urbano ou rural de proveniência, entre outros, e tudo
isso em funçäo do ano de escolaridade que frequenta e níveis de rendimento
escolar. Ainda a um nível mais descritivo, a investigaçäo pode agora avançar
para a "descriçäo de uma eventual relaçäo entre fenômenos". Aqui a investigaçäo
pode tentar identificar as componentes descritivas dos fenômenos, as suas
características, o seu nível ou intensidade e o grau de variaçäo conjunta que
podem apresentar. Para este objectivo, o investigador pode comparar, isto é,
recolher vários conjuntos de dados e estimar eventuais diferenças em termos de
proporçäo ou de médias, pode associar, ou seja, apreciar o grau de variaçäo
conjunta apresentada por dois ou mais conjuntos de dados, ou pode ainda
correlacionar, isto é, apreciar o grau de variaçäo conjunta de duas ou mais
variáveis, ou em que medida os valores de uma variável tendem a aparecer
associados com a variaçäo dos valores na outra. Por exemplo, o investigador
pode comparar a frequência dos comportamentos deficitários de atençäo de
uma criança dentro e fora da sala de aula, pode associar tal frequência com
o decurso da semana escolar, ou pode ainda correlacionar a frequência de tais
comportamentos com o grau de interacçöes verbais que o professor estabelece
com a turma.
Outro objectivo, que ultrapassa já o nível descritivo, pode situar-se na
prediçäo das categorias ou valores dos fenômenos. Neste caso, o investigador pro-
cura, por exemplo, calcular o grau ou a probabilidade de ocorrência dos fenômenos
ou variáveis através da análise da sua ocorrência em determinadas condiçöes ou
através dos valores que uma outra variável associada venha a assumir. Muitas das
decisöes dos psicólogos no seu quotidiano profissional decorrem deste tipo de
estudos: seleccionam os sujeitos para determinado posto de trabalho em funçäo dos
seus resultados nos testes, aconselham determinado tipo de psicoterapia em funçäo
do diagnóstico da pessoa e da situaçäo, sugerem determinadas medidas educativas
face às características pessoais do aluno.
Por último, o objectivo do investigador pode situar-se na explicaçäo das
relaçöes de causalidade entre os fenômenos. Neste caso, determina-se o sentido
e a intensidade de uma relaçäo entre fenômenos através, seja da comparaçäo,
em que dois grupos aleatórios submetidos a determinada condiçäo experimental
podem ser comparados, no final, nas suas respostas numa determinada variável;
26 A investigaçäo psicológica
seja da correlaçäo, isto é, vários modelos estruturais causais hoje disponíveis pos-
sibilitam realizar inferências de causalidade, tomando as interdependências e as
influências de múltiplas variáveis em estudos näo estritamente experimentais. Um
exemplo para o primeiro caso pode ser a extinçäo de uma resposta quando o sujeito
näo retira dela qualquer proveito - veja-se a criança que a partir de uma certa idade
deixa de chamar a atençäo dos pais através do choro; no segundo caso, podemos
afirmar que a relaçäo entre os níveis de capacidades possuídas e o rendimento no
trabalho é mediatizada quer pelo sentido que as tarefas têm para o sujeito, quer pelos
incentivos que ele recebe em funçäo da sua produtividade.
Modelos de investigaçäo
Vários critérios podem ser utilizados para descrever ou elaborar taxonomias
das investigaçöes em Psicologia. Por exemplo, em termos da sua finalidade elas
podem ser mais movidas pela descoberta e fixaçäo de leis gerais, estando entäo em
causa a investigaçäo básica ou investigaçäo pura; ou movidas pela resoluçäo de
problemas concretos e particulares, investigaçäo aplicada ou investigaçäo prática;
ou ainda movidas por alguma forma de conciliaçäo de ambas as posturas anteriores,
por exemplo naquilo que vem sendo chamado de investigaçäo-acçäo.
Por outro lado, e em termos de profundidade do estudo, as investigaçöes
podem distribuir-se num continuem cujos extremos seriam as exploratórias e as
experimentais, ficando como níveis intermédios as descritivas e as explicativas. Nessa
altura caminhamos de um grau mais indutivo ou de descoberta de pontos de
continuidade ou pregnância numa dada realidade (exploratória) para um nível mais
dedutivo em que importa testar relaçöes causa-efeito já devidamente estudadas
(experimental).
Em termos da sua própria nietodologia, as investigaçöes psicológicas podem
ser objecto de várias classificaçöes. Por exemplo, elas podem ser mais quantitativas
ou mais qualitativas, podem ser mais laboratoriais ou mais de campo (sobre o ter-
reno), podem ser mais estudos de índole transversal ou longitudinal. Por último, temos
a investigaçäo essencialmente dirigida pela busca das leis gerais (o mais frequente),
ou seja a investigaçäo nomotética, e a investigaçäo centrada na peculiaridade ou
singularidade investigaçäo idiográfica.
Metodologia da Investigaçäo em Psicologia e Educaçäo 27
Duas perspectivas básicas podem caracterizar, grosso modo, as
investigaçöes na Psicologia. Uma primeira, que definiríamos como empírico-
analítica, e que aparece frequentemente confundida (identificado) com outras
expressöes como investigaçäo quantitativa, positivista e experimental. Uma
segunda, que definiríamos por humanista-interpretativa, e que aparece por
norma mais associada a expressöes como investigaçäo qualitativa e naturalista.
No primeiro caso, a investigaçäo tem como objectivo explicar, predizer e
controlar os fenômenos. Considerada como próxima das ditas Ciências Exactas
ou Ciências Naturais, a investigaçäo busca aqui as regularidades e leis
explicativas através dos esforços colocados na objectividade dos procedimentos
e na quantificaçäo das medidas.
A aplicaçäo do método experimental ao estudo do comportamento humano
coloca algumas dificuldades, como já deixámos antever. A complexidade dos
fenômenos psicológicos é bem maior que a dos fenômenos, em certo grau regulares
e transponíveis para laboratório, que encontramos nas Ciências Naturais. A sua
defesa em absoluto ou em exclusivo pode dar origem a posiçöes reducionistas ou
mecanicistas do funcionamento e desenvolvimento psicológico, bem como a posi-
çöes menos científicas face ao objectivo de conhecer uma dada realidade na sua
especificidade. Vários fenômenos säo difíceis de observar sem serem afectados,
muitas situaçöes säo irrepetíveis, muitos resultados obtidos säo imbuídos de algum
artificialismo pouco condimente com a complexidade, a dinâmica e a natureza
interactiva dos fenômenos psicológicos.
A segunda perspectiva constitui-se em reacçäo à primeira, assumindo-se
como uma perspectiva marcadamente anti-positivista. A realidade psico-educativa é
percebida como mais dinâmica, fenomenológica, associada à história individual e aos
seus contextos. O seu estudo näo poderá ser feito sem o recurso à própria perspectiva
dos sujeitos implicados nas situaçöes. A par dos comportamentos observáveis, torna-
se necessário conhecer os sisternas de crenças e de valores, os sistemas de comuni-
caçäo e de relaçäo, bem como as suas representaçöes para os indivíduos ou grupos em
causa. Interessa particularmente aqui olhar aos significados e às intençöes das acçöes
humanas. Assim se explica, entäo, a importância atribuída aos métodos mais
qualitativos que quantitativos, aos métodos mais holísticos e idiográficos que
manipulativos" e nomotéticos.
Claro que, também alguns reparos e críticas podem ser feitos a esta perspec-
28 A investigaçäo psicológica
tiva. Em primeiro lugar, o peso da subjectividade nas suas análises e conclusöes. Em
segundo lugar, a pouca capacidade de fundamentar conclusöes no sentido da sua
generalizaçäo ou da descriçäo dos fenômenos ao longo do tempo e do espaço
(regularidades, leis), mesmo que se afirme näo ser esse o seu objectivo. Certamente
que a investigaçäo psicológica e educacional ficaria igualmente pobre quando
reduzida a esta perspectiva, ou sem ela. O mesmo aconteceria em relaçäo à perspec-
tiva anterior.
De acordo com o afirmado atrás, várias modalidades de investigaçäo
psico-educativa podem ser apontadas. Mencionaremos aqui as três modalidades
da investigaçäo mais frequentes na Psicologia e na Educaçäo: a quantitativo-
experimental, voltada essencialmente para a prediçäo e explicaçäo através da
testagem de teorias e hipóteses; a quantitativo-correlacional, voltada mais para
a compreensäo e a prediçäo dos fenômenos através da formulaçäo de hipóteses
sobre as relaçöes entre variáveis; e a qualitativa mais dirigida à compreensäo e
descriçäo dos fenômenos globalmente tomados.
Quadro 1. 2 - Modalidades de investigaçäo científica
Modalidades de Investigaçäo
Quantitativo - Quantitativo - Qualitativa
EAperimental C'orrelacional
Prediçäo e explicaçäo Conipreensäo e prediçäo dos Comprensäoedescriçäodos
dos fcIlônicilos fenónienos ferffinienos
Claro está que outras classificaçöes säo possíveis. As própii@,.s designaçöes
säo múltiplas, dependem de autor para autor, e todas elas acabam por dar uma
atençäo maior a um ou a outro aspecto. Voltaremos ao assunto no capítulo
dedicado aos planos da investigaçäo. Para já, fiquemos com a ideia que o
primeiro paradigma decorre da aplicaçäo do método experimental d&utivo-
positivista, mais característico das ciências naturais e exactas, na Psicologia e na
Educaçäo.
Metodologia da Investigaçäo em Psicologia e Educaçäo 29
O segundo está particularmente identificado com os modelos correlacionais
de análise e com os esforços da Psicologia e da Educaçäo de explicaçäo do
desenvolvimento psicológico, dos comportamentos humanos e dos rendimentos por
referência a outros construtos ou variáveis internas (veja-se o recurso aos testes
psicológicos como instrumento privilegiado de observaçäo nesta segunda corrente de
investigaçäo) ou externas (veja-se a tentativa de explicar o rendimento do aluno
recorrendo-se ao contexto familiar).
Finalmente, o terceiro modelo de investigaçäo tem vindo a ganhar importân-
cia nos últimos anos em face da maior abrangência da sua análise e do número de
variáveis (inclusive fenômenos) que procura abarcar. Para este último modelo,
encontramos expressöes como perspectiva etnográfica ou perspectiva naturalista, de
algum modo decorrentes do tipo de instrumentos de observaçäo usados preferenci-
almente nesta abordagem (observaçäo directa, realizaçäo de entrevistas, atençäo aos
significados e aos contextos). Também algumas vezes é designada de perspectiva
qualitativo-interpretativa, dado assumir uma menor postura nos aspectos da
quantificaçäo e da manipulaçäo-explicaçäo dos fenômenos.
Próximas deste último modelo, foram surgindo algumas subdivisöes com
características próprias e assentes também em objectivos mais específicos. Veja-se
o caso da designaçäo investigaçäo-acçäo que, defensores de uma ligaçäo estreita
entre investigaçäo e prática profissional, nos sentimos motivados a apresentar. O seu
uso parece decorrer de um predomínio de questöes de ordem prática sobre as de
investigaçäo, e onde objectivos como a transformaçäo da realidade, auto-consciência
dos indivíduos (e seus grupos de pertença) ou o desenvolvimento social mais lato
aparecem frequente e explicitamente formulados.
A investigaçäo-acçäo surge, assim, como o estudo de uma situaçäo social
com o fim de melhorar a qualidade da acçäo dentro da mesma. Apartir das acçöes, sua
discussäo, compreensäo e alteraçäo, esperam-se modificaçöes, em consonância, nas
situaçöes. Destes aspectos de participaçäo e mudança associados à "investigaçäo-
acçäo" decorre a tomada desta como ciência crítica ou, se quisermos, uma decisäo
política na medida em que envolve mudanças das pessoas e instituiçöes, a busca das
melhores condiçöes de vida e, inclusive, a participaçäo democrática de todos (por
vezes fala-se em "investigaçäo-acçäoparticipativa"). Citando Simöes, "o resultado
deverá ser um triplo objectivo: produzir conhecimento, modificar a realidade e
transformar os actores" (Simöes, 1990, 43).
30 A investigaçäo psicológica
Sob designaçöes nem sempre coincidentes, o uso de métodos de investigaçäo
no quadro do paradigma da investigaçäo-acçäo diminuiu nos anos 60, voltando de
novo a ressurgir o seu interesse na última década (Arnal et al., 1992, 246). Algumas
"fragilidades", as quais poderäo ter justificado o seu menor uso durante a década de
60, podem apontar-se: a dificuldade em precisar o seu significado; a dificuldade de
acordo entre os autores a propósito do seu âmbito lato e restrito; a ambiguidade da sua
natureza; e, a heterogeneidade dos seus procedimentos (Arnal et aL, 1992, 247).
Alguns princípios da investigaçäo-acçäo podem ser definidos atendendo às
sistematizaçöes de diferentes autores. Em primeiro lugar, a metodologia da investi-
gaçäo-acçäo na sua aplicaçäo tem sempre aspectos de índole prática a atingir, por
exemplo integra-se num processo ou programa de mudança, onde o saber (novo
conhecimento) e a própria mudança se podem construir em paralelo. Em segundo
lugar, a metodologia da investigaçäo-acçäo caracteriza-se por uma atitude contínua
de fases de planificaçäo, acçäo, observaçäo e reflexäo, e onde se pondera sempre o
feedback entre elas. Em terceiro lugar, a investigaçäo-acçäo requer o envolvimento
de outros que näo apenas o investigador no projecto e, por norma, os próprios
elementos das comunidades e instituiçöes que näo os integrados na equipa de
intervençäo e/ou de investigaçäo (Simöes, 1990). Neste sentido fala-se de uma
investigaçäo-intervençäo participativa, participante ou cooperante. Estas expressöes
salientam o envolvimento e o enriquecimento mútuo esperados.
O processo de produçäo do conhecimento científico
A produçäo do conhecimento científico assenta em dois elementos informa-
tivos básicos: os dados ou as observaçöes e as teorias ou postulados teóricos. No
primeiro caso, o método científico confunde-se com um método indutivo de com-
preensäo da realidade. Aqui, o investigador em face da necessidade de mais
informaçäo sobre um dado problema ou de uma teoria compreensiva sobre o mesmo,
parte de um conjunto parcial de dados para a elaboraçäo de um resumo descritivo dos
fenômenos observados, tomando sobretudo as suas possíveis relaçöes e primeiras
explicaçöes.
No segundo caso, o método científico inicia-se com a formulaçäo de um
enunciado hipotético em face de um dado corpo de conhecimentos teóricos prévios,
Metodologia da Investigaçäo em Psicología e Educaçäo 31
devidamente organizados e consistentes, avançando de seguida para a sua testagem
(contestaçäo). Trata-se essencialmente já de um método dedutivo.
Um e outro procedimento säo possíveis e, no caso da Psicologia e da
Educaçäo, igualmente necessários. Reportando-nos à Psicologia, tal necessidade
pode associar-se quer ao estado evolutivo em que se encontra nos seus vários
domínios de estudo, quer à especificidade dos fenômenos psicológicos e múltiplas
variáveis - que näo apenas psicológicas - que lhe estäo associadas. Podemos defender,
assim, que os dois procedimentos podem na Psicologia traduzir etapas diferentes na
produçäo do conhecimento científico. Enquanto o primeiro é mais heurístico e
exploratório, o segundo volta-se já mais declaradamente para a réplica, testagem,
explicaçäo e controlo dos fenômenos. Estes aspectos estaräo particularmente presen-
tes na descriçäo das fases ou momentos da investigaçäo como veremos nos capítulos
seguintes.
Reportando-nos à componente de metodológia de investigaçäo deste livro,
daremos particular atençäo a dois blocos informativos reportados às fases do método
científico. Um primeiro bloco tem a ver com os momentos preparativos de uma
investigaçäo e com os cuidados metodológicos a considerar tendo em vista a
definiçäo de um problema a investigar e a definiçäo de um modelo de relaçöes entre
as variáveis a testar com a investigaçäo. Um segundo bloco centra-se nas questöes do
plano da investigaçäo. Aqui analisaremos as investigaçöes obedecendo a planos
experimentais e näo-experimentais, bem como falaremos dos procedimentos de
amostragem. Terminamos este livro com o tópico da análise e discussäo dos
resultados, até como uma forma de síntese e interligaräo dos vários capítulos.
Procurar-se-á que esta divisäo promova o sentido da necessária continuidade de
decisöes e de passos na investigaçäo.
Bibliografia
Arnal, J., Rincón, D. & Latorre, A. (1992). Investigación educativa: Fundamentos y
metodología. Barcelona: Editorial Labor.
Bravo, R. S. (1985). Técnicas de investigación social: Teoria y exercícios. Madrid:
Paraninfo.
32 A investigaçäo psicológica
Kerlinger, F. N. (1979). Behavioral research: A conceptual approach. New York:
Holt, Rinehart and Winston.
Pinto, A. C. (1990). Metodologia da investigaçäo psicológica. Porto: Ed. Jornal de
Psicologia.
Popper, K. R. (1987). O realismo e o objectivo da ciência. Lisboa: Dom Quixote.
Simöes, A. (1990). A investigaçäo-acçäo: Natureza e validade. Revista Portuguesa
de Pedagogia, =V, 39-5 1.
Metodologia da Investigaçäo em Psicologia e Educaçäo 33
FICHA DE AUTO-AVALIAÇÄO
Respondu a 4 tlas 6 questó-ússeguintes:
l.Iiiveíitaricaspriiicil)aisc@tracterístic-llsda iii,,,cstigacäodita(lescritiva,correlacional
e experimenta]-,
2. Explique as seguintes características do conhecimento científico replicável e
analítico.
3. Interligue a sequência: factos, fenónienos e dados
4. Em que consiste o objectivo daprediçäo na investigaçäo?
5. O que diferencia a investigaçäo pura da investigaçäo aplicada?
6. Diferencie o método dedutivo do método indutivo na produçäo do conhecimento
científico.
@i
1.
11
I
,i!
11
1.
ii
11
11
li
fi
I-
I
I.
Capítulo 2
Problema, hipótese(s) e variável(eis)
1 k
1
'i
i,
-é'@ @O""
Problema, hipótese(s) e variável(eis)
Definiçäo de um problema
Passos na definiçäo de um problema
Revisäo bibliográfica
A(s) hipótese(s)
Classificaçäo das hipóteses
Aceitaçäo e rejeiçäo estatística das hipóteses
As'variáveis
Estatuto das variáveis na investigaçäo
Parâmetros de medida das variáveis
Natureza da medida das variáveis
Escalas de medida das variáveis
As variáveis no quadro dos modelos de investigaçäo
Neste capítulo descrevem-se as primeiras fases do processo de investigaçäo,
nomeadamente a formulaçäo do problema, a elaboraçäo da(s) hipótese(s) e a
definiçäo da(s) variável(eis). Partindo quer de estudos de índole experimental, quer
de índole correlacional e descritiva, procura-se ilustrar a pertinência e os cuidados a
ter em cada uma destas fases e as respectivas interdependências ao nível da
informaçäo a reter, bem como da tomada de decisöes inerentes.
Assim, ao longo deste capítulo abordaremos as características de cada uma
das fases do processo de investigaçäo e os vários cuidados a ter em consideraçäo.
Numa lógica de aproveitamento de recursos e de maior objectividade de todo o
processo, chama-se a atençäo para a necessidade de se atender e de respeitar esta
sequência de passos. Por último, descrevem~se as fontes de informaçäo a que o
investigador em Psicologia pode recorrer tendo em vista a tomada das melhores
decisöes nas opçöes exigidas em cada uma das etapas, concluindo-se acerca da
ligaçäo de tais decisöes com os modelos de investigaçäo a considerar.
Deriniçäo de um problema
Uma investigaçäo inicia-se sempre pela definiçäo de um problema. Face ao
volume de problemas e de incertezas do conhecimento científico na Psicologia e na
educaçäo poderíamos ser tentados a pensar que esta definiçäo se encontra facilitada.
Pelo contrário, tais aspectos mais complicam do que facilitam, sendo obviamente
necessário um conhecimento aprofundado dos fenômenos em causa e uma análise
aturada das variáveis que lhes estäo associadas, tendo em vista a delimitaçäo e
identificaçäo do problema. Posto isto, importa definir um modelo hipotético quanto
à forma como as variáveis se relacionam ou contribuem para o fenômeno em causa.
As fases seguintes väo-nos permitir testar tais modelos e, no final, aceitá-los ou refutá-
los. Por outras palavras, importa identificar e definir um problema, construir um
modelo que nos permita uma aproximaçäo ao seu estudo e testar o modelo entretanto
construido.
Esta sequencialidade é importante e decisiva no processo científico de
38 Problema, hpótese(s) e variável(eis)
construçäo de conhecimento. Qualquer investigaçäo é conduzido tendo em vista
esclarecer uma dúvida, replicar um fenômeno, testar uma teoria ou buscar soluçöes
para um dado problema. Colocado de formas diversas, toda a investigaçäo tem um
alvo ou um problema a analisar. Toda a produçäo científica inicia-se, entäo, pela
identificaçäo e clarificaçäo de um problema. A definiçäo doproblema constitui, entäo,
a primeira fase na elaboraçäo de um projecto ou a concretizaräo de uma investigaçäo.
Enquanto prévia à construçäo de um modelo pretensamente explicativo, a definiçäo
do problema é uma fase essencial e nela se inclui, designadamente, a definiçäo das
hipóteses e a operacionalizaçäo das variáveis a considerar. A testagem do modelo
implica a observaçäo/experimentaçäo e o tratamento dos dados.
Dada a grande proximidade e interdependência entre estas primeiras fases da
investigaçäo optamos por descrever, de uma forma mais operacional, as tarefas ou
subfases metodológicas que as integram. A par dessa caracterizaçäo, procuramos
definir algumas estratégias frequentemente utilizadas para ultrapassar com êxito as
exigências que as mesmas tarefas colocam, explicitando o papel que a revisäo bi-
bliográfica do domínio acaba por ter nas decisöes a considerar. No quadro seguinte
apresentam-se as fases da metodologia de investigaçäo subjacentes à definiçäo de um
problema e definiçäo de um modelo para o seu estudo.
Passos na definiçäo do problema
O primeiro passo numa investigaçäo surge quando se procura a resposta a uma
pergunta, dificuldade ou problema (escolha de uma área problemática). As formas
que o problema a definir pode assumir säo diversas. Em Psicologia e Educaçäo, o
problema formula-se na forma de questäo (investigaçäo voltada para a compreensäo
ou explicaçäo de um fenômeno) ou como uma resposta (decisäo sobre as propriedades
de um tratamento ou metodologia, situaçäo que se deseja alterar).
Se numa impressäo imediata nos pode parecer fácil definir um problema para
estudo (aliás näo faltam fenômenos por compreender ou situaçöes a alterar no
comportamento individual e de grupo ... ), a prática tem-nos revelado que nem sempre
é dada a devida atençäo a esta tarefa. Pior ainda, algumas vezes a situaçäo näo está
clara de início, podendo-se afirmar que bastante tempo e custos seriam economizados
se tudo fosse à partida devidamente definido. Ao mesmo tempo, uma má formulaçäo
Metodologia da Investigaçäo em Psicologia e Educaçäo 39
do problema pode levar-nos a investigar falsas realidades e, eventualmente, a retirar
ilaçöes que, mesmo correctas em face da metodologia seguida, poderäo em última
instância nada ter de científico, inclusive conduzir a posicionamentos comprome-
tedores. Aliás, tomando as palavras de Tukey (1962, 13), "é preferível de longe uma
resposta aproximada à pergunta certa que por vezes é vaga, do que uma resposta
exacta à pergunta errada, que pode tornar-se sempre precisa" (in Pinto, 1990).
Quadro II.1 - Fases da metodologia de investigaçäo subjacentes à definiçäo de um
problema e definiçäo de um modelo para o seu estudo
Fases Caraeterizaçäo
1. Definiçäo do Problema Identificar e descrever
Estabeleccr relaçöes
Apreciar pertinènci,1
Precisar o objectiv-(
2. Revisäo blobliográfica Situar o problenia
Precisar a rnetodologia
3. Formulaçäo (Ias hipóteses Definir a Iiii-x3tese experiniental,
a liil)(')iesc nula e as hipóte.,,es
aItcrnatIV@iS
4. Definiçäo (ias varláveis ldeiit]ficar as unidIades a observar
e a controlar
Definir os papeis (ias varIJKeis
Precisar a i@nenstir@il)Iii(l@icie (iças
varláveis
Estratégias
Teoria existente
Observaçäo directa
Investigaçöes anterores
l'roblenias anteríores
Consulta a bases de dados
Debates, esrwC[alIStI@Is
Sínteses ternáticas
Possíveis explicaçöes a
testar para os (],idos Cite se
,-enhani a obter
1.-.sl)ccil'icir o que se quer niedir
ou controlar
FIspecificar as relaçöes,
as influêncilts e O seu Sentido
Indicar as escalas de niedida a
usar rx)r
Vários passos podem ser dados no sentido da definiçäo do problema da
investigaçäo. Em primeiro lugar é preciso identificá-lo, descrevê-lo e relacioná-lo.
Convenhamos que nem sempre isso é fácil, face à complexidade dos fenômenos em
presença. Nesta identificaçäo, tomando como referência a experiência ou o campo
teórico nessa área, jogam papel importante os conhecimentos, as competências, os
interesses e as demais condiçöes do investigador. Tudo isso pode orientar as leituras,
as observaçöes e os contactos de aprofundamento necessário (especialistas, bases de
dados, sugestöes ou questöes deixadas em aberto por outros investigadores). Sisterna-
40 Problema, hpótese(s) e variável(eis)
tizando estas fontes de identificaçäo ou de definiçäo de um problema, podemos
afirmar que tal decorre: de uma teoria existente e que se toma como referência, da
observaçäo diária dos comportamentos, dos problemas práticos que em determinado
contexto se gostariam de resolver e, finalmente, das propostas decorrentes de
investigaçöes anteriores.
Acentuando-se uma tendência actual para um movimento cíclico entre teoria
e prática, bem assim como a importância de sempre se considerarem posicionamentos
anteriores de forma a salvaguardar um melhor enquadramento da investigaçäo e o seu
carácter construtivista em termos de conhecimento, diríamos que seria importante
considerar a informaçäo simultânea dessas quatro fontes informativas.
A teoria orienta a investigaçäo sugerindo relaçöes e previsöes sobre o
comportamento ou o fenômeno em estudo. A observaçäo directa dos comporta-
mentos, sobretudo a verificaçäo ou näo da sua regularidade e estabilidade no tempo
(e no espaço), é uma outra fonte decisiva para a definiçäo do problema a investigar
(variáveis intervenientes, condiçöes associadas à sua verificaçäo e à sua intensidade).
No caso concreto da Psicologia e da Educaçäo, uma ligaçäo estreita entre a investigaçäo
e a prática profissional tem justificado que um bom número dos problemas a
investigar sejam apresentados aos investigadores por indivíduos e instituiçöes de uma
forma já mais ou menos circunscrita. Nos vários campos de trabalho dos psicólogos
e educadores, e sobretudo quando estäo em causa equipas multidisciplinares, as
solicitaçöes "externas" säo seguramente uma outra fonte profícua e interessante de
definiçäo dos problemas a investigar. Algumas vezes esta postura dá origem à
investigaçäo orientada para problemas práticos (problem oriented research), ou ao
que mais frequentemente aparece descrito em língua portuguesa por investigaçäo
aplicada em alternativa à investigaçäo pura (dita básica ou fundamental também).
Por último, os resultados das investigaçöes anteriores säo outra fonte de informaçäo
na definiçäo dos problemas. Por norma, qualquer estudo ou investigaçäo termina
sugerindo novas pistas e colocando novas questöes para prosseguimento das análises.
Osposicionamentos sobre o assunto assumidos por outros investigadores permitern-
nos poupar tempo e meios, dirigindo a investigaçäo para aspectos ainda näo devi-
damente esclarecidos e potencialmente interessantes.
O segundo passo numa investigaçäo traduz a importância de se avaliar a
qualidade e a pertinência do problema identificado. Chegados a este ponto já näo
basta termos o problema bem identificado, descrito ou relacionado. Trata-se, aqui, de
Metodologia da Investigaçäo em Psicologia e Educaçäo 41
ponderar a sua própria relevância. Esta tarefa pode estar facilitada em funçäo da
qualidade das tarefas no momento anterior, designadamente dos contactos e
aprofundamentos conseguidos. Algumas condiçöes parecem ser de acautelar e, nesse
sentido, podem ser parâmetros de apreciaçäo a considerar:
o problerna deve, pelo menos, ser concreto ou real (näo se circunscrever a uma@
mera intuiçäo ou ideia vaga, mesmo que isso possa estar na origem do problema
a definir);
o problema deve reunir as condiçöes para ser estudado (meios técnicos e.
materi@tis,disrx)nil-)ili(l@idedoscontextosenvolvidos)epoderscroperacíonalizado
através de unia hipólese científica;
(iii) o I)roblema eleve ser relevante parei a teoria caiou para a pratica (resultados e
aprecies esperados, custos envolvidos); e,
...,..(iv) o problenia deve estar fornitilado de urna forma suficientemente clara e
perceptível por outros investigadores (Kerlínger refere três condiçöes essenciais
nessa forilitilaçäo: deveexpressarumarelaçäoentre duasournaIsvariáveisIdeVe@
expressar-se de ariana forma clara e de modo a apenas admitir respostas precisa&
e deve ser susceptívc1 de verificaçäo euipírica - Kerfiríger, 1979).
Como já referimos anteriormente, a definiçäo de um problema pode ser feita
através de um raciocínio indutivo ou dedutivo. No primeiro caso, vários fenômenos
singulares säo observados e, a partir deles, procura-se chegar a algo que os unifica
(parte-se, assim, do específico para o geral). Por exemplo, numa turma os alunos com
mais dificuldades de aprendizagem (A) referem ter problemas relacionais em casa
(B), nessa altura poder-se-ia tentar investigar se as dificuldades escolares säo
explicáveis pelos problemas familiares (B=>A). No método dedutivo, o mais recente
na investigaçäo científica (Popper, 1959), o ponto de partida näo säo as observaçöes
singulares, mas as teorias já existentes. Neste caso, parte-se de "ideias gerais e
abstractas de modo a extrair dados específicos e particulares" (Pinto, 1990, 14) ou
seja, parte-se de um conjunto de premissas para a sua verificaçäo. Por exemplo, será
que as expectativas negativas de um professor em relaçäo ao rendimento de um aluno,
influenciam negativamente a sua progressäo na aprendizagem?
Podemos acrescentar que ambos os métodos (indutivo e dedutivo) se mantêm
presentemente na Psicologia e na Educaçäo, e que ambos podem ser necessários. No
estado actual de conhecimentos é de esperar que cada vez mais se acentue, propor-
w,1
42 Problema, hpótese(s) e variável(eis)
cionalmente, a importância da investigaçäo ser dirigida por uma teoria, isto é,
orientada por uma atitude mais dedutiva que indutiva, mesmo que esta teoria seja
ainda provisória e explique apenas parcialmente um fenômeno. O importante, dentro
dos princípios da parcimónia e da reduçäo dos custos, é partir das teorias existentes
para a formulaçäo de hipóteses de estudo, e aqui nem todas as hipóteses têm idêntico
valor (contexto da descoberta) e, de seguida, planear procedimentos metodológicos
adequados tendo em vista a sua refutaçäo (contexto da justificaçäo ou refutaçäo).
Neste sentido é importante atender a máxima "näo existe nada mais prático que uma
boa teoria".
Revisäo bibliográfica
Após situar o problema torna-se necessário reunir e analisar o melhor
possível o que já se conhece sobre o assunto, ou seja, a informaçäo existente sobre
aquele problema (refira-se que, algumas vezes, esta revisäo é já simultânea à
clarificaçäo e descriçäo que mencionamos na tarefa anterior). Várias razöes podem
ser dadas para a necessidade desta recolha, algumas vezes tida erradamente por
prescindível:
(1) conhecimento do estado de conhecimentos no domínio que seleccionamos, por
exemplo se o problema que se colocajá foi Inclusive sol ucionado ou o que poderá
estar a l'@tit;tr para Isso;
(11) imi-mi---tância ern se conhecerem as teorias existentes naírca do estudoa realizar,
por exeniplo quais as teorias explicativas do fenórileiM cri] quesläo de modo a
iliellim-se podel. equacionar o próprio modelo fie análise a seguir;
(Iii) conhecimento (ia nietodologia de investigaçäo mais frequentemente usada no
problerna em causa (procedimento, arnostra, plano, instrumentos); e,
(iv) conhecimento das questöes deixadas em liberto por outros investigadores,
nomeadamente os erros metodológicos mais frequentes ou reducionismos
que incorreram os estudos interiores
Em resumo, esta revisäo da bibliografia é particularmente importante para se
definir e melhor enquadrar o referencial teórico para a investigaçäo em causa. Ela
serve, igualmente, para a obtençäo de indicaçöes e sugestöes importantes tendo em
Metodologia da Investigaçäo em Psicologia e Educaçäo 43
vista a definiçäo do procedimento metodológico, sobretudo, quando se trata de definir
o plano da investigaçäo e os instrumentos usados na recolha dos dados. Neste sentido,
a revisäo bibliográfica pode assumir-se como um "interface" entre a delimitaçäo do
problema e a formulaçäo da hipótese, bem como dos passos seguintes na
investigaçäo.
No momento presente, o trabalho de revisäo bibliográfica encontra-se bastan-
te facilitado, já que várias "bases de dados" se encontram disponíveis em computador
(Psyclit, Eric, Current contents, ... ). Ao mesmo tempo, em várias bibliotecas encon-
tram-se já informatizados os resumos dos artigos publicados em periódicos da
especialidade.
Também algumas publicaçöes nos vários domínios científicos fazem a
revisäo e sistematizam os livros e as revistas que väo sendo publicados (um contacto
directo com estas fontes de informaçäo é recomendado). Finalmente, um investigador
numa dada área näo pode prescindir dos artigos publicados nessa mesma área,
particularmente daqueles que ciclicamente fazem uma síntese das principais inves-
tigaçöes no domínio. Tais textos permitem-nos, rapidamente, näo só uma síntese
como uma referência a outros trabalhos que mereceräo ser consultados para determi-
nada faceta ou aspecto do problema em causa.
A(s) hipótese(s)
Face a um problema inventariado e descrito nos seus contornos, definem-se
as relaçöes que palrecem mais plausíveis a fim de poderem ser contestadas. Por
hipótese entende-se, pois, a explicaçäo ou soluçäo mais plausível de um problema.
Nesta altura, podemos afirmar que a "hipótese é uma proposiçäo testável, que pode
vir a ser a soluçäo do problema" (McGuigan, 1976, 37).
Claro está que nos situamos, particularmente, nas investigaçöes de carácter
dedutivo a que já aludimos. Com efeito, algumas vezes säo mencionadas investiga-
çöes sem hipóteses previamente definidas, por exemplo, em estudos exploratórios,
em estudos preliminares ou em estudos epidemiológicos ou meramente descritivos
de uma populaçäo. Contudo este tipo de estudos näo säo frequentes, podendo mesmo
questionar-nos se estamos em face de um estudo com total ausência da hipótese ou
mesmo se o estudo em causa se pode assumir como uma "investigaçäo". Pelo menos,
44 Problema, hpótese(s) e variável(eis)
quando se pretende utilizar o paradigma experimental, ou seja, encontrar as relaçöes
ou a causalidade de fenômenos, a investigaçäo näo prescinde da formulaçäo prévia
de uma ou mais hipóteses. Elas säo básicas e fazem a ponte entre a teoria e a
observaçäo/realidade, orientando toda a investigaçäo subsequente. Daí que, com a
formulaçäo das hipóteses, nós estamos a entrar decididamente na definiçäo de um
plano para a investigaçäo (assunto analisado mais à frente).
A formulaçäo das hipóteses deve obedecer a alguns princípios de modo a que
estas mesmas reúnam algumas características. Assim elas devem ser testáveis, ou seja
a sua operacionalizaçäo deve ser desde logo conseguido. Por outro lado, elas devem
enquadrar-se nas hipóteses existentes na mesma área, serernjustificáveis e, ao mesmo
tempo, serem relevantes para o problema em estudo. Espera-se também que a sua
formulaçäo obedeça a princípios de clareza lógica e de parcimónia. Por último, elas
devem ser susceptíveis de quantificaçäo e reunirem alguma generalidade explicativa
(McGuigan, 1976).
Classificaçäo das hipóteses
As hipóteses podem classificar-se de forma diversa, de acordo com o processo
como säo formuladas e com o nível da sua concretizaräo. Quanto aoprocesso da sua
formulaçäo, elas podem ser classificadas em:
(i) d<,duiii,as. quando decorrem de uni determinado campo teórico e procuram
comprovar deduçöes implícitas das mesmas teorias; por exemplo, crianças com:
ilisticess(esc()]@irpe,rmanentemanifestarno,,coniportamentosdep,assividadeedê@..'
abandono encontrados em animais quando colocados em situaçöes aversivas
. . .. ......
näo conseguem controlar; e .. ... . . . .. .....
. ... . .....
.. .. .. ... .. .
. .. . ...... ...
.. . . . .. ...... ... ..
.... . .. .. .. .. .. ..........
.. ..... . ..............
. ........ ...
. .. ... .....
indutivas, quando surgem da observaça( (u reflexöes sobre a realidade; por......
j@"cmos pensar que a instabilidade emocional dos toxicodependentes
.. ..... .....
está associada a níveis mais baixos de consistência do "Eu".
.... .. .......... ....
.. .. ....... .. . . . ... . ....... ....
......... .. ... ....
. .. .. ... ... .. .
. .. . .. .....
As hipóteses podem dividir-se, ainda, segundo o nível de concretizaräo em
que nos possamos situar. Assim säo ditas:
(i) conceptuais. quando estabelecem uma relaçäo entrevariáveis ou uma relaçäo a um
. a-
ou mais leorias,
quarí(lo nos m(ficarn as operaçöes necessárias para a sua ohser@,açäo, e
(iii) eslatísticas, (juari(lo expressam a relaçäo espera(la em termos iluantitativ(S.
Metodologia da Investigaçäo em Psicologia e Educaçäo 45
Assim, por exemplo, a interrogaçäo a propósito da relaçäo esperada entre o
auto-conceito e a auto-estima dos alunos em face da definiçäo de um e outro conceito
(nível conceptual) pode, já num segundo momento, aparecer descrita como "os
sujeitos com mais elevada pontuaçäo nos questionários de auto-conceito pontuam
também de um modo mais elevado nos questionário de auto-estima" (nível operativo)
e, já no final, podemos afirmar que o coeficiente de correlaçäo entre as duas
classificaçöes näo vai para além de um valor meramente ocasional (nível estatístico).
As hipóteses estatísticas enunciam-se de duas formas: hipótese nula (HO) e
hipótese alternativa (H,). A formulaçäo da relaçäo inerente à hipótese pode ser feita
de várias formas: (i) sob a forma de uma implicaçäo condicional "se... entäo" ou "se...
e se... entäo" (exemplo de hipótese dedutivo-experimental); e, (ii) sob a forma de uma
proposiçäo relacional "as pessoas que... apresentam também..." (exemplo de hipótese
indutivo-correlacional).
A hipótese nula (HO+ postula que os dados provenientes de diferentes con-
diçöes ou grupos näo se diferenciam, näo se associam ou näo se correlacionam
significativamente do ponto de vista estatístico. Por outras palavras, podemos afirmar
que tais diferenças ou relaçöes näo säo maiores que aquelas que poderíamos observar
devidas ao acaso. Claro está que o objectivo do investigador será o de rejeitar a
verificaçäo da hipótese nula para viabilizar ou continuar a defender a sua hipótese
experimental ou causal (também designada por hipótese científica - Pinto, 1990, 3 1).
A hipótese alternativa, como o termo o indica, é uma outra explicaçäo
alternativa para um fenômeno (H,). A recusa da hipótese nula näo significa, de
imediato, a verificaçäo da hipótese experimental. Neste sentido, importa que sejam
de antemäo formuladas e ponderadas outras hipóteses alternativas ou paralelas
explicativas do impacto da variável independente. Atenda-se ao quadro síntese para
uma sistematizaçäo na classificaçäo das hipóteses:
Quadro 11.2 - Classificaçäo das hipóteses
Processo de formulaçäoNível de concretizaräo
De(lutivasC,onceptuais
lndutMISOperatIVIIS
E,statísticas: Ilifx31ese nula
HifAtese
alternativa
E"I , -
11k1
46 Problema, hpótese(s) e variável(eis)
A investigaçäo dirigida por uma hipótese experimental apenas se pode
concluir quando conseguimos excluir essas explicaçöes alternativas para um deter-
minado fenômeno. Mesmo aí, defendida a hipótese experimental, a "asserçäo de que
a variável independente causou a variável dependente näo é absoluta, mas uma
asserçäo probabilística" (Pinto, 1990, 32). Podemos entäo aceitar, com maior
probabilidade de adequaçäo e de veracidade tal hipótese, contudo näo temos uma
certeza absoluta de que seja verdadeira. Mais uma vez näo podemos esquecer que uma
hipótese decorre, ou deve sempre decorrer, de uma teoria e que esta tenta ler,
descrever e explicar uma realidade. Por outras palavras, a teoria näo é essa realidade,
nem a causalidade que testa. Pelo contrário, ela näo é mais que uma tentativa
probabilística, e progressivamente consolidada, de explicar os fenômenos em estudo.
Ao mesmo tempo, qualquer estudo tenta controlar outras variáveis, mas sabemos
quanto isso é difícil em várias situaçöes da investigaçäo psicológica e educacional.
Por exemplo, podem sempre ficar algumas dúvidas sobre o controlo perfeito das
variáveis em presença na administraçäo de um teste e a importância que as mesmas
podem ter nos níveis de realizaçäo, muito embora näo sejam elas o alvo da avaliaçäo.
Veja-se o impacto eventual da ansiedade, ou dos níveis de compreensäo dos exemplos
e das instruçöes pelos sujeitos. Outras vezes poderäo näo ser devidamente conside-
radas outras variáveis importantes no estudo em causa. Veja-se a tentativa de associar
as dificuldades de uma criança nas tarefas de conservaçäo piagetiana à falta de
esquemas operatórios de compensaçäo ou reversibilidade na teoria original de Piaget,
quando hoje se acrescenta o impacto em tal realizaçäo da maior ou menor familiari-
dade da criança com o conteúdo e o tipo de tarefa.
Na formulaçäo das hipóteses interessa cuidar da forma final do próprio texto
(formulaçäo). Alguns cuidados podem ser sugeridos como norma a respeitar:
'(i) as variáveis. as refeiçöes e as condiçöes que se pretendem estudar e testar devem ser
passíveis de avaliaçäo;
(ii) a relaçäo estabelecida näo (acre aparecer inibuída de uízos de valor (a afirmaçäo `o
método Aé reitor para a aprendizageni do.% altinosqueo método B" poderia sernicilior
trariserlta por 4'os métodos A e B diferern quanto a facilitaçäo da aprendizagem dos
deve deixar em aberto ou fixar de inédito um determinado
sentido patim a reagiräo entre variáveís ou para as diferenças entre grupos (análise
unicaudal ou biçaudal iia significância estatística de uni coeficiente).
aluno,,"); e,
(iii) a fornitilaçäo (1,1
Metodologia da Investigaçäo em Psicologia e Educaçäo 47
Aceitaçäo e rejeiçäo estatística das hipóteses
Um passo importante no que respeita à investigaçäo tem a ver com o teste das
hipóteses. Como o próprio termo deixa antever, trata-se de confirmar ou infirmar, a
partir de uma certa margem de probabilidade de certeza, a aceitabilidade de uma
hipótese nula fixada. Depreende-se do exposto que, no caso da sua aceitaçäo näo
provamos que seja verdadeira. No entanto, e no caso da sua recusa, a probabilidade
estatística considerada permite-nos assumir um determinado grau de confiança na sua
infirmaçäo ou recusa.
No estudo dos fenômenos, por exemplo na comparaçäo das médias de dois ou
mais grupos ou, ainda, no estabelecimento de uma relaçäo de interdependência entre
duas ou mais variáveis, recorre-se à teoria das probabilidades para aceitarmos ou
recusarmos as hipóteses. Por norma, formula-se a hipótese nula, ou seja afirma-se näo
existir uma dada diferença ou relaçäo (e isto independentemente de outros estudos e
teorias apontarem em sentido contrário ... ). Se os resultados agora observados diferem
acentuadamente dos esperados face à hipótese nula fixada, por exemplo com base na
teoria das probabilidades, podemos afirmar que as diferenças observadas säo signi-
ficatívas e, entäo, rejeitar ou näo aceitar a hipótese nula. Como afirma McGuigan,
44 a hipótese nula é aquela que tentamos anular. Se pudermos anulá-la (rejeitá-la),
entäo podemos concluir que a variável independente é eficiente. Porém se falharmos
ao tentar anulá-la, näo podemos afirmar que a variável independente é eficiente"
(MeGuigan, 1976,124-5).
Depreende-se do exposto que, no verdadeiro sentido dos termos, näo pode-
mos provar HO nem directamente H,; será mais correcto dizer que apenas podemos
aceitar ou recusar a HO (em último caso, entäo, podemos aceitar a hipótese alterna-
tiva). Claro está que nesta decisäo corre-se sempre um certo risco, apontando-se dois
tipos de erros nesta decisäo:
(i) probabilidade de se rejeitar a 11( quando ela é verdadeira, ou seja qualido ela
deveria ser aceite (Ei-ro &, Tipo 1); e,
(ii) probabilidade de seaceitar a 1 lo (itlalido cai é frisei, ou seja deveria ser rejeitada
(Erro de Tipo 11).
Estas noçöes requerem alguns conhecimentos de estatística. A probabilidade
do erro de tipo I é coincidente com o nível de significância estatística que utilizamos
48 Problema, hpótese(s) e variável(eis)
(alpha). Essa probabilidade situa-se, no mínimo, a 0.05 (no caso de alpha=0.05,
ou seja temos 5% de possibilidades da Ho ser rejeitada indevidamente, ou uma
confiança de 95% de que se tome uma decisäo acertada-se a hipótese é rejei-
tada ao nível de significância de 0.05, entäo a possibilidade de erro é de 0.05
ou 5%).
Existe uma relaçäo de reciprocidade entre os dois erros apontados.
Suponhamos, por exemplo, que a Ho é de facto verdadeira. A margem de erro
será tanto maior quanto menor for o alpha utilizado para recusa da Ho. Daí
que, diminuindo o erro de tipo I, pode-se estar a incorrer no erro de tipo II
(aceitar a Ho quando de facto é falsa). O alcance das decisöes a tomar e das
implicaçöes dos dados da investigaçäo ajudam a ponderar as margens de erro, de
ambos os tipos, que se deseje considerar.
Outro aspecto a definir prende-se com o sentido esperado dos valores
calculados. Por exemplo, quando comparamos dois grupos e aceitamos a
hipótese alternativa temos que nos questionar quanto ao sentido que queremos
assumir em tais diferenças. Este pode ser (i) unidireccional ou unilateral, por
exemplo, a média do grupo A é maior que a média do grupo B; (ii) bidireccional
ou bilateral por exemplo, a média do grupo A pode ser maior ou menor que
a do grupo B (D'Hainaut, 1990, 164-5). O cálculo da probabilidade estatística
de um coeficiente difere num e noutro caso, recorrendo-se a um teste unicaudal
(one-tail test) e bicaudal (two-tail test), respectivamente, tal como se pode
visualizar na figura seguinte:
i 2,5 %
dos c
s casos asos
-2 -1 O 1 2
-2 -1 o 1
-1.96 1,96
1.64
Teste bicaudal Teste unicaudal
O uso de um ou outro tipo de teste depende da formulaçäo de Ho. Esta for-
mulaçäo pode ser mais aberta ou mais fechada. Por exemplo, num estudo sobre
diferença de gênero no desempenho escolar da matemática, o investigador deverá
optar por um teste unicaudal se a sua hipótese fôr no sentido da superioridade das
Metodologia da Investígaçäo em Psicología e Educaçäo 49
raparigas em relaçäo aos rapazes (ou vice-versa). Se a sua hipótese se pode verificar
qualquer que seja o sentido da diferença, entäo deverá optar por um teste bicaudal. Em
Psicologia e Educaçäo, a maioria das investigaçöes é conduzido por hipóteses de
verificaçäo bidireccional, nomeadamente quando os estudos se organizam em torno
de hipóteses indutivas.
A concluir, diríamos que quando uma HO é aceite entäo dever-se-ia alterar ou
abandonar a teoria por detrás da hipótese experimental formulada. Nem sempre isso
acontece, aliás por demasiadas vezes näo acontece. Esta situaçäo, ou dificuldade mais
comum nas Ciências Sociais e Humanas, em parte explica porque permanecem na
Psicologia teorias diversas, e igualmente plausíveis, para explicaçäo dos mesmos
fenômenos. Muitas vezes os investigadores têm dificuldades em abandonar uma
teoria, sendo essas dificuldades maiores quando foram eles próprios os seus criadores
(Meyers & Grossen, 1974, 30).
As variáveis
Ao formular as hipóteses o investigador está, no fundo, a identificar as
variáveis e a definir as suas relaçöes, ou seja o respectivo papel na investigaçäo. A
explicitaçäo das variáveis e das suas relaçöes constitui um novo passo importante na
definiçäo do modelo de análise do problema.
Dois sentidos säo frequentes em torno da palavra variável em Psicologia. Eles
estäo directamente associados aos dois modelos tradicionais de investigaçäo na
Psicologia: o experimental e o correlacional. No primeiro, a preocupaçäo está nas
variáveis de ocorrência de um comportamento (meio, organismo, condiçöes) e na sua
capacidade explicativa do mesmo comportamento. Mesmo näo sendo fácil fixar leis
e generalizar em Psicologia e Educaçäo, é certo que fôram dados passos enormes com
a utilizaçäo deste modelo em algumas áreas de investigado, por exemplo na área da
modificaçäo do comportamento, na definiçäo das leis do reforço e da puniçäo, ou de
leis nos domínios da percepçäo e da memória. No segundo, o objectivo está sobretudo
em quantificar e relacionar as dimensöes psicológicas. Ao nível da investigaçäo
experimental, o termo variável identifica-se com o factor determinante ou interveniente,
ou ainda com o factor determinado, num estudo. Na investigaçäo dita correlacional
(mais descritiva que explicativa), a variável tem sobretudo a ver com as dimensöes
50 Problema, hpótese(s) e variável(eis)
do comportamento avaliadas ou com os construtos subjacentes (traço ou traços a
avaliar).
As variáveis podem derivar de conceitos mais amplos, os chamados
construtos devidamente operacionalizados ou definidos em termos mais con-
cretos e observáveis. Enquanto que construtos säo entidades abstractas ou as
dimensöes latentes do comportamento, as variáveis säo a realidade observável,
sendo que na Psicologia, as variáveis podem assumir-se como os indicadores
dos construtos. Por exemplo, se inteligência (capacidade de apreender, de
estabelecer e de aplicar relaçöes entre elementos informativos ou condiçöes de
um problema) pode ser tida como um construto, as notas numa escala de Q1 podem
assumir-se como variável.
Nem sempre a investigaçäo psicológica ou a realidade analisada se
enquadra neste binómio construto-variável. Mais recentemente, e cada vez mais
as investigaçöes têm procurado utilizar medidas directas do comportamento
(abordagem comportamental da observaçäo psicológica) ou parâmetros do
contexto directamente observado (abordagem ecológica da observaçäo psicoló-
gica). No entanto, é ainda frequente a investigaçäo centrada nos contrutos
psicológicos (dimensöes internas) inferidos ou avaliados através das suas
manifestaçöes externas.
A passagem do construto à variável designa-se, frequentemente, por um
processo de operacionalizaçäo das dimensöes subiacentes aos comportamentos em
estudo. Este processo, segundo Bravo (1985), inclui as seguintes fases:
(i) enunciaçäo da variável a considerar ou a avaliar (incluindo a sua definiçäo);
(ii) deduçIäo dos Bisnetos ou dimensöes principais e que rnelhor descrevem tal
Variavel:
(iii) litisc@ i dos indicadores ou das circunstâncias cnipíricas concretas que
cada unia (kis dirriensöes identificadas; e,
(K coii,,Ii-tiçto de índices a tornar na sua niedida (rx)r exemplo, ponderar o peso dos....
. . ........
... . .. ....... ..
varios indicadores na medida a tomar).
.......... ..........
........................... .........
.... .... . ....... ..... .... .........................
.... . ......
............
Metodoluia da Investigaçäo em Psicologia e Educaçäo 51
Estatuto das variáveis na investigaçäo
Uma forma de analisar as variáveis num estudo é considerar o papel ou es-
tatuto que elas aí desempenham de acordo com as hipóteses formuladas. Claro está
que, também aqui, se têm verificado algumas alteraçöes na Psicologia e na Educaçäo.
Certas variáveis, tradicionalmente assumidas como tendo apenas um tipo de papel,
assumem hoje outros papéis alternativos. Por exemplo, a inteligência ou o desen-
volvimento cognitivo foram tradicionalmente assumidos como variáveis que influ-
enciavam outras variáveis, por exemplo, a aprendizagem, o rendimento, a produçäo,
o ajustamento social, e que, pela sua natureza "interna" näo eram passíveis de serem
tidas como decorrentes ou influenciadas por outras variáveis, por exemplo pela
própria aprendizagem. Hoje questiona-se o sentido unilinear de tal relaçäo. Os
contextos e os produtos da aprendizagem podem igualmente influenciar a inteligência
e o desenvolvimento cognitivo dos indivíduos.
Em funçäo do papel que uma variável tem numa investigaçäo ela pode ser
designada, em primeiro lugar, como variável independente ou como variável de-
pendente. A variável independente identifica-se com a dimensäo ou a característica
que o investigador manipula deliberadamente para conhecer o seu impacto numa
outra variável - a variável dependente. Por outras palavras, e apenas para clarificar,
é uma relaçäo de antecedente para consequente, de causa para efeito. Neste sentido
chama-se alguma vezes de variável experimental ou de tratamento, seguindo de perto
a especificidade do tipo de estudo em causa. Algumas vezes a variável independente
é dita activa quando é efectivamente manipulável ou manipulada no estudo, por
exemplo, o método de ensino usado pelo professor, ou entäo diz-se atributiva (ou
natural) quando considera apenas as características "naturais" dos sujeitos, dos
grupos ou dos contextos considerados (por exemplo, o sexo dos indivíduos ou a sua
classe social).
.A variável dependente define-se como a característica qt.,c aparece ou muda
quando o investigador aplica, suprime ou modifica a variável independente. Quando
se assume esta variável como efeito da variável independente, entäo é chamada
variável critério.
A par das variáveis independente e dependente, podem existir na investigaçäo
outras variáveis, o que em Psicologia e Educaçäo acontece por norma. Em primeiro
lugar, as variáveis ditas intervenientes que, sendo alheias aos experimentos mesmo
52 Problema, hpótese(s) e variável(eis)
assim näo deixam de influir nos resultados podendo mesmos desvirtuá-los (vejam-se
as disposiçöes de conduta que os sujeitos possam apresentar, as suas atitudes em
relaçäo ao estudo e aos seus momentos de avaliaçäo, as suas motivaçöes ou as próprias
condiçöes ambientais em que decorre a investigaçäo). Inclusive, tais variáveis
aparecem hoje bastante valorizadas, sendo frequentemente assumidas como variá-
veis moderadoras do comportamento ou variáveis intermédios (Kerlinger, 1979) pela
sua condiçäo de mediaçäo (situam-se entre as variáveis independentes e'as variáveis
dependentes). Para além do seu difícil controlo, muito menos anulaçäo, a questäo
complica-se pelo facto delas poderem actuar, e isso ocorre frequentemente, de uma
forma interactiva.
Por último, nos estudos experimentais algumas variáveis influenciam asso-
ciadas à variável independente e, embora alheias ao estudo em causa, afectam os
resultados da variável dependente, "contarninando-os". Säo as chamadas variáveis
estranhas ou as variáveis parasitas. Por exemplo, num estudo sobre as diferenças
individuais de memória de dígitos podemos no final considerar os resultados
@4 contarninados" por outras variáveis que näo exclusivamente a variável independente
(conteúdo numérico ou figurativo dos dígitos, condiçöes de estimularäo da sala,
efeito de aprendizagem dos primeiros para os últimos itens da série). Podemos pensar
ainda que recorrendo-se a material de conteúdo diverso (numérico, figurativo ou
verbal), os resultados podem variar de acordo com a motivaçäo dos sujeitos para um
e outro tipo de conteúdo, com a sua formaçäo acadêmica nas áreas da matemática, das
letras ou das artes, com a sua idade e sexo.
Por razöes óbvias, em qualquer estudo experimental procura-se controlar o
efeito de tais variáveis através de procedimentos precisos (McGuigan, 1976, 139-
151) que apresentamos no quadro seguinte:
..................................... --------- 1 @
(i) identificaçäo: reconheci niciito c i nclividua I izaç@-iodts rx)ssí,@,cis,@,@iriáveisesti,a-
nhas; por exemplo, o lipo de vocabu1,I@io usado na fOri-nulaçäo (Ias questöes de
um teste.
(ii)eliminaçäo: após identificadas. e rio caso de poderem interferir nos resultados,
aprimeiraopçaoéelinilil;i[,Ilsvl@il'l@l@,,(@isestrz@íilias; porexempio,seoruídoafecta
os resultados numa pesquisa sobre ilieiii@>rizi, entáo deve ser eliminado.
(iií) constância das condiçöes cio experimento: quando as Variáveis estrailhas no-lo
podem ser eliminadas. eras devem ser rnaritidas constantes; por exeniplo.,
a mesma hora do dia, o mesmo teste.
Metodologia da Investigaçäo em Psicologia e Educaçäo 53
(iv) d;is condiçöes: partiçäo equitativa das variáveis estranhas
pelas várias condiçöes em estudo; por exemplo. se temos mais mulheres que
lioniens no e,,ludo. e o sexo é Vinicio como Variável estranha, temos que os
distrair equit@tilvarlieiile.
(v) cono-abalanceamento dos sujeitos nas várias condiçöes experimentais: os
sujeilos passaril por todas as condiçöes salvaguardando o efeito de ordem;
procura-se. desta fornia cliiiiiii,@ti- o aleito de treino e de fadiga; rx)r exemplo. no
f111,11 de três ill(,)(Itjlo" de 11111 progrania, o professor deseja saber qual deles foi
melhor assimilo pelos alamos na turnia. localiza um teste dite contém as três
partes da materiais orvanizadas sequencialmente de forma diferente. A-13-C. B-
CA. ( .-A-I3. Cada grupo de 10 altinos irá resi-x)nder ao teste ritima das orei
(vi) alealot-izaçäo dos grupos de sustos nas várias condiçöes. Exerriplo: reti
11 1 IlUr @I(
acaso os altinos das turnias para cada @-vi-ul-x) a
Um procedimento complementar consiste no emparelhamento dos sujeitos
nos grupos. Este emparelhamento pode assumir todos os sujeitos, e os dois grupos säo
equiparados nos valores da variável independente tomada para a sua distribuiçäo, ou
pode ser feito mediante a utilizaçäo de um grupo homogéneo em tal variável. No
primeiro caso, por exemplo, os trabalhadores eram ordenados com base nos seus
índices de absentismo (variável independente no estudo) e, enquanto os números
ímpares integravam um primeiro grupo, os pares formavam um segundo. Na outra
situaçäo, utilizava-se um leque de resultados, relativamente restrito, de valores nessa
variável sendo os dois grupos aleatoriamente constituídos com base nos sujeitos
seleccionados nesse intervalo de valores. Claro está que, neste último caso, podemos
ter alguns problemas. Por exemplo, os custos podem ser substancialmente aumen-
tados dado que se terá que avaliar um número bastante elevado de sujeitos para se
definir um leque de resultados a considerar. Por outro lado, os sujeitos que väo ser
considerados para constituir os dois grupos podem assumir peculiaridades que
limitam bastante as possibilidades de generalizaçäo posterior dos resultados. Final-
mente, a constituiçäo de grupos homogéneos tende a acarretar menor variabilidade
dos resultados, facto a que se deve estar atento na análise estatística dos resultados
recolhidos.
A inventariaçäo das variáveis estranhas ou parasitas näo é uma tarefa fácil.
Uma das fontes de informaçäo a este respeito é a consulta da literatura na área e o
levantamento de variáveis que podem afectar a variável dependente. Algumas vezes
o efeito de tais variáveis apenas decorre quando se replicam os estudos, outras vezes
N*_
54 Problema, hpótese(s) e variável(eis)
permanecem de uma forma mais imperceptível. Mesmo tratando-se de variáveis
directamente observáveis, a questäo pode colocar-se se todas elas säo efectivamente
controladas nos estudos em causa. Com alguma frequência nos estudos tais variáveis
ganham efectiva importância e convertem-se em variáveis independentes em novas
investigaçöes.
Quadro 11.3 - Estatuto das variáveis na investigaçäo
Estatuto das
. ............
N, i Variavel Independente Dimensäo ou c.tracterística que o
investigador manipula delibera(kiniente
para conhecer o seu impacto numa outra
Variavel.
i V.11-Liável Depelidente D'rriensäo ou característica que surge ou
nitida quando o investigador aplica,
suprime ou modificam a v@tri,!,@,el
independente.
'V N-I Variável Modei-adoi-a Variável afficia mio estudo que lx)de
influenciar os resultados, podendo actuar de
fornia interactiva.
VP Variavel Pa[-asita Variável associada a variávei independente
que afecta os Hesitados da
deix.-ndentc, `contaminando-os`.
Ligado ao estatuto das variáveis na investigaçäo, podemos ainda classificar
as variáveis, especificamente na análise do comportamento, já näo em termos do
planeamento da investigaçäo mas em termos de descriçäo e explicaçäo comportamental.
Sobretudo a partir das correntes beavioristas de observaçäo, o comportamento passou
a ser analisado no quadro de um sistema dinâmico e para o qual convergem diversas
variáveis - o sistema "EORC" (Gonçalves, 1990).
Por E (estímulo) entendemos as variáveis ambientais ou outras imediatas
(anteriores) à resposta (R) e que a desencadeiam (podemos concordar que os
comportamentos dependem em grande medida da estimularäo específica que lhes é
Metodologia da Investigaçäo em Psicologia e Educaçäo 55
anterior). Por exemplo, uma mesma característica psicológica do indivíduo
(agressividade) pode estar associada a diferentes respostas em funçäo dos estímulos/
contextos desencadeadores (café, emprego, casa, colegas, familiares). Ainda que
sobretudo importantes na escola de "reflexologia soviética" e no "behaviorismo
clássico americano", os estímulos permanecem bastante valorizados na explicaçäo
do comportamento. O meio ambiente, de acordo com as aprendizagens anteriores dos
indivíduos, ganha propriedades discriminativas (discriminaçäo e generalizaçäo) e de
reforço (reforço secundário) que conduzem à formaçäo de comportamentos (apren-
dizagens) mais ou menos estáveis em face de situaçöes específicas.
Por O (organismo) entende-se o conjunto de variáveis pessoais, näo apenas
orgânicas mas também da história e do desenvolvimento pessoal (conceito mais
abrangente de "variáveis organísmicas"). Estas características pessoais, que interagem
por exemplo com as situaçöes específicas mencionadas atrás, passam por factores
genéticos, factores fisiológicos, factores educacionais e factores ambientais (apren-
dizagens). Grande parte das variáveis em Psicologia, sobretudo as incluídas nos
construtos da personalidade, da inteligência, da motivaçäo, das atitudes e dos valores,
integram-se nesta designaçäo quando säo consideradas como causa ou explicaçäo
plausível do comportamento.
Por R (resposta) entendemos a conduta ou resposta. Se inicialmente este
termo parecia resumir-se à componente motórica do comportamento, agora reúne
uma maior diversidade de aspectos. A resposta pode ser analisada tomando as
emoçöes e a significaçäo que incorporam. Estes aspectos encontram-se presentes,
mesmo que em grau variado, em toda e qualquer resposta, sendo necessário atender
à sua globalidade quer na avaliaçäo quer na intervençäo psico-educativa. A possi-
bilidade de compreensäo e de intervençäo junto de um fenômeno (por exemplo, o
tabagismo nos adolescentes) requer a tomada desta multiplicidade de aspectos face
à natureza dinâmica e polimorfa do fenômeno, bem como à sua interdependência
frequente. Por exemplo, pode näo ser suficiente uma avaliaçäo-intervenç5o exclu-
sivamente centrada nog aspectos cognitivos. Muitos dos fumadores permanecem no
"hábito" mesmo sabendo as consequências nefastas desse comportamento para a
saúde...
Por C (consequências) entende-se todos os estímulos contingentes à resposta,
concomitantes ou seguidos no tempo. Inclui-se, assim, todo o acontecimento ambiental
ou pessoal que ocorre contingente a uma dada resposta (R) e que influencia a sua
56 Problema, hpótese(s) e variável(eis)
frequência, a sua intensidade, a sua duraçäo ou a sua probabilidade de ocorrência
(influência quer no sentido do aumento ou da diminuiçäo). Por exemplo, a criança
pode "fazer birras" quando, com esse comportamento, vai finalmente conseguir algo
dos pais.
Parâmetros de me i zs vanaveis
Para a apreciaçäo e mensurabilidade de uma característica ou comportamento
podemos considerar vários parâmetros. Tais parâmetros podem ser tomados em
separado ou em simultâneo, e os mais frequentes säo os seguintes:
(i) frequênela de ocorrência de tinia resposta;
pr(.)1)@il)Iii(bi(le de ocorrêncla de tinia resf>osta;
(]li) duraçäo da ocorrêncla de urria resposta;
(iv) duraçäo do intervalo de tempo entre (luas ou rilais ocorréncias repetidas (lesse
fenômeno;
(v) intensidade ou grau com que se manifesta uma resrx)sta; e,
(vi) ,;elocidade e qualidade que as respostas podem assumir.
Veremos que, ao nível dos instrumentos de medida, e de acordo inclusive com
a natureza mais descritiva ou experimental dos estudos, alguns desses parâmetros
aparecem mais ou menos usados. Por sua vez, alguns destes parâmetros säo apenas
avaliados, ou no mínimo melhor avaliados, através de equipamento electrónico com
alguma sofisticaçäo e justificando, simultaneamente, condiçöes laboratoriais bastante
controladas. Por outro lado, veremos mais à frente que estes parâmetros, sobretudo
assentes no comportamento e na sua observaçäo directa, aparecem particularmente
usados na abordagem comportamental da observaçäo psicológica.
Natureza da medida das variáveis
Como o termo sugere, variável reporta-se a características ou atributos que
podem tomar diferentes valores ou categorias, o que se opöe ao conceito de
4@ constante". Dum ponto de vista tradicional, säo tomadas várias escalas de medida
Metodologia da Investigaçäo em Psicologia e Educaçäo 57
para as variáveis em Psicologia e Educaçäo. Reportamo-nos à sua natureza e à
apreciaçäo quantitativa das suas manifestaçöes ou da forma como väo ser medidas.
Algumas vezes confunde-se estes dois níveis: o da variável e o da sua medida. Em
parte é verdade que algumas variáveis poderäo ser, pelo menos ao nível em que nos
encontramos presentemente em termos de investigaçäo, menos susceptíveis de
quantificaçäo. Contudo näo podemos deixar de nos questionar a propósito do tipo de
instrumentos a usar. O formato dos itens e as condiçöes em que ocorrem a avaliaçäo
podem decidir da natureza da medida obtida para descrever as variáveis. Por exemplo,
se para a avaliaçäo intelectual de um grupo de sujeitos tomarmos a informaçäo do seu
desempenho num problema ou o seu resultado num teste com duas dezenas de itens,
sabemos que no final as duas informaçöes têm propriedades numéricas diferentes.
As variáveis em Psicologia podem dividir-se em:
. ... . .............
@.(i)qualitativas(@tributosoucategorias),permítindoapenasdescreversujéitoses tuaçoes;e......
quantitativas (características mensuráveís e que se podem exprimir em valores numèrIcoS@@
i@ei)oí-t,tdos,tumaunidadedemedidaoudeordem),permitindoiáumaavalia äotomandô'
Ç
critérios de frequência, de grau ou de intensidade (variáveis intervalares) ou critérios
SC(Iijêflcl@i ou ordem (varlaveis ordinais).
As variáveis qualitativas, também designadas variáveis tipológicas (descre-
vem tipos ou classes) podem, por sua vez, subdividir-se em variáveis dicotómicas
(apenas duas categorias) ou politómicas (três ou mais categorias). Por último, em
alguns manuais diferenciam-se as variáveis dicotómicas em: descontínuas (as varí-
áveis säo claramente dicotórnicas na sua natureza, por exemplo o masculino e o
feminino); e, planificadas dicotomicamente (as ditas dichotomous scales based on
continuousormultistepvariables-GuisellietaL, 1981,28),ousejaasobtidasatravés
da divisäo dos dados em dois grupos (por exemplo, aprovados e reprovados com base
numa escala contínua de O a 20 pontos). Aspecto importante a considerar neste tipo
de variáveis, e nas I-1scalas de medida a usar, é que o número de categorias a deve
assegurar, no final:
(i) a hoiiio,-,cncl(ki(ic da escala formada (categorias bem definidas e lógicas);
(ii) a inclusäo de todos os eleniciitos observados (niriguém fique de fora);
58 Problema, hpótese(s) e variável(eis)
(iii) a utilize da escala formada para o problerna em estudo; e
-ecíproca das categorias fôrmakis (näo podem haver elementos
¨ exclusäo i 1
Ao nível das variáveis quantitativas, estas podem subdividir-se em discretas
ou contínuas (Guiselli et aL, 1981, 13). Dizem-se discretas quando as variáveis
apenas podem tomar valores inteiros (por exemplo, o número de cigarros que o cliente
fuma), dizem-se contínuas quando podem tomar qualquer valor inteiro ou fraccionário
dentro de um continuem (por exemplo os tempos de reacçäo a estímulos).
Escalas de medida das variáveis
As variáveis, no que diz respeito ao tipo de escala de medida, podem
distribuir-se por escalas nominais, ordinais, intercalares eproporcionais (estas úl-
timas já em número bastante reduzido). Está aqui em questäo o acto de mediçäo em
Psicologia e Educaçäo, entendendo-se por ele os cuidados a considerar na atribuiçäo
de números de acordo com determinados parâmetros quantitativos e normas (Tyler,
1981). Tais cuidados têm a ver com a natureza quantitativa dos próprios números
atribuídos e, logicamente, com as operaçöes aritméticas (+, -, x, :) que daí se possam-
deduzir como passíveis de aplicaçäo (Pasquali, 1996). Por exemplo, podemos afirmar
a existência de um intervalo de 60 pontos entre o Q1 de um indivíduo de 120 e o de
outro de 60, no entanto näo podemos afirmar que o primeiro tem o dobro do OI do
segundo (näo é possível dividir um Q1 por outro para ver a respectiva proporçäo ou
razäo). Veremos, neste último caso, que tal apenas poderia ser possível se todos os
valores fossem assumidos como uma distância medida a partir de um ponto zero fixo
(escalas proporcionais). Mais frequentemente podemos assumir que os intervalos
existentes entre os números (as notas obtidas) säo iguais entre si, mesmo que näo
saibarnos a que distância eles se encontram de zero (escalas intervalares).
A questäo dos níveis de medida, ou o salto entre escalas mais qualitativas para
escalas quantitativas, passa evidentemente pelas dificuldades da medida nas Ciências
Sociais e Humanas ou pela própria mensurabilidade das variáveis. Tais dificuldades
estäo ligadas:
Metodologia da Investigaçäo em Psicologia e Educaçäo 59
(i) aos problemas com a definiçäo de algurnas variáveis (veja-se, por exemplo, a
controvérsia em torno do concelio
,(ii),Ios probienias coni a constipo de instrumentos precisos e seguros de medida
das características psicológicas ou das variáveis educacionais; e,
(iii) à maior dificuidade em se isolarem e corrigirem separa(iamente tais variáveis
bern como a menor constância no tempo e no contexto que essas variáveis
apresentei comparativanicnte ,àS VZiriaVeiS noutras ciências (probierna cios
próprios consIrulos)_
A diversidade de variáveis na investigaçäo psicológica educacional é grande.
Por exemplo, trabalhamos com variáveis mais ligadas ao indivíduo e com variáveis
mais interpessoais e contextuais, como os grupos de pertença e de referência, a
comunicaçäo e as teias de relaçöes, a instituiçäo singular e a comunidade mais lata.
Por outro lado, algumas variáveis säo, sobretudo, identificados com o substracto
orgânico do comportamento (sistema neurológico, sistema endócrino), outras com o
contexto sócio-cultural (classe social, práticas educativas) e outras podem ser ditas
mais psicológicas (dimensöes cognitivas, motivacionais ou afectavas do comporta-
mento).
As variáveis mais orgânicas ou directamente associadas a aspectos sensoriais
e motores parecem ser, intuitivamente, passíveis de maior e melhor mensurabilidade.
Os próprios instrumentos de medida säo mais rigorosos e progressivamente
actualizados. Contudo, este facto näo nos deve imobilizar na tentativa da melhor
medida para os restantes tipos de variáveis a que recorremos na Psicologia e na
Educaçäo. Infelizmente assume-se, com alguma passividade, uma ligaçäo entre o tipo
e natureza das variáveis e o tipo de escalas de medida a usar. Esta relaçäo apenas é
parcialmente verídica. Tudo isto vai depender muito do trabalho do investigador na
definiçäo operacional das variáveis. Tradicionalmente temos abusado em Psicologia
da definiçäo das variáveis através da sua adjectivaçäo (o mesmo aconteceu na
avaliaçäo psicológica em relaçäo aos indivíduos). Assim, facilmente dizemos que um
indivíduo é líder ou deprimido, ou constituímos um grupo dos deprimidos e dos
líderes. Pouca atençäo foi, no entanto, dada à definiçäo das variáveis (é fácil passar
da definiçäo à designaçäo, o inverso näo é igualmente verdadeiro).
Paralelamente existe o problema dos próprios instrumentos e, ainda, das
unidades usadas na avaliaçäo. Claro está que, se nos situamos mais num nível
60 Problema, hpótese(s) e variável(eis)
descritivo em termos de medida, entäo a nossa avaliaçäo (observaçäo) é sobretudo
classificativa. As descriçöes mais quantitativas permitem-nos reais medidas ou
avaliaçöes (Guiselli et aL, 1981, 9). Por último, poder-se-ia falar na grande comple-
xidade das medidas a realizar (associada às dificuldades com a definiçäo das
variáveis), da interferência do contexto na própria avaliaçäo ou na interpenetraçäo de
variáveis e mútuas influências quando nos reportamos à investigaçäo psicológica e
educacional.
Associada às escalas de medida está a precisäo da própria medida. Claro está
que também a escala vai depender do tipo de variável, do tipo de indicadores tomados
e do trabalho prévio que se queira ter na elaboraçäo dos instrumentos. Na investigaçäo
este ponto é muito importante pois vai condicionar fortemente o tipo de análises
estatísticas a operar com os dados que se venham a recolher. As escalas de medida
variam, entäo, no seu grau de precisäo, estando este associado aos princípios
matemáticos e lógicos a que obedecem, segundo uma hierarquia de complexidade.
Podemos ver isso num continuem entre as escalas meramente designativas ou
classificativas até às escalas numéricas em termos absolutos, passando pelas escalas
de ordenaçäo e de intervalos.
As propriedades dos números usados na descriçäo operacional das variáveis
podem situar-se a diferentes níveis. Em primeiro lugar, a propriedade da identidade,
ou seja, um número é diferente de outro. Em segundo lugar, a propriedade da
magnitude, ou seja, um número é maior ou menor que outro (ordem). Em terceiro
lugar, um número em relaçäo a outro mantém um intervalo constante (intervalos
iguais), possibilitando a sua aditividade. Por último, podemos afirmar que um número
é multiplicativo de outro, por exemplo, o dobro ou um meio de um número, em face
da existência no sistema de um zero absoluto ou verdadeiro ponto zero
(proporcionalidade). Este escalonamen to das propriedades dos números (identidade,
ordem, aditividade, e proporcionalidade) caracteriza o tipo de escalas de medida
disponíveis.
Assim, as escalas nominais säo meramente classificativas, permitindo des-
crever ou designar os sujeitos mas sem recurso à quantificaçäo. Os números
habitualmente usados justificam-se pela maior facilidade da sua compreensäo (fa-
miliaridade, simplicidade, näo ambiguidade) na nossa cultura, contudo näo traduzem
grandezas ou quantidades. Eles permitem apenas identificar os grupos e os sujeitos
com base no seu grupo de pertença (por exemplo atribuir o número 1 ao sexo feminino
Metodologia da Investigaçäo em Psicologia e Educaçäo 61
e o número 2 ao sexo masculino). Por norma, permitem-nos distribuir e classificar os
sujeitos dentro de uma amostra, o que muitas vezes é feito em estudos descritivos.
Claro está que, se os grupos säo formados com base nas notas que obtiveram num
teste, por exemplo acima, abaixo ou no intervalo de um desvio-padräo em relaçäo à
média, podemos atribuir uma relaçäo diferencial entre os três grupos. Näo é a situaçäo
mais frequente já que se perde informaçäo nesta passagem de notas individuais a uma
classificaçäo por grupos (por vezes este agrupamento tem mesmo que ser feito).
Geralmente as escalas nominais säo usadas para enumerar, descrever e contar sujeitos
por subgrupos dentro de uma amostra (cada sujeito apenas pode pertencer a um dos
valores da escala e possuir as características comuns e específicas dos membros que
o integram).
Nas escalas ordinais os indivíduos ou as observaçöes distribuem-se ásegundo
uma certa ordem, que pode ser crescente ou decrescente e, nesse sentido, permitem
já estabelecer diferenciaçöes. Por outras palavras, a par da classificaçäo dos sujeitos,
podemos agora compará-los tomando a respectiva ordem. Esta ordem assegura-nos
uma comparaçäo de posicionamento e nunca de unidade de escala de medida, por
exemplo, o 6Q melhor aluno em fluência de inglês, só por si, näo nos permite dizer
quanto ele é mais fluente que o 7% apenas que é mais fluente. Por outras palavras, sabe-
se que A>B, mas näo se quantifica essa diferenciaçäo em termos de unidade de
medida, apenas em termos de posiçäo. Em Psicologia e Educaçäo, muitos dos dados
que obtemos situam-se neste tipo de escala, sendo aliás suficiente esta informaçäo
para grande número das situaçöes de prática profissional. Vários questionários
usados na avaliaçäo das dimensöes pessoais utilizam este tipo de escala no formato
dos itens (veja-se o formato tipo likert dado a tais itens, com 5 ou mais níveis
desde "totalmente em acordo" a "totalmente em desacordo").
Säo escalas sem valores absolutos e as diferenças entre os pontos ou níveis näo
säo iguais (as classes e os espaços entre elas näo säo quantitativamente equivalentes).
As diferenças nos valores (escala de postos) näo correspondem a unidades idênticas
em toda a escala e, por outro lado, as diferenças na escala podem näo corresponder
a diferenças "com significado" nas variáveis. Um atleta que chega em Y lugar pode
diferir do Yern fracçöes de segundo, e diferir em vários minutos em relaçäo ao Y, e
4L'. Tais diferenças, no entanto, näo säo consideradas ou näo afectam o seu
posicionamento e classificaçäo.
Nas escalas intercalares a diferenciaçäo dos indivíduos ou das observaçöes
äO
62 Problema, hpótese(s) e variável(eis)
assume já um valor quantitativo constante, ou reunindo o mesmo significado, ao
longo de toda a escala (escalas de intervalos ou de pontos). Os valores decorrem da
frequência ou do grau assumidos por uma propriedade, por exemplo o número de itens
correctamente respondidos num teste de aptidäo. Tais valores envolvem já classifi-
caçäo, grandeza e unidades de tamanho idêntico. Assim, ao longo da escala, o ter mais
cinco pontos numa nota significa o mesmo no começo, no meio ou no final de uma
distribuiçäo de resultados. Claro está que nos reportamos aqui aos números, por
exemplo, às notas obtidas através de um determinado instrumento, e ao seu
significado restrito. Veremos que esse mesmo significado ao longo de toda a
escala näo se verifica quando passamos da lógica dos números (quantificaçäo)
para a lógica do seu significado psico-educativo (interpretaçäo). A falta de um
verdadeiro "ponto zero", ou a verificaçäo apenas de um "zero empírico" na escala de
medida, impede-nos de avaliar a razäo de um sujeito para outro em termos de
quantidade da propriedade ou acerca da proporçäo que um indivíduo tem em
relaçäo a outro (Guiselli et aL, 1981, 13).
As escalas intervalares säo muito usadas em Psicologia e, salvo raras excepçöes,
säo as de mais elevado nível de quantificaçäo que conseguimos na investigaçäo em
Psicologia e Educaçäo. Os testes psicológicos de aptidäo formados por um conjunto
de itens onde o sujeito obtém uma nota equivalente ao número de respostas correctas
ou as escalas de auto-conceito onde o sujeito no final obtém uma classificaçäo
decorrente das pontuaçöes atribuídas aos vários itens (e aqui nem todos estäo de
acordo com a passagem de uma escala ordinal a nível do item para uma escala
intervalar ao nível do resultado final na prova) säo exemplos de instrumentos onde a
avaliaçäo se organiza em termos de escala intervalar (refira-se que apenas nas
situaçöes em que as provas comprovem a sua unidimensionalidade). Säo escalas com
unidades iguais de medida, indicando quanto determinada característica está presente
ou ausente (quantidade do traço), o que permite já que os resultados dos indivíduos
sejam passíveis de conversöes lineares (somar, subtrair, multiplicar ou dividir por
unia constante), como aliás acontece na conversäo das notas brutas em notas
padronizadas tendo em consideraçäo a distribuiçäo dos resultados no grupo.
Nas escalas proporcionais ou escalas de razäo, em acrescento às escalas
intervalares, podemos dispôr já de um verdadeiro ponto zero (zero absoluto). Tais
4@ pontos zero" (total ausência de uma característica ou propriedade) säo difíceis de
fixar em Psicologia e em Educaçäo. Essa dificuldade passa certamente pelo carácter
inferencial de grande número das medidas que säo utilizadas, reportadas a dimensöes
Metodologia da Investigaçäo em Psicologia e Educaçäo 63
internas, por exemplo. Reportando-nos à aprendizagem escolar, uma hipotética
classificaçäo de zero num teste näo poderia ser assumida como ausência perfeita ou
completa de conhecimentos.
As quatro escalas apresentadas distribuem-se, como afirmamos, num
continuem em termos do nível de quantificaçäo que asseguram. Sem aprofundarmos
neste momento, é possível afirmar que daí väo decorrer implicaçöes importantes em
termos da formulaçäo das hipóteses e das análises estatísticas passíveis de serem
usadas. Voltaremos a este assunto no capítulo conclusivo deixando por agora um
quadro ilustrativo de tais implicaçöes, sobretudo em termos das análises estatísticas
com as diversas escalas de medida.
Quadro 11.4 - Tipos, características e implicaçöes nas análises estatísticas com as
diversas escalas de medida
Nível Escala Características
Estatística Ili-ocediiiientos
(Modelo) (Exemplos)
. . ..... ............................. ... . ........... ................... __------------.......................... --
(1,issi fiC@1(-äo 1'-i-cqtiêiici@ts
actiiiitjlidis
qtiI-quadr@tdo
r-bisserNI1
2 Ordinal Valorcs ordenulos Näo Paramétric;I i-liô de Spearman
Dií'CI-CnÇ@Is toimindo os IX)Stos t-wIlcoxon
teste de sinais
Mmin-WilMiev
3 Intervalar Interv;11os iguais MédM
Zero näo 'd)soltito Desvio-pidräo
Frequénckts
Pararnétrica Análise @,,,ir],'incia
I. de lle;tl.soll
4 Pr(Porcional Inierv31os igiwis Regressäo
Zero tt.).,olllto Análise factorial
Razäo entre quan[idades
64 Problema, hpótese(s) e variável(eis)
As variáveis no quadro dos modelos de investigaçäo
O paradigma experimental da investigaçäo aparece frequentemente assumido
como forma de se avaliar o grau de ciência de um determinado conhecimento ou
disciplina. Por norma, as Ciências Sociais e Humanas apresentam algumas dificulda-
des na adequaçäo a esse paradigma (ou com o seu fácil uso), o que näo acontece no
quadro das Ciências Naturais e Exactas. Mesmo assim, pensamos que a adesäo a esse
modelo e às suas implicaçöes - vantagens e limitaçöes permite-nos descrever e retirar
ilaçöes importantes a propósito da metodologia da investigaçäo psicológica e, no
final, a propósito da explicaçäo do comportamento humano.
É frequente sublinhar-se que existem dificuldades na aplicaçäo do método
experimental na área das Ciências Sociais e Humanas. Vários exemplos podem
apontar-se no sentido de tal dificuldade.
Em primeiro lugar, podemos apontar as dificuldades na definiçäo e delimi-
taçäo das variáveis a considerar. Assim, podemos facilmente reconhecer que as
variáveis säo, por norma, complexas em termos de definiçäo e dinâmicas ou
interactivas na sua natureza, assinalando-se a respectiva interdependência. Essa
complexidade näo facilita o esforço de objectividade, de controlo e de análise mais
pormenorizada, próprio do método experimental. Também complica o facto de
grande número de variáveis em análise näo serem, em si mesmas ou nas suas
componentes mais significativas (e isto depende evidentemente dos modelos teóri-
cos), directamente observáveis. Nessa altura, temos que recorrer ou às suas manifes-
taçöes habituais ou à sua manifestaçäo como resposta a situaçöes específicas de
estimularäo (por exemplo, na observaçäo psicológica através da aplicaçäo de testes)-
Decorre, entäo, a possibilidade de menor objectividade associada ao facto de termos
que inferir as variáveis através dos seus "indicadores". Esta complexidade, a par dos
problemas de índole ética, dificultam a experimentaçäo no sentado vulgar do termo
(replicaräo dos fenômenos, manipulaçäo das condiçöes).
A natureza mais fenomenológica da realidade psico-educativa parece indu-
zir-nos, intuitivamente, para um modelo mais interpretativo-qualitativo que experi-
mental-quantitativo. Aliás, o método experimental só por si näo chega para atingir-
mos tais fenômenos na sua essência. Progressivamente os métodos mais qualitativos
de análise ganham alguma importância nas Ciências Sociais e Humanas.
Metodologia da Investigaçäo em Psicologia e Educaçäo 65
Em segundo lugar, e associado aos aspectos apontados, colocam-se várias
reservas à medida e quantificaçäo em Psicologia e Educaçäo, ou seja um dos pontos
importantes do método experimental. Como se descreveu, a realidade psico-educativa
é mais fenomenológica que estática. Por outro lado, consideramos indicadores
(signos) para descrever realidades mais internas e formalizamos medidas, ou
quantificamos, mais em funçäo das respostas dos sujeitos que da medida real dos
atributos. Näo temos "zeros absolutos", e as escalas de quantificaçäo que considera-
mos estäo mais frequentemente referendadas nos indivíduos e grupos do que nos
atributos. Foi tradiçäo na Psicologia, partindo dos resultados dos indivíduos e da sua
distribuiçäo, retirar ilaçöes quantitativas para as dimensöes psicológicas estudadas.
Finalmente, e como corolário dos aspectos anteriores, podemos questionar a
precisäo da medida face ao carácter näo directo da avaliaçäo, à inexistência de "zeros
reais" e aos instrumentos usados. Questiona-se, ainda, o sentido experimental da
pesquisa psicológica face à impossibilidade de replicaräo dos fenômenos, à
multiplicidade de variáveis em presença e dificuldades de seu controlo, e à dificul-
dade de se fixarem regularidades ou leis dada a natureza instável dos fenômenos no
tempo e no espaço. Por último, se é necessário contextualizar os fenômenos para a sua
melhor compreensäo, certo é que tal contextualizaçäo acabará por dificultar a
generalizaçäo dos resultados. Por sua vez, se o investigador faz parte do todo
psicossocial que investiga quäo difícil poderá ser manter-se neutro e assegurar a total
independência dos seus estudos, e em que medida tal neutralidade näo poderá ser
eticamente censurada. Todos estes aspectos, mais que impossibilitarem a investiga-
çäo em Psicologia e Educaçäo, devem ser devidamente ponderados no planeamento
e nas conclusöes dos estudos.
Bibliografia
Bravo, R. S. (1985). Técnicas de investigación social: Teoria y ejercicios (6.2 Ed.).
Madrid: Paraninfo.
D'Hainaut, L. (1990). Conceitos e métodos da estatística (Vol. 1). Lisboa: Fundaçäo
Calouste Gulbenkian.
Gonçalves, 0. F. (1990). Terapia comportamentaL Modelos teóricos e manuais
terapêuticas. Braga: Ediçöes Jornal de Psicologia.
66 Problema, hpótese(s) e variável(eis)
Guiselli, E. E., CampbelI, J. P. & Zedeck, Sh. (1 98 1). Measurement theory for the
behavioral sciences. San Francisco, CA: W. H. Freeman.
Kerlinger, F. N. (1979). Behavioral research: A conceptual approach. New York:
Holt, Rinehart and Winston.
J
McGuigan, F. M. (1976). Psicologia experimental: Uma abordagem metodológica.
Säo Paulo: EPU.
Meyers, L. S. & Grossen, N. E. (1 974). Behavioral research: Theory, procedere, and
design. San Fracisco, CA: W. H. Freeman.
Pasquali, L. (1996). A teoria da medida. In L. Pasquali (Org.), Teoria e método da
medida em ciências do comportamento. Brasília: Ministério da Educaçäo e
Desporto, INEP.
Pinto, A. C. (1990). Metodologia da investigaçäo psicológica. Porto: Ed. Jornal de
Psicologia.
Popper, K. R. (1959). Logic of cientific discovery. London: Hutchinson.
TyIer, L. E. (1981). Testes e medidas. Rio de Janeiro: Zahar Editores.
Metodologia da Investigaçäo em Psicologia e Educaçäo 67
FICHA DE AUTO-AVALIAÇÄO
Grupo 1: Problema
Re3ponda às, duas qu(_wtöesseg1íi1it(.@@:
21.1. Acerca da questäo do iíisticesso escolar, tente formular um problema a ser
Arivestigado.
1.2. Como proceder para apreciar a pertinência e a actualidade desse problerna.
Grupo 11: Hipóteses
ReSponda a duas títis três questöesseguintes:
2. 1. Explicite o conceito de hipótese e a necessidade da sua formulaçäo previa numa
investigaçäo.
2.2. Diferencie o método in(lutivo do métoffi.) dedutivo na formulaçäo das hipóteses.
2.3. Diferencie "erro tipo Fe'4erro tipo 1l" na accitaçào., re eiçäo da hipótese nula
UinteS:
"@3.1.Diferencievariáveisqualítativasde viri@í-@,,cisqtiaiitit,,itív,l-ls.Quaisassubdivisöes
dentro de cada um destes dois grupos?
.3.2. Em termos de observaçäo comportamental, identifique e defina as.variáveis
@@Jnerentes ao sistema "E-O-R-C".
3@3. Apresente os diferentes sentidos que os números usados na medida das
v@ ariáveis podem assumir e faça-os corresponder às diferentes escalas de medida
e defina as designaçöes que as variáveis podem assumir no quadro
@@do seu estatuto ou papel numa pesquisa
Diferencie escala intervalar de escala ordinal em termos de medida dasw,
variáveis,.
Grupo III: Variáveis
,Responda a três das (,-iii(-.-o
r-
Capítulo 3
Procedimentos: planos e amostras
L- 1
- 1 N@
L 1.,
Procedimentos: planos e amostras
Planos de investigaçäo
Validade interna e externa
Grupos e momentos num plano
Método experimental
Planos factoriais
Classificaçäo dos planos
Método correlacional
Métodos qualitativos
Populaçäo e amostras
Conceito de populaçäo, amostra e sujeito
Processos e tipos de amostras
Representatividade e significância das amostras
Estudos de grupo e caso único
Os sujeitos na investigaçäo
Uma investigaçäo näo se realiza sem um problema devidamente equacionado
e sem a definiçäo de um plano que oriente a sua concretizaräo. Face aos objectivos
da investigaçäo, operacionalizados através da definiçäo do problema e das hipóteses
e variáveis que o delimitam, a fase seguinte envolve a organizaçäo do processo de
recolha dos dados tendo em vista a testagem devidamente controlada da hipótese.
Assim importa saber o que se vai fazer, quando e como vai ser feito, junto de quem
e por quem será feito, ou como väo ser os efeitos avaliados. Todas estas questöes
constituem assunto do plano da investigaçäo e seräo tratadas neste capítulo.
A elaboraçäo de um plano é básico ou fundamental em qualquer investigaçäo.
Ele representa o elemento organizativo e o esquema global de orientaçäo dos
trabalhos, indicando o que fazer e quando fazer, bem como vários outros aspectos a
considerar no momento da recolha e do tratamento dos dados. Os resultados, a
qualidade da investigaçäo e as suas possibilidades de responder aos objectivos para
que foi conduzido dependem grandemente do plano da investigaçäo. Todos estes
aspectos salientam a importância decisiva do plano numa investigaçäo e, logicamente,
apontam para a necessidade do mesmo aparecer devidamente descrito num projecto
de investigaçäo a conduzir ou no relatório final de uma investigaçäo concretizada.
No plano de uma investigaçäo todos os elementos metodológicos entram em
sintonia. Ao conceptualizar o plano, o investigador questiona de novo os aspectos de
delimitaçäo do problema, as hipóteses e as variáveis em estudo. Ao mesmo tempo,
questiona os sujeitos e as amostras a utilizar, os momentos da avaliaçäo e de
intervençäo, os instrumentos e as análises a efectuar com os dados.
Um aspecto importante em qualquer investigaçäo, e decorrente do plano, tem
a ver com as amostras ou os giupos de su eitos junto dos quais a experiência ou a
investigaçäo se vai concretizar, podendo também, em vez de amostras de sujeitos,
incidir em amostras de comportamentos ou de situaçöes. As amostras a utilizar,
mesmo podendo ser integradas no plano, aparecem aqui analisadas no quadro de um
tópico isolado dada a sua particular importância na investigaçäo psicológica e
educacional. Questöes a considerar passam, por exemplo, pelo efectivo necessário
(número de sujeitos) e pela sua representatividade. O valor da informaçäo recolhida
72 Procedimentos: planos e amostras
depende, näo apenas dos instrumentos usados e dos contextos em que ocorre, mas
também das características das amostras ou grupos onde foram obtidos. As diferenças
inter-individuais explicam que, consoante o tipo de grupo em presença, assim os
resultados podem sofrer alteraçöes. Em termos práticos, em qualquer investigaçäo de
cariz experimental importa que os resultados sejam atribuídos às condiçöes experi-
mentais e näo a condicionalismos das amostras ou grupos utilizados, salvo se as
características dos grupos säo assumidas como as variáveis independentes no estudo.
Na investigaçäo correlacional poder-se-á ter já estudos em que se procura manter as
condiçöes de observaçäo para apreciar diferenças entre grupos definidos. Refira-se
que, mesmo aqui, tais grupos acabam por poder ser como a variável independente do
estudo.
Outro aspecto a considerar säo os momentos em que ocorre a investigaçäo. Os
momentos em que decorrem as medidas das variáveis ou a manipulaçäo da variável
independente säo, por vezes, decisivos dos resultados recolhidos. Por exemplo, se o
estudo da satisfaçäo dos trabalhadores numa empresa coincide com um momento
crítico ou de greve, dever-se-á aceitar uma interferência desse momento nos resul-
tados obtidos. No final será difícil interpretar os valores observados sem uma
referência ao contexto laboral coincidente com o estudo.
Finalmente, dever-se-á falar dos procedimentos a usar na recolha dos resul-
tados. Uma pergunta feita através de um inquérito auto-aplicado ou através de uma
entrevista ou contacto pessoal do sujeito com o avaliador poderá näo proporcionar os
mesmos resultados. O mesmo se pode afirmar em relaçäo à pessoa e ao papel do
experimentador, mesmo em planos experimentais bastante controlados. Os estudos
sobre o efeito pigmaleäo em contextos de investigaçäo experimental säo
elucidativos da importância desta variável (Rosenthal, 1966).
Planos de investigaçäo
Plano (designo pode definir-se como o conjunto de procedimentos e orien-
taçöes a que uma investigaçäo deve obedecer tendo em vista o rigor e o valor prático
da informaçäo recolhida, mormente para a testagem das hipóteses inicialmente
formuladas para o problema em estudo. Após a formulaçäo das hipóteses, definidas
as variáveis e os respectivos estatutos na investigaçäo, a fase seguinte requer a
especificaräo doplanoldesignlplaneamento da investigaçäo (termos frequentemente
Metodologia da Investigaçäo em Psicologia e Educaçäo 73
tomados em alternativa). Ele será o guiäo de tudo o que deve ser feito em termos de
investigaçäo, precisando nomeadamente:
(i) junto de quem se vai intervir, experimentar ou meraniente proceder à observaçao
(poptji,tç@io, aniosIra. grupos ou stijeitos-alvo),
(11) quem vai intervir e./Ou quem val avaliar (os agentes e"-'ou os avaliadores),
(Iii) quando se vai ap-esentar a condiçäo exiwrImental ou (Ii.unido se vai avaliar
(timing na intervençw e na avallacäo),
(iv) conio se vai proceder em conci-eto ao níVei da inici-vençäo e (Li avaliaçäo
(secltiéiici;i(l;iscoíi(liçC)es,enip@ii-elli,tíilcíito.,;(Io.%grLjrx)s,ouir,@is 1'()riii@is(lecontro-
lo (IIIS val-iáveis Pal-asitas), e
(v) o que val ser cí'ecti-,,,,ziniente avallado e com que nicios (dil]ICIIS(CS Psicológicas,
comportamentos, situaçöes).
Um plano procura ter as respostas para todas estas questöes e, geralmente,
tem-no de uma forma orientadora para o próprio investigador. Depreende-se, entäo,
ser um plano anterior ao início da intervençäo/investigaçäo, seja esta de índole
experimental seja de índole correlacional. Reafirmamos a importância de todos esses
aspectos, pois que deles vai depender a margem de erro nas análises e nas interpre-
taçöes, a segurança nos resultados obtidos, a ligaçäo dos resultados às condiçöes
experimentais de um procedimento e a própria possibilidade de generalizaçäo dos
resultados obtidos para outras amostras, situaçöes e tempo.
Validade interna e externa
Nem qualquer plano serve aos objectivos da investigaçäo. Eles variam no grau
de adequabilidade, de rigor e de validade, sendo estes os aspectos que, por norma, se
procuram maximizar na elaboraçäo de um pl"-,io de investigaçäo (Christensen, 1980).
Em primeiro lugar, um plano deve ser adequado e rigoroso, ou seja, assegurar
que os procedimentos se adequem à natureza do problema e aos objectivos do estudo.
Assim, importa apreciar o rigor e a pertinência das hipóteses formuladas, as condiçöes
em que väo decorrer as observaçöes, os procedimentos de recolha e de análise
planeada dos dados ou o papel que vai desempenhar o experimentador, entre outros.
No fundo, o plano deve permitir captar a informaçäo de uma forma objectiva e
74 Procedimentos: planos e amostras
assegurar-nos confiança nas relaçöes que se possam vir a estabelecer entre os dados.
Em segundo lugar, ele deve ser válido ou garantir a validade da
informaçäo recolhida. Para o efeito, importa que o plano da investigaçäo controle
várias fontes de erro que poderäo colocar em causa quer o significado dos
resultados (validade interna) quer a sua generalizaçäo a outras amostras e
situaçöes (validade externa).
Factores que afectam a validade interna
Por validade interna entende-se o grau com que no final da investigaçäo se
consegue atribuir os resultados observados na variável dependente à manipulaçäo da
variável independente. Tomaremos como fonte de erro todos os factores que possam
pôr em causa tal relaçäo explicativa dos resultados observados.
a. contexto: qualquer acontecimento externo e concomitante ao estudo, ligado
ou näo ao procedimento, e diferente da variável independente que ao longo da
investigaçäo possa influenciar a variável dependente. Por exemplo, alguns programas
comunitários ou programas na comunicaçäo social surgem abordando aspectos em
que incide, por exemplo, uma intervençäo educativa. Seria o caso de um ensa- io
avaliativo sobre a eficácia de um determinado método para a aprendizagem da leitura
e escrita ao mesmo tempo que passava a série televisava "Rua Sésamo". No final, seria
difícil atribuir os resultados exclusivamente à intervençäo na sala de aula.
A presença e a importância deste factor de erro aparece ligado à duraçäo do
programa, ou seja, será tanto mais possível a sua ocorrência e evidente o seu impacto
se o tratamento decorre por vários meses ou anos, se se trata de uma investigaçäo-
acçäo alargada à comunidade, se se trata de uma investigaçäo no terreno ou quando
os V"lios grupos criados em funçäo da manipulaçäo da variá@,el independente näo
recebem" o tratamento em simultâneo.
b. Maturaçäo elou desenvolvimento dos su'eitos: nomeadamente em crianças
podem esperar-se mudanças decorrentes do seu crescimento biológico, do seu
processo de aprendizagem, idade, experiência, doença e desenvolvimento psicossocial.
As respostas na avaliaçäo final podem traduzir estes ganhos naturais. No caso de uma
distribuiçäo dos sujeitos pelos grupos, inclusive pelo grupo de controlo, este mesmo
Metodologia da Investigaçäo em Psicologia e Educaçäo 75
grupo pode servir para apreciar a grandeza de tais efeitos ditos naturais (por
alternativa aos "efeitos experimentais").
c. Selecçäo diferencial dos sujeitos: trata-se de eventuais enviesamentos ve-
rificados na constituiçäo dos grupos em estudo (grupos para os diferentes tratamentos
e controlo), nomeadamente quando se parte de grupos naturais, como por exemplo,
turmas de alunos, enfermarias de doentes ou celas de prisioneiros que näo asseguram
a homogeneidade dos grupos à partida. Nessa altura, poderemos ter dúvidas em
afirmar que as diferenças observadas no final entre os grupos sejam apenas atribuídas
à variável independente.
d. Mortalidade experimental: acontece com alguma frequência o desapare-
cimento ao longo de um programa, de um treino ou de um tratamento de alguns
sujeitos. Por exemplo, as pessoas abandonam, os ratos morrem, as organizaçöes
mudam ou deixam de existir. Este factor acontece frequentemente quando o estudo
se prolonga bastante no tempo. As questöes podem passar pela própria especificidade
da desistência e das condiçöes em que as mesmas ocorreram, bem assim como quanto
às características específicas desses sujeitos. Por norma esta mortalidade näo é
randómica, antes fruto de um processo de auto-selecçäo. Se essa perda levanta
sempre algumas interrogaçöes, mais dúvidas nos ficam quando tal perda se verifica
junto dos sujeitos situados nos extremos da distribuiçäo dos resultados relativamente
ao pré-teste.
e. Efeitos de interacçöes: vários dos factores de erro apontados anteriormente
podem actuar interactivamente. Por exemplo, podemos imaginar efeitos de interacçäo
conjugando a selecçäo e a maturaçäo ou a selecçäo e o contexto. No exemplo atrás,
as crianças que visionam o programa "Rua Sésamo" podem näo se encontrar
igualmente distribuídas pelos grupos experimental e controlo.
f Reactividade da ir,,cdida: entende-se aqui o efeito nos resultados da exis-
tência de momentos de avaliaçäo a.) longo do programa ou do tratamento. Além disso,
podemos imaginar que o tipo de provas e de medidas podem afectar de forma
diferencial os sujeitos quer ao nível da avaliaçäo em si mesma quer tomando eventuais
impactos na motivaçäo ou envolvimento na intervençäo (variável independente). Por
exemplo, a aplicaçäo de uma ficha de auto-avaliaçäo dos professores antes de uma
acçäo de formaçäo pode sensibilizá-los para certos temas e, deste modo, ter alguma
interferência no grau de participaçäo e no aproveitamento da formaçäo. Essa
76 Procedimentos: planos e amostras
interferência pode, ainda, näo assumir a mesma forma e grau junto de todos os
professores, antes apresentar-se condicionada pelos seus níveis de conhecimentos e
de expectativas face à temática da acçäo de formaçäo.
g. Instrumentaçäo: no seguimento da alínea anterior, podemos mencionar
alguns problemas que podem ocorrer com os próprios instrumentos de medida
usados, eventualmente aplicável também à própria intervençäo se esta recorre a
instrumentos. Por exemplo, tais instrumentos podem deteriorar-se com o tempo, ou
os alunos que respondem aos testes numa segunda ou terceira aplicaçäo podem
beneficiar de marcas constantes nos cadernos de exercícios. Outras vezes pode
pensar-se que os instrumentos säo equivalentes quando na realidade näo o säo. Ocorre
também que, com o tempo ou de grupo para grupo, pode o observador alterar os seus
critérios na recolha e na pontuaçäo das respostas, estando aqui em causa a maior ou
menor eficácia do avaliador.
h. Regressäo estatística: este erro é meramente probabilístico e ocorre as-
sociado à tendência dos valores extremos numa distribuiçäo tenderem para a média
numa avaliaçäo posterior. Essa tendência ocorre quer se recorra à mesma medida,
quer a outra correlacionada. Factores ocasionais da realizaçäo e deficiências do
instrumento, factores sempre presentes, explicam este efeito de regressäo estatística
dos extremos da distribuiçäo em relaçäo à média do grupo: quer os resultados mais
altos quer os mais baixos, em nova aplicaçäo dos testes, tendem a aproximar-se da
média. Por exemplo, conhecendo-se este facto, poder-se-á ponderar a constituiçäo e
a equivalência dos grupos näo apenas reportando-se à média mas ao tipo de
distribuiçäo que apresentam. Situaçäo extrema seria (mesmo que por mero acaso) que
no grupo experimental se encontrassem os sujeitos com pontuaçöes mais baixas e no
grupo de controlo estivessem os de maior pontuaçäo; nessa altura, será que a diferença
estatisticamente significativa que eventualmente se encontre no pós-teste näo poderá
traduzir apenas o efeito do factor de erro que acabamos de mencionar?
i. Difusäo ou imitaçäo do tratamento: este último factor de erro tem a ver com
eventuais efeitos de "osmose". As pessoas do grupo experimental e do grupo controlo
podem aprender acerca de outros programas que näo os seus. Algo do programa ou
do tratamento é "passado" para os vários grupos constituídos, inclusive para o grupo
de controlo. Quando os vários grupos pertencem a uma mesma comunidade ou a
comunidades contínuas, quando os alunos säo provenientes da mesma escola ou
escola próximas, devemos interrogar-nos se näo terá ocorrido passagem das carac-
Metodologia da Investigaçäo em Psicologia e Educaçäo 77
terísticas do programa ou do tratamento dos sujeitos do grupo experimental para os
sujeitos dos grupo de controlo. Esta situaçäo pode ser mais frequente quando o grupo
de controlo fica a aguardar a conclusäo do tratamento no grupo experimental para
receber" a intervençäo. A imitaçäo, por outro lado, ocorre quando o conhecimento
de outros tratamentos, por exemplo tidos como mais desejáveis, pode alterar os seus
comportamentos. Esta situaçäo é mais frequente quando os elementos pertencentes
aos vários grupos, em que väo ser aplicadas as várias condiçöes da variável
independente (por exemplo, diferentes metodologias de ensino), comunicam entre si.
Factores que afectam a validade externa
Ao referirmo-nos à validade externa de um plano experimental estamos a
questionar as condiçöes que podem afectar a representatividade dos seus procedimentos
e resultados e, logicamente, a generalizaçäo destes últimos a outras amostras, à
populaçäo em geral ou a outras condiçöes e situaçöes reais.
a. Reactividade experimental: algumas vezes os sujeitos do grupo experi-
mental alteram os seus padröes habituais de comportamento em face da especificidade
do tratamento, podendo-se falar numa interacçäo tratamento-contextos. Por vezes,
basta o conhecimento que integram uma investigaçäo ou que fazem parte do grupo
que nessa investigaçäo testam determinadas condiçöes para alterarem os seus
comportamentos habituais. Nesta altura, como poderemos no final generalizar tais
resultados a outros sujeitos, ou generalizar a eficácia ou a ineficácia do programa a
outros sujeitos, grupos e condiçöes?
b. Interacçöes tratamento-atributos: vários erros podem ocorrer em funçäo
dos efeitos de interacçäo tomando, por exemplo, os aspectos da selecçäo dos sujeitos
e a variável experimental. Assim, quando a investigaçäo utiliza amostras específicas
(alunos voluntários da universidade, pessoas de certo nível social, pessoas que
frequentam clínicas privadas, por exemplo), existem reais dificuldades em se gene-
ralizar os resultados a outros grupos näo devidamente representados na amostra.
c. Efeito reactivo ou interactivo dopré-teste: a existência de um pré-teste no
procedimento experimental só por si pode afectar a generalizaçäo dos resultados
finais obtidos. Por exemplo, o pré-teste pode ter treinado os sujeitos para a variável
independente ou ser ocasiäo para várias interacçöes de variáveis. Pode, ainda, ser a
78 Procedimentos: planos e amostras
causa ou factor facilitador das mudanças verificados. No limite, a generalizaçäo dos
resultados do tratamento passaria a exigir a avaliaçäo de pré-teste.
d. Interferências de tratamentos múltiplos: quando se aplicam diversos tra-
tamentos, excepto se os efeitos dos tratamentos anteriores tiverem sido eliminados,
dificilmente estamos em condiçöes de poder afirmar que os resultados num dado
momento traduzem apenas os efeitos do tratamento a ocorrer naquele momento. A
condiçäo de "iniciante" näo se repete quando um indivíduo, mesmo que por razöes
diversas, foi objecto de tratamentos ou intervençöes anteriores.
e. Novidade do tratamento: a curiosidade, a motivaçäo ou a novidade inerep-
tes ao experimento ou ao tratamento podem afectar o impacto da variável indepen-
dente. Por norma, tais aspectos "aumentam" o efeito potencial da variável indepen-
dente. Esta influência pode desaparecer já nas aplicaçöes posteriores do tratamento,
ou seja quando este assume uma maior naturalidade. Alunos percepcionando a grande
importância de uma experiência de inovaçäo em que participam, poderäo ser
44 generosos" na sua avaliaçäo no pós-teste.
Grupos e momentos num plano
Dois aspectos säo fundamentais para o rigor do procedimento da investiga-
çäo: o processo de selecçäo dos sujeitos que väo fazer parte da investigaçäo, isto é,
quem vai ser alvo da intervençäo e/ou da avaliaçäo, e os momentos em que ocorre a
recolha dos dados. A abordagem de ambos os aspectos permite-nos identificar várias
condiçöes em que pode ocorrer uma investigaçäo que se aproxime do paradigma
experimental e, consequentemente, formas diversas de assegurar a validade interna
e externa dos planos.
Grupos de sujeitos
Nos planos, ditos experimentais, as amostras tomadas numa investigaçäo
tendem a repartir-se por dois ou mais grupos de sujeitos. A necessidade de vários
grupos decorre de necessitarmos de pelo menos um grupo para cada condiçäo
experimental. Para além disso, faz sentido em algumas investigaçöes assegurar a
existência de um grupo que nos sirva de comparaçäo. Outros grupos podem ser
Metodologia da Investigaçäo em Psicologia e Educaçäo 79
necessários, ainda, quando o plano pretende controlar eventuais efeitos de variáveis
estranhas conhecidas previamente ou efeitos de ordem na aplicaçäo das várias
condiçöes da variável independente.
0(s) grupo(s) alvo da intervençäo ou das condiçöes experimentais säo
chamados grupo(s) experimental(ais). A comparaçäo do impacto da variável inde-
pendente (ou da sua manipulaçäo) é feita, quando a investigaçäo näo é de caso-único,
através do grupo de controlo que é formado pelos sujeitos que näo passam pela
intervençäo. Algumas vezes acrescenta-se um grupo placebo, isto é, grupo que re-
aliza um programa ou intervençäo de efeito neutro para os objectivos em causa.
Enquanto o grupo de controle näo "sofre" intervençäo, e isto pode favorecer a
curiosidade e a tendência dos sujeitos deste grupo para conhecerem e acompanharem
a intervençäojunto dos sujeitos do grupo experimental, o grupo placebo é alvo de uma
intervençäo e, por esse facto, elimina-se substancialmente tal curiosidade e tendência.
Na formaçäo dos dois grupos (experimental e controlo) deve acautelar-se
alguns aspectos. Desde logo, é importante cuidar da forma como se chega aos sujeitos,
ou se . a, como estes säo seleccionados para a investigaçäo e como passam a integrar
os grupos a constituir. Mais à frente falaremos da questäo das amostras na investi-
gaçäo psicológica, contudo desde já é importante mencionar alguns pontos decisivos
para um plano experimental de investigaçäo. A constituiçäo das amostras ou dos
grupos, no fundo os sujeitos efectivamente utilizados, näo deve colocar em causa a
significância final dos resultados recolhidos (independência dos resultados em
relaçäo aos sujeitos tomados). Este aspecto é geralmente assegurado através de um
método aleatório de amostragem ou seja a tentativa de constituiçäo dos grupos
através de um método desprovido de efeitos de enviesamento.
Contudo, algumas vezes acontece que, apesar do método aleatório na cons-
tituiçäo dos grupos, e particularmente quando os grupos säo de reduzida dimensäo,
os grupos em comparaçäo näo podem ser assumidos como equivalentes. Sendo difícil
antecipar que os grupos possam ser à partida equivalentes e, dado que isso vai levantar
sérias dificuldades à associaçäo de eventuais diferenças encontradas aos valores ou
condiçöes da variável independente, importa de imediato utilizar procedimentos
complementares que salvaguardem tal equivalência. Nessa altura, os autores acon-
selham o uso de processos de amostragem directamente dirigidos à equivalência dos
grupos em presença. Um desses métodos é a formaçäo de grupos através do
emparelhamento dos sujeitos, isto é, os sujeitos säo repartidos pelos grupos a formar
80 Procedimentos: planos e amostras
com base numa distribuiçäo equitativa dos valores numa variável independente
considerada. Outros métodos foram já descritos quando nos referimos às variáveis
estranhas e ao seu controlo nos estudos experimentais (cf. capítulo 2).
Finalmente, nem todas as pesquisas requerem a formaçäo de vários grupos ou
a utilizaçäo de um grupo de controlo. Por exemplo, nos estudos de "caso único" a
manipulaçäo da variável independente näo é feita através da constituiçäo de grupos
para cada condiçäo da variável independente mas através da passagem sequenciada
do sujeito ou pequeno grupo por todas essas condiçöes. O professor pode verificar se
o seu contacto ocular com o aluno é decisivo para alterar o seu comportamento de
indisciplina na sala de aula gerindo momentos sequenciados com e sem contacto
ocular. Outro exemplo da näo necessidade de um grupo de controlo verifica-se nos
planos factoriais. Aqui, a manipulaçäo das diversas condiçöes da variável indepen-
dente é feita assegurando um grupo em cada condiçäo. As características destes
planos seräo abordados ainda neste capítulo.
Momentos da avaliaçäo
Um aspecto importante na investigaçäo experimental quando está em causa
uma apreciaçäo de efeitos, de mudanças ou de ganhos é a existência de dois ou m- ais
momentos de avaliaçäo, sendo pelo menos um antes da manipulaçäo da variável
independente e outro após tal manipulaçäo. Tais momentos säo designados, respec-
tivamente, porpré-teste (ou pré-tratamento) epós-teste (ou pós-tratamento). Por vezes,
surge ainda um terceiro momento, mais longínquo no tempo e que pretende
verificar a estabilidade ou a permanência dos efeitos do tratamento (follow-up). Esta
avaliaçäo é particularmente valorizada em intervençöes dirigidos à modificaçäo de
comportamento ou à facilitaçäo de mudanças e aprendizagens, permitindo verificar
se os efeitos perduram no tempo ou se permanecem para além da duraçäo da
intervençäo.
Estes momentos de avaliaçäo, e sobretudo os do pré-teste e do pós-teste,
permitem-nos verificar se efectivamente alguma coisa mudou com a introduçäo de
certa condiçäo da variável independente ou com a intervençäo. Por exemplo, junto de
crianças com fobia à escola, podemos apreciar os efeitos de uma psicoterapia,
atendendo às avaliaçöes realizadas no começo e no final do tratamento. Por outro
lado, tomando a avaliaçäo dos grupos experimental e controlo, podemos verificar se
Metodologia da Investigaçäo em Psicologia e Educaçäo 81
a mudança ocorrida é atribuível ao processo terapêutica, ao intervalo de tempo
(durante a terapia poderäo ter ocorrido oportunidades diversas de acolhimento e de
adaptaçäo adaptadas pela professora, por exemplo) ou a ambas.
Acrescente-se que esse intervalo é particularmente importante na investigaçäo
psico-educativa. Por norma, esse intervalo sempre proporciona oportunidades de
aprendizagem para os sujeitos e, muitas vezes, as condiçöes e contextos sócio-
culturais de vida näo passíveis de controlo por parte do experimentador interagem
com as variáveis em estudo. Esse tempo ou intervalo é, ainda, tanto mais importante
quanto a investigaçäo considera crianças como sujeitos pois que passíveis de maior
e mais rápido desenvolvimento e maturaçäo, quanto maior o intervalo entre as duas
avaliaçöes, ou quanto maior a duraçäo do tratamento (Pinto, 1990, 109).
Antes de avançarmos para outro tópico gostaríamos de alertar para a näo
estrita necessidade de haver uma avaliaçäo inicial (pré-teste) na investigaçäo, mesmo
nos planos experimentais. Inclusive essa avaliaçäo pode ser desaconselhada pelos
efeitos reactivos que poderá ter no tratamento ou intervençäo. A salvaguarda da
objectividade e validade desses planos é conseguido nesses casos através de uma
única avaliaçäo de pós-teste no grupo experimental e no grupo de controlo (evi-
dentemente que este grupo deve ser de "verdadeiro controlo").
Grupos e momentos da avaliaçäo
Os estudos podem diferir entre si na forma como os respectivos planos
contemplam simultaneamente os grupos e os momentos da avaliaçäo. Assim, é
frequente falar-se em estudos transversais, longitudinais e sequenciais. Ligados
sobretudo a preocupaçöes com a avaliaçäo de resultados associados ao desenvolvi-
mento e à aprendizagem, estes estudos procuram fazer comparaçöes entre grupos
tendo em consideraçäo sobretudo as suas diferenças etárias. Por outras palavras, o
objectivo é avaliar os fenômenos psico-educativos nas suas mudanças e estabilidade
associadas com a variável tempo (Baltes & NeIsselroade, 1979, 2; Lemos, 1986).
Por estudos transversais entende-se a avaliaçäo comparativa de grupos
etariamente diferenciados, ou seja, utilizam-se vários grupos independentes retirados
de diversos níveis etários, comparando-se os seus resultados obtidos num dado
momento nas medidas utilizadas. As diferenças observadas säo interpretadas no
N@1
82 Procedimentos: planos e amostras
sentido da evoluçäo ou desenvolvimento havidos ao longo do tempo. O näo controlo
dos efeitos de geraçäo (por exemplo, as práticas educativas, as mentalidades, as
mutaçöes sócio-culturais) retira alguma objectividade na associaçäo de tais diferenças
exclusivamente ao factor idade.
Neste sentido, vários autores defendem ser o desenvolvimento e tais diferenças
melhor avaliados através de estudos longitudinais, ou seja, medidas repetidas numa
única amostra de sujeitos ao longo do tempo. Claro que aqui surge outro tipo de
dificuldades como, por exemplo, a morosidade do processo (uma geraçäo envolve no
mínimo 5 anos), os elevados custos envolvidos, os efeitos interactivos da testagem ou
avaliaçäo sucessiva e a mortalidade experimental no grupo tomado.
Para ultrapassar estas dificuldades, mais recentemente, os autores defendem
uma metodologia mista, ou seja os estudos sequenciais. Nestes estudos consideram-
se vários grupos etários independentes, contudo a avaliaçäo é feita em dois ou mais
momentos distantes no tempo (intervalo entre as avaliaçöes de acordo com o intervalo
de geraçäo tomado). Nestes últimos estudos podemos considerar simultaneamente
em análise as diferenças inter- e intra-individuais, por outras palavras um compromis-
so entre os dois tipos de estudos anteriores.
Método experimental
O método experimental tem servido de ponto de partida e de orientaçäo à
investigaçäo científica nas diversas ciências. Diríamos, em consonância, que ele deve
ser a meta a seguir na investigaçäo ou na produçäo de conhecimento científico em
qualquer área do saber. O que em Psicologia se designa por experiência científica, ou
seja uma situaçäo de "observaçäo objectiva de fenômenos que säo forçados a ocorrer
numa situaçäo rigorosamente controlada, e em que um ou mais factores säo manipu-
lados enquanto os restantes säo controlados ou mantidos sob condiçöes constantes"
(Zimmey, 1961), requer a salvaguarda dos aspectos apontados ao método experimen-
tal. No fundo, e isto está bem patente na definiçäo apresentada de "experiência
científica", trata-se de salvaguardar que:
(i) aobscrx,@tç,~to seja object i va, deNndendo Isso q ue r da qua h dade dos instrumentos
e dos procedimentos de niedida usados quer do Bitolo da situaçäo;
Metodologia da Investigaçäo em Psicologia e Educaçäo 83
(ií) os resultados fiffilis e as conclusöes a estabelecer assentem exclusivamente no
quadro da relaçäo entre a variável independente e variável dependente.
Três aspectos definem o que designamos por plano experimental ou também
plano verdadeiramente experimental (Arnal et aL, 1992, 102). Em primeiro lugar
podemos mencionar o facto de assegurar a manipulaçäo da variável independente e
a fixaçäo prévia dos seus valores. Em segundo lugar, implica dois ou mais níveis ou
valores na variável independente com o fim de se contrastar os efeitos da variável
dependente. Em terceiro lugar, a amostra será escolhida ao acaso. Por exemplo se a
variável independente se aplica a grupos independentes, estes devem aparecer àpriori
e aleatoriamente constituídos (garantir a homogeneidade ou equivalência), sendo os
valores da variável independente distribuídos ao acaso por qualquer um dos grupos
formados.
O que se pretende é que a variância dos resultados na variável dependente seja
exclusivamente, ou o mais possível, associada aos valores assumidos pela variável
independente. Desde logo, importa entäo controlar os efeitos cumulativos ou
interactivos de outras variáveis alheias ao procedimento, por exemplo, as variáveis
associadas às condiçöes em que decorre a investigaçäo: o experimentador, o contexto
experimental, e as demais características dos sujeitos.
Em primeiro lugar, consideremos as variáveis associadas ao experimentador.
Em várias investigaçöes os resultados obtidos poderäo encontrar-se afectados pelas
suas atitudes e expectativas em relaçäo aos resultados "desejados". Também os seus
traços físicos (idade, sexo, aspecto físico) ou sociais (estatuto, relaçäo estabelecido)
podem ser factor de erro associado às variaçöes provocados nos resultados. O
desempenho de crianças em testes pode aparecer diferenciado consoante o avaliador
pertence ou nao ao grupo étnico da criança (Labov, 1970).
Em segundo lugar, podemos falar em variáveis ligadas ao contexto experi-
mental. A sua influência ios dados pode ser vista, por exemplo, através da formal
como os sujeitos vivenciam as condiçöes do ambiente (luz, temperatura, ruído), as
condiçöes do experimento ou, por vezes ainda mais importante, a forma como eles
percepcionam a investigaçäo e nela desejam participar. Rumores prévios sobre a
investigaçäo, indícios iniciais ou as primeiras instruçöes podem proporcionar aos
sujeitos uma percepçäo do estudo e uma forma particular de nele "colaborar". Assim,
o sujeito pode ir mais de encontro ou contrariar os resultados "esperados" pelo
84 Procedimentos: planos e amostras
investigador, ou pode procurar deliberadamente padröes näo habituais de resposta,
por exemplo.
Por último, podemos falar em algumas variáveis mais directamente ligadas às
características dos sujeitos. A Psicologia e a Pedagogia foram inventariando um
conjunto de variáveis dos sujeitos que tendem a associar-se a diferenças nos seus
comportamentos. Referimo-nos à idade, à classe social, às habilitaçöes acadêmicas,
ao sexo ou, ainda, a variáveis já de índole psicopedagógica (inteligência, auto-
conceito, motivaçäo) e ao seu impacto na própria experiência. Por exemplo, alguns
sujeitos podem entusiasmar-se mais do que os outros pelo facto de participarem numa
investigaçäo, ou gostarem mais ou menos da novidade da situaçäo de investigaçäo em
que se encontram. Mesmo que nessas variáveis näo experimentais os grupos em
comparaçäo se näo diferenciem estatisticamente no pré-teste, tais diferenças individuais
ao nível dos sujeitos de um ou outro grupo podem ocasionar variaçöes nos resultados
finais näo directamente associadas à variável independente. Claro está que, se ao nível
do pré-teste tais diferenças eram já estatisticamente significativas, o grau de controlo
do experimento encontra-se ainda mais afectado.
Esta questäo remete-nos para a explicaçäo a dar à variância (S2) final dos
resultados na variável dependente e em que medida ela pode ser explicado pela
variável independente. A variaçäo total das pontuaçöes pode ser devida a Autuaçöes
constantes, sistemáticas ou experimentais (S 2 sistemática) e a outras irregulares ou
aleatórias (S2 de erro), sendo que a S2 sistemática refere-se à S2 explicado no quadro
do plano experimental. Os valores väo sempre numa determinada direcçäo e magnitude.
Nos planos factoriais (mais do que uma variável independente), os autores referem
duas fontes para o coeficiente de S2 sistemática: as variaçöes centradas na manipu-
laçäo da(s) variável(eis) independente(s) (S2primária) e as variaçöes associadas aos
efeitos interactivos das mesmas variáveis (S2 secundária). A S2 de erro diz respeito
às variaçöes da variável dependente devidas ao acaso, por exemplo às características
pessoais dos sujeitos, aos instrumentos de medida usados ou aos procedimentos
experimentais.
Num procedimento experimental o investigador deve procurar eliminar a
S2 de erro, já que pode induzir em erros importantes na parte das conclusöes. As
principais formas ao seu alcance passam pela constituiçäo dos grupos em comparaçäo
e pelo planeamento da própria avaliaçäo (momentos, instrumentos, impacto na
própria intervençäo). Na medida em que tal variância se explica, em primeiro lugar,
Metodologia da Investigaçäo em Psicologia e Educaçäo 85
pela presença de variáveis estranhas ou parasitas, o objectivo é procurar ter grupos
equivalentes em tais variáveis à partida. Dois métodos de constituiçäo dos grupos säo
frequentemente usados. Em primeiro lugar o da aleatoriedade na constituiçäo dos
grupos em relaçäo a tais variáveis supostamente importantes em face da natureza do
problema em estudo: quer os sujeitos a considerar se distribuem aleatoriamente pelos
grupos em formaçäo, quer estes väo ficar afectos aleatoriamente às várias condiçöes
do procedimento experimental. Para vários autores constituye elprocedimiento más
adecuado para controlar las variables extrafias conocidas y desconocidas que
proceden de los sujetos (Arnal et aL, 1992, 115). Se os indivíduos se distribuem
segundo as suas características intelectuais, motivacionais ou de personalidade de
uma forma aleatória pelos grupos, a nossa expectativa é que essas variáveis deixem
de explicar a variabilidade dos resultados que se verifica no final entre os grupos ao
nível da variável dependente. Os seus efeitos compensar-se-iam de grupo para grupo,
sendo possível considerá-los como equivalentes em tudo o mais excepto em relaçäo
à variável independente. Claro está que é mais fácil enumerar e compreender o
princípio que assegurá-lo na prática a 100%. Mais ainda, este procedimento é
sobretudo eficiente com grandes grupos e quando o recenseamento prévio da
populaçäo é efectivamente conseguido.
Noutras situaçöes, vários procedimentos ligados à selecçäo dos indivíduos
para os grupos podem seguir-se tendo em vista o controlo dos efeitos das variáveis
estranhas. Tal selecçäo dos sujeitos na formaçäo dos grupos, prévia à experimentaçäo
propriamente dita, visa tornar os grupos equivalentes excepto na variável indepen-
dente. O emparelhamento sistemático dos sujeitos nos grupos de acordo com tais
características é um dos métodos aconselhados. Também o contrabalanceamento ou
a equiparaçäo dos grupos pelas várias condiçöes experimentais pode ser um outro
recurso para o investigador.
Outra forma de referir os cuidados de controlo a ter numa investigaçäo é
centrar-nos nas variáveis em estudo. Em primeiro lugar, é necessário assegurar o
controlo da variável independente. Duas formas säo mais frequentemente usadas para
tal controlo: a manipulaçäo efectiva desta variável e a selecçäo dos sujeitos de acordo
com os valores que ela pode assumir. Em relaçäo à manipulaçäo da variável
independente, os autores consideram-na o método mais eficaz. Deliberadamente
variam-se as condiçöes ou os valores da variável independente e analisam-se os
efeitos daí decorrentes na variável dependente. Importa salientar que, no entanto,
existem situaçöes na Psicologia e na Educaçäo em que tal manipulaçäo näo é possível
86 Procedimentos: planos e amostras
e pode, inclusive, infringir princípios éticos a respeitar pelo investigador.
Nesta altura, o investigador pode ter como alternativa um segundo método, ou
sej a escolher os sujeitos para cada um dos valores da variável independente em funçäo
dos seus atributos ou características próprias, näo manipuladas experimentalmente.
Por exemplo, podemos näo manipular a classe social ou o sexo de um indivíduo para
apreciar o efeito destas variáveis no rendimento em provas de compreensäo meca-
nica, no entanto pode-se assumir a "manipulaçäo" da variável independente quando
nas análises se consideram os sujeitos de acordo com a classe social e o gênero dos
alunos, nomeadamente se a amostragem foi feita de uma forma correcta.
Um segundo aspecto a merecer o controlo do investigador tem a ver com a
variável dependente. Aqui o que está em causa é a sua mensurabilidade (vejam-se as
escalas de medida já atrás mencionadas), o rigor dessa medida (por exemplo,
considerar uma ou mais que uma medida), a qualidade métrica dos instrumentos, o
estado de conservaçäo de tais instrumentos ou, ainda, o momento em que tal medida
ocorre.
Em terceiro lugar, importa também cuidar do controlo das variáveis estranhas
ou variáveis parasitas à investigaçäo. Como já afirmámos antes, várias ocorrências
e influências procedentes de variáveis estranhas à investigaçäo podem ocorrer no seu
percurso. O controlo destas variáveis consiste em eliminar, ou igualar, a influência
possível de variáveis alheias aos objectivos da investigaçäo e, desse modo, tentar
assegurar que os efeitos na variável dependente possam ser exclusivamente atribu-
ídos à variável independente. Vários factores associados ao ambiente ou contexto
(por exemplo a luz ou a temperatura) ou aos sujeitos (por exemplo a inteligência ou
a motivaçäo) podem interferir na relaçäo a testar entre a variável independente e a
variável dependente. Uma análise bibliográfica num determinado domínio e problema
ajuda-nos a precisar tais factores e formas do seu controle.
Planosfactoriais
Quando os planos experimentais incluem mais do que uma variável inde-
pendente eles säo ditos factoriais ou multifactoriais. Neles se estabelecem todas as
combinaçöes possíveis dos níveis de cada uma das variáveis independentes. Por
exemplo, se o plano contempla duas variáveis independentes e cada uma com dois
níveis, entäo ele implica a existência de 2 x 2 grupos (4 grupos no final) de sujeitos
Metodologia da Investigaçäo em Psicologia e Educaçäo 87
para a combinaçäo completa das condiçöes experimentais (plano bifactorial). Por
exemplo, testamos o efeito do método de estudo (A) dos alunos (Al - método global
ou A2 - método analítico) conjuntamente com o tipo de reforço (B) dado pelos pais
ffil - alta ou B2 - baixa frequência). A investigaçäo implicaria desde logo a formaçäo
de 4 grupos. No quadro seguinte descreve-se um plano experimental desse tipo e os
efeitos passíveis de serem analisados.
Ouadro III.1 - Plano factorial (2 x 2) combinando método e reforço
A1 A2
1,3 a 1 b 1 @'2b 1
(G 1) (G3)
132 alb2 @ 1 2 1) 2
1 (G2) *;4)
Um plano deste tipo, permite-nos analisar três tipos de efeitos: (a) Efeitos
simples, (b) Efeitos globais ouprincipais, e (c) Efeitos de interacçäo ou secundários.
Por efeitos simples, referimo-nos aos efeitos dos níveis de uma variável independente
dentro de cada nível da outra variável. Por exemplo, o método (variável A) exerce dois
efeitos simples: o primeiro obtém-se comparando as médias de A no lQ nível da
variável ou factor B (G3-Gl) e o 29 efeito obtém-se comparando as médias de A no
segundo nível de B (G4-G2). O mesmo efeito pode ser calculado para a variável B.
Já os efeitosprincipais têm a ver com as influências ou efeitos globais de cada
variável independente por separado ou sem tomar em conta os valores que toma a
outra (tomar os 4 grupos 2 a 2 de acordo com a variável que se quer analisar, ou seja
olhando às linhas ou às colunas no quadro).
Por efeito3 de interacçäo ou secundários, consideram-se os efeitos decor-
rentes da interacçäo existente entre as duas variáveis independentes (os valores na
variável dependente estäo associados simultaneamente aos valores recíprocos das
variáveis independentes: os efeitos do método dependem também do tipo de reforço
atribuído). A interacçäo é significativa quando a diferença entre os efeitos simples de
uma variável é demasiado grande para ser atribuído ao acaso, sendo isso contrastável
através do cálculo da diferença das médias dos grupos nas diagonais [(Gl+G4) -
88 Procedimentos: planos e amostras
(G2+G3)] / 2 (na ausência de qualquer efeito secundário dever-se-ia obter um
coeficiente de zero ou muito próximo). Quando a interacçäo entre as duas variáveis
independentes näo se mostra estatisticamente significativa podemos depreender que
os respectivos efeitos factoriais säo aditivos, ou seja verifica-se uma mútua indepen-
dência.
Classificaçäo dos planos
Nem todos os planos se podem assumir como verdadeiramente experimentais.
No plano pré-experimental näo se manipula efectivamente a variável independente.
Isto näo significa que näo tenha ocorrido uma intervençäo, mas que apenas é
considerado o grupo da intervençäo. Também näo existe pré-teste, acontecendo
apenas a avaliaçäo no final do tratamento (daí a expressäo frequente de estudopost-
facto).
No esquema seguinte representamos este plano, em que X representa a in-
tervençäo e O o momento em que ocorre a avaliaçäo. Neste plano apenas se considera
um grupo de sujeitos (Gl) e um único momento de observaçäo (pós-teste). No final,
näo se sabe a que variáveis (independentes, parasitas) se podem atribuir os resultados
obtidos.
FGI X
No plano quase-experimental, como o próprio nome indica, verifica-se já
uma aproximaçäo ao plano experimental contudo näo se controlam ainda algumas
variáveis parasitas que confluem ou podem confluir com a variável independente, na
explicaçäo dos resultados. Alguns procedimentos ou tipos de estudos exemplificam
os planos quasi-experimentais: recurso a um grupo de comparaçäo (grupo näo
randómico), recurso a séries temporais de registo, e plano de correlaçäo intervalar
cruzada.
No primeiro caso, o investigador considera um grupo experimental ffil) e
um grupo de comparaçäo (G2) que, pelo facto de serem formados de forma näo
aleatória, näo se garante a equivalência dos grupos à partida. No final, as diferenças
observadas nos resultados entre o pré-teste (01) e o pós-teste (02) näo podem ser
Metodologia da Investigaçäo em Psicologia e Educaçäo 89
exclusivamente atribuídos à manipulaçäo da variável independente (X). Diversas
variáveis, como seja a selecçäo de grupos ou interacçöes diversas, näo se encontram
devidamente controladas.
GI 01. X 02
G2 01. 02
Nas séries temporais de registo, o investigador recolhe várias medidas da
variável dependente num momento anterior e posterior à intervençäo (o número de
registo deve situar-se em torno de 50 registos (Pinto, 1990, 140). As diferenças
encontradas nos resultados para os dois momentos de avaliaçäo näo podem, contudo,
serem exclusivamente atribuídos à variável independente. Algumas variáveis estranhas
(história, maturaçäo) podem contaminar os resultados.
01 02 Cb 04 05 ... X 01 (2 03 04
Finalmente, no caso do plano de correlaçäo intercalar cruzada,
existem no mínimo duas variáveis, obtidas no mesmo grupo de sujeitos mas
em dois momentos temporais diferentes. A utilidade e uso deste plano pren-
de-se com a análise de relaçöes bidireccionais entre variáveis. Por exemplo,
podemos questionar-nos se säo as aptidöes cognitivas mais e menos desen-
volvidas que levaräo os jovens a escolher áreas ou cursos mais ligados a
letras, a ciências, às tecnologias e às artes, ou se, pelo contrário, é a frequência
de tais vias alternativas de formaçäo que explica a diferenciaçäo e espe-
cializaçäo cognitivas dos sujeitos. Ainda, interessará questionar-nos se,
eventualmente, ambas as variáveis (área de estudos-X; aptidöes inte-
lectuais-Y) näo se aposentam interdependentes ao longo do tempo. Para es@a
última análise e ponderaçäo dos efeitos, os alunos poderiam ser avaliados
no começo do W ano e no final do 122 ano de escolaridade (V@ avaliaçäo -
T1; 2@I avaliaçäo - T2). Se, como neste caso, o plano incluir apenas duas
variáveis (X e Y) e dois momentos temporais (T1 e T2), teremos que
considerar seis correlaçöes diferentes tal como pode ser visualizado no quadro
que se segue (adaptado de Pinto, 1992, 143). Assim temos: duas correlaçöes
EL
90 Procedimentos: planos e amostras
sincrónicas: XT1 - YT1 e XT2 - YT2 (linhas verticais), duas correlaçöes diacrónicas:
XT1 - XT2 e YT1 - YT2 (linhas horizontais) e duas correlaçöes cruzadas: XT1 - YT2
e YT1 - XT2 (linhas diagonais).
No plano experimental, a manipulaçäo da condiçäo experimental é feita
através da constituiçäo aleatória de grupos de sujeitos para as várias condiçöes da
investigaçäo e, inclusive, para o grupo que serve de controlo. Um aspecto a salientar
nestes planos é que todos os grupos säo constituídos de forma randómica (R). Se os
grupos de intervençäo (grupo experimental) e de comparaçäo (grupos de controlo)
säo equivalentes, as diferenças que possam encontrar-se no pós-teste säo atribuíveis
à manipulaçäo da variável independente.
No esquema seguinte säo utilizados dois grupos randómicos (R), o grupo
experimental (Gl) e o grupo de controlo (G2). Os dois grupos säo avaliados ao mesmo
tempo em dois momentos distintos, antes (pré-teste) e após (pós-teste) a manipulaçäo
da variável independente. Uma vez que os grupos säo equivalentes no pré-teste (01),
as diferenças entre os dois grupos no pós-teste (02) podem ser atribuídas à manipu-
laçäo da variável independente.
(R) G1 01 X 02
(R) G 2 o1 O2
Um dos factores de erro, que este plano näo permite controlar diz respeito
à reactividade das medidas. A questäo que deixa em aberto tem a ver com o eventual
Metodologia da Investigaçäo em Psicologia e Educaçäo 91
efeito da avaliaçäo no pré-teste nos sujeitos e a "contaminaçäo" que provavelmente
exerce quer na variável independente quer nos resultados finais. O controlo do efeito
da avaliaçäo inicial pode ser feito através de um plano experimental simples em que
os dois grupos equivalentes (randómicos) apenas säo avaliados no momento do pós-
teste:
(R) G1 X 02
(R) G2 02
No plano Solomon o efeito da avaliaçäo inicial é também controlado pela
introduçäo de mais dois grupos (ambos sem a avaliaçäo do pré-teste). O esquema
deste plano, visto como o cruzamento dos dois anteriores, é descrito no esquema
seguinte:
(R) GI 01, X 02
(R) G2 01 02
(R) G 3 XO2
(R) G4 02
Este plano, como se depreende pelo esquema, permite-nos controlar o efeito
da testagem (ou pré-teste), nomeadamente os efeitos de interacçäo com o tratamento
(comparaçäo do grupo 1 e grupo 3) e com a avaliaçäo de pós-teste (comparaçäo do
grupo 2 e grupo 4).
Nas intervençöes psicológicas, por exemplo avaliaçäo de programas
psicoterapêuticos, existem planos experimentais de investigaçäo centrados em
sujeitos singulares. Em tais planos, procura-se avaliar o impacto de um tratamento ou
de uma condiçäo experimental no comportamento do sujeito. Dois planos experimentais
aparecem aqui descritos: o plano A- B- A e o plano A- B- A- B. Em ambos os casos,
a variável independente é manipulada (presença e suspensäo do tratamento; Pinto,
1990, 131) no mesmo sujeito. Avaliado o sujeito antes do tratamento (A ou linha de
base), introduz-se a condiçäo experimental (B) e avalia-se os seus efeitos, e por
último reintroduz-se a condiçäo/situaçäo anterior ao tratamento (A) e avalia-se. As
diferenças observadas nos resultados nos três momentos podem ser, entäo, atribuídas
92 Procedimentos: planos e amostras
à variável independente. No plano A - B - A - B, o sujeito termina a expe-
riência beneficiando novamente das vantagens do tratamento.
Método correlacional
Nem toda a investigaçäo em Psicologia e Educaçäo se orienta pelo modelo
experimental. Diremos que, num ou em mais do que um aspecto, a definiçäo anterior
näo se aplica. Por exemplo, fora dos contextos e dos temas mais trabalhados na
Psicologia Experimental, e muito particularmente fora do quadro Iaboratorial",
existem investigaçöes que näo possuem estes graus de controlo, de rigor ou de
causalidade inerente às relaçöes encontradas entre variáveis. Também em algumas
aplicaçöes da Psicologia, seja por razöes éticas seja por condicionalismos vários da
prática profissional ou da natureza dos fenômenos e das variáveis em presença, torna-
se impossível a aplicaçäo exaustiva dos elementos caracterizadores deste método,
pelo menos no momento histórico e na fase de desenvolvimento da "ciência
psicológica" em que nos encontramos. Por razöes diversas, inclusive por näo ser essa
a metodologia mais indicada, outros modelos de investigaçäo alternativos aoparadigma
experimental säo usados na Psicologia e Educaçäo Um desses paradigmas é conhecido
pela investigaçäo correlacional e/ou método diferencial, um outro é descrito por
estudos qualitativos que se situariam J a mais claramente no polo oposto do continuem
em relaçäo ao paradigma experimental.
Em relaçäo ao método correlacional de investigaçäo, podemos afirmar que
este se situa entre os métodos descritivos, ou simplesmente compreensivos da
realidade (estudos qualitativos), e os estudos experimentais. Em relaçäo aos primeiros
ele consegue ir para além da mera descriçäo dos fenômenos, pois o investigador
consegue já estabelecer relaçöes entre as variáveis, quantificando inclusive tais
relaçöes. Ern relaçäo aos segundos, no entanto, näo consegue estabelecer significado
de causalidade ao nível das relaçöes encontradas.
O termo usado para designar este método decorre do tipo de análises ou de
medidas utilizadas no estudo das variáveis e dos fenômenos. Por exemplo, o termo
correlacional parte da metodologia mais frequentemente utilizada: o estudo das
relaçöes entre variáveis, ou seja, os coeficientes de correlaçäo. O termo diferencial,
com que esta abordagem aparece também identificado, parte do facto de que os
Metodologia da Investigaçäo em Psicologia e Educaçäo 93
estudos consideram neste caso as diferenças de resultados entre grupos ou entre
condiçöes para análise da relaçäo entre variáveis. Embora o estudo das diferenças de
médias ou de frequências, em termos estatísticos, se diferenciem do estudo das
correlaçöes ou do grau de associaçäo entre variáveis, podemos afirmar a sua mútua
interdependência: se näo existir qualquer relacionamento entre duas variáveis tam-
bém näo é possível encontrar diferenças sistemáticas nos valores de uma em funçäo
dos valores da outra, e vice-versa.
A análise das correlaçöes entre variáveis define o tipo de estudos inerentes ao
método correlacional de investigaçäo em Psicologia e Educaçäo. Em termos de
intensidade importa afirmar que a grandeza estatística do coeficiente de correlaçäo
entre duas variáveis pode oscilar entre -1.00 e +1.00. Um valor de zero significa
ausência de correlaçäo, sendo essa correlaçäo mais perfeita à medida que se aproxima
da unidade. Neste caso, ela pode ser positiva (+1.00) ou negativa/inversa (-1.00)
conforme as oscilaçöes dos resultados nas duas variáveis ocorram no mesmo sentido
(por exemplo, a relaçäo entre a motivaçäo e a aprendizagem), ou em sentido inverso
(por exemplo, a relaçäo entre o número de faltas às aulas e o rendimento escolar).
Assim, no coeficiente de correlaçäo importa atender quer à sua grandeza (intensidade
da relaçäo) quer ao seu sentido (direcçäo). Ambos os parametros säo autónomos,
descrevendo a força e o sentido da interdependência dos valores nas variáveis.
O coeficiente de correlaçäo entre duas variáveis remete-nos para o coeficiente
de determinaçäo (r2 = % de variância de uma variável que pode serprevista a partir
do conhecimento dos resultados na segunda variável; ou parte comum da variância
dos resultados em duas variáveis). Importa salientar, que estamos em presença de um
coeficiente de previsibilidade e näo de um coeficiente explicativo da natureza da
relaçäo entre as variáveis" (Pinto, 1990, 16). O significado de previsäo näo pode ser
tomado como explicaçäo e, daí, encontrar uma relaçäo de previsibilidade näo
significa encontrar uma relaçäo de causa-efeito. Aqui podemos assumir mais claramente
a distinçäo entre a metodologia correlacional e a metodologia experimento-] na
investigaçäo em Psicologia: "se os estudos correlacionais permitem o estabelecimento
de previsöes é errado supor que o índice de correlaçäo obtido forneça uma prova da
causalidade (... ) a determinaçäo da causa de um fenômeno só é possível a partir da
investigaçäo experimental" (Pinto, 1990, 62).
É evidente que a correlaçäo se pode assumir como um dos aspectos da
causalidade. Para que uma variável ou fenômeno seja a causa de outra(o), os
94 Procedimentos: planos e amostras
respectivos valores devem encontrar-se associados. O facto de num estudo correlacional
podermos näo atingir na sua essência todas as explicaçöes possíveis para os fenômenos,
e näo manipularmos sistematicamente as condiçöes ou os valores da variável
independente, impede-nos de avançar para a explicaçäo de tipo causal entre variáveis
e fenômenos. Algumas vezes, a relaçäo encontrada entre duas variáveis näo se explica
ou pode ser reduzida ao impacto de uma na outra; frequentemente uma terceira
variável pode explicar a relaçäo entre as duas variáveis estudadas (registe-se que esta
situaçäo foi frequente na tradiçäo diferencial da investigaçäo psicológica). Essa
terceira variável, intermediária ou parasita (concorrente ou estranha), afecta os
resultados de uma ou de ambas as variáveis em estudo, impedindo qualquer tentativa
por parte do investigador em explicar os fenômenos em termos de causalidade.
Refira-se que estas variáveis nem sempre säo de fácil controlo, mesmo na investigaçäo
experimental. O investigador deve assumir algumas precauçöes nas conclusöes que
tira ou que deixa em aberto tomando os dados da sua investigaçäo.
Dentro dos estudos correlacionais podemos mencionar aqueles em que se
consideram, simultaneamente, diversas variáveis independentes e as respectivas
correlaçöes com a variável dependente. Nesta altura falamos em correlaçöes múlti-
plas e em análise da regressäo. Trata-se de procedimentos bastante explorados em
determinados campos de aplicaçäo da Psicologia (por exemplo selecçäo profissional,
orientaçäo vocacional), procurando-se obter equaçöes de prediçäo do critério tomando
vários indicadores (predictores ou variáveis independentes). Finalmente, alguns
modelos estatísticos, como o linear structural relations (LISREL) pretendem
avançar na explicaçäo de alguma causalidade entre variáveis, mesmo em investigaçöes
näo inseridos nos planos experimentais.
Métodos qualitativos
As origens destes métodos säo anteriores ao método experimental-
positivista, contudo a sua força recente pode ter a ver com novas preocupaçöes da
investigaçäo nas Ciências Sociais e Humanas. Por exemplo, a fenomenologia tem
sido uma das fontes mencionada para o reforço e interesse crescente pelos métodos
qualitativo-interpretativos de análise. Três dos seus princípios reforçam a pertinência
e a necessidade de uma postura interpretativa dos comportamentos e fenômenos
sociais:
Metodologia da Investigaçäo em Psicologia e Educaçäo 95
(iy'@'i"'pri'n ia'z'ia da experiência subjectiva como fonte do cónheéím:ento;::::::::::::.::::.
(ii) o estudo dos feriómenos a partir da perspectiva do outro oli respeitando os seus:..
marcos de referência: e
(iii) o interesse em se conhecer a fornia conio as pessoas experienciam
iíiterpretanioriiuiidos(.)cl@tlquel@inil)éniac@ibam[X)reonstruirinteractiv Ment
Alguns destes tópicos säo retomados ou melhor explicitados por outras
correntes de pensamento. Nos nossos dias, retomam-se na Psicologia as significaçöes
pessoais dos fenômenos, as suas representaçöes, a natureza interactiva da sua
construçäo e a necessidade de se colocar na perspectiva do outro como condiçäo
prévia ao conhecimento e à explicaçäo do seu comportamento (Simöes, 1990). De
novo os processos internos e as simbolizaçöes ganham espaço na investigaçäo
psicológica e, desta forma, integra-se na investigaçäo as dimensöes internas dos
sujeitos, dos grupos ou das organizaçöes, ou os seus aspectos näo directamente
observáveis nem susceptíveis de experimentaçäo. Reconhece-se que as pessoas
interagem em funçäo dos significados que as coisas, as outras pessoas e as condiçöes
têm para elas, sendo tais significados produzidos pela própria interacçäo e interpretaçäo
do sujeito.
Outro aspecto comum às várias correntes metodológicas que podemos incluir
dentro da metodologia qualitativa, é a busca da globalidade e da compreensäo dos
fenômenos ou seja um enfoque de análise de cariz indutivo, holístico e idiográfico.
Por outras palavras, estuda-se a realidade sem a fragmentar e sem a descontextualizar,
ao mesmo tempo que se parte sobretudo dos próprios dados, e näo de teorias prévias,
para os compreender ou explicar (método indutivo) e se situa mais nas peculiaridades
que na obtençäo de leis gerais.
Em consonância com o exposto integram-se aqui um conjunto de metodologias
de recolha e de análise dos dados bastante mais diverso e mais flexível comparati-
vamente ao planeamento e à prossecuçäo da investigaçäo tipicamente experimental
anteriormente descrita. Por exemplo, os planos säo mais flexíveis e podem pro-
gressivamente adequar-se à fase em que se encontra a investigaçäo. Por sua vez, as
técnicas de recolha dos dados podem diversificar-se no tempo e de acordo com as
condiçöes existentes num dado espaço e tempo, podendo recorrer-se a métodos mais
informais e menos quantitativos de avaliaçäo, por exemplo, a entrevista, o registo
96 Procedimentos: planos e amostras
directo, a observaçäo participante ou a análise de documentos, entre outros. Neste
quadro torna-se difícil antever a defesa e a aplicaçäo dos princípios anteriormente
apontados de objectividade e validade, recorrendo-se frequentemente a métodos de
triangulaçäo e de contrastaräo subjectiva tendo em vista a consistência da própria
informaçäo recolhida e das interpretaçöes produzidas.
Populaçäo e amostras
Falámos já que uma investigaçäo é dirigida à testagem de hipóteses e que se
pretende, ao definir um plano de investigaçäo, criar as condiçöes para que os dados
obtidos sejam significativos para o problema em questäo. Tal significância passa
indubitavelmente pela qualidade das amostras tomadas, ou seja, junto de quem foi
realizada a investigaçäo. O valor científico dos resultados deve ser independente dos
sujeitos que foram tomados e avaliados. Decorre daqui que os resultados devem estar
o mais possível associados às condiçöes experimentais da investigaçäo e à sua
manipulaçäo. Se os dados podem ser explicados, ou ser meramente atribuídos às
singularidades dos sujeitos tomados, entäo eles näo contribuem para responder à
hipótese formulada.
Assim, aspecto essencial numa investigaçäo é a definiçäo da amostra oudos
grupos de sujeitos a considerar. Dois factos condicionam este ponto na planificaçäo
de uma investigaçäo. Por um lado, a impossibilidade e desinteresse em serem
considerados todos os indivíduos, em segundo lugar a necessidade de, näo sendo
tomados todos os indivíduos, mesmo assim os resultados poderem ser generalizados.
Na investigaçäo científica, por norma, recorre-se a amostras extraídas de populaçöes
às quais se querem depois generalizar os resultados. As amostras a tomar devem,
entäo, possuir certas características como forma de se constituírem em boas repre-
sentaçöes das populaçöes de onde foram retiradas.
Conceito de populaçäo, amostra e sujeito
Alguns conceitos merecem ser desde já clarificados. Em primeiro lugar o
conceito de universo. Ele diz respeito a todos os sujeitos, fenômenos ou observaçöes
passíveis de serem reunidas como obedecendo a determinada característica. De
seguida, podemos falar em populaçäo, significando esta o conjunto dos indivíduos,
Metodologia da Investigaçäo em Psicologia e Educaçäo 97
casos ou observaçöes onde se quer estudar o fenômeno. Regra geral é difícil definir
o universo nas Ciências Sociais e Humanas, pelo que o nosso ponto de partida se situa
geralmente ao nível dapopulaçäo. Segue-se o conceito de amostra, ou seja, o con-
junto de situaçöes (indivíduos, casos ou observaçöes) extraídos de umapopulaçäo.
Finalmente chegamos aos casos individualmente tomados e, tratando-se de indivídu-
os, o termo mais usado é o de sujeito, reportando-nos já a cada um dos elementos que
compöe a amostra.
Estamos aqui a analisar a questäo de junto de quem o investigador vai realizar
a investigaçäo. Por outras palavras, interessa saber qual vai ser a sua populaçäo-alvo.
Por razöes de tempo, dinheiro, acessibilidade e desinteresse estatístico näo faz sentido
trabalhar com a populaçäo mas tomar apenas uma amostra. Em qualquer ciência, o
recurso da investigaçäo a amostras de acontecimentos ou de indivíduos é prática
corrente. É economicamente inviável, estatisticamente desnecessária e humana-
mente impossível considerar na investigaçäo todos os indivíduos (Miranda, 1983).
Outro procedimento levaria a que, quando se concluísse a observaçäo do universo, já
os primeiros dados estariam desadequados, ou que para testar algo se tivesse que
incomodar toda a gente. Assim como para se apreciar um bolo se pode provar apenas
uma fatia ou se inutiliza apenas um número determinado de peças para se avaliar da
robustez de uma série de peças produzidas, também nos estudos envolvendo popu-
laçöes e grupos humanos o procedimento da amostragem tem sido usado com sucesso
na investigaçäo.
Podemos aceitar que "a amostragem é um processo utilizado há muitos anos,
baseando-se na experiência e na intuiçäo da ideia de que uma amostra pode informar
sobre as propriedades do universo" (Murteira & Black, 1983, 8). A alternativa é a
observaçäo de uma parte ou subconjunto do universo - uma amostra. Tal processo
implica, no entanto, que se salvaguardem algumas características. A mais importante
é que a amostra represente a populaçäo de que é proveniente.
Processos e tipos de amostras
A constituiçäo de amostras é prática corrente na investigaçäo em geral. Claro
está que algumas vezes é difícil definir-se a populaçäo. Nesta altura, será fácil de
antever algumas dificuldades em representar umapopulaçäo vagamente definida ou
mal delimitada numa amostra. Este é um dos problemas frequentes da investigaçäo
nas Ciências Sociais e Humanas.
W
98 Procedimentos: planos e amostras
O processo para se chegar à definiçäo de uma amostra designa-se amostragem.
Em termos de metodologia científica esse processo deve possuir certos requisitos de
modo a garantir a validade dos resultados e a possibilidade dos mesmos serem
generalizados a uma populaçäo. Esse processo pode orientar-se por princípios
probabilísticos ou näo probabilísticos. Diremos que, no primeiro caso, os
procedimentos conduzem a "verdadeiras amostras", assumidas estas na sua proba-
bilidade de representarem uma populaçäo. No segundo caso, os procedimentos
usados formam mais grupos do que verdadeiras amostras. Ao nível dos
procedimentos probabilísticos podemos referir:
. ......... ................
(i) o método de amostragem aleatório simples (a modalidade mais conhecida e que
alcança maior rigor científicoao permitir que qualquer indivíduo possuaa mesma
probabilidade de inlegrar a amostra e a saída de uni näo afecta a probabilidade de
saída dos restarites - aniostra refirada ao acaso);
(i]) a aniostragem sisteniálica (obtendo-se um coeficiente do quociente do efectivo
ela populaçäo sobre o da aniostra, retiram-se os sujeitos através dos números
a]Cat@)riOs COUICIdentes Com esse Intervalo - Ni`n=intervalo ele sujeito ao longo do
contínuo a retirar);
(iii) a ;ii-n@)sir@tLØeiii estratificada (Lisa-se quando a populaçäo está estratificada por
gf-ul-x)s lioniogéneos Com rCsl-x@iIo à característica que se estuda, melhor ainda
quando dentro de cada estreita os sujeitos säo retirados ao acaso simples ou
sisteiii@ític(.). o n de cada estrato pode ser prol-x)rcional ou entäo de fixaçäo simples
ou Constante).,
(iv) a aniostraIgem 1->or grupos (aniostra tomando näo os indivíduos singulares mas
grui-ms em que a populaçäo se encontrei organizada. rx)r exemplo, tomando os
distriios de um país ou as turmas nuni (lado ano de escolaridade); e,
(v) a aniostra,,e111 I-X)Helápica (feita em múltiplas etapas. por exemplo distrito,
concelho, escola e iurnia, havendo ou näo aniostraoem aleatória em cada uma
des,,as fases).
Alguns tipos de amostras säo mais referendados na literatura, sendo igual-
mente os que mais säo utilizados na investigaçäo em Psicologia e Educaçäo.
Referimo-nos às amostras aleatórias e às amostras estratificadas, bem como à sua
combinaçäo. Estas säo as que mais garantias nos oferecem de representar uma dada
populaçäo.
Metodologia da Investigaçäo em Psicologia e Educaçäo 99
Amostras aleatórias simples
A forma mais simples de obtermos uma amostra representativa de uma
populaçäo é a sua obtençäo totalmente ao acaso. Falamos, entäo, de amostra alea-
tória, randómica ou ao acaso (diferente de amostra ocasional). Este é o método mais
frequentemente empregue nas Ciências Sociais e Humanas, e tem em vista evitar
amostras viciadas (Murteira & Black, 1983). Após uma definiçäo/precisäo da
populaçäo, o carácter aleatório da amostra obriga a que: todo o sujeito tenha igual
probabilidade de integrar a amostra; a selecçäo de um sujeito näo interfere ou
condiciona a selecçäo do sujeito seguinte (veja-se o que acontece ao retirarmos
aleatoriamente 10 cartas de um baralho de 40).
É evidente que a expressäo "amostra aleatória ou ao acaso" está longe de
significar selecçäo directa, descuidada ou casual. Os dois pontos anteriores implicam
cuidados prévios por parte do investigador e, só dessa forma, podemos defender o uso
e o valor científico deste método de amostragem para assegurar a representatividade
de uma amostra em relaçäo a uma populaçäo. Outros cuidados complementares
podem ter-se nesse esforço de representatividade. As características observadas nesta
amostra podem mais facilmente generalizar-se à populaçäo quanto mais se aproxi-
mam os Ns (número de sujeitos) da amostra e da populaçäo. Em segundo lugar, tal
representatividade será melhor conseguido se paralelamente se atender aos estratos
mais significativos dessa populaçäo (n em funçäo dos estratos populacionais, defi-
nindo-se estes em funçäo da respectiva pertinência para o estudo em questäo).
Finalmente, a representatividade será tanto mais conseguido quanto mais se conse-
guir manter a aleatoriedade quer no momento da recolha dos sujeitos, quer ao longo
da intervençäo, ou seja, na sua participaçäo efectiva.
As amostras aleatórias simples apresentam algumas vantagens, como os
menores custos envolvidos e o facto de tenderem a assegurar amostras representativas
e, também, estatisticamente significativas;. Dependendo do n utilizado, este método
evita qualquer tendenciosidade consistente numa amostra. Além disso, para além de
um método fácil e económico, por vezes apresenta-se ao investigador como o único
possível. As suas desvantagens, por outro lado, decorrem do näo conhecimento
minucioso dos estratos da populaçäo à partida e, logicamente, da näo distribuiçäo
equitativa destes na amostra formada. Acontece, ainda, que nas Ciências Sociais e
Humanas se torna frequentemente difícil especificar ou "recensear" os indivíduos na
100 Procedimentos: planos e amostras
sua globalidade, muito menos fazê-lo de acordo com as suas categorias de pertença
(estratos).
De entre as amostras aleatórias, por vezes já contemplando alguma
estratificaçäo, refira-se as listas de pessoas ou o procedimento do painel (amostra
aleatória de pessoas que é seguida ao longo do tempo). Este tipo de amostra é muito
usado nas sondagens e nos estudos, nomeadamente envolvendo uma análise evolutiva
da opiniäo pública. Inicialmente a lista é escolhida aleatoriamente e, a partir de entäo,
é seguida "longitudinalmente" no tempo. Este procedimento apresenta a vantagem de
uma maior precisäo comparativa do que aquela que seria possível obter através do
recurso a escantilhöes independentes sucessivos. Aparece particularmente valoriza-
do em Psicologia Social quando se pretende estudar o impacto na opiniäo pública de
um determinado acontecimento (avaliaçäo feita antes e após a sua ocorrência). Além
disso, dado o anonimato dos sujeitos nestes estudos, o procedimento parece garantir
um maior aprofundamento dos resultados e das análises quando necessário. As
desvantagens, neste caso, passam pela perda do carácter aleatório com o tempo
(mudanças de residência, desistências) ou pelo eventual enviesamento nos resultados
introduzido pelos próprios sujeitos ao sentirem a sua importância para o estudo em
que participam ou para as implicaçöes que daí decorrem (vejam-se ospainéis usados
antes das eleiçöes para análise das tendências de voto).
Finalmente, convém distinguir entre selecçäo aleatória e distribuiçäo ale-
atória dos sujeitos. No primeiro caso, está sobretudo em causa o processo de recolha
dos indivíduos (amostragem), enquanto no segundo está em causa a sua distribuiçäo
por grupos (por exemplo, na formaçäo do grupo controlo e do grupo experimental).
Assim, ambos os procedimentos näo säo coincidentes no tempo. Por exemplo, o facto
dos indivíduos serem aleatoriamente distribuídos nada diz quanto à sua
representatividade da populaçäo de origem ou de partida. Este é um erro frequente em
alguns projectos de investigaçäo-acçäo que incluem a avaliaçäo da sua eficácia. Com
frequência se anuncia a intervençäo e se abre um período de inscriçöes. De seguida,
e de forma aleatória, os sujeitos inscritos säo distribuídos pelo grupo experimental e
pelo grupo controlo. A questäo que, neste caso, fica obviamente por responder é se
os sujeitos num e noutro grupo podem ser assumidos como amostras aleatórias da
populaçäo. Por norma näo o säo. A vontade de livremente participar num dado
programa difere de sujeito para sujeito numa populaçäo em funçäo de múltiplos
aspectos como os objectivos, as exigências de tal participaçäo ou os condicionalismos
de tempo e de espaço requeridos. Esse facto, no entanto, näo afecta a comparabilidade
Metodologia da Investigaçäo em Psicologia e Educaçäo 101
dos dois grupos formados. Estamos face a um exemplo em que validade interna e
vaidade externa se poderiam visualizar como näo coincidentes. A primeira está
salvaguardada (os dois grupos säo comparáveis), a segunda näo está garantida (os
dois grupos podem näo representar a populaçäo e näo ser possível generalizar a ela
os resultados da investigaçäo).
Amostras aleatórias estratificadas
A estratificaçäo de uma populaçäo e a sua posterior distribuiçäo numa
amostra representativa tende a assumir-se como o método mais preciso de amostragem.
Constituem-se grupos aleatórios de indivíduos respeitando a sua frequência no
universo populacional em diferentes categorias. A distribuiçäo dos sujeitos na
amostra é em tudo equivalente ou paralela à distribuiçäo encontrada na populaçäo.
Aplica-se quando a populaçäo pode ser dividida em estratos ou subgrupos de acordo
com as variáveis em análise e quando o recenseamento dos indivíduos nesses estratos
se encontra viabilizado. A equivalência é garantida por dois aspectos:
obediência às quotas ou à percentagem de sujeitos em cada estrato e sua.---
mútua interdependência,
os sujeitos säo aleatoriamente integrados na amostra, respeitando-se os dois:
po
trás pontidossobreornétodoalcat(@riosimplesdeconstituiçäodas@@.,@
ritos a a
amostras.
Existem algumas dificuldades e, logicamente, algumas oscilaçöes introduzidos
nos estudos em relaçäo a estes dois pontos. Por exemplo, na aferiçäo de instrumentos
de avaliaçäo psicológica junto de populaçöes estudantis, a estratificaçäo da popula-
çäo e da amostra pode ser feita com base em registos do Ministério da Educaçäo, mas
os sujeitos säo aleatoriamente seleccionados ao nível do grupo-turma (geralmente o
n a tomar é elevado, näo sendo viável outra forma de agir em face da organizaçäo das
escolas ou um procedimento diferente teria custos materiais e humanos demasiado
elevados). Por outro lado, em algumas investigaçöes recorre-se a uma estratificaçäo
proporcional ou por optimizaçäo da escolha. Neste caso, considera-se a variabilidade
dos indivíduos de um determinado estrato no comportamento em estudo para se
102 Procedimentos: planos e amostras
aumentar ou diminuir os efectivos desses estratos nas amostras (n mais elevado
quanto maior a variabilidade no comportamento)-
Representatividade e significância das amostras
Duas questöes se colocam mais frequentemente às amostras nas investigaçöes:
a sua significância e a sua representatividade. Pela primeira, entende-se os efectivos
da amostra (o seu número) e, pela segunda, a sua qualidade (o método de amostragem).
Embora os dois conceitos apareçam, algumas vezes, como sendo coincidentes, näo
o säo. Se a representatividade de uma amostra implica também a existência de uma
amostra significativa, nem sempre uma amostra com um N significativo de sujeitos
ou observaçöes se pode considerar representativa da populaçäo.
A representatividade de uma amostra é essencial ou a condiçäo mais importante
numa investigaçäo, nomeadamente quando se pretende generalizar os resultados
obtidos com uma amostra à populaçäo. Para que tal generalizaçäo seja possível, é
necessário que a populaçäo se encontre "reflectida" na amostra considerada. A
representatividade de uma amostra numa investigaçäo requer a salvaguarda de alguns
princípios ou tem as suas exigências próprias:
(i) o conhecimenio previo (Ia.,; c;ir@icierísticis da íx)Ixilaç,äo relevantes para o estudo
em questäo:
(ii)oconhecifilcill() da (11s11.11)Luçám da rx)pijliç@-io Ix>r taiscaracterísticas ldentificadas
(variáveis), e,
(iii) a utilizei de iiiii procedimento correcto de aim)strageni (veja-se os pn)cedi-
mentos deiiiiosti,;i,,cni pr(lhabilísticos antes enunciados).
...........
. .........
Algumas investigaçöes psicológicas, ao näo serem feitas junto de amostras
representativas, perdem no final alguma capacidade explicativa dos fenômenos.
Julgamos que, näo sendo possível o recurso a planos verdadeiramente experimentais
nalgumas pesquisas, seria interessante que tal limitaçäo fosse de algum modo
compensada através da utilizaçäo de amostras representativas. Erradamente, tende-
se a optar pelo método aleatório de amostragem como procedimento para obtençäo
Metodologia da Investigaçäo em Psicologia e Educaçäo 103
de uma amostra representativa. Apesar das vantagens do método aleatório simples,
e de tendencialmente garantir resultados satisfatórios, näo podemos assumir tal
propriedade como absoluta. Na realidade, näo é possível termos a garantia total de que
uma amostra ao acaso seja, de imediato, representativa da populaçäo. O carácter
representativo de uma amostra deve colocar-se sempre em termos relativos ou
probabilísticos. Näo é possível defendê-lo em termos absolutos. Como noutras
situaçöes näo se trata de uma questäo "tudo-ou-nada". As probabilidades de uma
maior representatividade da amostra säo conseguidos quando: o n tomado na inves-
tigaçäo é elevado e traduz em percentagem os estratos da populaçäo previamente
identificados; e quando os indivíduos säo seleccionados aleatoriamente.
Uma segunda questäo prende-se com o tamanho da amostra, ou seja a sua
significância. Näo é fácil nas Ciências Sociais e Humanas definir quantos sujeitos
deve possuir uma amostra para que a mesma seja significativa. Claro está que esse
número deve ser compatível com a representaçäo da populaçäo, ou seja, a amostra
deve ser suficientemente grande para garantir a representatividade. A estimativa do
tamanho da amostra pode ser feita tomando a definiçäo prévia do nível de confiança
e do erro de estimativa. Algumas tabelas permitem-nos determinar o tamanho da
amostra e o nível correspondente de confiança face ao N da populaçäo. Para estimar
o tamanho da amostra necessitamos conhecer o nível de confiança que queremos que
os dados possuam (geralmente opta-se por um nível de confiança de 95 ou 99%, e um
erro de estimativa máximo de 5% ou 1%). De acordo com Krejcie e Morgan (1970)
é possível ter uma estimativa do valor de n da amostra, conhecido o N do universo,
para uma probabilidade de erro nunca superior a 5%. No quadro III.2 sintetizamos
alguns dos valores para o tamanho da amostra em funçäo do N na populaçäo.
Quadro 111. 2 - Estimativa do n da amostra em funçäo do N da populaçäo
(adaptado de Krejcie & Morgan, 1970)
N Populaçäo :t n Amostra N Populaçäo ii Amostra N Populaçäo n Amostra
1 M 80 (M 230 1500 320
200 130 700 245 2000 330
300 165 8M 200 -300 350
400 M IMO 270 5000 360
215 1 oO 2M 1 ** 370
104 Procedimentos: planos e amostras
Como podemos observar, quando o efectivo da populaçäo é inferior a 100,
o efectivo da amostra exigido é praticamente coincidente com o da populaçäo. A
medida que avançamos nos efectivos da populaçäo verificamos que o aumento
exigido no n da amostra vai-se tornando menos perceptível. Assim, podemos afirmar
que o n da amostra aumenta à medida que o N da populaçäo é mais elevado, sendo,
no entanto, esse aumento representado por uma curva algorítmica e näo linear.
Ao tomarmos os resultados obtidos junto de uma amostra é possível defender
que eles näo säo coincidentes com os valores reais na populaçäo. O erro de amostragem
define-se, precisamente, como a diferença entre o parâmetro numa populaçäo e o
parâmetro estatístico de uma amostra. Os erros de amostragem, logicamente, surgem
quando em vez de tomarmos uma populaçäo tomamos uma amostra. Estes erros säo
devidos a dois factores principais: o erro de representatividade (a amostra näo é
representativa) e o erro aleatório (devido ao acaso da amostragem). A estimativa, e
logicamente o maior controlo do erro de amostragem, pode ser feita através da análise
dos resultados por subamostras (subsamples) e re-amostras (resamples) em que se
divida a amostra final a considerar.
Estudos de grupo e caso único
Existem também métodos näo probabilísticos de amostragem. Säo métodos
que poderäo apresentar algumas vantagens específicas para o estudo de um determi-
nado assunto, mas perdem desde logo qualquer possibilidade de generalizaçäo dos
dados e das conclusöes obtidas para outras situaçöes ou amostras para além daquelas
em que a investigaçäo se concretizou.
Em Psicologia e Educaçäo recorre-se muitas vezes ao estudo de grupos e näo
de amostras, sobretudo quando näo se tem como objectivo abarcar as características
de uma populaçäo ou a generalizaçäo dcs resultados. Esse procedimento é ainda
frequente em estudos exploratórios. Contudo, se isto pode explicar o largo recurso a
grupos na Psicologia Social, Clínica e Escolar por ser difícil definir a populaçäo, no
caso da Psicologia Experimental essa larga utilizaçäo dos grupos j ustifica-se em face
dos objectivos da investigaçäo e de outras condiçöes de controlo que os experimentos
conseguem salvaguardar. A diferenciaçäo entre grupos e amostras de sujeitos prende-
se, por um lado, com o número de efectivos considerados (menor, em geral, no caso
Metodologia da Investigaçäo em Psicologia e Educaçäo 105
dos grupos) e, por outro, com a metodologia de amostragem seguida (menos aleatória
no caso dos grupos).
Constituiçäo dos grupos
Podemos começar por afirmar que duas atitudes ou procedimentos podem
seguir-se no momento da construçäo dos grupos de sujeitos a tomar numa investiga-
çäo. Um primeiro consiste em prescindir de qualquer cuidado ou intençäo específica
e, nessa altura, os grupos säo formados por todos os que responderam afirmativamente
e colaboraram na investigaçäo (grupo tout venants). Este procedimento é conhecido
por amostragem acidental ou incidental. Os sujeitos que em determinado momento
se encontram em determinado local ou a realizar determinada tarefa (ou qualquer
outra condiçäo) väo constituir o(s) grupo(s) a observar.
Um segundo procedimento, mais intencional, consiste na escolha prévia dos
sujeitos a serem observados. Por exemplo, podemos pensar que os jornalistas
constituem um grupo por excelência para opinar sobre um dado acontecimento
político. Nessa altura pode näo interessar incluir outros indivíduos. Também pode-
mos pensar que as "donas de casa" seräo as pessoas por excelência para opinar sobre
a qualidade de um detergente. Neste caso poder-se-á ir a um centro comercial a meio
da manhä e ouvir apenas este grupo. Falamos, entäo, de amostras intencionais ou de
um método intencional de amostragem. Aceita-se, aqui, que determinado grupo de
indivíduos "representa" particularmente bem determinado fenômeno, opiniäo ou
comportamento e, por esse facto, säo escolhidos para o seu estudo. O rigor deste
método aumenta quando alguma aleatoriedade for possível introduzir na constituiçäo
dos grupos.
Grupos em Psicologia Experimental e em Psicologia Diferencial
Em Psicologia Experimental, como afirmamos, recorre-se frequentemente a
grupos e näo a amostras. Claro está que alguns cuidados säo norma corrente nessas
investigaçöes. Por exemplo, se o experimento inclui mais que uma condiçäo experi-
mental, os sujeitos säo previamente reunidos e só depois säo repartidos aleatoriamen-
te por dois ou mais grupos a considerar na investigaçäo em causa. Este procedimento
106 Procedimentos: planos e amostras
é algumas vezes designado como método de equivalência por randomizaçäo e, fre-
quentemente, proporciona grupos equivalentes. Esta equivalência pode mais facil-
mente ser atingida se, para as características achadas mais importantes no estudo em
causa, os sujeitos forem previamente identificados procedendo-se depois ao seu
emparelhamento aleatório nos grupos a formar.
Em Psicologia Diferencial é também frequente o recurso a grupos e näo a
amostras (estas circunscrevem-se, mais frequentemente, aos estudos de aferiçäo e
normalizaçäo dos resultados em provas psicológicas). Dois tipos de grupos surgem
aqui particularmente utilizados. Em primeiro lugar os grupos específicos, ou seja grupos
constituídos por sujeitos com uma determinada característica comum. Por exemplo,
poder-se-á recorrer a quadros nosográficos (tipos) específicos para analisar as
respostas de tais grupos a determinada prova ou situaçäo. Num estudo de validaçäo
externa de um teste como o MMPI poderia interessar ter grupos clínicos diferentes
para cada uma das sub-escalas que constituem o teste.
Em segundo lugar, é frequente o recurso a grupos que claramente se
diferenciam numa dada variável, assumida esta diferenciaçäo em termos de posiçöes
diferenciadas num continuem. Por exemplo, sujeitos deprimidos e näo deprimidos
foram considerados para a validaçäo do diagnóstico clínico da depressäo através do
inventário IACLIDE (Vaz Serra, 1994). Duas designaçöes aparecem frequentemente
tomadas aqui: os grupos contrastados, e os grupos contrastantes. Em ambos os casos
obtém-se grupos contrastados ou que se afastam claramente em determinada carac-
terística (aí näo equivalentes), passando a designar-se grupos contrastantes quando
os dois grupos se situam nos extremos da distribuiçäo dos resultados na variável a
tomar (critério estatístico dos 27% superiores e 27% inferiores, ou dos 1/3 superiores
e 1/3 inferiores). Também aqui, os autores podem buscar uma maior proximidade dos
grupos a formar (apenas diferentes na característica em estudo) tentando emparelhar
os grupos através da distribuiçäo dos sujeitos noutras características (idade, escola-
ridade, sexo, estado civil ... ).
Estudos de caso único
Estes estudos säo menos frequentes e, por vezes, confinados aos estudos
exploratórios ou à investigaçäo em situaçöes muito particulares. Na literatura
Metodologia da Investigaçäo em Psicologia e Educaçäo 107
encontra-se, no entanto, vários exemplos de estudos de caso único (single-case),
nomeadamente em Etologia, Psicofisiologia, Psicologia Clínica e Psicologia do
Desenvolvimento. A validade externa dos resultados e das conclusöes deste tipo de
estudos é obviamente baixa. A única possibilidade de generalizaçäo destes estudos
ocorre quando referente a situaçöes ou fenômenos de variabilidade baixa, por
exemplo disfuncionamentos associados a malformaçöes genéticas específicas.
Este tipo de estudos aparece habitualmente designado por estudos de caso.
Como o próprio nome deixa antever, os estudos de caso visam geralmente a
observaçäo de fenômenos raros mas ricos ou importantes do ponto de vista de
informaçäo contida para questionar uma dada teoria ou contrapor teorias, para
explorar uma hipótese ou uma metodologia de análise. Este método pode ser
particularmente importante na avaliaçäo de uma metodologia de intervençäo, na
averiguaçäo dos efeitos de traumatismos ou na evoluçäo de determinadas casuísticas.
Na Psicologia do Desenvolvimento ele tem servido para avaliaçöes longitudinais do
desenvolvimento.
Alguma aproximaçäo pode fazer-se dos caso único para condutas ou situa-
çöes de observaçäo. Nessa altura näo nos reportamos a um sujeito mas a uma dada
situaçäo. Por exemplo, o comportamento atípico de um aluno na sala de aula pode ser
um incidente que mereça uma análise exaustiva e de uma forma isolada. Na literatura
surgem referências aos incidentes críticos como momentos relevantes para a avali-
açäo de problemas particularmente significativos.
Os sujeitos na investigaçäo
Recorre-se frequentemente na Psicologia e na Educaçäo a amostras e a
grupos nos estudos de investigaçäo. O interesse de tal procedimento é inquestionável,
assim como a objectividade na informaçäo recolhida e nas conclusöes extraídas,
sobretudo se alguns cuidados metodológicos säo considerados na sua constituiçäo.
No entanto, terminaríamos este capítulo alentando para alguns cuidados a ter.
Um primeiro advém de um certo "abuso" em Psicologia e Educaçäo ao serem
tomados grupos constituídos pelos sujeitos mais disponíveis e mais estruturados
enquanto grupos (estudantes, hospitalizados, clientes, empregados, militares, ... ). Os
problemas, nessa altura, colocam-se sobretudo quando se pretende daí extrapolar ou
108 Procedimentos: planos e amostras
generalizar conclusöes para a populaçäo. Refira-se, como mero exemplo, um estudo
sobre o assunto realizado a propósito da näo perfeita aleatoriedade das amostras
estudantis portuguesas em face de um efeito de selecçäo sócio-cultural à medida que
se avança no nível escolar dos sujeitos (Miranda, 1983). Essa selecçäo tende a ser
maior no grupo dos rapazes que nas raparigas, e maior nas classes sociais mais
desfavorecidas. Este problema repete-se com as amostras retiradas de estabelecimentos
"colectivos" (hospitais, prisöes, centros para deficientes). O tipo de internamente em
hospitais ou em clínicas, ou a frequência de estabelecimentos de educaçäo especial,
podem estar "marcados" pela origem sócio-cultural dos indivíduos.
Evidentemente que é necessário considerar sempre as vantagens (económi-
cas, materiais, humanas) dos procedimentos de amostragem. No entanto, também as
desvantagens näo podem ser ignoradas. A par da questäo da representatividade dos
resultados, colocam-se ainda os problemas de índole ético quanto às conclusöes de
tais estudos.
Finalmente, os estudos com amostras aparecem fundamentalmente associa-
dos com os trabalhos em psicometria voltados para a aferiçäo de instrumentos
psicológicos. Tais procedimentos säo particularmente requeridos quando se pretende
elaborar normas para a interpretaçäo dos resultados individuais nos testes. Nestes
estudos, pretende-se salvaguardar que a observaçäo de uma amostra ou parte da
populaçäo possibilite que, no final, as normas obtidas sejam generalizadas a toda a
populaçäo. Esta generalizaçäo pressupöe, como já afirmámos, o conhecimento desta
populaçäo e sua distribuiçäo percentual pelas características tidas como relevantes
para a variável em estudo.
Bibliografia
Arnal, L, Rincón, D. & Latorre, A. (1 992). Investigación educativa: Fundamentos y
metodologiä. Barcelona: Editorial Labor.
Baltes, P. B. & Nesselroade, J. R. (1979). History and rationale of longitudinal
research. In J. R. Nesselroade & P. B. Baltes (Eds.), Longitudinal research
in the study of behavior and development. New York: Academic Press.
Christensen, L. B. (1 980). Experimental methodology (2nd ed.). Boston: Allyn/Bacon.
Metodologia da Investigaçäo em Psícologia e Educaçäo 109
Krejcie, R. V. & Morgan, D. W. (1970). Determining sample size for research
activities. Education and Psychological Measurement, 30, 607-610-
Labov, W. (1 970). The logical non-standard English. In F. Williams (Ed.), Language
andpoverty. Chicago: Markham Press.
Lemos, M. (1986). Metodologias sequenciais de investigaçäo do desenvolvimento.
Cadernos de Consulta Psicológica, 2, 143 -154
Miranda, M. J. C. (1983). A amostragem de indivíduos: Algumas questöes sobre a
organizaçäo de amostras para a aferiçäo de testes psicológicos em Portugal.
Revista Portuguesa de Pedagogia, XVII, 241-257.
Murteira, B. J. F. & Black, G. H. J. (1983). Estatística descritiva. Lisboa: McGraw-
Hifi.
Pinto, A. C. (1 990). Métodologia da investigaçäo psicológica. Porto: Ed. Jornal de
Psicologia.
Rosenthal, R. (1966). Experimenter effects in behavioral research. New York:
AppIetori-Century-Crofts.
Simöes, A. (1990). A investigaçäo-acçäo: Natureza e validade. Revista Portuguesa
de Pedagogia, =V, 39-5 1.
Zimmey, G. H. (1961). Methods in experimental psychology. New York: Ronald
Press.
Vaz Serra, A. (1994). IACLIDE: Inventário da Avaliaçäo Clínica da Depressäo.
Coimbra: Ediçäo "Psiquiatria Clínica".
110 Procedimentos: planos e amostras
FICHA DE_@ AUTO-AVALIAÇÄO
Grupo I: Marios
Re,NI)otida a 4 das 6 qliesiöesse<,,mintes:
1.1. Como diferencia validade 1111e1,11a e validade (:w(Tiza num plano de investi-
gaçäo?
1.2. Em que se diferenciam gríil)o de controlo e grul)o de coinj)araçäo?
1.3. Diferencie estudos transversais, longitudinais e sequenclais.
1.4. OplatioSolomon pode considerar-se o plano experimental maiscompleto nos
factores de erro controlados. Justifique.
1.5. Porque é que os termos correlacional e diferencial têm sido usados como.
.sinónimos na designaçäo de um paradigma de investígaçäo, em Psicología.'@"e...'
Educaçäo?
1.6. Nurn piara(.) multifl(ictorial, diferencie os efeitos simples, principais e seciindá-
rios.
Grupo 11: Aniostras
RespoiWa a 2 das 3 questöes s(@uin1es:
1. Porque se diz que o métodoaleatório está longe de ser uni método acidental?
9 Os termos ainosti-a representaffi,a e (amostra significativa näo säo coinci-
dentes. EIXplicite.
2.3. Como se obtêni dois grupos contraslatites numa variável'?
Capítulo 4
1
Recolha dos dados: procedimentos e instrumentos
1 1
1
Recolha dos dados: procedimentos e instrumentos
Procedimentos de construçäo
Recolha dos itens
Análise e selecçäo dos itens
Análises qualitativas
Análises quantitativas
Organizaçäo dos itens na prova
Administraçäo da prova
Aferiçäo dos resultados
Características metrológicas dos resultados
Sensibilidade dos resultados
Fidelidade dos resultados
Validade dos resultados
Normalizaçäo dos resultados
Cálculo das normas
Interdependência e sentido das normas
Tendo-se analisado nos capítulos anteriores os passos na investigaçäo refe-
rentes à definiçäo do problema, da hipótese, das variáveis, do plano e da amostra, um
novo passo tem a ver com a recolha dos dados. Aqui entram as questöes centradas nos
instrumentos e nos procedimentos de avaliaçäo. Basicamente, a questäo central a que
se pretende responder agora, tem a ver com a forma e os meios como väo ser
recolhidos os dados empíricos a usar na testagem da(s) hipótese(s). A qualidade
informativa de tais dados väo, parcialmente, depender da qualidade dos instrumentos
usados nessa recolha e, daí, a importância que a questäo dos instrumentos tem na
avaliaçäo e na investigaçäo em Psicologia e Educaçäo.
Neste capítulo e livro centrar-nos-emos na apresentaçäo das análises qualita-
tivas e quantitativas que devem presidir à construçäo, adaptaçäo e aferiçäo dos
instrumentos de avaliaçäo. Deixaremos para eventuais trabalhos posteriores qualquer
referência à apologia de instrumentos de avaliaçäo disponíveis e às grandes correntes
norteadoras da sua construçäo, análise e utilizaçäo.
As análises a descrever neste capítulo orientam-se mais para os itens ou
questöes singulares de um instrumento, ou para os resultados finais no conjunto dos
itens (scores). Como veremos, várias destas questöes têm mais relevância e tradiçäo
na Psicologia do que na Educaçäo. Ao longo do texto alentaremos para algumas
especificidades dos instrumentos mais comuns numa e noutra área. No entanto, como
o objectivo da avaliaçäo é a obtençäo de informaçäo significante, tais análises e
cuidados - mesmo que de formas diversas - säo sempre necessárias para garantirem
o rigor e valor da informaçäo que se recolha.
A percepçäo da falta de um número suficiente de provas de avaliaçäo
psicológica e educacional aferidas quer em termos nacionais quer em termos de
subgrupos ou problemáticas específicas, justifica o maior desenvolvimento dado a
este capítulo. Ele está pensado como sendo um ponto inicial de apoio e de incentivo
a acadêmicos e a profissionais que desejam contribuir para a superaçäo das lacunas
e limitaçöes actuais nesta área. Mesmo para os simples utilizadores, julgamos que a
informaçäo deste capítulo é igualmente relevante. Ela pode torná-los mais críticos e
114 Recolha dos dados: procedimentos e instrumentos
mais autónomos nas avaliaçöes que realizam e, logicamente, mais importantes que os
próprios instrumentos que usam.
Procedimentos de construçäo
Qualquer instrumento de avaliaçäo, seja ele um teste, uma prova, uma escala,
uma ficha ou uma grelha de entrevista, pode definir-se como um conjunto de itens,
questöes ou situaçöes mais ou menos organizado e cobrindo um certo domínio a
avaliar. Falaremos aqui dos processos de recolha, de análise, de selecçäo e de
organizaçäo desse conjunto de itens numa prova ou situaçäo de avaliaçäo. O termo
prova permite-nos abranger a generalidade dos testes, inventários, escalas e
técnicas mais formais de avaliaçäo. O termo "situaçäo de avaliaçäo", por seu lado,
pode incluir as listas de verificaçäo de comportamentos, as grelhas de observaçäo
sistemática, as grelhas de entrevista e as técnicas mais informais de avaliaçäo.
Recolha dos itens
A construçäo de uma prova ou situaçäo de avaliaçäo inicia-se pela recolha de
um conjunto de itens (aqui tomados em sentido lato). Esta recolha pressupöe -uma
definiçäo prévia dos seguintes parâmetros:
(i) âmbito e objectivos do instrumento a construir,
(ii) lx)ptilaçäo a que se destina a prova ou contexto de observaçäo,
(iii) caraclerística ou dimensäo a avaliar (construto), e
(iv) aspectos corriportamentais a integrar e que explicitam o construto.
Estes parâmetros, cuja análise pressupöe um contacto com a literatura na área,
com provas anteriores e especialistas ou futuros alvos, devem assegurar uma
operacionalizaçäo ou antevisäo da prova a construir ou alguma definiçäo da situaçäo
ou contexto a observar. No final deve ficar claro se o construto a avaliar terá uma ou
mais dimensöes, que comportamentos seräo os mais relevantes, a que condiçöes da
observaçäo se deverá atender ou que sentido faz construir novos instrumentos quando
outros já existem.
Metodologia da Investígaçäo em Psicologia e Educaçäo 115
Ambito da prova
Particularmente nas técnicas de avaliaçäo formal, onde se pretende passar dos
resultados nas provas à descriçäo das dimensöes psicológicas internas, os itens podem
assumir-se como signos ou como uma amostra representativa de situaçöes (Ss) com
potencialidades reconhecidas de evocar a manifestaçäo dos construtos a avaliar. Esta
é a teoria da medida e da construçäo de instrumentos particularmente desenvolvida
pela abordagem psicométrica na Psicologia: partir da definiçäo operacional dos
construtos para a fixaçäo das operaçöes que os explicitem e, destas, para os itens ou
situaçöes que os avaliem na sua forma ou intensidade.
Como se pode antever esta sequência é complicada face ao carácter interno
(näo directamente observável) dos construtos e às múltiplas definiçöes que a
Psicologia tem para a grande maioria desses construtos. Assim sendo, o caminho
inverso näo se encontra também liberto de eventuais problemas. Näo é tarefa fácil,
nem täo pouco consensual entre os especialistas, a transposiçäo dos itens para as
operaçöes e destas para os atributos ou construtos.
Alguma tautologia inferencial por parte da abordagem psicométrica encon-
tra-se presente nesta sequência de passos na construçäo das provas (Almeida, 1986).
Defendidos e definidos os construtos (aptidöes, traços ou dimensöes latentes),
importa construir instrumentos (testes, provas ou escalas de medida) que, aplicados
aos indivíduos, nos permitam resultados (notas ou respostas manifestas) informativos
sobre a sua realidade latente (dimensöes ou variáveis medidas). Evidentemente que
esta sequência salienta a mútua interdependência dos aspectos e níveis de análise,
bem assim como a mútua justificaçäo da trilogia traços, provas e resultados nesta
corrente (Almeida, 1988).
Colocado este ponto prévio, podemos afirmar que o processo de construçäo
de um teste ou prova começa pela Definiçäo do que se vai avaliar, para que se vai
avaliar e junto de quem vai decorrer tal avaliaçäo. Julgamos ser mais correcto
considerar todas estas especificaçöes no começo do processo. Esta maior
pormenorizaräo näo só orienta nas fases sucessivas de recolha, análise e selecçäo dos
itens a reter na prova ou situaçäo de avaliaçäo, como no imediato traduz uma opçäo
por instrumentos de medida mais circunscritos a domínios, a objectivos e a grupos
específicos. Fazendo um pouco de história, nem sempre isso aconteceu com os testes
116 Recolha dos dados: procedimentos e instrumentos
psicológicos e, se por um lado se ganhava algo ao construí-los mais genéricos ou
utilizáveis para diversas situaçöes da prática e amostras populacionais, certo que
também essa abrangência se veio a converter num dos pontos de acesa crítica e,
inclusive, do seu abandono em face da menor precisäo e pertinência da informaçäo
para os problemas concretos da prática.
Precisar a variável interna a avaliar ou os contextos e os comportamentos
manifestos a observar, requer algum esforço por parte do seu construtor. A revisäo da
literatura sobre a dimensäo ou os parâmetros que se pretendem avaliar mostra-se
importante. Também a consulta de outros instrumentos já construidos ou de espe-
cialistas na área se mostra uma precauçäo interessante. Parece-nos que a tendência
tem sido a de rapidamente se delimitar o construto ou a situaçäo, pegar numa amostra
de itens e proceder à sua aplicaçäo. As análises estatísticas viräo depois "decidir" os
itens a reter, acabando a estatística por tomar o lugar da teoria psicológica,
indevidamente (Pasquali, 1996). Algumas sugestöes nesta fase inicial da construçäo
podem ser feitas. É fundamental saber se estamos perante construtos unidimensionais
ou pluridimensionais. A elaboraçäo dos itens deverá ter este aspecto esclarecido. Por
vezes, tratando-se de construtos psicológicos, os autores preferem instrumentos
unidimensionais, mesmo que complementares. Nestes casos, uma prova mede apenas
uma variável ou dimensäo. Tratando-se de instrumentos de observaçäo directa -ou
comportamental os autores defendem a sua diversidade ou multidimensionalidade.
Nesta decisäo pode-se considerar ainda, o próprio grupo etário a que se destina o
instrumento de avaliaçäo a construir, bem como os seus objectivos. A manifestaçäo
das dimensöes psicológicas näo assume a mesma forma ao longo de todo o ciclo vital,
assim como podemos aumentar a capacidade preditiva de uma prova (validade
externa dos seus resultados) diversificando mais os seus itens, por exemplo.
É de referir ainda outros aspectos a atender na elaboraçäo dos itens. Desde
logo importa ter claro o seu objectivo. Assim, eles podem pretender diagnosticar
traços internos ou centrar-se em dimensöes mais próximas do comportarnento,
podem servir para classificar os sujeitos e diferenciá-los por diferentes vias escolares
e profissionais, podem centrar-se na definiçäo de parâmetros que definam uma
metodologia de intervençäo ou que atendam a esses parametros no momento da
avaliaçäo da eficácia de uma intervençäo ou programa de desenvolvimento. Igual-
mente, tais provas podem servir de primeiro despiste (screening) de situaçöes ou de
comportamentos de risco ou, ainda, permitir informaçäo sobre evoluçöes esperadas
Metodologia da Investigaçäo em Psicologia e Educaçäo 117
no futuro em termos do desenvolvimento e do comportamento dos sujeitos. Uma
definiçäo clara do objectivo pretendido com um dado instrumento ajuda-nos
a precisar que tipo de dados ou informaçäo nos interessa obter com o seu uso
e, desde logo, os procedimentos a atender na sua construçäo. As análises a
realizar, por exemplo, têm que considerar tal objectivo para nos permitirem afirmar
que um item é melhor ou pior do que outro, ou se um dado resultado garante
determinado tipo de confiança e de valor informativo em face do objectivo para que
foi construido.
Formulaçäo dos itens
A operacionalizaçäo do construto e da situaçäo em sucessivos níveis de
aproximaçäo ao comportamento manifesto permite-nos a formulaçäo de um
primeiro conjunto de itens para a prova. Por norma, este conjunto inicial
duplica o número desejado de itens a ter na versäo final do instrumento. Só
com esse número, e criada a possibilidade de vários itens poderem ser elimi-
nados, faz sentido falarmos numa fase de análise e selecçäo dos itens. Assim,
algumas decisöes prévias devem ser tomadas neste momento, nomeadamente:
(i) o número dos itens a incluir na versäo definitiva do iiislrtiniento,
(ii) o grau de dificuldade ou o nível de Intcnsidade dos c(iiiilx)í-tiíiieíito,,@, que se deverá
ter na prova em face dos sujeitos e dos ol)'ectivos a que a mesnia se destina.
(iii) a forma e o conteúdo dos itens na sua fornitilaçäo,
(iv) a forma corno val ser félta a sua Implicaçäo aos sujeitos (rx)r exemplo. auto-
administrados ou aplicados individual ou colectivamente pelo psicólogo).
Mesmo que as fases posteriores de construçäo possam conduzir a mudanças
e a reformulaçöes nos itens, convém avançar para a construçäo do primeiro grupo de
itens com algumas decisöes tomadas em termos do formato dos itens e das condiçöes
de aplicaçäo dos instrumentos. Assim, deverá estar decidido se seräo dadas alternativas
para escolha ou se o sujeito terá que elaborar a sua resposta, se vai haver recurso à
resposta escrita ou oral do sujeito, se é uma prova papel-lápis ou se envolve
118 Recolha dos dados: procedimentos e instrumentos
manipulaçäo de materiais, se vai ser de aplicaçäo individual ou de grupo, se se
procuram itens muito estruturados (questöes e respostas fechadas) ou se nos interessa
atingir a singularidade do sujeito através de itens pouco estruturados (por exemplo
técnicas projectavas, provas de criatividade e de estilos cognitivos). Por outro lado,
e antes de se avançar para qualquer aplicaçäo, importa ter as instruçöes, os exemplos
e os exercícios de treino definidos. Alguns dos problemas na avaliaçäo começam pela
pouca atençäo dada a estes pormenores iniciais de explicitaçäo da tarefa aos sujeitos.
Algumas vezes observa-se uma total dessincronia entre aquilo que o investigador
pretende avaliar com uma dada prova e aquilo que esta realmente mede (por exemplo,
os sujeitos interpretam o teste e däo as suas respostas tomando referenciais diferentes
do autor). Reafirmamos que säo decisöes que devem ser pensadas na fase de
construçäo da prova. Provas construídas sem estes cuidados prévios dificilmente
asseguram resultados válidos. A posteriori é difícil suprir estas limitaçöes, para
além das questöes éticas associadas a uma avaliaçäo recorrendo a instrumentos näo
validados.
A recolha dos itens é um misto de trabalho interessante e de trabalho
fastidioso, um misto de "ciência" e "arte" (Brown, 1976), pelo que quase sempre o
psicólogo precisa de ajuda. A consulta de especialistas é norma nesta fase, assim
como a leitura da bibliografia no campo ou produzida sobre instrumentos com alguma
similaridade de construto, objectivo ou populaçäo-alvo. O trabalho interdisciplinar é
geralmente requerido na generalidade das situaçöes. A avaliaçäo de determinadas
aptidöes, por exemplo, pode aconselhar uma análise dos postos de trabalho, contacto
com outros profissionais ligados aos conteúdos e às operaçöes mentais a avaliar. A
procura de uma adequaçäo dos itens às situaçöes aconselham essa aproximaçäo. Os
especialistas na área podem servir esse objectivo. Um teste de criatividade a construir
dificilmente pode prescindir da consulta de pessoas reconhecidamente criativas.
Também um teste de compreensäo verbal pode prescindir na sua construçäo da
consulta de especialistas na língua. Alguns conteúdos e os próprios formatos,
inclusive, podem envolver a consulta de pessoas ligadas às artes gráficas. No fundo,
importa assegurar a convergência de opiniöes e, embora tudo possa estar ligado aos
objectivos de cada instrumento, assegurar uma complementaridade entre teoria e
prática.
Alguns princípios gerais devem ser considerados na formulaçäo dos itens de
forma a garantir algumas propriedades à medida. Algumas destas propriedades
Metodologia da Investigaçäo em Psicologia e Educaçäo 119
poderäo, inclusive, näo vir a ser detectadas nas análises qualitativas e quantitativas
dos itens, pelo que exige maior cuidado na sua formulaçäo.
Em primeiro lugar a formulaçäo deve ser objectiva. Näo se pretendem res-
postas "impressionistas" mas sim que o sujeito mostre "ser ou näo ser capaz..." ou
@cestar ou näo estar de acordo...... Uma escala de tipo likert com 9 postos pode con-
trariar este esforço de objectividade, já näo ao nível do conteúdo mas do formato do
item. Näo é fácil ao sujeito precisar as distâncias entre os vários postos e posicionar-
se nessa escala (5 postos apenas seräo suficientes para os objectivos pretendidos).
Uma segunda ideia a ter em consideraçäo na formulaçäo do item é a
simplicidade da formulaçäo. A situaçäo ideal seria a correspondência um item-uma
tarefa e uma tarefa-uma ideia. Quando a complexidade do item decorre da
multiplicidade de aspectos, ideias ou informaçäo que integra, poderá ser difícil
interpretar as respostas dos vários sujeitos num único sentido. Por norma, essa
complexidade retira clareza ao item, introduzindo ambiguidades desnecessárias e näo
controladas na sua posterior compreensäo pelos sujeitos.
Uma terceira ideia é obter itens relevantes para o domínio e objectivo da
avaliaçäo. A tarefa (item) deve estar relacionada e ser relevante para a dimensäo a
avaliar. As leituras bibliográficas na área, provas anteriores ou a consulta de
especialistas ajudam nesta decisäo. Mais tarde algumas análises estatísticas, por
exemplo as saturaçöes factoriais dos itens, permitem-nos apreciar a (in)suficiência
destes primeiros cuidados na formulaçäo dos itens.
Uma quarta ideia é ter itens formulados para a amplitude do domínio que se
quer avaliar. Este cuidado näo está desligado do objectivo do teste e dos grupos
populacionais a que majoritariamente se destina. Num teste de aptidäo poder-se-á
partir de itens que se repartam por grupos de dificuldade (fáceis, médios, difíceis). Em
escalas de personalidade ou nos inventários auto-administrados (atitudes, valores,
motivaçäo, identidade, ... ) é importante considerar também situaçöes diversas dife-
rindo na intensidade de traço exigida para a resposta. Numa escala de ansiedade, por
exemplo, deveräo existir itens para graus diferentes de ansiedade.
Finalmente, podemos falar na clareza do item. O critério da clareza prende-
se com a inteligibilidade do próprio item ou da sua ideia. Por norma, frases curtas ou
expressöes simples favorecem a clareza do item, tornando-os adequados mesmo para
120 Recolha dos dados: procedimentos e instrumentos
os estratos culturais mais baixos da populaçäo a que se destina. Igualmente favorece
a clareza do item o reportar-se a comportamentos e näo a abstracçöes. Na fase da
reflexäofalada, à frente abordada, geralmente os problemas com a clareza dos itens
surgem verbalizados pelos sujeitos, sendo portanto detectados.
Análise e selecçäo dos itens
Construída a primeira versäo dos itens, inicia-se o processo de análise. Vários
estudos exploratórios qualitativos e quantitativos podem ser conduzidos nesta fase,
produzindo-se reformulaçöes, acrescentes e retiradas sucessivas de alguns itens ou
parâmetros comportamentais a observar.
Análises qualitativas
Incluem-se aqui as análises realizadas para apreciar o conteúdo e a forma dos
itens, nomeadamente a sua clareza, compreensibilidade e adequaçäo aos objectivos
da prova. O uso do método da reflexäo falada ou thinking aloud (Goldman, 1971)
tem sido aconselhado junto de sujeitos próximos dos futuros destinatários da prova.
Este método consiste na aplicaçäo individual da prova e no registo de todas as
verbalizaçöes dos sujeitos. Estes, instruídos para o efeito, devem comunicar as
impressöes em relaçäo a cada item, a forma como o abordam e realizam, os processos
utilizados e as facilidades ou dificuldades que encontram.
As análise qualitativas, e sobretudo aquelas que partem da resoluçäo em voz
alta da prova, apresentam alguns pontos de interesse:
(i)a identificaçäo de ambiguidades associadas quer ao formato quer ao conteúdo dos
itens (algumas vezes tais ambigui(lades desviam o sujeito do seu o1@jectivo da
avaliaçäo, outras vezes complexlt'lc@ti-n de forma alcatória a questäo);
(ii) a identificaçäo dos processos e estratégias usadas pelos sqjeitos nas suas
respostas, e em que medida elas estäo de acordo ou contrariam o sentido da
avaliaçäo em causa (se num iterri de ií)ti(lä(-.) espacial a atençäo à grossura dos
traços é mais decisiva que as rotaçöes dos elementos. entäo podernos estar a
também, ou essencialmente. a atencäo);
Metodologia da Investígaçäo em Psicologia e Educaçäo 121
(iii),i apreciaçäo da eficacia e qualidade (Ias viii---las alternativas d e respo)sta fOrniuIa-
das (acontece que ni.ais do flue unia alternativa po)de ser considerada correcta. ou
eniao ouiras näo têm qualqucres---offia 1x1w; suicítos e, como Ial, näoapresentarri
qualquer efeito distractór),
(iv) a iden ti ficaräo de alguns aspectos peculiares ou algumas dificuldades acrescIdàs@':':
apresentadas por um ou outro item;
... ...........
o conhecimento das atitudes gerais dos sujeitos face aos itens propostos e issóso.......
longo da prova (o texto em que aparece formulado um item ou a gravura que
uma situa äo podem estimular reacçöes pouco adequadas para o objectivo &É-
prova);
i) a verificaçäo de alguns padröes específicos de realiza äo nalguns itens
por::
determinados grupos de sujeitos (este cuidado é tanto mais importante quanto se
Dretenda eliminar algumas fontes de enviesamento habituais nos resultados, por:
exemolo, as ligadas ao género e ao grupo étnico dos sujeitos);
ii) a detecçäo de itens mal construidos (por exemplo, a existência de duas
alternativas iguais; formulaçäo incompleta do Item);
um primeiro nível de conhecimento das dificuldades sentidas pelossujeitos na
W@@@ú prova ou nalguns itens, bem corno a interferência de certos procedimentos mais
e menos eficazes usados pelos sujeitos nas suas respostas; e
(ix) unia prinieira percepçäo da dificuldade dos itens e dasuficiência das instruçöeS@-J
a par de tinia estinianva do lernIx) reclucrido para a realizaçäo da prova.
Algumas dificuldades podem ser apontadas ao método da reflexäofalada na
análise dos itens. Em primeiro lugar, a nossa capacidade de registo é limitada e o
recurso a equipamento pode provocar alguns enviesamentos, por exemplo induzir um
maior cuidado do sujeito nas suas verbalizaçöes. Em segundo lugar, näo podemos
esquecer que esta análise implica previamente boas capacidades de interiorizaçäo, de
verbafizaçäo e de expressäo por parte dos sujeitos o que nem sempre acontecerá em
idades mais baixas, em idades mais avançadas ou junto de grupos com menor índice
de escolaridade. Finalmente, levanta sempre algumas dificuldades fazer acompanhar
os processos mentais internos de resoluçäo da sua expressäo verbal. Mesmo com o
treino do sujeito, esta dificuldade mantém-se por vezes ao longo de toda a prova.
Nalguns casos, fica a impressäo de que o sujeito fixa um procedimento de resposta
nos primeiros itens que depois repete ou adapta nos itens seguintes. Claro que este
procedimento näo é forçosamente negativo pois acaba por nos informar como outros
sujeitos poderäo proceder.
122 Recolha dos dados: procedimentos e instrumentos
A consulta de especialistas ou de profissionais com prática no domínio serve
também o objectivo da análise qualitativa dos itens. Inclusive, alguma da informaçäo
potencialmente recolhida através da aplicaçäo da prova segundo o método da reflexäo
falada pode ser reconfirmada através destas consultas. Um professor do Ensino
Básico pode ajudar a apreciar qualitativamente um conjunto de itens que pretendam
avaliar a capacidade de leitura das crianças, ou uma lista de comportamentos
disruptivos que possam ser verificáveis na sala de aula.
Análises quantitativas
Vários parâmetros estatísticos tendem a ser usados na análise e selecçäo dos
itens para uma prova psicológica ou educacional. Particularmente importante aqui é
ter presente os objectivos que levam o autor à construçäo de um dado instrumento de
avaliaçäo. Com efeito, certas análises a efectuar e a ponderaçäo a dar aos coeficientes
estatísticos podem justificar-se mais ou menos consoante o instrumento a construir
apresenta uma lógica de maior ou menor diferenciaçäo dos desempenhos individuais,
em primeiro lugar. Assim, uma prova informativa da aquisiçäo de conceitos matemá-
ticos leccionados deverá ter itens com características diferentes de uma outra que
pretenda seleccionar os dois melhores alunos para representar a escola nas "olimpí-
adas" de matemática.
Um outro aspecto a interferir nas análises prende-se com a construçäo de
provas homógeneas ou heterógeneas em relaçäo aos seus itens. No primero caso, os
itens säo muito próximos entre si e garante-se a sua aditividade (obtençäo de uma nota
global). No segundo caso, poder-se-á afirmar que uma dada situaçäo ou dimensäo a
avaliar é heterogénea por natureza e o instrumento a construir perderá todo o valor
informativo (validade) se essa diversidade näo transparecer nos seus itens. Como
veremos, a lógica da homogeneidade (consistência interna) e da heterogeneidade
(validade) nem sempre convergem na análise e selecçäo dos itens.
Estes problemas colocam-se particularmente aqui pois näo podemos tomar
apenas em consideraçäo os valores estatísticos das análises efectuadas para reter ou
abandonar um item. Nalgumas provas, por exemplo nas provas de realizaçäo habitual
ou nos testes referendados a critério (criterion-referenced tests), a ênfase na seriaçäo
dos sujeitos e na comparaçäo interindividual dos resultados näo fazem sentido, ou
Metodologia da Investigaçäo em Psicologia e Educaçäo 123
pelo menos tanto sentido. Numa escala de auto-conceito as instruçôes explicitam que
näo existem "boas e más respostas", ou respostas tidas como mais certas ou erradas.
Por sua vez, nos testes centrados em normas (norm-referenced tests) ou testes de
realizaçäo máxima tais objectivos de comparaçäo e seriaçäo estäo presentes.
Três tipos de análises estatísticas säo, por norma, conduzidos na fase de
análise e de selecçäo dos itens. Tais análises consistem e visam, nomeadamente:
l'<i) a apreciaçäo tia dificuldade ou dispersäo das respostas nurriziamostra de suje M
avaliados Cito necessáilo a qualquer tilx) de medida),
(íi) a apreciaçäo da Capacidade discriminativa (validade interna) dos itens, ou seja
em que medida o resultado iiiiiii Item está rejacioriado Com as resix),;tis aos
deniais itens ou está correlaciona(jo corri o resultado final na prova), e,
(iii) a apreciaçäo da validade exierna Li() I[Clll OU sIM correlaçäo com eritérios
externos (outra prova, notas escalares. diagnósticos clínicos ou índices de
produtividade na empresa, entre outros).
índice de dificuldade
O índice de dificuldade traduz a proporçäo de sujeitos que consegue realizar
correctamente o item. A fórmula de cálculo usada (ID = C/N) dá-nos uma relaçäo de
significado inverso, ou seja falamos em índice de dificuldade e na equaçäo conside-
ramos o número daqueles que acertaram (C) sobre a globalidade da amostra (N).
Neste caso concreto, a globalidade da amostra a tomar na fórmula integra os que
acertaram (C), os que falharam (E) e os que omitiram (0) o item (omissäo por
dificuldade e näo por falta de tempo; aliás para estas análises a prova deve ser aplicada
sem limite de tempo).
O leque de valores possíveis ni escala do índice de dificuldade varia entre um
ID=.00 e um ID=1.0, verificando-se no primeiro caso que nenhum sujeito respondeu
correctamente, enquanto no segundo caso todos os sujeitos resolveram correctamente
o item. Através da proporçäo de certos e de errados a um item obtemos uma
informaçäo sobre a sua variância (p.q), sendo fácil identificar entäo que a máxima
variância se obtém com itens de ID = .50 (Anastasi, 1990, 203). Este aspecto deve ser
tomado em consideraçäo nas provas voltadas para a seriaçäo dos sujeitos ou que
124 Recolha dos dados: procedimentos e instrumentos
pretendem uma máxima comparabilidade interindividual dos resultados. Podemos
comparar melhor os sujeitos entre si tomando itens em torno de um índice médio de
dificuldade (ID = .50, permite 50 x 50 pares de combinaçöes dos sujeitos entre si;
enquanto que um item com ID = .90, permite 90 x 10 pares). Veremos mais à frente
que, mesmo no caso desses testes, näo podemos reter apenas itens com dificuldade
média. A máxima diferenciaçäo nos testes centrados em normas obtém-se com os
itens de índice de dificuldade perto de .50 e quando, simultaneamente, a prova inclui
itens que se aproximam dos limites da distribuiçäo dos índices de dificuldade (.00 e
de 1.0 - Gronlund, 1976, 154).
Alguns cuidados devem ser tidos em atençäo na análise do índice de
dificuldade. Em primeiro lugar importa atender às omissöes de resposta. Quando se
trata de omissöes intercalares elas devem ser tomadas como "erro ou dificuldade". Na
parte final do teste, tais omissöes podem significar dificuldade mas também falta de
tempo para concluir a prova. Neste último caso, elas näo entram no cálculo, sendo o
sujeito em causa retirado da amostra (N) nas análises feitas a partir desse item. Em
face da ambiguidade criada, sugere-se a aplicaçäo do teste sem limite de tempo
quando se pretende efectuar estas análises.
Em segundo lugar, o cálculo do índice de dificuldade em testes de velocidade
e de acuidade perceptiva näo faz sentido. Por norma säo provas em que a dificuldade
real näo está tanto ao nível dos processos mentais envolvidos, mas decorre do pouco
tempo disponível para a sua realizaçäo. Estas provas näo têm presente, ou pelo menos
de uma forma täo clara, a ideia ou o objectivo de itens com graus diferentes de
dificuldade.
Por último, em escalas de avaliaçäo, usualmente designadas escalas likert,
o problema coloca-se de uma forma diferente. Também aqui importa ter itens com
graus diferentes de dispersäo dos resultados pois no final pretende-se ter uma nota,
ou uma classificaçäo (e isto independentemente da lógica menos seriativa destas
provas). No caso concreto destas provas, dever-se-á privilegiar os itens com maior
distribuiçäo dos sujeitos pelos pontos que o formato da escala assegura. Por outras
palavras, a variância máxima dos resultados nos itens é conseguido quando uma
mesma proporçäo de sujeitos se reparte pelos vários níveis do formato da escala, e será
menor quando num ou dois pontos da escala encontramos a quase totalidade de
sujeitos. Veremos também que nalgumas situaçöes concretas este princípio tem
Metodologia da Investigaçäo em Psicologia e Educaçäo 125
dificuldades de aplicaçäo ou de ser assumido como o mais decisivo na selecçäo dos
itens.
A apresentaçäo do índice de dificuldade dos itens pode ser feita através de
escalas alternativas à mais frequentemente usada (proporçäo ou percentagem de
respostas correctas). Tendo em vista a comparabilidade directa dos itens entre si, e
independentemente das amostras de sujeitos avaliados, alguns autores sugerem
formas alternativas de cálculo ou meras conversöes dos valores em notas z. Anastasi
(1990, 204-5) apresenta algumas dessas escalas de intervalo no cálculo dos índices
de dificuldade, bem como alguns desenvolvimentos a este propósito decorrentes da
teoria da resposta ao item (item response theory).
A concluir, importa reunir a informaçäo referente ao índice de dificuldade ou
de dispersäo dos resultados que nos interessa considerar no momento de avaliar e
seleccionar os itens para a versäo definitiva. Referimos atrás que os itens de
dificuldade intermédio proporcionam à partida maior variância dos resultados (trata-
se de uma probabilidade estatística). Entäo, fará sentido retermos mais itens nesse
grupo, mas nunca todos. Num teste fazem falta 2 ou 3 itens particularmente fáceis pois
que servem de incentivo, auto-confiança, aprendizagem ou, inclusive, de diferenci-
açäo para sujeitos com particulares dificuldades de desempenho nas características
avaliadas; assim como reter 2 ou 3 itens particularmente difíceis e capazes de nos
garantirem alguma diferenciaçäo dos sujeitos com elevado desempenho nas caracte-
rísticas que estäo a ser avaliadas. Alguns autores sugerem a proporçäo de itens a reter
de acordo com os índices de dificuldade. Assim, Garrett (1962) refere que numa prova
devemos incluir 50% de itens com Ms situados entre .25 e .75; 25% com ID abaixo
de .25 e 25 % com ID acima de .75. No quadro IV. 1 apresentamos uma outra proposta
mais discriminativa (Baquero, 1974).
Quadro IV.1 - Classificaçäo dos índices de dificuldade
classi ficaçäo de itens Limites ID
Muito fIlecis W > .74
Fáceis 20 .55 -.74
Médios 40 .45 - .54
Difíceis 20 .25 - .44
Muito difíceis ]0 > .25
126 Recolha dos dados: procedimentos e instrumentos
As alternativas e o acaso nas respostas
Os testes de desempenho, sejam reportados à norma ou ao critério, na maioria
das vezes säo formados por itens de resposta fechada, mais concretamente apresen-
tam ao sujeito várias alternativas para escolha. Este procedimento tende a assegurar
maior objectividade na avaliaçäo, melhor comparabilidade dos desempenhos indi-
viduais, maior facilidade na correcçäo e aparece, por norma, como uma da condiçöes
prévias à administraçäo colectiva de uma prova. No entanto, a adopçäo deste formato
exige alguns cuidados. As alternativas criadas podem, por exemplo, näo ter q ualquer
atracçäo, escolha ou efeito distractor para os sujeitos. O facto de existirem várias
alternativas, só por si, näo implica estarmos perante um item de escolha múltipla
(multiple-choice). Coloca-se, entäo, a necessidade de analisarmos as alternativas de
resposta.
O cálculo, item a item, da percentagem de respostas distribuídas por cada
uma das alternativas é requerido nestas situaçöes. Se nos itens muito fáceis e muito
difíceis a distribuiçäo dos sujeitos toma uma forma particular, nos itens de dificuldade
intermédio nenhuma alternativa deve possuir maior número de escolhas que a
alternativa correcta, devendo verificar-se ainda níveis diferentes de atractibilidade
por parte das restantes alternativas. Geralmente, na construçäo dos itens as alterna-
tivas de resposta säo pensadas e formuladas para terem um efeito "distractor"
(inclusive em graus diferenciados). Na análise quantitativa das alternativas de
resposta deve-se estar atento ao tipo de sujeitos que escolhe predominantemente uma
alternativa tida como incorrecta. Por razöes óbvias, eles devem pertencer em maior
número ao grupo de sujeitos com mais fraco desempenho no teste total (Gronlund,
1976).
A existência de alternativas de resposta ou o formato de escolha múltipla
introduz o problema das respostas ao acaso nos testes. Alguns sujeitos que acertam
o item podem näo conhecer realmente a resposta correcta. No finai, e seu resultado
pode traduzir, simultaneamente, a capacidade possuída e um estilo pessoal de
resolver situaçöes cuja resoluçäo näo conheça em absoluto (por exemplo, uma maior
desinibiçäo comportamental em face de situaçöes em que, podendo näo ter a certeza
absoluta de uma resposta, mesmo assim assinala a alternativa que lhe parece mais
aproximada).
Metodologia da Investigaçäo em Psicologia e Educaçäo 127
As respostas ao acaso afectam a objectividade da avaliaçäo na medida em que
näo podemos dizer que a nota final é apenas fruto da capacidade resolutiva do sujeito
ou "nota verdadeira". Já em trabalho anterior analisamos este assunto e as possibi-
lidades da sua minimizaçäo (Almeida & Roazzi, 1989). O problema coloca-se com
maior acuidade em itens com um número reduzido de alternativas para escolha e em
testes com poucos itens. O formato de item mais problemático, a este propósito, é o
dicotómico (verdadeiro/falso ou A/B). Num item de formato dicotómico, o sujeito
tem 50% de possibilidade de acertar sem um conhecimento efectivo da resposta
correcta.
Uma a roximaçäo entre a probabilidade de acerto ao acaso e o índice de
p
dificuldade média dos itens a reter num teste é-nos apresentada por Gronlund (1976,
154) no quadro IV.2. Os valores apontam para as vantagens de itens com mais
alternativas de resposta.
Quadro IV. 2 - Nível médio de dificuldade nos itens dado o número de alternativas
N.11 de alternativas Probabilidade ID médio
de acaso
2 (Verd-Falso) .50 .75
3 -33 .67
4 .25 .63
5 .20 .60
Várias fórmulas de correcçäo do índice de dificuldade dos itens aparecem
nos manuais a fim de atenuarem os acertos devidos ao acaso. Optámos por reproduzir
a fórmula de cálculo apresentada por Garrett (1962, 220):
I,(: dos que coifficeem de facio;j resl-x)sta (ID corrigido)
w R - ii." dos que aceriadaniente
R-
K - 1 W - 11.`, tios que falharam o 'lei]]
PC N - 11R K - ii.`de alterriativas de reslx)SUIL
N - rl.'à dos Sujeitos da arnostra
I-IR - su 'eitos que näo atirigiram o (orilissöes lx)r latia
de icnli-x+
128 Recolha dos dados: procedimentos e instrumentos
As fórmulas de correcçäo de respostas correctas devidas ao acaso partem da
suposiçäo de que os sujeitos, perante uma situaçäo que näo conhecem na globalidade
e ao darem uma resposta, tanto podem acertar como falhar. Por exemplo, se numa
prova de itens dicotómicos o sujeito tem 10 itens errados, podemos supor que ele terá
também acertado num número próximo de itens meramente ao acaso (probabilidade
de acertar ou falhar é aqui idêntica, ou seja, 50%). As fórmulas usadas apenas retiram
do resultado global, tomando como referência o número de erros dados, uma
proporçäo de itens que teräo sido respondidos correctamente fruto do acaso (GronIund,
1976). Por exemplo, em itens com quatro alternativas de respostas apenas se tomará
1/3 do número de erros (a probabilidade de acerto meramente ocasional é agora de
apenas 25%). Saliente-se que o número de acasos bem sucedidos deve ser sempre
estimado como uma fracçäo do número de itens mal sucedidos (Guiselli et aL, 1981,
440): dado o número de alternativas (K) de resposta para o item, a possibilidade de
uma resposta correcta ao acaso é de 1/K e a de resposta incorrecta é de (K-1)/K.
Apenas em itens de formato dicotómico a estimativa do número de acasos bem
sucedidos é equivalente ao número de itens errados. Abrindo um breve parêntesis, em
provas de escolha múltipla e pelas razöes já invocados, poder-se-á proceder à
correcçäo da nota final de um sujeito considerando o número de itens respondidos
incorrectamente.
Podemos tecer, por último, algumas consideraçöes sobre a eficácia destes
procedimentos correctivos. Numa análise interindividual dos resultados podemos
pensar que só parcialmente o problema do "acaso" nas respostas se encontra
ultrapassado. Por exemplo, a fórmula näo controla o grau relativo de certeza dos
indivíduos. Täo-pouco considera, no número de itens incorrectamente respondidos,
o grau de atractibilidade das alternativas escolhidas. Também em provas com 20 ou
mais itens, de cinco alternativas, os acertos meramente ocasionais ganham pouco
significado nas notas finais. Nas instruçöes, inclusive, deve mencionar-se quando os
erros säo considerados na fixaçäo da nota final e quando näo entram. Desta forma, e
mais concretamente no último caso, a influência dos estilos pessoais de resoluçäo ou
a percepçäo de risco associado a uma tentativa de resposta deixam de ter tanta
importância.
Poder discriminativo
Por poder discriminativo de um item entende-se o grau em que o item
Metodologia da Investigaçäo em Psicologia e Educaçäo 129
diferencia no mesmo sentido do teste global. Em termos práticos, esta definiçäo
implica que os sujeitos melhores e piores realizadores no teste deveräo responder
também de forma diferente naquele item acertando e falhando percentualmente mais,
respectivamente. Como estamos a apreciar as qualidades métricas de um item
singular por referência ao próprio teste, ou ao conjunto dos outros itens, este
coeficiente é também designado de validade interna do item.
O poder discriminativo é um coeficiente de correlaçäo e, como tal, pode
variar entre -1.0 e +1.0. Oualquer coeficiente negativo significa que säo os sujeitos
com pior desempenho no teste global aqueles que melhor realizam o item em causa,
situaçäo inversa daquela que se espera num teste e que nos é dada pelos coeficientes
positivos. Os valores em torno de .00 significam ausência de correlaçäo ou poder
discriminativo nulo (idêntico número de sujeitos bons e fracos realizadores acertam
ou falham o item).
O poder discriminativo pode ser calculado através de um coeficiente de
correlaçäo bisserial (rbis) quando a resposta ao item é de tipo dicotómica (certo ou
errado). Podemos nessa altura utilizar a seguinte fórmula (Glass & Stariley, 1970,
164):
média (1().,; resultados no teste dt)s
SUJeitos que aceriauini () item
XJ - X n, x n X - Inédia ocral (k)s
M .1 IWS
DP no(ri - geral restiltados
de sujeitos (Li @mwsIra
11 11." que acerlaraii] o item
ii.@' dos que falharam
Outros procedimentos mais simples de cálculo podem apontar-se. Um deles
consiste na formaçäo de um grupo superior e outro inferior na amostra, e calcular a
diferença de percentagem de respostas correctas nos dois grupos. Espera-se uma
diferença sempre favorável ao grupo superior e o mais elevada possível no caso de näo
serem itens demasiado fáceis ou difíceis (Gronlund, 1976). Recorrendo-se ao método
dos 27% superiores e inferiores, o cálculo do poder discriminativo pode ser calculado
directamente através de algumas tabelas existentes para o efeito (Garrett, 1962;
Baquero, 1974).
pr
130 Recolha dos dados: procedimentos e instrumentos
Relaçäo entre índice de dificuldade e poder discriminativo
Como deixamos antever atrás, existe uma relaçäo entre o índice de dificul-
dade e o poder discriminativo de um item. Os itens muito fáceis ou muito difíceis têm
menor capacidade de discriminaçäo dos sujeitos entre si. Inversamente, säo os itens
de índice de dificuldade médio aqueles que, à partida, podem permitir níveis mais
elevados de discriminaçäo.
Claro está que, se no caso do índice de dificuldade interessava reter na prova
uma maioria de itens com níveis intermédios de dificuldade e alguns mais difíceis e
mais fáceis, em termos de poder discriminativo só interessam itens com coeficientes
positivos e quanto mais elevados melhor. Entre dois itens que cumprem a mesma
funçäo no teste em termos de índice de dificuldade e da dimensäo psicológica
avaliada, reteríamos o de poder discriminativo mais elevado (maior correlaçäo entre
o item e o conjunto dos demais itens).
Antecipando um pouco, diremos que os valores mais elevados de poder
discriminativo associam-se a coeficientes mais elevados de fidelidade pois que väo
no sentido da homogeneidade da prova ou da sua unidimensionalidade. Veremos, de
seguida, que a par da validade interna do item, o construtor deve atender ainda à sua
validade externa, sendo certo que a grandeza e o sentido dos coeficientes estatísticos
para ambas as validades nem sempres andam juntos.
Poder discriminativo dos itens nas escalas
Em questionários, inventários ou outro tipo de escalas, os itens näo se
encontram formulados no sentido de diferenciar os sujeitos de acordo com as suas
dificuldades. Pelo contrário, solicita-se que os sujeitos respondam a todos os itens,
que näo existem "boas e más" respostas. O cálculo do índice de discriminaçäo dos
itens nestas escalas, tipo likert, é feito correlacionando a pontuaçäo no item e a nota
total da escala ou sub-escala a que pertence. De referir que este coeficiente de
correlaçäo é-nos dado directamente na análise da fidelidade (reliability) dos resul-
tados de uma escala através dos programas informáticos existentes, por exemplo, do
SPSS. Alerta-se para a conveniência desse coeficiente de correlaçäo tomar o total da
Metodologia da Investigaçäo em Psicologia e Educaçäo 131
escala ou sub-escala sem o item em análise de forma a näo "inflacionar" os valores
obtidos.
Um procedimento alternativo consiste em dividir a amostra em dois grupos
extremos (notas mais baixas e mais altas na escala a que o item pertence). Segue-se
uma comparaçäo das médias dos sujeitos dos dois grupos nas pontuaçöes atribuídas
a cada item. Um item é tanto mais discriminativo quanto maior discrepância
proporciona entre os dois grupos. Numa escala tipo likert de 5 pontos a máxima
diferenciaçäo situa-se em 4.0 pontos (de um lado todos com 1.0 e do outro lado todos
com 5.0). Podemos aceitar como valor mínimo aceitável 1.5 pontos nessa diferenciaçäo,
e sempre no sentido da nota global (sentido positivo deste índice).
Validade externa
Por validade externa entende-se a relaçäo que existe entre as respostas dos
sujeitos a um item e o seu desempenho numa outra situaçäo que näo o próprio teste.
Neste ponto difere do poder discriminativo, e daí a razäo deste último coeficiente ser
designado por validade interna do item.
Múltiplos critérios externos podem ser usados nestas análises, tudo depen-
dendo da sua disponibilidade na prática, do construto avaliado e dos objectivos
prosseguidos com a construçäo da prova. Tradicionalmente em provas de desempenho
usam-se, conforme os grupos de sujeitos, as suas notas escolares ou alguns parâmetros
da sua realizaçäo profissional. Em escalas de desenvolvimento recorre-se frequen-
temente à própria idade ou à progressäo das suas aprendizagens. Em testes de
personalidade, o recurso mais habitual tem sido o diagnóstico psicopatológico ou
diferentes medidas da adaptaçäo psicossocial dos sujeitos. Em qualquer uma destas
e outras provas é sempre possível, ainda, o recurso a outras provas similares já
existentes e bem apreciadas pelos investigadores e profissionais (procedimento aliás
muito frequente em países com maior número e diversidade de provas validadas).
Os procedimentos de cálculo säo diversos. A par do tipo de escala de medida
inerente ao forma . to do item, coloca-se agora o problema também do tipo de escala em
que se apresenta o critério a correlacionar. Algumas vezes a informaçäo é exclusi-
vamente qualitativa e, nessa altura, apenas podemos utilizar procedimentos estatís-
132 Recolha dos dados: procedimentos e instrumentos
ticos tomando o grau de associaçäo das frequências de casos nos vários valores de
cada uma das variáveis. Várias tabelas de cálculo encontram-se disponíveis (Jurgensen,
1947; Edgerton, 1960), requerendo algumas competências na área da Estatística por
parte dos interessados.
Algumas destas análises consideram as respostas de grupos específicos e de
grupos contrastados. Por exemplo, poderia interessar contrastar as respostas aos itens
de uma amostra de depressivos e as respostas de um grupo normal numa escala de
depressäo. Como já referimos, a escala de depressäo IACLIDE (Vaz Serra, 1994)
utilizou este procedimento na análise e selecçäo dos seus itens. Por sua vez, dado que
a construçäo de uma prova envolve diversas aplicaçöes e amostras, alguns autores
defendem a realizaçäo de estudos de cross-validaçäo dos resultados como forma de
se garantir a sua generalizaçäo posterior (Cronbach, 1990, 444). As questöes da
validade das medidas psicológicas podem entender-se como um processo contínuo
de apreciaçäo da qualidade da informaçäo recolhida de acordo com o momento, o
grupo e o contexto das próprias investigaçöes.
Validade interna versus validade externa
Uma questäo particularmente importante no momento da selecçäo dos itens
é a ponderaçäo entre a sua validade interna (consistência ou homogeneidade) e sua
validade externa (ligaçäo à prática, poder preditivo). Sabemos que os melhores itens
a incluir numa prova säo aqueles que apresentam níveis mais elevados num e noutro
coeficiente, contudo o problema surge quando näo se verifica uma coincidência entre
ambos. Com alguma frequência itens com elevada consistência interna podem
apresentar baixa validade externa, e vice-versa. Podemos encontrar-nos perante um
dilema e uma necessidade de optarmos por uma "filosofia" de análise dos itens
trabalhando mais a sua homogeneidade ou mais a sua capacidade de se relacionarei
com critérios externos (Brown, 1976).
Por exemplo, numa escala sobre práticas educativas familiares podemos
encontrar 20 itens sobre rotinas quotidianas em casa (arrumar, acatar ordens, asseio,
tarefas domésticas), estando os restantes 5 itens repartidos por comportamentos
sociais e por atitudes ou valores mais latos. Numa análise destes itens podemos
facilmente esperar que os itens das rotinas quotidianas apresentem índices mais
Metodologia da Investigaçäo em Psicologia e Educaçäo 133
elevados de validade interna que os restantes pois que o total na escala reflecte
sobretudo a presença desses itens (80% da escala é formada por esses itens).
Coeficientes täo elevados podem já näo ocorrer em relaçäo à sua validade externa.
Situaçäo inversa pode encontrar-se com os restantes cinco itens e, inclusive,
podemos pensar que a avaliaçäo das práticas educativas apenas tomando as rotinas
domésticas pode traduzir-se num reducionismo que, na prática, näo nos possibilite a
informaçäo para as decisöes a que a prova vai estar ligada (por norma, os critérios
externos, as situaçöes e as decisöes para as quais a informaçäo das provas psicológicas
vai ser usada säo bastante latos e multifacetados). Teríamos, entäo, de novo o dilema:
optar por uma prova mais coesa, mesmo que menos ligada aos critérios externos, ou
vice-versa?
Näo säo fáceis as respostas a estas questöes. Existem sempre alguns riscos
na decisäo tomada. O mais importante é diminuir os riscos no sentido do objectivo
para que a prova se destina. Por exemplo, se na prova anterior interessava mais
assegurar uma ligaçäo entre os itens (ou o resultado final) e as práticas educativas
familiares, entäo seria preferível prejudicar a hornogeneidade da prova. No fundo,
dois aspectos devem aqui ser retomados: a definiçäo que foi dada da variável a avaliar
através da prova a construir e o objectivo mais de descriçäo/compreensäo dos sujeitos
ou a margem de previsibilidade dos resultados na prova em relaçäo a outros critérios.
Ao nível da definiçäo e da operacionalizaçäo que foi feita do construto,
importa ver se estamos face a um construto unidimensional ou multidimensional. A
ênfase colocada na validade interna tende a seleccionar os itens de acordo com um
critério de unidimensionalidade do construto e da escala. Se deliberadamente o
construto é definido como multidimensional, e este aspecto deve ser tomado na
escala, entäo, ou construímos várias escalas independentes e salvaguarda-se a sua
hornogeneidade, ou näo podemos, tomar apenas o coeficiente de validade interna para
a selecçäo dos itens.
Teoria da resposta ao item (TRI)
Os procedimentos de análise estatística dos itens que acabámos de descrever
integram o que podemos designar por teoria clássica dos testes. Nos últimos anos
134 Recolha dos dados: procedimentos e instrumentos
uma perspectiva diferente tem sido defendida para a construçäo dos testes e para a
análise e selecçäo dos itens. Referimo-nos mais concretamente à item response
theory ou teoria da resposta ao item (TRI). Uma descriçäo mais pormenorizada em
língua portuguesa pode encontrar-se em livro recente (Pasquali, 1996).
Na teoria clássica os resultados estavam bastante condicionados às amostras
de sujeitos e de itens usados nos estudos. Neste caso, as medidas encontram-se
fortemente condicionadas às características dos resultados obtidos, reflectindo estes
por sua vez, as características das amostras e dos itens. Por exemplo, um item pode
ser tido como muito fácil ou muito difícil em funçäo da amostra que o resolve. Assim,
as propriedades do item decorrem menos do construto avaliado e mais dos sujeitos
que respondem. Ao mesmo tempo, num teste de 20 itens assume-se que qualquer um
deles tem o mesmo valor para representar o construto. Isto explica, aliás, que duas
notas de 12 pontos no teste tenham o mesmo significado independentemente dos itens
que foram num e noutro caso respondidos correctamente. Estas säo, pois, algumas das
limitaçöes da teoria clássica dos testes (Muiliz, 1994).
A teoria da resposta ao item pretende ultrapassar estas dificuldades através
de uma estimativa prévia do traço e de uma ligaçäo estreita entre o nível de
desempenho no traço e no item (Hambleton & Swaminathan, 1985). As caracterís-
ticas dos itens deixam de estar dependentes da amostra avaliada, as pontuaçöes do
sujeito näo estäo condicionadas ao tipo de teste e as medidas de precisäo säo
-calculáveis para cada nível de aptidäo.
Esta análise pressupöe a recolha de um largo conjunto de itens e a sua
aplicaçäo a grandes amostras de sujeitos, que devem ser, ainda, bastante heterogéne-
as. Decorre daqui uma estimativa do traço latente que servirá de orientaçäo na análise
das curvas características dos itens (Pasquali, 1996; Mufliz, 1990), ou seja, a pro-
habilidade de acerto ao acaso, o nível de aptidäo exigido na respost4- e a discriminaçäo
(estes säo os três parâmetros mais frequentemente analisados - Lord, 1980). Conhecidas
as características métricas de todos os itens para um determinado atributo psicoló-
gico, podemos estimar a aptidäo correspondente de um sujeito através das suas
respostas a um pequeno grupo de itens, por exemplo, dez itens. O padräo de respostas,
calculado com base na realizaçäo nesse pequeno grupo de itens, permite-nos estimar,
em termos de probabilidade, o nível de desempenho do sujeito no traço em avaliaçäo.
Metodologia da Investigaçäo em Psicologia e Educaçäo 135
Na figura seguinte apresentamos as curvas características de três itens nos três
parâmetros mencionados (Fonte: Pasquali, 1996, 87).
1.0
.9 -
.8_
.7 -
.6-
5
.4 -
.3-
o
-3 -2 1 2 3
Amplitude do traço latente
Os três parâmetros do modelo de Lord (1980) estäo presentes neste gráfico
para cada item (curva característica do item). A dificuldade do item é-nos dada através
do valor no traço equivalente ao momento em que a curva corta a linha que representa
a probabilidade .50 de resposta correcta. O poder discriminativo está representado
graficamente através do formato da curva. Quanto mais íngreme esta curva, ou quanto
mais próxima de um ângulo de incidência de 900, mais discriminativo é o item. Por
último, quando a curva näo atinge a abcissa é sinal de que algumas das respostas
correctas ao item foram devidas ao acaso (sujeitos com zero de traço responderam
acertadamente ao item). O peso das respostas correctas ao acaso é dado pela distância
que vai do ponto O (zero) na abcissa até ao ponto onde a curva corta a ordenada.
Apreciando os resultados obtidos para os três itens na figura anterior,
verificamos que a curva característica do item 3 näo cruza a abcissa mas a ordenada,
136 Recolha dos dados: procedimentos e instrumentos
significando que alguns sujeitos com O (zero) de aptidäo no traço acertam o item
(Ci=. 18). Esta situaçäo já näo acontece com o item 1 e item 2 (Ci=O). Por sua vez, a
dificuldade nos itens 2 e 3 é coincidente (o mesmo valor do traço necessário para .50
ou 50% de respostas correctas). Comparativamente, o item 1 é um item mais fácil
(menos traço é exigido para .50). Finalmente, a discriminaçäo nos itens 1 e 2 é igual
(veja-se a inclinaçäo da curva no momento de inflexäo na recta .50), havendo menos
discriminaçäo por parte do item 3.
Algumas expectativas para a avaliaçäo psicológica decorrem deste novo
modelo de construçäo e análise dos testes. Sendo a unidade de análise o item e näo
o resultado no seu conjunto, ou teste, espera-se que a investigaçäo no futuro possa
responder melhor a algumas dificuldades actuais ou abrir novas perspectivas de
utilizaçäo dos testes psicológicos e educacionais. A informaçäo sobre cada sujeito
pode ser mais precisa dado ser avaliado num determinado nível de aptidäo no traço
ou área curricular. Além disso, esta adequaçäo dos itens ao nível de capacidade do
indivíduo melhora a precisäo da medida, permite comparaçöes inter-sujeitos mais
fidedignas e torna desnecessária a aplicaçäo de grandes conjuntos de itens. Ao mesmo
tempo, uma avaliaçäo e uma informaçäo mais centrada no item permite ultrapassar
algumas das limitaçöes da teoria clássica assente nos resultados. Com efeito, duas
pontuaçöes de 20 numa prova podem ser qualitativamente diferentes consoante o tipo
de itens correctamente respondidos e os processos de resposta utilizados. Finalmente,
esperam-se grandes contributos desta abordagem para os estudos transculturais e para
os estudos longitudinais em face da possibilidade de virem a ser criadas medidas dos
atributos mais independentes dos sujeitos e das respectivas culturas.
Organizaçäo dos itens na prova
Os itens a reter na prova seräo precisamente aqueles que no quadro das
análises qualitativas e quantitativas näo apresentam problemas face aos objectivos da
prova em causa, sendo seleccionados em relaçäo ao conjunto inicial de itens pelos
seus melhores parâmetros estatísticos e informativos. Essa selecçäo näo é tarefa fácil,
muito embora a qualidade da versäo final seja tanto maior quanto a escolha é feita
junto de itens todos eles "bons".
Alguns cuidados devem também ser tidos em consideraçäo quando se trata
Metodologia da Investigaçäo em Psicologia e Educaçäo 137
de organizar a versäo final da prova com base nos itens seleccionados. Em testes de
desempenho, e sobretudo nos testes de aptidäo cognitiva, os itens aparecem organizados
hierarquicamente segundo o seu grau crescente de dificuldade. Este procedimento
traz algumas vantagens à avaliaçäo:
-41) cria se um clima de confiança e sentimentos de auto-eficácia por parte do sujeito......
no Começo da lx.w'.a.
(ii)evita-seaperda de ternI)ocom lici1% iiiaisdifíceisnäoatíngíndoositensmaisfáceis
com possibilidadede re,,ultados diferentesem testesde aptídäonäohierarquizados
poderem estar 11,gados a diferenças de personalidade dos indivíduos (maior ou
menoi- persistêiicia individual quando confrontados com tarefas difíceis, por
exeniplo), e
(iii) C,';ita-sea Coincidêncla (k) cansaço e da desmotívaçäo frequentes ria parte Tina] da
realizaçäo das PRYVZIS COIII Itens mais faceis.
Em testes de realizaçäo máxima, como os testes de inteligência, esta
apresentaçäo dos itens por ordem crescente de dificuldade j ustifica-se, ainda, em face
do tempo limite dado para a sua realizaçäo (por norma esse tempo foi fixado com base
nos 20% primeiros sujeitos a concluir a prova nos estudos de estandardizaçäo e, por
isso, é insuficiente para a sua conclusäo pela maioria dos sujeitos). Acredita-se que,
desta forma, se torna possível assegurar que cada um realize a prova e os itens de
acordo com o seu nível de capacidade real. Veja-se o procedimento de administraçäo
nalgumas provas individuais, como por exemplo a WAIS, onde o psicólogo inicia a
prova por itens que näo os iniciais ou deixa de a aplicar a partir de um determinado
número de insucessos consecutivos. Estamos em face de um esforço de adequaçäo da
avaliaçäo às características do sujeito, neste caso concreto às suas capacidade, de
forma a diminuir perdas de tempo e a näo criar reacçöes contrárias à própria avaliaçäo.
Uma calibraräo mais perfeita entre os níveis de dificuldade dos itens e os
itens a realizar por cada sujeito em funçäo do seu nível de capacidade aparece hoje
melhor conseguido através da administraçäo de testes informatizados. O modelo
computerized adaptative testing (CAT) ou tailored testing consegue, através da
aplicaçäo prévia de um conjunto de itens, situar o sujeito num determinado nível de
dificuldade dos itens e, de uma forma mais rápida e económica, avaliar o sujeito
através de uma amostra mais adequada e reduzida de itens. Uma exigência na
aplicaçäo destes novos modelos, para além de todo o software próprio, passa pela
verificaçäo prévia e forçosa da unidimensionalidade dos itens do teste.
138 Recolha dos dados: procedimentos e instrumentos
Nas escalas de personalidade, nos inventários de atitudes ou nos questioná-
rios de auto-conceito, por exemplo, a organizaçäo dos itens na versäo definitiva da
prova deve tomar outras precauçöes. Por exemplo, deve evitar o agrupamento dos
itens de acordo com especificidades do seu conteúdo, mesmo tratando-se de várias
dimensöes diferentes, isto é, ou se opta por provas separadas ou tratando-se de uma
única prova os itens devem encontrar-se misturados. Esta precauçäo evita que o
sujeito elabore a partir dos primeiros itens, algumas rotinas de resposta ou inferências
lógicas que acabem por afectar as suas respostas no conjunto da prova.
Administraçäo da prova
É importante aceitar uma distinçäo entre teste e testing, separando o instru-
mento do seu uso e, em particular, da sua realizaçäo pelos sujeitos. A avaliaçäo é um
processo mais complexo e cujos contornos, objectivos e fases se podem integrar no
quadro de um problema a resolver (Simöes, 1994). Se quisermos, após um período
de alta crença na objectividade dos testes e de total confiança nos seus resultados,
investigadores e profissionais tornaram-se mais cautelosos em relaçäo a tentativas de
sobreposiçäo entre teste(s) e avaliaçäo. Afinal o teste, ou outro qualquer instrumento
de avaliaçäo, näo passa de um meio. Para além de reportados ao teste, os desempenhos
traduzem as próprias condiçöes em que a avaliaçäo ocorre, parte delas pouco ou nada
tendo a ver com as características do sujeito em avaliaçäo. Neste sentido, os resultados
nos testes näo podem ser absolutizados, täo-pouco tomados como suficientes ou em
separado de um conjunto mais lato de informaçöes referentes à avaliaçäo. É neces-
sário dispôr de outros meios de observaçäo do comportamento do sujeito. Mesmo ao
longo da própria situaçäo de resposta ao teste, deve-se recolher todo um conjunto de
informaçöes sobre a situaçäo de forma a complementar e a dar significado aos valores
obtidos (como os sujeitos começam, as atitudes e cooperaçäo que manifestam, o
respeito que têm pelas instruçöes e pelo trabaffio individual, a linguagem e os gestos,
o método pessoal de trabalho ou a reacçäo aos incidentes, por exemplo).
Estudos no campo da avaliaçäo em Psicologia e Educaçäo aconselham-nos
a ter hoje uma atitude mais abrangente da situaçäo de testing e, ao mesmo tempo, um
posicionamento de maior relativizaçäo face à sua pretensa objectividade. Da Psico-
logia Experimental vieram sobretudo dados preciosos sobre as condiçöes contextuais
Metodologia da Investigaçäo em Psicologia e Educaçäo 139
em que decorre a avaliaçäo e o seu impacto no desempenho dos sujeitos. A Psicologia
Diferencial e a Psicologia do Desenvolvimento ajudam a entender o impacto de
algumas variáveis pessoais na avaliaçäo e no desempenho manifesto, algumas delas
interagindo com as próprias condiçöes de testing. A Psicologia Cognitiva e a Psico-
logia Social salientam que, para além dos comportamentos, temos a sua significaçäo
e representaçäo pelo sujeito, ou ainda as relaçöes e os contextos de vida dos
indivíduos.
O material
A avaliaçäo pressupöe na maioria das vezes o uso de material que se exige
em boas condiçöes e que deve ser adequadamente utilizado. Na grande maioria das
provas psicológicas (testes, escalas, inventários) este material inclui o manual, a
prova e a folha de respostas. Importa que esse material esteja em boas condiçöes de
uso, particularmente equipamento electrónico usado em alguma avaliaçäo laboratorial
ou naturalista. Também nos cadernos de testes papel-lápis se deve dar atençäo a
eventuais marcas deixadas pelos sujeitos em aplicaçöes anteriores.
A leitura das instruçöes, a apresentaçäo e a resoluçäo dos exemplos e
exercícios de treino säo outro aspecto a considerar no material. Importa seguir os
manuais e as ínstruçöes facultadas pelos autores pois que, por norma, estiveram
sujeitas a estudos prévios. O esclarecimento do sujeito deve ser sobretudo feito
tomando as instruçöes e os exercícios de treino, assim como deve ocorrer antes do
início da prova. Deve, por último, obedecer-se ao tempo de realizaçäo proposto e a
sua indicaçäo ou näo aos sujeitos.
A aplicaçäo
Na aplicaçäo das provas psicológicas dever-se-á atender às condiçöes físicas
e ambientais em que a mesma vai ocorrer, o estado físico e psicológico do sujeito, e
a própria relaçäo criada entre avaliador-avaliado e entre avaliado e a situaçäo de teste.
As condiçöes físicas e ambientais em que ocorre a avaliaçäo devem ser adequadas.
Nem sempre as condiçöes de ventilaçäo e iluminaçäo säo as melhores. Algumas vezes
a entrada e saída de pessoas, ou o local onde se encontra a sala näo favorecem o
silêncio necessário. Por outro lado, o tamanho da sala ou o número de sujeitos, a
140 Recolha dos dados: procedimentos e instrumentos
disposiçäo das cadeiras e mesas ou a posiçäo do examinador e dos avaliados entre si
näo favorecem o envolvimento pessoal necessário ou a realizaçäo individual da
prova. Por último, as horas do dia em que ocorre a aplicaçäo, o dia da semana ou o
mês do ano podem também afectar a objectividade da medida.
Em relaçäo ao estado físico dos sujeitos importa atender, por exemplo, ao seu
estado de fadiga, sono, hipoglicernia e saúde em geral. Estes aspectos podem
justificar uma adequada planificaçäo entre tempos de avaliaçäo e intervalos e, dentro
dos tempos de avaliaçäo, aconselhar uma correcta planificaçäo da ordem das provas
a realizar. Por sua vez, falando-se no estado psicológico dos sujeitos, importa referir
que determinadas emoçöes, por norma acrescidas nos momentos de avaliaçäo,
causam interferências na avaliaçäo e afectam os resultados individuais. Aspectos
como a motivaçäo sentida com a realizaçäo da prova, os mecanismos de auto-defesa,
a ansiedade face ao teste, as expectativas de sucesso ou de fracasso e a predisposiçäo
para respostas ao acaso têm sido estudados e tidos como bastante frequentes nas
situaçöes de avaliaçäo (Cronbach, 1990, Cap. 3). Tais interferências ocorrem quer
nos testes formais quer em situaçöes de entrevista, inventários ou quando os sujeitos
se percepcionam observados (técnicas de observaçäo directa). Por último, e no que
diz respeito à avaliaçäo das dimensöes cognitivas, vários autores propöem uma
avaliaçäo dinâmica. Esta significa uma papel mais interactivo por parte do avaliador,
podendo ir desde a mera informaçäo de que a resposta ao item pelo sujeito está certa
ou errada até à situaçäo mais instrutiva de explicar os elementos que integram o item
e os processos requeridos para a sua resoluçäo (Simöes, 1995).
A cotaçäo e interpretaçäo dos resultados
Este ponto apenas pode ser globalmente analisado após a referência aos
procedimentos de aferiçäo dos resultados. Com efeito, a interpretaçäo dos resultados
vai depender, nomeadamente, da sua fidelidade e validade, e sobretudo das normas.
Na quase totalidade das provas psicológicas os resultados Frutos näo säo de inter-
pretaçäo directa, carecendo de parâmetros ou orientaçöes para esse efeito. Tais
orientaçöes podem ter, como veremos, um fundamento mais estatístico ou mais
clínico.
Desde já, no entanto, importa mencionar alguns cuidados por parte do
avaliador quer na cotaçäo quer na interpretaçäo dos resultados obtidos, mesmo que
Metodologia da Investigaçäo em Psicologia e Educaçäo 141
de uma forma bastante geral. Assim, em primeiro lugar, a cotaçäo deve respeitar as
orientaçöes contidas no manual da prova que, por sua vez, foram já precedidas de
estudos normativos prévios. O uso de grelhas de cotaçäo é frequente nos testes de
papel-lápis, cobrindo quer os testes de aptidäo quer a generalidade dos inventários
existentes. Em provas escolares pode-se recorrer a grelhas ou a respostas-modelo para
apreciar a adequaçäo das respostas dadas pelo aluno à resposta idealizada. Noutras
provas e situaçöes de observaçäo informal a cotaçäo é deixada bastante à iniciativa
do avaliador. Por exemplo, nos testes de criatividade e nas técnicas projectavas, o
psicólogo deve seguir as orientaçöes contidas nos manuais e, com algum cunho
pessoal (que se espera tecnicamente apoiado), proceder à cotaçäo dos protocolos.
Também na entrevista e na generalidade das técnicas de observaçäo informal o
psicólogo pode ter um "guiäo" para proceder à sua cotaçäo, analisando o respectivo
conteúdo. Nas situaçöes de observaçäo directa, o avaliador deve ser preciso no registo
dos comportamentos e situaçöes de acordo com a 1ista" que para o efeito foi
elaborada, evitando o mais possível que tal registo seja imbuído de impressöes
pessoais ou atitudes interpretativo-avaliativas.
Por último, cotar uma prova ou um protocolo näo é um acto meramente
mecânico. Mesmo o recurso ao computador para esta tarefa, em provas que se
adequem, näo dispensa uma atençäo a aspectos mais de índole qualitativa. Esta
atençäo, por exemplo analisar as respostas em branco ou os procedimentos de
resposta usados pelos sujeitos, pode ser fundamental na interpretaçäo e na integraräo
posterior da informaçäo recolhida. Uma nota muito fraca num teste está algumas
vezes associada ao facto do sujeito, após responder a 2 ou 3 itens fáceis no início do
teste, começar a responder a partir do último item, entrando na zona dos itens
particularmente difíceis. Enquanto na maioria dos testes psicológicos o resultado
traduz o número de itens correctamente respondidos, ou o total de pontos nos vários
itens likert de uma escala, nas provas escolares a soma das pontuaçöes aos vários itens
é geralmente feita no quadro de uma escala (notas de 1 a 100, de 1 a 5 ou de 1 a 20)
cuja significaçäo se encontra previamente definida e generalizada.
Aferiçäo dos resultados
A aferiçäo dos resultados numa prova constitui um momento decisivo tendo
em vista a sua futura utilizaçäo quer na investigaçäo quer na prática psicológica e
educacional. Estes procedimentos de análise na construçäo das provas säo, no
142 Recolha dos dados: procedimentos e instrumentos
entanto, mais reclamados nas provas psicológicas, por razöes que analisaremos. Na
aferiçäo incluímos toda a informaçäo técnica que importa tomar na análise e na
apreciaçäo dos resultados, mais concretamente as normas ou os padröes para a
interpretaçäo dos resultados brutos, a sensibilidade, a fidelidade e a validade dos
resultados.
Duas preocupaçöes é preciso ter neste momento. Em primeiro lugar, a
aferiçäo näo se deve circunscrever à fixaçäo das normas de interpretaçäo de uma
prova. Mesmo que essa prova tenha sido apenas traduzido para uma nova populaçäo,
ou nem sequer isso tenha ocorrido em face do seu material näo-verbal, importa
conhecer a sensibilidade, fidelidade e validade dos resultados na nova amostra e na
populaçäo a que se destina. Daí que estas análises näo devam apenas ser realizadas
quando está em causa a construçäo de um novo teste. Essa informaçäo é requerido
quando está em causa a aplicaçäo de uma prova construída para um grupo diverso,
muitas vezes de um outro país, daquele para quem se deseja transpôr agora a sua
uflizaçäo. A confusäo anterior vem sobretudo de uma prática frequente, mais no
mundo profissional que acadêmico, de se tomar uma prova estrangeira e aferi-Ia para
a populaçäo portuguesa fazendo-se apenas a normalizaçäo dos resultados. O conceito
de aferiçäo, quanto a nós, é mais lato e implica para além das normas, o estudo das
características metrológicas dos itens e dos resultados no sentido das análises que já
mencionamos atrás e de outras que veremos de seguida (sensibilidade, fidelidade,
validade).
Em segundo lugar, estas análises näo säo específicas dos testes centrados em
normas, nem das técnicas de avaliaçäo mais formal. Veremos que foi sobretudo no
contexto dessas provas que esta metodologia de análise se desenvolveu, contudo näo
pode ser exclusiva da construçäo dessas provas a questäo do rigor, da precisäo ou do
valor da informaçäo recolhida. Também nos testes referendados a critério, nas provas
escolares, nas técnicas de registo, na entrevista ou nos registos de acontecimentos
importa assegurar tais qualidades para a informaçäo recolhida.
Características metrológicas dos resultados
Incluem-se aqui as características usualmente denominadas por sensibilidade,
fidelidade e validade dos resultados. A par destas três, alguns autores fazem referên-
cia a outras de índole prática ou essencialmente postuladas numa lógica dos utilizadores.
Está neste caso a usabilidade de um teste (Gronlund, 1976, 125-8), onde se pondera,
Metodologia da Investigaçäo em Psicologia e Educaçäo 143
entre outros aspectos, a facilidade de aplicaçäo, o tempo requerido para a sua
aplicaçäo, a facilidade de estandardizaçäo dos resultados, a facilidade de correcçäo
e de interpretaçäo, a existência de formas equivalentes do teste, o seu próprio custo
ou a existência de suporte informático para o tratamento d--s respostas.
Caracterizaremos neste texto apenas as três características metrológicas mais
referendadas nos manuais. Entretanto, importa esclarecer alguns aspectos. Em
primeiro lugar, é mais correcto reportar os coeficientes de sensibilidade, de fidelidade
e de validade, näo ao teste em si mesmo, mas aos resultados. Este aspecto permite
desde logo salvaguardar que um teste pode reunir tais características num dado grupo
ou situaçäo e näo noutro. Pode ser um bom teste num país e näo noutro, pode ser um
bom teste para a selecçäo profissional e näo para a descriçäo operacional das
capacidades cognitivas de um sujeito, ou pode ser bom para a seriaçäo dos candidatos
ao Ensino Superior e näo para avaliar as aquisiçöes dos alunos no final do Ensino
Secundário.
Em segundo lugar, a grandeza numérica dos coeficientes obtidos a este
respeito, ou a sua adequaçäo em relaçäo aos objectivos do teste, está associada à
heterogeneidade das amostras ou à maior variância observada nos resultados em
análise. Como em qualquer coeficiente de correlaçäo, a grandeza numérica depende
da variabilidade dos resultados esperando-se maiores coeficientes em amostras mais
diversificados. Mais uma vez, é mais correcto falarmos em sensibilidade, fidelidade
e validade dos resultados num teste, logo acrescentando as especificaçöes do grupo
avaliado, do que remeter tais valores directamente para o teste em si mesmo. Estamos
face a uma das limitaçöes da "teoria clássica dos testes" na medida em que se descreve
as propriedades de um teste a partir dos "objectos" medidos (Mufliz, 1994, 43).
Em terceiro lugar, os valores nestes três coeficientes, em termos de aceitaçäo
como adequados, näo obedecem à Iei do tudo ou nada". Eles dependem dos aspectos
já enumerados e do próprio tamanho do teste, por exemplo. Para além da explicaçäo
estatística associada à maior variabilidade cios resultados que um teste mais longo
pode proporcionar, certo também que, ao aumentarmos o seu tamanho, estaremos a
diminuir o impacto de factores ocasionais de erro e a aumentar a probabilidade da
variável psicológica se encontrar melhor representada na amostra de itens aplicados
(Ebel, 1972). Por último, o recurso a instrumentos na avaliaçäo pretende diminuir a
subjectividade na mesma avaliaçäo. A eliminaçäo de todo o erro é impossível, pelo
que o recurso a instrumentos que em certo grau consigam diminuir essa subjectividade
está justificado.
144 Recolha dos dados: procedimentos e instrumentos
Sensibilidade dos resultados
Entende-se por sensibilidade dos resultados numa prova o grau em que os
resultados nela obtidos aparecem distribuídos diferenciando os sujeitos entre si nos
seus níveis de realizaçäo. Se as características psicológicas apresentam uma distribui-
çäo dos sujeitos próxima das leis da curva gaussiana ou normal (Anastasi, 1990, 74),
a sensibilidade tem entäo a ver com a adequaçäo dos resultados à distribuiçäo de
acordo com as propriedades daquela curva.
A sensibilidade dos resultados näo aparece frequentemente analisada nos
manuais de metodologia de investigaçäo ou de avaliaçäo. Provavelmente, a menor
ênfase selectiva na utilizaçäo das provas psicológicas no presente retira-lhe alguma
pertinência e actualidade. Por outro lado, as provas escolares näo têm, declaradamente,
como objectivo uma distribuiçäo gaussiana dos seus resultados.
Os procedimentos de análise da sensibilidade dos resultados säo diversos,
embora todos ligados à questäo da normalidade ou näo-normalidade da distribuiçäo
dos resultados em análise. Em primeiro, podemos analisar o leque de resultados e
esperar que ele percorra o intervalo entre um número mínimo de itens correctos (2 ou
3 itens) e o número máximo de itens na prova. Em segundo lugar, podemos apreciar
a média dos resultados e a sua proximidade em relaçäo à mediana e à moda da
distribuiçäo (valores que se sobrepöem numa distribuiçäo gaussiana). Em terceiro
lugar, podemos analisar os coeficientes de assimetria e de curtose esperando que näo
se afastem da unidade. Por último, podemos proceder à análise da correspondência
das percentagens observadas em relaçäo às esperadas (qui-quadrado) tomando as
várias unidades de desvio, por exemplo numa distribuiçäo em cinco classes
normalizadas (classes descritas à frente).
Alguns factores afectam o coeficiente de sensibilidade dos resultados, para
além de alguns mais gerais referidos anteriormente:
o t@imanIio da amostra e a sua representatividade näo serem suficientes para
imssibilitar tinia Pior distribuiç'àto dos resuitados lidas provas,
(ii) os itens rias provas apresentarern algurrias particularidades como, [.x)r exem-
elo, serem milito faceis ou milito difíceis para o,,rtirx) em c@ttis@t-,
(iii) os itens serem anil)íguos. ou cricontrarem-se mal hierarquizados. tornando os
resultados finais poLIC( c(es(s em termos interindividuais;
Metodologia da Investigaçäo em Psicologia e Educaçäo 145
(iv) o tempo de execuçäo ler sido deniasiado Ion go ou curto näo perinitindo unia...
adequada (111'ct-cficl;iç,-io dos desempeifilos
(v) a aplicaçäo da prova iiäo ler sido a anais adequada. os sujeitos iiäo se
cíi,@,olvererri im realizaçäo da prova, as coii(liç@)es anibictilms externas liäo
serena adequarias ou as riläo terem sido respeitackts.
Fidelidade dos resultados
A fidelidade dos resultados numa prova diz-nos algo sobre o grau de
confiança ou de exactidäo que podemos ter na informaçäo obtida. O conceito
apresenta duas significaçöes mais habituais: o teste avalia o mesmo quando
aplicado em dois momentos diferentes aos mesmos sujeitos (conceito de
estabilidade ou constância dos resultados) e os itens que compöem o teste
apresentam-se como um todo homogéneo (consistência interna ou
hornogeneidade dos itens). No quadro da teoria psicométrica o primeiro
conceito foi predominante. Claro está que temos algumas dificuldades em pensar
o conceito de estabilidade em sentido absoluto, por exemplo no sentido de que
os resultados dos indivíduos permanecem uniformes ao longo do tempo. O
conceito deve, antes, assumir-se em sentido relativo, ou seja, os sujeitos tendem a
manter as respectivas posiçöes ao longo do tempo e para além de mudanças
operadas nas reais características avaliadas.
Os métodos de cálculo da fidelidade dos resultados, todos eles assentes em
coeficientes de correlaçäo de resultados, podem subdividir-se consoante está em
causa uma análise assente na estabilidade ou uma análise assente na consis-
tência. Para o primeiro caso podemos utilizar o método do teste~reteste com o
mesmo teste, ou teste-reteste com formas paralelas (equivalentes ou alternadas).
Para o segundo caso podemos recorrer ao método da bipartiçäo dos itens e ao da
consistência interna dos itens. O quadro seguinte permite-nos uma comparaçäo
entre os quatro métodos de cálculo da fidelidade dos resultados frequentemente
assinalados na literatura.
146 Recolha dos dados: procedimentos e instrumentos
Quadro IV.3 - Descriçäo sumária dos métodos de cálculo da fidelidade
Método Tipo de NeIMade Vuriância de erro Procedimento Estatística
Teste-retesle Flutuaçäo teniporal 1 teste - 1 grupo - r de Pearson
2 aplicaçöes rbô de Spearnian
Reteste Coni Equivalência itens 2 testes - 1 grupo - r de Pearson
fórnias-paraIcIa@ Especificidade Flutuaçäo teniporal 2 aplicaçöes rliô de Spearman
Acordo inier- 1.`quivalência Treino dos (Verva- 1 sitiado - 1 registo - @k, de acordos
-observadores doreS - 2 obema&ires
B#mioo CMStênck IIspecinc*de dos 1 teste - 1 grupo - r de Purson
E~Ada Ans 1 aplicaçäo Correcçäo de Spear-
mail-Brown
ConsjsT@ncia Consisiência Especúcidade dos 1 wsm - 1 grupo AJOa de C~M
inwma bens 1 aplica Kuder-Richardrson
I leterogencidade dos
bens
L
Teste-reteste com a mesma forma do teste
Neste método a prova é passada mais que uma vez aos mesmos sujeitos e
correlacionam-se os resultados obtidos nas duas aplicaçöes. Espera-se, no caso da
fidelidade, que se obtenham nas duas aplicaçöes os "mesmos" resultados. As
condiçöes nas duas aplicaçöes devem ser o mais possível equivalentes e os coeficientes
de correlaçäo a usar väo depender da natureza mais quantitativa ou qualitativa dos
resultados (testes paramétricos ou näo-paramétricos de correlaçäo).
Um dos problemas que surge no uso deste método, para além dos custos
envolvidos com a segunda aplicaçäo da mesma prova, é a sua justificaçäo aos sujeitos
e a manutençäo das mesmas condiçöes no teste e no reteste. Em segundo lugar,
algumas dificuldades estäo inerentes à existência de um intervalo de tempo ente as
duas aplicaçöes leste intervalo näo deverá @,er demasiado curto que proporcione uma
transiçäo de aprendizagem ou informaçäo memorizada da primeira para a segunda
aplicaçäo (e que näo seria do mesmo grau em todos os sujeitos), nem pode ser una
intervalo demasiado longo que possa permitir alteraçöes significativas dos sujeitos
em termos do seu desenvolvimento ou outras aprendizagens (também näo igualmente
repartidos por todos os sujeitos). Associada ao intervalo, podemos mencionar ainda
a idade dos sujeitos e, por exemplo, em crianças de pouca idade, sabemos que um
Metodologia da Investigaçäo em Psicologia e Educaçäo 147
intervalo de alguns meses pode ser suficiente para favorecer a ocorrência de
aquisiçöes desenvolvimentais ou outras que venham afectar a medida da variável
psicológica em causa (quando näo a própria variável).
Por último, podemos afirmar uma interacçäo entre o intervalo de tempo e o
tipo de teste ou conteúdo avaliado. Este aspecto traduz-se, por exemplo, na diferença
ente urntesle de raciocínio abstracto ou séries de números e um teste de memória
auditiva ou de informaçäo. Enquanto que em relaçäo aos primeiros um período mais
curto de tempo poderia näo trazer qualquer problema (veja-se o carácter repetitivo das
séries de números), esse mesmo período seria já êlesaconselhado tratando-se de uma
prova de memória em face da maior transposiçäo de informaçäo da primeira para a
segunda aplicaçäo neste último caso.
As limitaçöes ou as dificuldades que apontamos a este método justificam as
recentes opçöes por métodos assentes na consistência dos itens, os quais implicam
apenas uma aplicaçäo da prova. Se o intervalo de tempo näo pode ser demasiado longo
por causa das diversas experiências educativas que possam ocorrer nesse período,
nem demasiado curto por causa da transferência de procedimentos e de informaçäo
da primeira para a segunda aplicaçäo, fica-se com muitas dúvidas quanto à duraçäo
ideal em cada caso (grupo de sujeitos, tipo de prova). No final, se o coeficiente obtido
é bom diremos que o intervalo de tempo foi o adequado, se é fraco pensamos o
contrário. Finalmente, como em qualquer correlaçäo entre duas medidas associadas,
o coeficiente tende a diminuir à medida que se aumenta o intervalo de tempo entre as
duas aplicaçöes em face das maiores dificuldades em se manter a "mesma" situaçäo
de testing e as mesmas condiçöes por parte dos próprios sujeitos (Gronlund, 1976).
Teste-reteste com formas paralelas
Em termos de metodologia e de procedimentos estatísticos este método näo
se afasta do anterioL A existência de duas aplicaçöes traz de novo o problema da
transferência de aprendizagem da primeira para a segunda aplicaçäo, ainda que aqui
já mais atenuada pela näo perfeita coincidência do material. Outras questöes a
propósito da duraçäo do intervalo entre as duas aplicaçöes, ou entäo o tipo de testes
e grupos de sujeitos, podem retirar-se do que ficou exposto em relaçäo ao método
anterior.
148 Recolha dos dados: procedimentos e instrumentos
A maior dificuldade com este método tem a ver com o problema de se
conseguirem, de facto, duas versöes equivalentes de um mesmo teste (igualdade no
conteúdo, dificuldade e forma - Garrett, 1962, 181@,ko nível das situaçöes escolares,
estando delimitada a área curricular, a construçäo de duas -versöes paralelas para um
teste parece-nos bem mais fácil do que era relaçäo às dimensöes psicológicas, pelo
menos em países como Portugal com poucos desenvolvimentos na área da avaliaçäo
psicológica.
Acordo entre observadores
Nas técnicas de observaçäo informal, por exemplo na observaçäo sistemática
através de listas de comportamento ou da observaçäo "desarmada" de uma situaçäo
com recurso a uma grelha de observaçäo, utilizasse o acordo entre dois ou mais
observadores independentes para afirmar a fidelidade dos resultados obtidos. A
lógica neste caso é a seguinte: estando ambos os avaliadores treinados para a
observaçäo e sendo a situaçäo a observar a mesma (por exemplo, gravada em vídeo),
espera-se no final que ambos cheguem aos mesmos registos e resultados. No caso
contrário, dipsuá que a grelha näo é precisa para a observaçäo em causa.
Este método, desde logo, pressupöe a equivalência dos diferentes avaliadores.
Os autores sugerem o seu treino prévio e, apenas após se garantir uma alta percen-
tagem de acordo nas respectivas observaçöes, poderemos usá-los para apreciar a
fidelidade dos resultados. Näo se trata, pois, de um método fácil embora seja o método
disponível na generalidade das situaçöes de observaçäo informal. Níveis de acordo
em torno de 80 % säo igualmente necessários para assegurar a confiança nos registos.
Bipartiçäo ou duas metades
Trata-se de uma única aplicaçäo da prova analisando-se, de seguida, a
correlaçäo entre duas metades formadas pela divisäo dos seus itens. A formaçäo das
duas metades deve ser feita com algum princípio lógico. Se os itens estäo organizados
segundo um grau crescente de dificuldade, o procedimento para assegurar a equi-
valêncAa das uas metades é formá-las tomando alternadamente os itens pares e os
itens ímpares. Uma divisäo da prova entre um primeiro conjunto de itens e um
segundo conjunto, tomando a primeira e a segunda metade dos itens na prova, näo é
Metodologia da Investigaçäo em Psicologia e Educaçäo 149
aconselhável (mesmo em escalas ou outras provas que näo de desempenho) dado que
frequentemente a segunda metade, onde se incluem os últimos itens da prova, poderá
näo ter sido realizada com o mesmo envolvimento da primeira. Habitualmente,
verificam-se na segunda rnetade da prova alguns efeitos de fadiga ou de aborrecimento.
A equivalência das duas metades ficaria, assim, posta em causa.
Os coeficientes de correlaçäo a utilizar dependem da natureza da escala de
medida em presença. Independentemente disso, e pelo facto de estarmos a calcular o
coeficiente de correlaçäo com base em duas metades do teste e näo tomando este no
seu conjunto (aspecto que afecta negativamente o coeficiente de correlaçäo dada a
menor variabilidade dos resultados)Justifica-se a aplicaçäo de uma fórmula correctiva
ao coeficiente inicialmente obtido. Trata-se da aplicaçäo da fórmula de correcçäo de
Spearman-Brown para atenuar o efeito negativo da diminuiçäo do leque dos resul-
tados na grandeza do coeficiente obtido ou, por outras palavras, estimar o coeficiente
esperado se o mesmo fosse calculado com o tamanho do teste na sua globalidade
(Anastasi, 1990, 121):
n rjj
+ (n - r
n - número de vezes que o teste é partido
re,-1.- coeficiente estiniado
rH - coedificiente de correlaçäo (cicias metades)
O método da bipartiçäo é de fácil aplicaçäo à generalidade das provas, excepto
nas provas de ve locidade. A tomada dos resultados de uma única aplicaçäo permite
que se eliminem as variaçöes de erro devidas a alteraçöes ocorridas durante o
intervalo ern duas aplicaçöes separadas. Como desvantagem é de refc,,. ir que os erros
ocasionais se distribuem por ambas as metades podendo isso "inflacionar' o coefi-
ciente final obtido (mais incisivo se o teste tem poucos itens)-
Consistência interna dos itens
Entende-se por consistência interna o grau de uniformidade e de coerência
eAstenk ente as respostas dos sujeitos a cada um dos itens que compöem a prova
150 Recolha dos dados: procedimentos e instrumentos
(Meuris, 1968). Outras designaçöes aparecem nos manuais para designar este
método, por exemplo, a consistência inter-itens ou equivalência racional (Garrett,
1962, 184). Nalguns artigos aparece ainda indevidamente identificado por coeficien-
te "alpha", nome do procedimento estatístico usado nas escalas com itens de tipo
1ikert.
Em termos de procedimento, este método requer apenas uma única aplicaçäo
da prova. Os coeficientes disponíveis para o seu cálculo procuram avaliar em que grau
a variância geral dos resultados na prova se associa ao somatório da variância item
a item. Isto explica porque, em testes de velocidade, este procedimento de cálculo da
fidelidade também näo possa ser usado.
Em funçäo das respostas aos itens serem dicotómicas ou se distribuírem por
urna escala ordinal, devemos usar o coeficiente de Kuder-Richardson (1937) ou o
coeficiente alpha de Cronbach (1951), respectivamente. Para o cálculo do Kuder-
Richardson podemos utilizar a seguinte fórmula (Anastasi, 1990, 123):
K - n.@' de iteris do teste
KR 20' K 1 - @:J)(J Var. - variância geral dos restiltados
K- 1 V@_1r pq - sonia da proporçäo de certos (p) e de cri-os (q) a
Cada ali] dos itens.
Em alternativa à fórmula anterior, e quando näo dispomos de um computador
para cálculo do somatório item a item, podemos recorrer a uma outra versäo próxima
da fórmula (K.R-21). Assume-se, aqui, que uma mesma proporçäo de sujeitos responde
correctamente a cada um dos itens. Segundo Garrett (1962, 186), mesmo nos testes
com um grau de dificuldade variável de item para item, esta versäo simplificado da
fórmula garante uma boa apreciaçäo cia fidelidade dos resultados
il - n.` de itens do teste
KR - ri . Var - M (ri - Nä) Var- - variáricia geral dos restiltados
2C M (ri - 1 )
M - rnédia dos restiltados no teste
Metodologia da Investigaçäo em Psicologia e Educaçäo 151
No cálculo do alpha de Cronbach, podemos voltar à fórmula KR20 e
substituir 2 pq pelo sornatório da variância dos resultados item a item (Anastasi,
1990, 124).
A concluir, devemos referir a aposta que hoje os construtores de testes
colocam na consistência interna ou homogeneidade dos itens para a apreciaçäo da
garantia dos resultados. Trata-se de uma questäo decisiva no uso dos testes,
nomeadamente quando se pretendem normalizar resultados e comparar
desempenhos individuais. Num teste cujos itens näo se apresentem homogéneos,
rigorosamente näo se podem somar as respostas item a item nem, täo-pouco
podemos assumir que medimos essa variável através de uma escala intervalar de
medida. Acrescentaríamos que, mesmo havendo consistência interna em face dos
bons índices de intercorrelaçäo entre os itens ou entre estes e o total, podem
subsistir algumas especificidades dos itens (por exemplo, as estratégias usadas
e outros circunstancialismos das respostas). Quando os coeficientes apontam
para a falta de homogeneidade, entäo faz menos sentido assumir naquela prova
uma nota ou classificaçäo global.
Aspectos gerais sobre fidelidade
O método usado no cálculo da fidelidade dos resultados afecta a grandeza dos
coeficientes obtidos. Os métodos assentes na consistência interna dos itens tendem
a suplantar os coeficientes assentes na estabilidade. Assim, enquanto se exige um
coeficiente igual ou superior a .85 nos métodos assentes na consistência interna, tal
valor desce para .75 quando nos reportamos a métodos assentes na estabilidade. A
inconsistência dos resultados num teste conduz necessariamente à sua instabilidade
(Meuris, 1968), assim como a estabilidade dos resultados será tanto maior quanto
mais elevado o coeficiente de consistência interna.
Um procedimento prático a usar pelos autores dos testes para atingirem o
valor desejado de fidelidade dos resultados no seu teste consiste no aumento do
número de itens. Afórmula de Spearman-Brown pode servir esse objectivo (o valor
de n indica-nos o número de vezes que o teste deve aumentar o seu tamanho em
relaçäo ao tamanho actual - Garrett, 1962, 189):
152 Recolha dos dados: procedimentos e instrumentos
rnn -r n - vens que o tamanho ti) leste deve aunientar
n r correlaçäoJá encontrada
rné wwdificienle de c@ii-rel@tÇ,-to que se deseja.
Quanto ao acordo entre observadores, os autores defendem uma percentagem
de acordo nunca inferior a 90% (cálculo tomando a globalidade dos registos, mesmo
daqueles que indicam a ausência de um determinado comportamento da grelha
utilizada). Nas fórmulas em que näo entram os acordos nas situaçöes de ausência da
observaçäo ou de ocorrência dos comportamentos essa percentagem de acordo pode
ser mais baixa (75 ou 80%).
Neste momento importa referir que o valor numérico encontrado para o
coeficiente de Edelidade poderá, só por si, näo ser significativo para os objectivos da
avaliaçäo. O valor encontrado deve ser devidamente enquadrado num conjunto de
aspectos que lhe däo sentido e que o podem relativizar quer quando se situa acima quer
abaixo do limiar antes enunciado. A ponderaçäo deve tomar em consideraçäo a
natureza do teste, o seu tamanho, a variabilidade do grupo e o próprio objectivo do
teste (Garrett, 1962, 199-200).
14 uúlkaçäo na prática do coeficiente de fidelidade dos resultados, nomeada-
mente quando se analisa um resultado individual, é feita através do cálculo do erro
padräo da medida (EPM). Este coeficiente correctivo, ou margem de erro esperada
num resultado individualmente tomado, surge nalguns manuais como a indicaçäo do
grau de garantia esperada com os resultados naquela prova. O procedimento parece-
nos o mais correcto na medida em que, na prática, poucos profissionais sabem chegar
ao seu cálculo através do coeficiente de fidelidade indicado.
Erro padräo da medida
O coefícieme de fídelidade pode assumir-se como a proporçäo da variância
total dos resultados obtidos determinada pela variância das notas verdadeiras e näo
fruto de erros ocasionais da medida. Assim sendo, fidelidade define-se como a razäo
Metodologia da Investigaçäo em Psicologia e Educaçäo 153
ente a variância dos resultados verdadeiros e a variância total dos resultados, sendo
esta igual à soma da variância dos resultados verdadeiros acrescida da variância de
erro ffibel, 1972). O erro padräo da medida (EPM), partindo-se do coeficiente de
fidelidade (rii) já obtido, é calculado da seguinte forma:
UNI - DP ro
1.`AIM - erro padräo da niedida
D11 - Desvio-padräo dos resultados ria prova
r Coeficiente de Fidelidade calculado
Vejamos um exemplo: na prova das Matrizes de Raven o desvio-padräo dos resultados
constante do manual é de 6.50 pontos, enquanto que o coeficiente de fidelidade teste-reteste se situou
em 0.96. Qual o valor do UM a considerar na análise dos resultados nesta prova? (R=1.30)
A utilizaçäo do EPM na análise dos resultados individuais remete-nos para as
Ieis da curva normal". Por exemplo, sabendo-se que entre uma unidade de desvio
acima e abaixo da média encontramos 67% dos casos, entäo somando e subtraindo
à nota do indivíduo uma unidade de EPM nós podemos afirmar que, com uma margem
de 67% de confiança, a sua nota se situa entre o intervalo inferior e superior
calculados. Níveis mais elevados de confiança podem procurar-se, aumentando o
número de unidades de UM tomados, ou seja, o leque de notas. Se quisermos, o
aumento do grau de confiança num dado resultado encontra-se logicamente associado
ao maior intervalo de notas possíveis. No entanto, a partir de certo momento deixa de
fazer sentido pois passamos a ter muita confiança, mas a nota situasse num intervalo
de valores dernasiado aberto. Cada situaçäo prática determinará o grau de confiança
que se considera oportuno considerar.
Validade dos resultados
Como para a fidelidade, verifica-se hoje uma dupla significaçäo para o termo
validade (Anasosi, 1990, 139J 1% primeiro lugar, o termo significa em que medida
os resultados no teste estäo a rnedir aqdlo que pretendem medir, sendo este o sentido
tradicional de validade. Em segundo lugar, o termo significa o conhecimento que
154 Recolha dos dados: procedimentos e instrumentos
possuímos daquilo que o teste está a medir. Uma mudança significativa se introduz
com a inclusäo deste segundo sentido e com o reconhecimento, cada vez mais
frequente, que, antes de sabermos se o teste mede (prediz) aquilo que pretende, im-
porta sabermos o que ele está efectivamente a avaliar.
A opçäo na psicometria clássica pelo primeiro significado decorre da ênfase
colocada no poder preditivo dos resultados dos testes, quer em termos de futuro
(prognóstico) quer em relaçäo a situaçöes simultâneas no tempo. Assim, classicamente,
validade dos resultados näo significa apenas o grau em que avaliam o que pretendem
medir (Freeman, 1974, 98) mas também o grau em que predizem um comportamento
relacionado com a variável psicológica avaliada. A ênfase actual nas próprias
dimensöes psicológicas (traços, factores, dimensöes) explica que esse conceito de
validade se encontre agora de algum modo relativizado, assistindo-se a uma preo-
cupaçäo maior por parte dos investigadores com o conhecimento da significaçäo
psicológica dos resultados no teste.
Algumas precauçöes devem ser tidas no uso do termo validade:
J, --- äe--- , 'C" .. (--- re""t' ""'
(i a valida diz r sl-wito a )s sul ad ) obtidos e näo ao instrumento em s-i mesmo.
CSmo y aNmám(m cN coeficientes obtidos väo depender das condiçöes em qu@@]
as probas foram utilizadas, do objectivo que presidiu à sua aplicáçäo@e@@d@]
hornogencidade ou lieierogeneidade dos grupos tornados;
a ~atle näo Medece ao princípio do "tudo ou nada" podendo ser graduadg
imporlarido que a iní'ormaçäo proporcionada po. r uma prova nos ajude nas I
decisöes e reduzatiLwns erros de inferência que n
aperias pelas leis do acaso;
No a validade é sempre referendada a um uso específico dos resultados
1976, 81);
iv) os coeficientes obtidos väo depender do tipo de critérios externos usados, dá
ninar ou merior proximidade com as situaçöes a,@,alitokts. com a ob@jectividad@@ 111
imwnw m, ws"@i(los tio critério e com o intervalo que medeia entrem avaliaçäo
na prova e a avaliaçäo no critério.
Várias metodologias estäo disponíveis para o estudo da validade. Em relaçäo
a posiçöes mais recentes, e onde tudo parece reduzir-se à validade de conceito, a
classificaçäo por nós usada permite ao leitor um conhecimento mais diverso e mais
organizado, certamente que ainda mais histórico, dos procedimentos de cálculo.
Metodologia da Investigaçäo em Psicologia e Educaçäo 155
Analisaremos, desta forma, os três tipos de validade mais frequentes: validade de
conteúdo, validadepor referência a um critério e validade de construto ou conceito.
Validade de conteúdo
Também chamada de validade lógica, a validade de conteúdo tem a ver com
o grau de adequaçäo dos itens em relaçäo à dimensäo do comportamento avaliada pela
prova. Como o próprio nome o deixa antever, procura-se apreciar em que medida o
conteúdo da prova (itens) cobre os aspectos mais relevantes do construto (definiçäo
operacional da dimensäo psicológica avaliada). Esta análise de adequaçäo do con-
teúdo toma uma dupla orientaçäo: a sua relevância e a sua representatividade (content
relevance e content coverage - Messick, 1980).
A metodologia seguida para esta análise interliga, forçosamente, a definiçäo
operacional do construto com os domínios abarcados na prova através dos itens que
a compöem. Utilizando uma tabela de especificaçöes, podemos analisar em que medida
as definiçöes mais importantes do construto aparecem reunidas nos itens da prova (e
sobretudo essas), salvaguardando-se nesta altura o critério da relevância ou importân-
cia. A mesma tabela permite-nos verificar se os itens que aparecem com uma maior
frequência ou ponderaçäo correspondem também às definiçöes mais importantes da
descriçäo do construto (critério agora da representatividade).
Esta análise qualitativa e substantiva de uma prova psicológica é bastante
difícil. Existem dificuldades especiais nos testes psicológicos: problemas na deli-
mitaçäo e definiçäo das dimensöes, dificuldades na sua descriçäo em termos
operacionais ou de comportamentos, e grande necessidade de recurso aos especia-
listas e às revisöes bibliográficas, infelizmente com baixo acordo entre si na maioria
dos casos. Alguns autores sugerem o seu uso nas fases iniciais de construçäo da prova
(em que medida a amostra de itens tomada poderá garantir uma avaliaçäo da dimensäo
no seu todo - Guion, 1974).
O procedimento é mais fácil em testes de conhecimentos, por exemplo nos
testes escolares e profissionais referendados a critério. Aqui, näo só o domínio
aparece mais claramente definido, como os objectivos e os comportamentos esperados
no final se encontram igualmente prefixados. Além disso, e no que diz respeito ao
NI
156 Recolha dos dados: procedimentos e instrumentos
critério da representatividade, vários elementos informativos podem tomar-se quan-
do näo se encontram logo à partida definidos (temas ao longo do programa, número
de aulas por ternas, número de textos de apoio ou de páginas no manual para cada
tema). Säo provas reportadas a domínios onde está claramente definido o âmbito a
avaliar, ponderadas as várias partes do programa e fixados os objectivos prosseguidos.
Por tudo isto, torna-se mais fácil reunir itens próximos e retirados das próprias
aprendizagens, bem como apreciar na construçäo da prova se os aspectos da
relevância e da representatividade dos itens se encontram devidamente salvaguardados.
Algumas expressöes da validade frequentemente associadas à validade de
conteúdo podem aqui ser mencionadas. Falamos em validade de conteúdo ou em
validade lógica, assumindo-se os dois termos como sinónimos. Trata-se de encontrar
um paralelismo entre aquilo que o teste pretende avaliar e o conteúdo dos itens que
o compöem. Por exemplo, esperam-se itens representando engrenagens numa prova
de aptidäo mecânica, como se esperam itens reportados a timbre e intensidade de sons
num teste de aptidäo musical. Algumas vezes na literatura encontra-se também a
expressäo validade racial tomada erradamente como sinónima. Entende-se por va-
lidade racial, também dita "validade aparente", a percepçäo da prova como estando
a avaliar aquilo que pretende medir (o teste parece medir aquilo que é suposto medir
- Kline, 1979, 8). Para certos sujeitos, por exemplo com adultos, é importante a
validade facial da prova. Assim, näo lhes devem ser apresentados itens lúdicos ou
infantis, ou situaçöes que lhes possam parecer absurdas ou "estúpidas" para a sua
idade ou nível de escolaridade. Discrepâncias a este nível, mesmo que numa fase
inicial do teste, podem dificultar a cooperaçäo e envolvimento dos sujeitos na
avaliaçäo. O problema parece mais frequente em testes de interesses e de persona-
lidade (padröes estereotipados de resposta podem, entäo, tornar-se frequentes nos
indivíduos).
Validade por referência a critério
A validadepor referência a critério foi, durante muito tempo, a única e a mais
importante forma de validar um teste. Ela está intimamente ligada ao primeiro
conceito a que a expressäo "validade" aparece associado (grau em que o teste mede
aquilo que pretende medir). Chamada validade externa, validade empírica, validade
de critério ou validade por referência a critério (criterion-related validity) ela é
Metodologia da Investigaçäo em Psicologia e Educaçäo 157
avaliada através do grau de relacionamento que é possível obter entre os
resultados na prova (preditores) e a realizaçäo dos sujeitos em critérios externos,
supostamente associados ou dependentes da dimensäo psicológica que a prova
avalia (Guion, 1974). Trata-se, pois, do tipo de validade que decorre da
perspectiva psicométrica de observaçäo (desempenhos e comportamentos em
geral como reflexo de factores internos a avaliar, testes como "bons" instrumentos
de avaliaçäo das dimensöes internas, estabilidade das dimensöes e possibilidade
de boas inferências actuais e futuras a partir dos resultados nos testes para outras
situaçöes).
A validade por referência a um critério aparece, nalguns manuais,
subdividida em validade concomitante ou concorrente e validade preditiva ou de
prognóstico. Falamos em validade concomitante ou concorrente quando se
verifica uma simultaneidade no tempo entre a aplicaçäo do teste e a obtençäo
das notas reportadas ao critério. Por validade preditiva ou de prognóstico
entendemos os coeficientes obtidos através de estudos onde a informaçäo relativa
à prova e ao critério näo säo obtidas em simultâneo e, por norma, a informaçäo
no critério externo é posterior aos resultados no teste (Messick, 1980). O interesse
desta última validade está associada à utilizaçäo da avaliaçäo psicológica para
predizer o comportamento futuro dos sujeitos. O sentido clássico da orientaçäo
escolar e profissional, a selecçäo profissional ou a avaliaçäo dos traços de
personalidade de una criminoso, ilustram a iniportâncAa dessa informaçäo "distanciada"
no tempo. Quando está em causa a antecipaçäo da adaptaçäo e do desempenho do
sujeito alguns anos mais tarde, entäo essa informaçäo pode ajudar-rios a cometer
menos erros inferenciais.
Vários critérios externos säo frequentemente usados neste tipo de estudos.
Em funçäo do tipo de prova ou dimensäo avaliada, assim se poderäo usar critérios
mais centrados no desempenho ou mais voltados para aspectos da personalidade.
Nestas duas situaçöes, os critérios externos mais usados säo: as classificaçöes noutras
situaçöes de realizaçäo (notas escolares, níveis escolares atingidos, sucesso profis-
sional, resultados noutras provas psicológicas similares) e as avaliaçöes de
personalidade (diagnóstico clínico, resultados da observaçäo directa ou entrevistas,
auto-avaliaçöes, relatos do sujeito por outros significativos e resultados noutras
provas similares existenteo-
158 Recolha dos dados: procedimentos e instrumentos
Alguns destes critérios levantam problemas específicos no estudo da
validade:
10> Atérios apresentani-se. por norma, mais heterogéneos nas suas dimensöes do
que os itens dos testes;
a óNmúddmk e a n&H&We dos resultados nos critéríos externos säo, muitas
vezes, inferiores aos v;ik"s encontra~ nos resultados no tesle; e,
(NO o matar V)der preditivo dos testes de realizaçäo com as classificaçöes doil
sujeitos nos períodos de formaçäo (escolares ou profissionais) podendo
E MunXar quer Ürná maior proximidade entre as duas situaçöes de
a querumamáiorheterogencidadedosfactoirese s ctos inerentes ao desempenharemos!
prof issional, quer ainda um maior envolvimento dos sujeitos nas situaçöes
desempenho em que se encontra mais claramente presente a componeà@@-"--,"----I.
Os métodos estatísticos de cálculo assentam, também, em estudos
correlacionais. As fórmulas a usar dependem, evidentemente, do tipo de escalas de
medida na prova e no critério. As análises de regressäo complementam as análises
simples de correlaçäo e servem para fixar melhores índices de previsibilidade ou para
fixar uma tabela de expectativas das posiçöes no critério conhecidas que sejam as
notas na(s) prova(s) preditora(s).
Erro padräo de estimativa
Associado à validade dos resultados encontra-se o erro padräo de
estimativa (EPE), ou seja a margem de erro esperado na previsäo do resultado
de um sujeito no critério em consequência da validade imperfeita dos resultados no
t,@ste. A fórmula de cálculo a usar é a seguinte:
EPE = DP \L EPE - Erro padäo de embruNa
Xv
DP - Cusviogadräo dos ~Mos
r - correlaçäo entre os resultados no teste e no
XV
critério
Metodologia da Investigaçäo em Psicologia e Educaçäo 159
Uma das formas de apresentar a informaçäo relativa à validade dos resultados
e no sentido do uso numa prova psicológica é a construçäo de tabelas de expectativa
dos resultados. Com base nos valores estimados na variável critério em face do
coeficiente de validade encontrado, podemos elaborar tabelas que nos permitem
posicionar o sujeito na variável critério quando conhecemos o seu resultado na Inova
psiMógica. Nalgumas situaçöes escolares e profissionais é possível identificar
sujeitos que realizam abaixo das expectativas calculadas. Uma avaliaçäo mais
específica pode entäo ocorrer no sentido de se clarificar a situaçäo "anómala" ou
inventariar aspectos que poderäo estar a dificultar o seu rendimento.
Validade de conceito ou de construto
É a expressäo mais recente no estudo da validade dos resultados nas provas
psicológicas e também aquela que, no presente, maior consideraçäo tem merecido nos
estudos. Os manuais hoje publicados sempre a incluem no conjunto das análises
realizadas. Ela está ligada ao segundo sentido introduzido no conceito de validade,
ou seja o grau em que conhecemos aquilo que a prova está a medir.
A definiçäo, bem assim como a apresentaçäo da metodologia usada para o seu
estudo, näo é tarefa fácil. A questäo näo está tanto na diversidade de opiniöes dos
autores, pois por sinal estäo mais ou menos consolidadas, mas sobretudo pela
diversidade de perspectivas, aspectos ou elementos que o conceito pode integrar. Em
primeiro lugar, olhando aos próprios termos usados para definir este último tipo de
validade (validade de conceito, validade conceptual, validade de construto, validade
de construçäo, validade hipotético-dedutiva ... ) verificamos um vaivém entre algo
más directamente ligado ao construto, à dimensäo ou à variável psicológica, e algo
mais directamente ligado ao processo de construçäo da prova ou de definiçäo do
conceito ou construto. Trata-se, pois, de um processo contínuo e nunca acabado de
buscar informaçöes que nos a>dem a melhor entender o que o teste está a medir,
decorrendo daqui melhores conhecimentos teóricos sobre os próprios construtos,
melhores Inovas para a sua avaliaçäo e, logicamente, também melhorias na prática
quando se trabalham com tais construtos em face da sua melhor avaliaçäo. Basica-
mente o cWe está em causa neste tipo de validade é o grau de consonância entre os
resultados no teste, a teoria e a prática a propósito das dimensöes em avaliaçäo (daí
a pecinência da expressäo também usada de validade hipotético-dedutiva). É, pois,
bis,
160 Recolha dos dados: procedimentos e instrumentos
uma noçäo bastante teórica e global de validade, ou ainda um processo de validaçäo
da própria teoria subjacente às dimensöes avaliadas (Cronbach & MeehI, 1955).
A validade de construto näo se expressa sob a forma simples de coeficientes
de correlaçäo. Trata-se, antes, de um julgamento com base em diferentes tipos de
informaçäo, por exemplo, os procedimentos seguidos na construçäo dos testes, a
análise dos resultados no teste em condiçöes experimentais específicas, a estrutura
factorial dos resultados em grupos de testes ou os padröes de correlaçäo dos seus
resultados com outras medidas (Guion, 1974). Por tudo isto, é um processo que
envolve uma certa imaginaçäo e raciocínio (Cronbach, 1990), e que se pode assumir
como sempre inacabado ou uma validade que "requere a acumulaçäo gradual de
informaçäo" (Anastasi, 1990, 153).
A crescente valorizaçäo deste terceiro tipo de validade na investigaçäo e na
avaliaçäo psicológica tem gerado uma maior preocupaçäo por parte dos investigadores
e profissionais com aquilo que estäo a avaliar. Assim, maiores cuidados têm sido
dedicados à fundamentaçäo e definiçäo das dimensöes ou situaçöes que pretendem
avaliar. Ao mesmo tempo, essa preocupaçäo generaliza-se aos instrumentos de
medida (conteúdo e formato dos itens, condiçöes em que säo avaliados, os contextos
ou os comportamentos na avaliaçäo mais informal - Brown, 1976; Guiselli et aL, 1981).
Em consonância com o exposto, a metodologia usada para apreciaçäo da
validade de conceito ou de construto dos resultados numa prova psicológica é diversa
e acumula a informaçäo proveniente de diferentes fontes. Um método, no entanto, tem
grangeado maior uso e reconhecimento entre os autores: a análisefactorial dos itens
e dos resultados. Parte-se das intercorrelaçöes entre os itens ou entre os resultados
num conjunto de provas para se identificarem as componentes gerais e/ou diferen-
ciadas que possam explicar a variância comum neles encontrada. Uma explicaçäo
mais detalhada desta análise estatística será dada no próximo capítulo. Outra
metodologia é o recurso a estudos experimentais, por exemplo a introduçäo de
alteraçöes controladas no comportamento dos sujeitos e a sua avaliaçäo imediata
através das provas em estudo. Por exemplo, podemos aumentar experimentalmente
o nível de ansiedade num grupo de sujeitos e passar de seguida um questionário de
ansiedade tentando verificar se os seus resultados diferem significativamente, e no
sentido do esperado, comparativamente aos valores numa situaçäo mais neutra
emocionalmente.
Metodologia da Investigaçäo em Psicologia e Educaçäo 161
Em terceiro lugar, recorre-se ainda a estudos desenvolvimientais, nomeada-
mente quando as dimensöes em estudo se assumem como sensíveis ao desenvolvi-
mento psicológico ou à aprendizagem escolar. Também alguns estudos diferenciais
podem mencionar-se a este propósito, por exemplo o recurso a grupos específicos ou
a grupos contrastantes, ou ainda o recurso a estudos correlacionais (correlaçöes com
outros testes ou com critérios externos vários). Mais recentemente, ainda, tem-se
introduzido nestes estudos alguns dos ensinamentos da Psicologia Cognitiva, por
exemplo a atençäo aos processos e às estratégias cognitivas, ou às representaçöes que
desenvolvem sobre determinados fenômenos e acontecimentos.
Por último, dentro da perspectiva global e de compilaçäo de informaçäo em
cWe aventa a análise da validade de conceito, ou seqja näo só dos resultados como da
prova e näo só da prova como do construto, podemos mencionar a análise da
convergência e divergência dos diversos indicadores disponíveis. Referimo-nos mais
concretamente à análise da validade convergente e validade discriminante (Campbell
& Fiske, 1967) dos resultados utilizando uma matriz multi-traçoltnulti-método (cf.
Mufliz, 1994, 124-5). Nesta altura estima-se o acordo entre medidas e conceitos à
partida esperados como convergentes, ou o seu grau de desacordo quando à partida
se esperaria a divergência. Por exemplo, deve-se esperar um maior grau de acordo
entre medidas do mesmo traço através de dois métodos diferentes (validade con-
vergente), por exemplo a liderança avaliada através de um questionário e de uma
entrevista, e maiores diferenças entre medidas de dois traços à partida tidos como
diferenciados (validade discriminante), por exemplo medidas da liderança e da
inteligência social.
Mesmo sem ser especificado numa alínea própria, importa afirmar que as
consideraçöes produzidas a propósito da sensibilidade e da fidelidade dos resultados
säo generalizáveis também para a validade. s coeficientes väo depender do tipo de
método considerado, do tamanho e heterogeneidade das amostras observadas, da
qualidade métrica dos critérios externos que venham a ser considerados e da literatura
existente sobre o carácter unidimensional ou multidimensional das provas.
Normalizaçäo dos resultados
Algumas vezes persiste a ideia de que, obtidos os resultados, se conclui a
162 Recolha dos dados: procedimentos e instrumentos
avaliaçäo. Pior ainda, pensa-se ser fácil e directa a passagem dos resultados obtidos
à sua interpretaçäo ou à formulaçäo das conclusöes. A interpretaçäo dos resultados
nas provas, nomeadamente nas provas psicológicas, passa por três fases:
(i) anal ise e correcçäéi úè resposta, ob idaí item a item, é: @ Iè
(ii) a apreciaçäo das notas obtidas em funçäo de critérios estatísticos ou praticO.@
(cornparaçäocomoutrossijjcitos.compiraçäocomotitro.@
[email protected] evoltilivos existentes, número de rxintos nurna escala pré-existente), e
(iii) a consideraçäo de MeNos elenmnios e Mes infonnativas disp)násis para,
através de um esGwe) de shucw e de integraçäo. se rx)der chegar a urna
informaçäo conclusiva sobre a situaçäo, o indivíduo ou o problema qug@:@@
justilIcou a avaNaçäo.
Neste texto desenvolveremos apenas os dois primeiros pontos. O terceiro
decorre muito mais das situaçöes práticas de actuaçäo do que de princípios
rnetodológicos gerais. Mesnio assim, falaremos desse tópico no próximo capítulo,
sobretudo naquilo que mais directamente se aplica à análise e discussäo dos resultados.
Correcçäo dos resultados
A fase de correcçäo está, em muitos testes psicológicos, facilitada em face da
existência de grelhas de correcçäo. Algumas provas escolares editadas possuem
também essas grelhas. Por norma, algum cuidado na adequaçäo das grelhas às folhas
de resposta, na atençäo às respostas anuladas paios sujeitos ou nas duplas respostas
assinaladas para tini rnesrno item, e na diferenciaçäo das omissöes por falta de tempo
das omissöes por dificuldade 'sobretudo quando existem fórmulas de cálculo do
k
resultado final em que as omissöes por dificuldade säo tomadas em consideraçäo) é
necessário. Progressivamente temliavido um esforço de informatizaçäo da correcçäo
e cotaçäo dos protocolos. A velocidade e a acuidade dos meios técnicos disponíveis
säo superiores comparativamente às mesmas tarefas realizadas por pessoas (inclui-
se aqui a rápida verificaçäo das respostas e correcçäo, a facilidade dos cálculos
estatísticos e conversäo dos resultados brutos em resultados padronizados).
Situaçäo de objectividade diferente encontramos na grande maioria das
Metodologia da Investigaçäo em Psicologia e Educaçäo 163
provas de aplicaçäo individual, nas provas de criatividade e de conhecimentos, nas
técnicas projectavas, nas entrevistas ou nalgumas formas de registo e de documenta-
çäo a analisar, bem como na generalidade das metodologias de avaliaçäo mais
qualitativa. A fragilidade e a riqueza informativa destas provas pressupöem uma
análise mais holística e individualizada da informaçäo, e geralmente uma integraräo
do sujeito noutras dimensöes da sua personalidade globalmente tomada, uma atençäo
aos seus contextos de vida ou aos processos usados nas respostas dadas.
Necessidade de normas
O objectivo da avaliaçäo é o do próprio sentido a dar à informaçäo recolhida.
Aqui se poderá justificar mais o recurso a dados normativos ou nomotéticos
(comparaçäo do sujeito com os seus pares) ou a dados idiográficos ou individualizados
(significaçäo referendada ao próprio indivíduo). A abordagem psicométrica valorizou,
sobretudo, o primeiro tipo de análise. A avaliaçäo naturalista, por exemplo, privilegiou
a segunda. Acreditamos que, numa síntese final da informaçäo recolhida, sempre
importa considerar alguns reämenciais externos (norma, desejabilidade, frequência
usual) para apreciar os desempenhos individuais, a frequência ou a intensidade
observadas num registo, os valores mais esperados ou menos usuais numa dada
situaçäo ou fenômeno. A par destes parâmetros, ditos de referência externa, certamente
que a síntese final e a conclusäo devem considerar a singularidade do sujeito e a
própria situaçäo de avaliaçäw Estes últimos aspectos, por razöes que já apontámos,
däo o sentido compreensivo-explicativo da informaçäo obtida.
Cálculo das normas
A normalizaçäo das provas, ou fixaçäo de padröes externos de realizaçäo
visando a interpretaçäo dos desempenhos individuais, acompanha a história dos
estes psicológicos e esteve presente desde a criaçäo destes. Assim, ao falarmos em
normas de realizaçäo ou em estandardizaçäo dos resultados estamos a remeter-nos,
mais uma vez, para a abordagem psicométrica de avaliaçäo psicológica, e muito
concretamente para as provas reverenciadas a normas (uso da média e do desvio-
padräo dos resultados numa amostra para apreciarmos o posicionamento de cada
indivíduo). Algumas alternativas surgem hoje a tais standards de grupo e a tal
comparaçäo, particularmente nos testes reverenciados a critério e nas técnicas de
avaliaçäo informal. Nestes dois últimos casos, o sujeito é comparado como os
164 Recolha dos dados: procedimentos e Instrumentos
objectivos inicialmente previstos (níveis de mestria) ou tomado na singularidade da
sua pessoa, processos e contextos, respectivamente.
A fixaçäo e uso de normas de grupo para a interpretaçäo das provas
psicológicas (inteligência, personalidade, motivaçäo) remete-nos para a própria
definiçäo de teste enquanto situation expérimentale standardisée servant de
stimulus à un comportement. Ce comportement est évalué par une comparaison
statistique avec celui d'autres individus placés dans la même situation,
permettant ainsi de classer le sujet examiné (Pichot, 1968, 2). Os resultados
brutos numa prova, só em si mesmos, têm pouco sentido. É importante introduzir,
para a sua conveniente apreciaçäo, alguma referência externa. Nos estudos de
normalizaçäo tais critérios externos säo baseados era dois princípios estatísticos:
0) os valores uIUMAs para análise individual ou comparado dos Sujeitos entre si:"
forani recolhicioseiiitíiiostrisrepresentitivasd@is@x)ptiliçC)es,cobrin(lologicamente
os sujeitos agora Nvaiúdos;
00 os res~a na pnwa em quesdo (para Dalguns a própria dimensäo a avaliar)
disubuernse de acordo uim as Mis da curva normal", ou seja, com a média e o
desvio-padräo dos resultados 1-x)dernos fazer equivaler cada nota bruta a um
determinado desvio eni refeiçäo à média, assim corno converter esse desvio numa
percemagnn de casos com classificaçöes superiores ou inferiores.
Com base nestes critérios, um resultado bruto numa prova pode ser
convertido num resultado ponderado ou normalizado. Vários tipos de normas
podem ser usados, uns mais familiares e outros mais desconhecidos dos
psicólogos. Faremos unia descriçäo do tipo de normas mais frequentes na
observaçäo psicológica.
Normas centradas na média e desvio-pad-äo
Um primeiro grupo de normas tem a ver com a conversäo dos resultados
brutos em resultados numa escala coincidente ou decorrente da curva gaussiana ou
curva normal. Estamos face a transformaçöes lineares dos resultados com base numa
determinada média e desvio-padräo da escala que se petende usar. Dois tipos de
conversöes säo mais frequentes:
Metodologia da Investigaçäo em Psicologia e Educaçäo 165
(i) Notas Z: escala de coiiversäo dos resultados obtidos para uma distribuiçäo com a
média sittiada em O (zero) e o Liesvio-l),idi-@-io fixado eni 1 (tini);
(ii),Notas T:escala shuibrà anterior,niasoiide a média sesiluaagoraeni 50codesvio-
padräo em ]O rx)ntos.
O procedimento estatístico de cálculo destas duas escalas é bastante simples,
como se depreende do facto de estarmos perante conversöes lineares dos resultados:
A desvio-Dadräo da escala a usar
NMa Ndäo Ai k@-D@p +Mi X i -resultado bruto obtido
M média gxral dos resuItados
DP - de-,vío-padräo dos resultad?S
Mi - mépg o# escalá a usar
Nas conversöes lineares, os resultados padronizados mantêm entre si as
mesmas propriedades numéricas dos resultados brutos. Por outro lado, se no caso das
notas Z podemos encontrar números negativos e valores decimais, tal situaçäo
encontra-se superada nas notas T. Apesar da simplicidade de cálculo ambas as notas
näo säo de fácil "manipulaçäo" na prática pelos profissionais. A par dos seus
limitados conhecimentos estatísticos por norma, acresce que ambas as escalas
requerem um uso bastante fluente dos princípios inerentes às áreas da "curva normal
reduzida".
Normas centradas na frequência
Um segando tipo de normas disponíveis na Psicologia e Educaçäo, estas
também bastante LOMas na Irática quotidiana, säo as chamadas notas percent:'Iicas.
Aqui, parte-se da divisäo da amostra global de sujeitos avaliados por grupos de
efectivos idênticos (daí o chamarem-se também escalas rectangulares). As notas que
delimitam cada um dos grupos formados permitem-nos, na interpretaçäo dos resul-
tados individuais, indicar a percentagem de sujeitos que se situam abaixo desse valor.
As escalaspercentílicas ou escalas rectangulares mais usadas säo os quartis, os decis
e os postos percentílicos. Estes últimos, assumindo todos os pontos possíveis da
166 Recolha dos dados: procedimentos e instrumentos
escala, säo os mais usados na apreciaçäo dos desempenhos. A fórmula de cálculo é
a seguinte:
f, + fa fr - frequência relativa da nola em catisa
Pacentil 2 x I* fa - 1'rc(ltiéiici,@ admiti até à nota em caw@i, inclusive
Algumas vantagens podem apontar-se às escalas percentílicas e mais
concretamente aos postos percentílicos em termos de normas. Em primeiro lugar,
o seu cálculo é relativamente fácil. Em segundo lugar, trata-se de uma noçäo
bastante simples e de fácil compreensäo pelas pessoas. A sua interpretaçäo
decorre do conceito de percentagem, bastante frequente no nosso quotidiano. Em
terceiro lugar, é um tipo de normas que se aplica a qualquer tipo de prova ou escala,
näo exigindo p=viamente uma escala de medida de tipo intervalar. Em quarto lugar,
tratam-se de escalas que podem ser interpretáveis mesmo quando os resultados na
prova em causa näo se distribuem segundo as leis da curva normal. Finalmente,
quando está em causa uma diferenciaçäo mais fina entre os sujeitos, os postos
percentílicos reúnem algumas vantagens pois, na teoria, asseguram uma distribuiçäo
por 100 postos e, logicamente, garantem na prática um bom índice de discriminaçäo
das posiçöes individuais.
A principal desvantagem dos postos percentílicos decorre de näo ponderar
devidamente a grandeza da diferença entre duas classificaçöes. Como as posiçöes
relativas de cada indivíduo näo asseguram qualquer conversibilidade em termos
das notas, aquele tipo de comparaçäo näo é possível (veja-se o afirmado
anteriormente a propósito das escalas ordinais de medida). Decorre, daqui, uma
segundadesvantagen,ouslaumavalerizaçäc)desigu2d asnotasjuntodamédiae
nos externos da distribuiçäo. Assente na freq.jência e näo nos valores em si mesmos,
as escalas rectangulares possibilítana urna maior discriminaçäo dos resultados junto
da média do que nos extremos da distribuiçäo. Em sentido contrário às "leis
da curva normal", pequenas diferenças em torno da média aparecem diferenciadas em
face da larga concentraçäo de sujeitos, enquanto que grandes diferenças nos extremos
da distribuiçäo ficam agrupados por causa do número reduzido de sujeitos nesses
valores.
Metodologia da Investigaçäo em Psicologia e Educa!2O 167
Classes normalizadas
As classes normalizadas procuram sobrepor aspectos dos dois tipos de normas
anteriores. A ideia base nestas escalas é, de novo, as áreas da curva normal, ou seja
o facto de, a cada unidade de desvio em torno da média, corresponder uma
determinada percentagem de casos, e vice-versa. Estas escalas podem ser formadas
por um número variável de classes, sendo as mais usadas as de 5, 7 e 9 classes. Este
número varia em funçäo do interesse prático das mesmas normas, correspondendo um
número mais elevado a maiores necessidades de seriaçäo dos sujeitos entre si. Dado
ser necessário encontrar uma classe intermédia nestas escalas, acima e abaixo da qual
se situe um mesmo número de classes, o número final de classes por escala é sempre
ímpar.
0 procedimento de cálculo usado nestas escalas, inclui vários momentos:
(i) divisäo (1,1 amplitude da C(jr-,,,,i nori-rial que se queira tomar (total equivale a 6
unidades de des,,,io-padräo sinieiricarnenic distribtií(los em torno da média) pelo
número de classes (N(:) (Itie sc (Itici, constituir, deste modo a
(1(,)s
resultados ficando-sea conhecera amplitude do intervalo dos resultados notes 1,
(AO a Wtegmr cada classe: [Ai=l)i x DP];
(No cAculado o valor de Ai, procura-se os valores. mínimo e máximo de delimitaçäo
de cada classe, iiiician&vw e, >Quíçäo pela classe intermédio;
(iv) corno o leque de resultados nesta classe intermédio deve estar simetricamente
distribuído em iorno da média, podemos somar e subtrair a esta metade de Ai;@
fixados os limites inferior e superior para a classe intermédio, os limites para as
dádi restantes säo fixados somando ou subtraindo Ai aos valores progressivas
mente encontrados.
Numa distribuiçäo dos resultados por classes normalizadas atendendo agora
às frequências relativas, far-se-ia corresponder a percentagem de sujeitos por classe
à área delimitada da curva normal correspondente aos limites fixados por uma
conversäo em notas Z da amplitude de cada classe (Ai) no computo da amplitude
global (Almeida, 1982).
ammhwo 0)0 Pw classe: "% bscS
(i:@) a amplittide (Ias classes (I)O é entäo riiLiltiplic@t(.]() pai()
168 Recolha dos dados: procedimentos e instrumentos
Estas escalas permitem-nos formar classes com o mesmo intervalo de valores
(escalas sigmáticas ou idêntico valor de desvio), embora com uma percentagem
diferente de sujeitos. Por exemplo, a classe central possui claramente mais sujeitos
que as extremas (situaçäo inversa da encontrada nas escalas rectangulares). Contudo
este tipo de distribuiçäo adequa-se melhor aos princípios subjacentes à distribuiçäo
normal ou, inclusive, às dificuldades em Psicologia e Educaçäo com a fixaçäo dos
valores extremos destas escalas. Outra vantagem destas escalas passa pelas possi-
bilidades criadas de se conseguirem níveis mais elevados e mais baixos de diferen-
ciaçäo dos suj eitos entre si (escolha ente 5, 7, - 1 1 classes), para além da popularidade
que a escala de 9 classes, os "estaninos" (standard nine ou stanine), grangeou na
prática psicológica. A desvantagem apontada por alguns autores passa pela näo
atribuiçäo de uma diferença específica a cada classificaçäo, o que, se para a prática
poderá näo ter qualquer problema ou inclusive traduzir vantagens em face dos erros
de medida associados a qualquer nota, para as análises estatísticas na investigaçäo já
näo se poderá dizer o mesmo (também facilmente ultrapassada pois sempre podem
ser tomados os resultados brutos).
Notas de idade
As notas de idade foram a primeira forma de interpretar e comparar os
resultados individuais nos testes de inteligência. O seu aparecimento data do
começo do século com a Escala de Inteligência de Binet-Simon (1908). Trata-
se de um critério bem popular e objectivo de avaliar o desempenho das crianças
(após a adolescência o critério etário näo apresenta a mesma relevância e clareza).
Ainda no quadro das escalas de inteligência reportadas ao trabalho de Binet,
dês tipos de idades aparecem mencionadas: a idade cronológica (ou seja a idade real
do sujeito), a idade de base (ou seja a idade correspondente ao grupo etário mais
elevado de itens que o sujeito consegue realizar na sua globalidade), e a idade mental
(a idade de desenvolvimento psicológico calculada com base na idade de base
acrescida das bonificaçöes - em meses - correspondentes à resoluçäo de itens de
grupos etários superiores). Um exemplo ajuda-nos a entender o princípio subjacente
ao cálculo da idade mental, tomando o desempenho de uma criança com 8;0 anos
(quadro IV.4):
Metodologia da Investigaçäo em Psicologia e Educa,@o 169
Quadro IVA - Cálculo da idade mental (criança de 8;0 anos)
ReaNeNäo da criança
Resoluçäo de todos os itens dos 8 anos
Resoluçäo de 3 dos 6 itens dos 9 anos
Rwol uoo de 2 ~ 6 itens dos ]O anos
Resoluçäo de 1 dos 6 h=" M 1 1 mu,
Näo resoluçäo ele qualquer item do.,; 12 anos
LCM0 anos; I.B.=8,0 anos; I.M.=9;0 anos
Méditos recebidos
8 a~ QleIM de Basq
+ O meses
+ 4 meses
+ 2 meses
A idade mental veio a ser tomada nos primeiros cálculo do Q1 (quociente de
inteligência). Trata-se de um QI de razäo (fórmula de Stern) ou seja a idade mental
a dividir pela idade cronológica e a multiplicar por 100 (no exemplo anterior, QI=1 13).
Quer o QI de razäo quer a idade mental apresentam alguns condicionalismos
em termos de cálculo e de significado. Em primeiro lugar, eles parecem fazer mais
sentido nas idades mais baixas, ou seja nas idades coincidentes com os períodos de
maior desenvolvimento psicológico. Em segundo lugar, a diferença entre a idade mental
e a idade cronológica näo tem o mesmo significado ao longo dos diferentes grupos
etários. Pequenas diferenças säo mais significativas, em termos psicológicos, em
idade mais precoces. Por sua vez uma diferença, no sentido de um atraso, de um ano
tem um significado diferente consoante se verifica aos 3 anos ou aos 12 anos (por
exemplo, para mantermos a mesma razäo no caso apontado, a uma criança de 4 anos
com uma idade mental de 3 anos, ou seja um atraso de 1 ano, corresponderia a uma
criança de 12 anos com uma idade mental de 9 anos, já com um atraso de 3 anos).
Estes condicionalismos suscitaram várias críticas, por exemplo a dificuldade
de interpretaçäo em termos psicológicos das diferenças positivas ou negativas entre
as duas idades. Algumas críticas säo apontadas às notas de idade:
(i) a tornada dos itens rcslx)iiclidos por escaläo etlrío näo seafasta do número de itens
correctamente resi->ondi~ no o~to do teste (cuidado essencial na efective
hierarquizaçäo cios itens por nívei cifräo em leiamos de dificuldade);
(ii)averificaçäode Ibibesde idade pra além
já näo aumenta;
quais ampwWmk me&& peloteste
170 Recolha dos dados: procedimentos e instrumentos
(NO o SeMO ~fli uto que a nota idade inenial parece conter qualido de facto a sua
significaçäo varia consoante a idade cronológica dos sujeitos; e
,,,,,(iv) o conceito idade mental ern Suj'Ma adultos podera (lucrei- si,<,,riií'icir ii
Mo
iiàl;ilidade (Etide niental alíngida) enquanto algués aukrcs rMern o decaí
(Marques, 1969. 39-40).
Em alternativa ao QI de razäo, IVechâer rwopöe para as suas escalas de
inteligência um QI de desvio (tomada do desvio-padräo dos resultados). O QI
de desvio é calculado, como na generalidade dos demais testes psicológicos, recor-
rendo a uma escala em que a mécha se situa em 100 e o desvio-padräo em 15 pontos.
Interdependência e sentido das normas
Com base nas fórmulas de cálculo e sua significaçäo, podemos depreender
que os diversos tipos de normas säo mutuamente conversíveis. No quadro IV.5
apresenta-se uma tabela de conversäo mútua de tais normas entre si. Apenas por uma
questäo de maior equivalência gráfica das normas apresentadas em relaçäo aos
limites nas classes normalizadas de distribuiçäo dos resultados, estas últimas näo
foram incluídas no quadro. No entanto, pegando nas notas z equivalentes para uma
distribuiçäo dos resultados em 9 classes normalizadas (estatinos), verifica-se a
possibilidade de tal conversäo servindo-nos de alguma adequaçäo das classes
formadas (quadro IV. 6; Fonte: Murphy & Davidshofer, 1994, 55-6).
Quadro IV.5 - Interdependência dos vários tipos de normas
Tipo VammS
Notas Z JA -2A -IA o LO 2A @@Ajj@
+tas T 20 M) x40 gg so 60 70
NotasdeC1 45 60 SS IN 1 00 115 130
Percentis 1% 2% -16% 50% 84% 98% ::.MygU,
Quadro IV.6 - Conversäo dos estaninos noutros tipos de normas
Emaning 1 2 4 5 6 8 9
fotas Z .2A -133 0
,@>6t 1.33 2M
NotasT 30 36 43 50 56: 63 70
NoWs de CM 70 50 90 V100 110 120 130MA
Aercem. 23% 92% 25-5% 50% 745% (Off/,, (7.-r1o:@@:@@
Metodologia da Investigaçäo em Psicologia e Educaçäo 171
Algumas precauçöes devem ser consideradas no uso destas normas. Em
Psicologia ter~se-á abusado do seu uso generalizado, e daí também algumas das
críticas à avaliaçäo psicológica tradicional (Almeida & Cruz, 1985). Em primeiro
lugar importa assegurar se efectivamente as normas tiveram na sua origem amostras
representativas da populaçäo e se os sujeitos num dado momento avaliados se
encontravam devidamente representados na amostra considerada (problema mais
sentido na avaliaçäo de indivíduos pertencentes a grupos étnicos ou sócio-culturais
minoritários). Em segundo lugar, todas as normas säo reportadas no tempo. A sua
actualidade deveria ser ciclicamente estimada, o que habitualmente näo acontece
pelos recursos e custos envolvidos. Algumas provas de desempenho cognitivo
aproximam-se das tarefas escolares, podendo isso dificultar a permanência no tempo
do valor das normas originalmente fixadas, por exemplo. Finalmente, as normas
devem funcionar como parâmetro de apreciaçäo dos desempenhos e resultados
individuais. O seu cálculo, estando assente no desempenho das amostras tomadas,
näo nos permite remeter tais valores para estimativas directas dos construtos ou
dimensöes avaliadas, nem assumir o resultado individual sem considerar o erro
associado à medida.
Estes aspectos näo impedem o uso e o valor social de tal informaçäo, no
entanto impele-nos a cuidados acrescidos nas interpretaçöes que se façam. Por mais
melhorias que possam ocorrer nos instrumentos de avaliaçäo, e em Portugal impor-
taria um maior investimento na área (Almeida et aL, 1995), importa salientar que os
avaliadores devem ser sempre melhores que os instrumentos que usam.
Bibliograria
Almeida, L. S. & Cruz, 0. (1985). Utilizaçäo dos testes psicológicos:
Algumas consideraçöes sobre a sua evoluçäo. Jornal de Psicologia, 4 (1), 13-17.
Alm--ida, L. S. (1986). Inteligência: Evoluçäo no seu estudo. Jornal de
Psicologia, 5 (3), 13-17.
Almeida, L. S. & Roazzi, A. (1989). As respostas ao acaso em testes de
aptidäo: Estudo segundo o sexo e o ano de escolaridade. In José l@ Cruz, Rui A.
Gonçalves & Paulo P. P. Machado (Eds.), Psicologia e educaçäo: Investigaçäo e
intervençäo. Porto: Associaçäo dos Psicólogos Portugueses.
172 Recolha dos dados: procedimentos e instrumentos
Almeida, L. S., Gonçalves, M. M. & Simöes, M. R. (1995). Provaspsicológicas
em Portugal: Situaçäo actual, limitaçöes e desafios. In 1- S. Alrneida, 1X R- Siniöes
& M. M. Gonçalves (Eds.), Provas Psicológicas em Portugal. Braga: Associaçäo dos
Psicólogos Portugueses.
Anastasi, A. (1990). Psychological testing (6th edition). New York:
MacMillan.
Baquero, G. (1974). Testespsicométricos eprojectivos. Säo Paulo: Loyola.
Brown, F. G. (1976). Principles of educacional andpsychological testing.
New York: Holt, Rinehart & Winston.
Campbell, D. T. & Fiske, D. W. (1967). Convergent and discriminam
validation by the multitrait-multimethod matrix. In D. N. Jackson & S. Messick
(Eds.), Problems in human assessment. New York: McGraw-Hill.
Cronbach, L. J. (1951) Coefficient alpha and the internal structure of tests.
Psychometrika, 16, 297-334.
Cronbach, L. J. (1990). Essentials of psychological testing (5th edition).
New York: Harper Collins Pubs.
Cronbach, L. J. & MeehI, P. E. (1955@ Construct validity in psychological
tests. Psychological Bulletin, 52, 281-302.
Ebel, R. L. (1972). Why is a longer test usually a more reliable test?
Educational and Psychological Measurement, 32, 249-253.
]Edgerton, & AL (1960). A table for computing the phi coefficients.
Journal of Applied Psychology, 44, 141-145.
Freeman, F. S. (1974). Teoria e prática dos testes psicológicos. Lisboa:
Fundaçäo Calouste Gulbenkian.
Garrett, H. E. (1962). A estatística na psicologia e na educaçäo. Rio do
Janeiro: Fundo da Cultura.
Glass, G. V. & Stanley, J. C. (1970). Statistical methods in education and
psychology. Englewwod Cliffs, NJ: Prentice-Hall.
Metodologia da Investigaçäo em Psicologia e Educa5@O 173
Goldrnar4 L. (1971). Using tests in counselling. Santa Monica: Goodyear
Pubs.
Gronlund,N.E. (1976).Measurementandevaluationinteaching.NewYork:
MacMillan.
Guiselli, E. E., Campbell, J. P. & Zedeck, S. (1 98 1). Measurement theoryfor
the behavioral sciences. San Francisco: W. H. Freeman.
Hambleton, R. K. & Swaminathan, H. (1985). Item response theory:
Principles and applications; NonvelI, MA EJuarer N4hoff.
Jurgensen, G IL (1947). Table for determining phi coefficients.
Psychometrika, 12, 17-29.
Mine, P. (1979). Psychometrics andpsychology. London: Academic Press.
Kuder, G. & Richardson, M. (1937). The theory of the estimation of test
reliability. Psychometrika, 2, 151-160.
Lord, F. M. (1980). Applications of item response theory to practical
testíngproblems. Hillsdale: NJ: Lawrence ErIbaum.
Marques, J. H. F. (1969). Estudos sobre a Escalla de Wèchsler para
Crianças (WISC): Sua adaptaçäo e aferiçäo para Portugal. Lisboa: Faculdade de
Letras (Tese de Doutoramento)-
Messick, S (1980). Test validity and the ethics of assessment. American
Psychologist, 35, 1012-1027.
Meuris, G. (1968). La fidé3é des mesures en psychologie et en
pédagogie. Reme de Pàyrhologie et des Sciences dÉducation, 3, 239~267.
Mufliz, J. (1994). Teoría clásica de los tests. Madrid: Ediciones Pirâmide.
Mufliz, J. (1990). Teoría de respuesta a los items: Un nuevo enfoque en
la evaluación psicológica y educativa. Madrid: Ediciones Pirâmide.
Murphy, K. R. &Davidshofer, Ch. 0. (1994).Psychologicaltesting.-Principles
174 Recolha dos dados: procedimentos e instrumentos
and applications (3rd edition). Englewood Cliffs, NJ: Prentice-Hall.
Pasquali, L- (1996V Medida psicométrka. In L. Pasquali (Org.), Teoria e
métodos de medida em ciências do comportamento. Brasília: MEC, SEDIAE/I, NEP
e LABPAM.
Pichot, P. (1968). Les tests mentaux. Paris: Presses Universitaires de France.
Simöes, M. R. (1991. Notas em torno da arquitectura da avaliaçäo psicoló-
gica. Psychologica, 11, 7-44.
Simöes, M. R. (1995). Contributos e limites da avaliaçäo dinâmica ou
interactiva para a avaliaçäo psicológica em contextos educativos. Revista Galega de
Psicopedagoxia, 8, 59-76.
Vaz Serra, A. (1994). IACLIDE: Inventário de Avaliaçäo Clínica da De-
pressäo. Coimbra: Ediçäo "Psiquiatria Clínica".
Metodologia da Investigaçäo em Psicología e Educaçäo 175
FICHA DE AUTO-AVALIAÇÄO
Grupo I: Análise dos itens
Responda às 2 questöes seguintes:
1.1. llorque é que podei- dí.,;<,-riinitiaiii,o e validade interna dos itens se podem
assurnir como expressöes sinónimas?
1.2. Como explicar que os itens coni II) em toi-no de 0.50 apresentem índices de
discriminaçäo tendencialmente mais elevados?
Grupofi: Análise dos resulta(los
Responda a 3 das 4 questöes
2.1. Como diferenciei os coeficientes (ill?h(i de Cronha(-li e Kuder-Richai-dson na
análise da consistência interna cios itens?
2.2. Porque é que a validade de conteúdo é de mais fácil análise numa prova de
conhecimentos escolares do que num teste de aptidäo intelectual?
2.3. Porque é que a análise factorial é o método por excelência U6 estudo dà'@'@
validade deconstruto dos resultados num teste?
2.4. Porque recorrer-nos a um número ínipar de classes na disiribuiçäo dos
resultados num teste por classes nornializadas?
Capítulo 5
Resultados: análise e discussäo
11
1 i,
42 -
PLUsultados: análise e discussäo
Os dados, as análises e as conclusöes
O tratamento dos dados
Dimensionalidade das escalas
Significância dos dados
Generalizaçäo, explicaçäo e prediçäo
Consideraçöes éticas da investigaçäo
Aspectos éticos na investigaçäo e na observaçäo psicológica
Aspectos a considerar num relatório científico
Um estudo de investigaçäo ou de observaçäo em Psicologia e Educaçäo,
termina com a apresentaçäo, análise e discussäo dos resultados, complementadas
com a elaboraçäo e apresentaçäo das conclusöes. Neste sentido, justifica-se
concluir este livro com uma referência a alguns tópicos finais, por exemplo o
tratamento dos dados, as análises e as conclusöes de uma investigaçäo, ou ainda
algumas consideraçöes éticas em torno da investigaçäo e da avaliaçäo.
Retomaremos, desta forma, vários aspectos metodológicos abordados nos
capítulos anteriores, nomeadamente aqueles que podemos antecipar como mais
controversos e justificando uma tomada de decisäo ou compromisso por parte do
investigador e do profissional em geral.
A preocupaçäo neste capítulo é de, por um lado, interligar os aspectos
versados ao longo do livro, favorecendo a interligaräo dos aspectos metodológicos
em foco, ou a sua clarificaçäo e integraräo. Por outro lado, salientando alguns pontos
mais controversos, espera-se desenvolver junto dos profissionais e investigadores,
actuais e futuros, atitudes críticas e avaliativas em relaçäo aos objectos, aos métodos
e aos produtos da investigaçäo nas respectivas áreas de actuaçäo. Neste último caso,
julgamos näo ser possível deixar de referir a organizaçäo de um relatório científico,
os aspectos estruturais da leitura de um artigo e os aspectos de índole deontológica
a considerar quer na investigaçäo quer na avaliaçäo. Neste último ponto, incidiremos
no que à Psicologia diz respeito.
Os dados, as análises e as conclusöes
Retomando os objectivos da investigaçäo, por exemplo a realizada no
seio da Psicologia e da Educaçäo, em termos de descrever, explicar, predizer
e controlar os fenômenos e os comportamentos, o último passo numa inves-
tigaçäo consistirá na análise dos dados recolhidos com a observaçäo ou
avaliaçäo conduzido. Este tratamento dos dados, seqja qualitativo seja quanti-
tativo, e sempre que possível ambos, vai permitir ao investigador e ao profis-
sional retirar'conclusöes do seu estudo junto de um indivíduo, grupo, situaçäo ou
instituiçäo.
180 Resultados: análise e discussäo
¨ tratamento dos dados
O tratamento, incidindo na análise dos resultados obtidos, pode subdividir-se
em dois momentos. Num primeiro, descrevem-se e sistematizam-se os resultados ou
a informaçäo recolhida. Através de quadros, gráficos ou listas de categorias (entre
outros), apresentam-se as amostras utilizadas em relaçäo às suas características
descritivas mais importantes e os resultados nas variáveis analisadas quer na amostra
global quer nas subamostras que se desejam considerar. Importa que os primeiros
resultados a apresentar numa investigaçäo descrevam a amostra e subamostras nas
suas características mais relevantes, assim como a distribuiçäo dos resultados nas
variáveis consideradas. Estas duas fontes informativas säo relevantes para uma
apreciaçäo das análises estatísticas subsequentes, quer em termos da sua legitimidade
quer da força das conclusöes que se venham a retirar do estudo.
Vários procedimentos de categorizaçäo da informaçäo e de análise estatística
dos dados encontram-se disponíveis. Como apontámos atrás, as opçöes de análise
estabstica väo depender da natureza quantitativa das escalas de medida utilizadas.
Assim poder-se-á recorrer a procedimentos estatísticos paramétricos e näo-
paramétricos (cf. Quadro II.4).
Num segundo momento de análise, e já mais directamente dirigido à testagem
das hipóteses, os resultados säo analisados recorrendo-se nomeadamente à estatística
inferencial. A estatística inferencial analisa, sobretudo, relaçöes entre variáveis ou
estuda diferenças entre grupos ou momentos de avaliaçäo. Dois grupos autónomos a
comparar säo tomados como grupos independentes; dois grupos de resultados re-
portados aos mesmos sujeitos säo considerados grupos emparelhados. Estäo, neste
último caso, os resultados da comparaçäo dos efeitos de uma intervençäo num
determinado grupo de sujeitos em dois momentos distintos, por norma pré-teste e pós-
teste, ou a análise da correlaçäo entre duas variáveis ou medidas, corno acontece por
exemplo no estudo da fidelidade através do teste-reteste. A distinçäo entre amostras
paralelas ou independentes de dados é importante em algumas análises estatísticas.
Uma mesma análise pode recorrer a fórmulas diferentes quando estamos face a um
e outro tipo de dados, por exemplo no teste-t para a comparaçäo de médias. Final-
mente, quer para o estudo da correlaçäo quer para a análise da dispersäo dos
resultados, existem procedimentos de análise estatística de acordo com a escala de
medida dos resultados. Para uma correcta decisäo quanto ao procedimento de análise
Metodologia da Investigaçäo em Psicologia e Educaçäo 181
a usar, importa um conhecimento das técnicas de estatística paramétrica e näo-
paramétrica disponíveis. A generalidade dos programas informáticos de análise
estatística possui diversas opçöes a este propósito.
Dimensionalidade das escalas
Um dos aspectos prévios à análise dos resultados numa ou mais provas psico-
educacionais prende-se com o estudo da dimensionalidade dos seus itens. Quando
somamos dois itens estamos a assumir que ambos säo parcelas de um todo maior. Por
este facto, a questäo da dimensionalidade de um instrumento é fundamental na
Psicologia e na Educaçäo.
A importância da dimensionalidade pode ver-se a dois níveis. Em primeiro
lugar, podemos assumir que a aditividade das pontuaçöes num grupo de itens
subentende a sua unidimensionalidade. A legitimidade de notas globais ou parciais
numa escala passa, assim, pela resoluçäo desta questäo. Em segundo lugar, a questäo
da dimensionalidade coloca-se nas próprias dimensöes a avaliar. Por exemplo, refere-
se hoje que o auto-conceito é uma variável psicológica multidimensional, podendo
incluir as facetas do auto-conceito social, físico e acadêmico, por exemplo. Por estas
razöes, o uso de uma escala multidimensional para a avaliaçäo do auto-conceito é
defensável. Por sua vez, numa prova escolar, podemos assumir várias dimensöes a
avaliar. Numa prova geral de acesso à Universidade podem incluir-se as capacidades
linguísticas, a cultura geral e a capacidade de resoluçäo de problemas dos candidatos.
Em ambos os casos, as variáveis ou atributos a avaliar apresentam-se multidimensionais
na sua definiçäo. Por este facto, o instrumento ou instrumentos a usar devem respeitar
e permitir avaliar essas várias dimensöes
A verificaçäo da unidimensiornalidade ou multidimensionalidade de um
instrumento deve fundamentar-se em termos teóricos e empíricos. A validade de
construto, a que já fizemos referência, tem sido apontada como a integraräo de
procedimentos vários tendo em vista essa verificaçäo.
Em termos teóricos, o problema exige a leitura dos posicionamentos de
diferentes autores, se possível cruzando informaçäo decorrente das elaboraçöes
teóricas e das reflexöes sobre a prática. Nem sempre esta leitura é conclusiva, sendo
cedo que é usual na Psicologia e na Educaçäo encontrarmos diversas teorias
182 Resultados: análise e discussäo
explicativas para um mesmo atributo. No campo da inteligência, por exemplo,
podemos ter autores que inventariam apenas um factor geral, enquanto outros podem
assinalar 7, 9 ou mais de uma centena de aptidöes independentes (Almeida, 1994).
Em termos empíricos, a maioria dos autores recorre à análisefactorial. Se a
variável é unidimensional ou multidimensional, os resultados numa prova devem
poder ser explicados recorrendo apenas a uni ou entäo a vários factores, respectiva-
mente. A decisäo passa aqui por uma análise que permita defender se o construto é
uni- ou multifactorial. Se na disciplina de matemática os professores defendem que
uma coisa é operar ou aplicar um algoritmo e outra coisa é problematizar situaçöes
e resolver problemas, entäo uma avaliaçäo adequada deste construto pressupöe dois
instrumentos ou um instrumento com dois grupos de itens para uma e outra
habilidade. De outra forma a prova poderá estar a avaliar capacidade de cálculo e näo
competência matemática, ou vice-versa. Como se depreende, é fundamental na
análise e discussäo do$ dados saber de onde se parte.
Estamos aqui a questionar-nos sobre os instrumentos de avaliaçäo usados, em
que rnedida eles expressam através dos seus itens os construtos a avaliar, e em que
medida as definiçöes operacionais destes construtos encontram-se devidamente
fundamentadas em termos das teorias existentes na área e devidamente representadas
nos mesmos instrumentos. Em nossa opiniäo, pela continuidade informativa em
causa, dever-se-á sempre acautelar estes aspectos na fase de análise e discussäo dos
resultados - mais ainda se näo se acompanhou as fases anteriores da investigaçäo.
Com alguma frequência no nosso País traduz-se uma escala para língua portuguesa,
aplica-se e analisam-se os dados mantendo a estrutura dimensional da versäo original.
Este procedimento é incorrecto, e o facto de ser frequente mais agrava a necessidade
de algumas alteraçöes nas nossas práticas avaliativas.
A grande maioria das análises estatísticas que säo cedas dos resultados nuina
prova partem do pressuposto da sua unidimensionalidade. Trabalha-se com notas,
resultados ou scores assumindo que o conjunto de itens ou de situaçöes de avaliaçäo
säo susceptíveis de serem somados, ou estäo a avaliar um e o mesmo construto. Neste
sentido, antes de se avançar em análises estatísticas contrastas nos resultados globais,
importa apreciar em que medida estamos face a uma medida uni- ou multidimensional.
A análise factorial dos itens surge como o procedimento analítico mais empregue.
A análise factorial possibilita-nos saber quantos e quais factores o instrumento
Metodologia da Investigaçäo em Psicologia e Educaçäo 183
está a avaliar, assim como nos permite identificar que itens se encontram associados
a cada factor. Neste caso, podemos ver que itens formam cada um dos factores
avaliados e, passando da estatística para a Psicologia ou Educaçäo, podemos ver que
itens melhor avaliam os traços ou dimensöes em avaliaçäo. A análise factorial
permite~nos analisar a carga factorial (saturaçäo) de cada item nos factores isolados,
indicando-nos essa carga factorial a covariância existente entre o factor e o item.
Como nos índices de correlaçäo, as cargas factoriais podem variar entre -1.00 e +1.00,
significando um valor de .00 a ausência de relaçäo entre o item e o factor, e um valor
próximo da unidade a identidade quase perfeita entre item e factor (o item pode-se
assumir como um excelente representante comportamental do traço latente aqui
representado estatisticamente através desse factor).
Na Psicologia e na Educaçäo näo existe um valor fixo, tido como mínimo, na
apreciaçäo das cargas factoriais. Os seus valores, mais uma vez, näo obedecem ao
princípio do "tudo ou nada". Mesmo assim, costuma-se apontar a necessidade desse
valor näo ser inferior a.30. Como se poderá depreender, quanto mais elevado for esse
valor melhor para os objectivos da avaliaçäo: os itens como bons indicadores das
dimensöes subjacentes. Registe-se que uma carga factorial de .30 significa uma
covariância entre o item e o factor de 9% (.302), o que convenhamos ser um valor
bastante insignificante. Claro está que no conjunto da prova deveräo aparecer itens
com cargas factoriais mais elevadas, ou entäo teremos que concluir que esse factor se
encontra mal representado pelo conjunto de itens que o formam. Valores superiores
a .50 säo necessários, podendo inclusive optar-se por apenas se tomarem estes numa
lógica de näo alongar demasiado o número de itens e o tempo de aplicaçäo da prova.
As cargas factoriais permitem-nos apreciar a qualidade dos vários itens numa
prova, assim como o seu conjunto. Neste último caso estamos já a apreciar o próprio
factor e em que medida o instrumento em causa se pode assumir como adequado para
a avaliaçäo de determinadas dimensöes psicológicas, por exemplo.
Por último, importa mencionar que as cargas factoriais tanto podem ser
positivas como negativas. Ambas nos interessam, sendo o sinal menos relevante do
que a magnitude para apreciar a aproximaçäo entre item e factor. O facto das cargas
factoriais dos itens serem positivas ou negativas no mesmo factor apenas sugere que
alguns deles estäo associados ao pólo positivo e outros ao pólo negativo do factor.
Numa escala de hábitos de estudo em alunos universitários o item "arrumo os meus
materiais de estudo antes de fazer um intervalo" e o item "esqueço-me de separar os
184 Resultados: análise e discussäo
apontamentos das aulas pela capa de cada disciplina" podem aparecer reunidos num
mesmo factor, ou seja "organizaçäo dos materiais", representando o primeiro item o
pólo positivo e o segundo item o pólo negativo desse único factor.
No quadro V.2 apresenta-se uma síntese dos resultados da análise factorial de
10 itens numa escala de hábitos de estudo. A carregado estäo indicados as cargas
factoriais superiores a .30 e na última coluna a comunalidade (h2).
Quadro V.2 - Análise factorial dos itens num inquérito de hábitos de estudo.
QUI Actor 1 3~ H h 2
1 M 1( .65
2 .70 _M .49
3 .78 .20 .65
4 -.70 15 .51
5 .21 _.19 .11
6 -07 .50 .32
7 .13 -63 .41
8 M9 -66 .46
9 M -.70 .49
1( .33 -.45 .31
Valor-próprio 4.614 3.34
AMA 3521 W23
Os valores obtidos permitem-nos defender que a escala avalia dois factores.
O item 5 näo aparece assoc@ado a qualquer um dos factores, pelo que pode ser
eliminado. Por sua vez o item 10, poderá servir para a avaliar ambos os factores,
embora a sua carga factorial seja menor do que a dos demais itens. Aqui, a decisäo
de se eliminar o item poderia ser apenas tomada após se ver em que medida o resultado
num e noutro factor (dimensäo) ficaria afectado. A análise da consistência interna dos
itens de cada um dos factores poderia ser feita previamente a essa decisäo, por
exemplo.
Metodologia da Investigaçäo em Psicologia e Educaçäo 185
Os dois factores foram isolados porque apresentam um valor próprio (eigen-
value superior à unidade (1.00). No seu conjunto, os dois factores explicam 61.4%
da variância total dá escala (a variância näo explicado por estes dois factores pode
estar associada a diversos erros de medida e, em particular, a especificidades de
formulaçäo ou de resposta dos próprios itens). A percentagem de variância explicado
por um factor pode ser lida como correspondendo ao somatório do quadrado das
saturaçöes dos itens nesse factor, dividido pelo número de itens da escala e multipli-
cado por 100 (Bryman & Cramer, 1993, 320). A eliminaçäo do item 5 fará aumentar
a % de variância da escala explicado pelos dois factores, por exemplo.
O coeficiente de comunalidade (h2) descreve-nos a covariância do item com
os factores isolados, ou seja em que medida cada item tem a ver com os factores
isolados. Por exemplo, o item 1 apresenta um h2 de .65, ou seja 65 % de covariância
com os dois factores. No entanto, ainda de acordo com os valores do quadro, podemos
associar este item mais com o factor 1 Ç802 ou 64%) do que com o factor II (. 102 OU
1 %), daqui se depreende ser uni itern que representa bem o factor I e näo o factor H.
Um outro aspecto a considerar na análise factorial prende-se com a rotaçäo
dos factores. Trata-se de um procedimento de uso frequente e que tem como principal
objectivo maximizar as saturaçöes dos itens nos respectivos factores (Bryman &
Cramer, 1993, 317). Através desta aproximaçäo entre itens e factores torna-se mais
fácil uma interpretaçäo dos factores, passando do domínio da estatística para o
domínio dos comportamentos avaliados (itensh e que se podeni agrupar tendo alguma
dimensäo comum subjacente.
Dois métodos de rotaçäo aparecem mais usados: a rotaçäo ortogonal e a
rotaçäo oblíqua. Pela primeáa obtêm-se factores independentes entre si, ou factores
näo correlacionados ou ortogonais. Pela segunda obtêm-se factores correlacionados,
o que poderá parecer mais razoável na Psicologia e na Educaçäo em face da percepçäo
generalizada de que muitas das variáveis e dos factores subjacentes aos comporta-
mentos se encontram mutuamente interdependentes. Para a primeria análise o método
varimax é o mais usado, e para a segunda o método oblimin.
Concluindo, a análise factorial é o procedimento por excelência para apreciar
a dimensionalidade dos instrumentos que utilizamos. Numa perspectiva de exploraçäo
de factores ou de confirmaçäo de hipóteses subjacentes (acrescente-se o pouco uso em
Portugal da análise factorial confirmatória - Maia, 1996), a análise factorial foi ao
186 Resultados: análise e discussäo
longo deste século a ferramenta metodológica mais empregue para validar as provas
psicológicas, por exemplo. Daí, trata-se de um procedimento de análise estatística
bastante complexo e com múltiplas formas alternativas à disposiçäo do investigador.
A consulta de manuais espeóahzados nesta área torna-se aconselhável para algum
domínio da técnica.
Significância dos dados
O recurso à análise estatística no tratamento dos resultados tem associada a
possibilidade de, no final, o investigador poder defender ou näo um significado
específico para os seus dados. Podemos definir este objectivo como a análise da
significância dos valores obtidos. Mesmo que se tenda a associar a análise da
significância dos resultados a parâmetros estatísticos, gostaríamos de aqui falar em
dois tipos de significância: a si@gpnzificância intrínseca e a significância estatística dos
resultados. Ambas estäo interligadas, contudo tentaremos mostrar que näo säo
coincidentes.
Quando falamos em significância intrínseca questionamo-nos sobre o sig-
nificado dos dados recolhidos. Por exemplo, em que medida tais resultados foram
aqueles e näo podiam ser outros. Se repetíssemos a investigaçäo ou se fossem feitas
algumas alteraçöes no procedimento, o que aconteceria aos resultados obtidos? De
novo, voltamos à questäo do controlo e validade interna dos procedimentos
metodológicos usados na "manipulaçäo" das variáveis ou na obtençäo dos dados.
É decisivo acautelar a qualidade dos dados que se recolhe e analisa. Para tal
importa apreciar o grau de contingência entre os resultados obtidos e os diversos
procedimentos descritivos da investigaçäo realizada: variáveis tomadas, amostras
utilizadas e instrumentos de avaliaçäo empregues. Os dados em Psicologia e Educaçäo
podem estar afectados pela maior ou menor qualidade das decisöes e opçöes tomadas
nesses três aspectos metodológicos, pelo que faremos uma última referência a cada
um deles.
Em primeiro lugar, devemos considerar as variáveis a estudar. Por exemplo,
importa analisar a relevância de tais variáveis para o problema em questäo, bem como
a sua abrangência para o analisar de uma forma adequada. Associada a esta questäo,
está a forma como as variáveis foram operacionalizadas, por exemplo, quais as
Metodologia da Investigaçäo em Psicologia e Educaçäo 187
dimensöes consideradas ou os aspectos comportamentais valorizados. Num compor-
tamento problema, por exemplo a desmotivaçäo do aluno na sala de aula, podemos
considerar as dimensöes cognitivas, emotivas, sócio-relacionais ou motoras na sua
descriçäo. Tais dimensöes nem sempre säo simultâneas, täo-pouco interferem de
igual modo ou assumem idêntica importância no comportamento ou problema em
questäo. Por exemplo, o jogador de casino sabe já (cognitivo) que o jogo pode levá-
lo à ruína, contudo, por razöes afectavas (afectivo) ou hábitos instituídos (motor), näo
abandona o seu comportamento de risco. Também se se pretende estudar a relaçäo
entre o envolvimento dos trabalhadores na empresa e a sua produtividade, certamente
que a investigaçäo näo se pode limitar a operacionalizar tais variáveis considerando
aspectos estritamente cognitivos (destrezas possuídas, competências, cogniçöes
1)essoaisy lEssa postura levaria a que ficassem de fora aspectos mais afectivo-
relacionais (o clima de grupo, a motivaçäo no trabalho), por exemplo. Inclusive,
podem os trabalhadores auto-avaliarem-se e percepcionarem-se como altamente
produtivos e interessados, contudo os seus "actos" näo väo no mesmo sentido
(absentismo, prolongamento dos intervalos, falta de cooperaçäo). Interessa na definiçäo
das variáveis, e na sua operacionalizaçäo, considerar esta multidimensionalidade de
vertentes.
Um outro exemplo ilustra esta nossa afirmaçäo. Pensemos que nos é solicitada
a avaliaçäo de um programa de intervençäo comunitária constituído por sessöes de
informaçäo e de resoluçäo de problemas com pais tendo em vista um incremento do
seu relacionamento com os filhos e uma melhoria nas suas interacçöes com os
professores e a escola. Se nessa avaliaçäo atendermos apenas às opiniöes, atitudes ou
aos conhecimentos possuídos antes e no termo do programa de intervençäo, certamente
que os resultados confirmam a eficácia da intervençäo. Contudo, se a avaliaçäo se
orienta mais para as práticas educativas familiares ou o envolvimento efectivo na vida
escolar, entäo os resultados poderäo já näo sugerir de forma täo clara para tal eficácia.
Ena termos mais comportamentais, os pais podem na prática continuar a näo
aproveitar as rotinas para a educaçäo dos filhos, as idas à escola säo mínimas e'as
conversas com os professores centrana-se apenas em questöes disciplinares...
Em segundo lugar, os resultados estäo condicionados ao tipo de amostras e
grupos que se considerem na investigaçäo. Sabe-se que os resultados de uma
sondagem de opiniäo säo diferentes consoante a amostra tomada. Podemos encontrar
grandes índices de correlaçäo entre os resultados nos testes de Q1 e o rendimento
escolar se considerarmos na amostra do estudo um grupo de alunos bem dotados
188 Resultados: análise e discussäo
intelectualmente e um outro grupo com grandes dificuldades a este respeito. Se os
parâmetros estatísticos que se venham a calcular estäo de algum modo condicionados
ao grau de homogeneidade ou de heterogeneidade dos grupos nas características
avaliadas, entäo pode-se "procurar" as amostras de acordo com os objectivos e com
as hipóteses da investigaçäo a testar. Na medida em que os resultados obtidos
reflectem em grande medida as amostras observadas, é necessário cuidar particu-
larmente deste factor de enviesamento nos estudos.
Estes aspectos e cuidados aplicam-se quer a amostra se reporte a sujeitos
(indivíduos) quer se reporte a situaçöes (contextos). Um e outro servem-nos de ponte
informativa e "oferecem-nos" os indicadores a tomar na observaçäo/avaliaçäo.
Observar a dinâmica da sala de aula quando as crianças preparam em pequenos grupos
uma "prenda para o dia do pai" ou no dia-a-dia escolar poderá permitir dados
diferentes ao nível da atençäo dos alunos, seu envolvimento nas tarefas, clima de
interacçöes, etc.
Em terceiro lugar, os resultados obtidos estäo condicionados pelo tipo de
instrumentos que utilizamos na sua recolha e pelas próprias condiçöes de avaliaçäo.
Um inquérito auto-administrado pode ser vivido de forma diferente pelos vários
participantes numa investigaçäo, como a situaçäo de entrevista pode inibir uns e
desbIoquear outros. O formato e o conteúdo dos testes e provas em geral podem,
ainda, adequar-se melhor a uns e pior a outros indivíduos. Provavelmente, crianças
provenientes dos meios sociais mais desfavorecidos säo capazes de efectuar pequenos
cálculos de cabeça nos seusjogos e actividades de rua, contudo apresentam dificuldades
na realizaçäo das adiçöes na escola (Carraher et aL, 1988). É necessário, entäo, que
o investigador se questione em que medida os resultados recolhidos podem estar
determinados pelas especificidades dos instrumentos usados ou pelas condiçöes em
que a avaliaçäo ocorreu. Ao nível da avaliaçäo cognitiva de crianças com e sem
dificuldades na aprendizagem, com e sem deficiência mental, temos verificado uma
estreita interdependência entre condiçöes da avaliaçäo e resultados obtidos Quz &
Almeida, 1996). Concordaremos que o objectivo primeiro na investigaçäo é que os
resultados reflictam as reais características dos indivíduos, das relaçöes ou dos
contextos, assumidos como o alvo da observaçäo. Neste sentido, todas as precauçöes
na conduçäo da avaliaçäo/observaçäo devem ser consideradas. Numa primeira fase
elas devem estar presentes na organizaçäo e conduçäo do plano da investigaçäo, numa
segunda fase elas devem estar presentes na ponderaçäo dos dados obtidos.
Metodologia da Investigaçäo em Psicologia e Educaçäo 189
Ao fazermos aqui referência a estes três aspectos de ordem metodológica
pretendemos salientar que numa investigaçäo, previamente às conclusöes que se
possam retirar, importa analisar o suporte empírico em que as mesmas assentam.
Estes cuidados devem ser proporcionais às consequências individuais e colectivas
que decorram de tais investigaçöes e avaliaçöes. Relatam-se situaçöes que exemplificam
investigaçöes na Psicologia onde certos procedimentos metodológicos podem ter
sido usados para falsear a própria realidade (Gould, 1991).
Um outro tipo de significância dos resultados, particularmente usada na
investigaçäo psicológica e nas publicaçöes científicas, tem a ver com a significância
estatística. Aqui, a análise pretende informar se uma diferença encontrada entre dois
ou mais grupos de sujeitos, ou se uma correlaçäo observada entre medidas emparelhadas
de duas ou mais variáveis, podem assumir-se como estatisticamente significativas,
isto é, näo serem meramente atribuídas ao acasm,k resposta a esta pergunta é-nos dada
através de tabelas estatísticas específicas para os procedimentos de análise utilizados.
A significância estatística de um coeficiente vai depender do seu valor numérico e do
suporte de apoio em que foi calculado (número de observaçöes ou casos). Assim,
alguns cuidados devem ser tidos em consideraçäo na apreciaçäo destes coeficientes
e, sobretudo, näo considerar como "conclusivo" todo o coeficiente estatisticamente
significativo.
Retomando alguns aspectos anteriores, podemos dizer que a grandeza numérica
de tais coeficientes (variância e correlaçäo) podem estar afectados pelo tipo de
amostras e pelo tipo de instrumentos utilizados. Uma grande dispersäo de resultados,
conseguido através de grupos muito heterogéneos ou de instrumentos com elevado
leque de valores (por exemplo, usar uma escala de avaliaçäo de itens com 7 e mais
níveis de resposta), pode aumentar indevidamente a grandeza dos coeficientes e, ao
mesmo tempo, a probabilidade da sua significância estatística.
Para aléna do impacto dos procedimentos metodológicos nos coeficientes
obtidos, e da necessidade da sua ponderaçäo na análise dos resultados, coloca-se
ainda uma segunda questäo que tem a ver com o próprio significado estatístico de um
coeficiente näo ocasional. Dado que a significância estatística de um coeficiente está
associada quer à grandeza numérica do coeficiente quer aos graus de liberdade
(número de observaçöes, de sujeitos ou de grupos em que assentam as comparaçöes),
um coeficiente pode näo ter significado estatístico para um pequeno grupo de sujeitos
(graus de liberdade menor), mas já ser significativo quando reportado a uma amostra
190 Resultados: análise e discussäo
com um n mais elevado. Se quisermos, quanto maior uma amostra observada, maiores
probabilidades tem o investigador de encontrar difúèrenças ou correlaçöes estatisti-
camente significativas. Claro está que esta ilaçäo näo pode ser considerada de forma
täo simplista. Uma pequena diferença dificilmente será significativa comparando
dois grupos com poucos sujeitos. Contudo, quanto mais a amostra se amplia mais ela
se aproxima do universo e, nessa altura, pode a diferença continuar a ser pequena mas
começa a ser difícil continuar a afirmar que ela näo existe. Do ponto de vista
quantitativo ela existe e em termos de probabilidade estatística ela torna-se signifi-
cativa à medida que aumentamos o número de observaçöes, contudo a sua relevância
para a prática pode ser insignificante. Säo aspectos distintos e merecem ser devidamente
atendidos pelo investigador na discussäo dos seus dados e elaboraçäo das conclusöes.
Reportando-nos, ainda, à significância estatística dos coeficientes, quer na
comparaçäo de frequências ou de médias de grupos quer na correlaçäo dos valores
entre variáveis, importa no primeiro caso näo generalizar tais diferenças a todos os
sujeitos dentro de cada grupo. Ao afirmar que a média de longevidade das mulheres
é superior à dos homens e que essa diferença é estatisticamente significativa, näo
podemos concluir que todas as mulheres e todos os homens se comportam dessa
forma. A única coisa que se pode concluir, tomando estes dados e a diferença
encontrada, é que, em termos de probabilidade, podemos esperar uma maior
longevidade de um sujeito quando ele é do sexo feminino do que quando é do seio
masculino. Se esta informaçäo pode ser importante para uma "empresa de seguros",
a aplicaçäo dessa informaçäo a cada sujeito singular pode ter pouco significado. Se
a generalizaçäo dos resultados de uma amostra para a populaçäo é difícil, näo menos
o é quando se pretende transferir essa informaçäo para os casos individuais.
Em relaçäo aos coeficientes de correlaçäo um outro cuidado deve ser
considerado por parte do investigador. Algumas vezes, erradamente, toma-se um
coeficiente de correlaçäo estatisticamente significativo como garantia de que uma
variável interfere ou é a causa da outra. Por exemplo, as correlaçöes entre os testes de
inteligência geral e o rendimento escolar tendem a ser estatisticamente significativas.
Um erro comum entre psicólogos e educadores pode ser o de interpretar tal relaçäo
no sentido de que o rendimento dos alunos é explicado pelas suas capacidades
intelectuais. Fica sempre a possibilidade de outras variáveis explicarem tal relaçäo,
bem como as teorias recentes de que a aprendizagem e a inteligência dos alunos se
encontram mutuamente condicionadas (Almeida, 1993a). Assim, importa salientar
que um coeficiente de correlaçäo näo nos permite falar em "causalidade" de efeitos
Metodologia da Investigaçäo em Psicologia e Educaçäo 191
entre variáveis; em segundo lugaV o sentido da influência entre duas varm"va's pode
ser recíproco e, inclusive, pode ficar a dever-se a uma terceira variável näo conside-
rada no estudo.
Finalmente, um coeficiente de correlaçäo entre duas variáveis, mesmo sendo
estatisticamente significativo, deve ser mais apreciado pela sua grandeza numérica do
que pela sua significância probabilística. De novo, um coeficiente de correlaçäo de
.20 pode ser estatisticamente significativojunto de amostras grandes e näo o serjunto
de amostras mais reduzidas. No entanto, e porque a percentagem de variância que
podemos assumir numa variável explicado pela outra com que se correlaciona é-nos
dada pelo quadrado do coeficiente obtido (r2). No caso concreto de um coeficiente de
.20, podemos afirmar que 496 da vaúância numa variável pode ser prevista através dos
valores na segunda. Convenhamos que é uma percentagem bastante insignificante,
mesmo sendo estatisticamente significativa...
Generalizaçäo, explicaçäo e prediçäo
Este tópico remete-nos para três questöes finais na investigaçäo: "Como se
generaliza? Como se explicam os resultados obtidos? Como se pode predizer para
outras situaçöeW Se na investigaçäo aplicada podemos afirmar que o investigador
se (Auge pela resoluçäo de um problema concreto, e com isso atinge os seus
objectivos, na investigaçäo pura procura-se normalmente chegar a princípios gerais
e a satisfaçäo do investigador apenas é possível quando consegue uma aplicaçäo mais
geral dos seus resultados.
As possibilidades de generalizaçäo remetem-nos para vários aspectos
metodológicos seguidos na investigaçäo. Em primeiro lugar, podemos questionar-
nos sobre a significância e, sobretudo, a representatividade das amostras utilizadas
(maior generalizaçäo pode ser defendida se näo surgem dúvidas de que um grupo ou
amostra representam uma populaçäo). Por outras palavras, a generalizaçäo da
amostra para a populaçäo pressupöe tratar-se de uma amostra representativa dessa
populaçäo. Nas aferiçöes dos testes psicológicos, onde a normalizaçäo dos resultados
para a populaçäo é feita através dos resultados na amostra observada, este aspecto é
particularmente relevante. Claro está que sempre subsistem dificuldades. Podemos
apontar a falta de recenseamentos actualizados ou de recenseamentos que considerem
as variáveis que interessam considerar na investigaçäo. Também podemos falar nas
192 Resultados: análise e discussäo
diferenças ao nível dos aplicadores das provas (próximo da variável experimentador
num estudo laboratorial ou do observador numa situaçäo de observaçäo "desarma-
da") ou nas condiçöes em que ocorrem as avaliaçöes.
Era segundo lugar, a generalizaçäo acompanha a nossa real compreensäo do
problema. Esta compreensäo implica que sejam consideradas diversas variáveis,
condiçöes e grupos. Tomando a literatura produzida no campo, o investigador deveria
estudar sistematicamente as variáveis que pudessem interagir com as suas variáveis
de interesse. A multiplicidade de variáveis (psicológicas e näo psicológicas) que
interferem no comportamento humano, bem como as respectivas interacçöes,
aconselham planos multifactoriais de investigaçäo. Também as condiçöes säo im-
portantes. Podemos obter resultados em laboratório que näo se generalizam para
outras situaçöes externas em virtude das condiçöes e contextos se alterarem. Defender-
se-ia, aliás, que condiçöes muito padronizadas numa investigaçäo tendem a limitar a
amplitude das suas generalizaçöes no final, situaçäo inversa pode esperar-se de
avaliaçöes psico-educacionais mais contextualizadas e abrangentes, ou seja aquelas
que hoje säo classificadas como possuindo uma boa validade ecológica.
Por último, devemos mencionar os sujeitos e os grupos. Por exemplo, se
pensamos que as notas num Mäe podem variar de acordo com o sexo, a idade, a
escolaridade e a classe social dos sujeitos, entäo essas variáveis deveriam -ser
devidamente consideradas na constituiçäo da amostra (vejam-se as amostras que
combinam o método estratificado com o método aleatório na sua constituiçäo) e as
análises estatísticas deveríam explícitar os efeitos do seu conjunto.
Em relaçäo à explicaçäo, ou ao "porquê", podemos afirmar que a investigaçäo
é tradicionalmente assumida como dirigindo-se à resoluçäo desta questäo. Fre-
quentemente se define a investigaçäo e o trabalho do investigador como a procura das
leis explicativas de um fenômeno ou grupo de fenômenos. Esta possibilidade apenas
pode ocorrer se estiverem claramente definidas as condiçöes antecedentes e as leis
gerais em aplicaçäo. Só assim podemos explicar os fenómenos, as mudanças e a
relaçäo entre os resultados obtidos e as variáveis em estudo. Como precauçäo, e antes
de fazer inferências ou tirar conclusöes, o investigador deverá questionar-se acerca
de outras eventuais explicaçöes para os seus dados ou para a verificaçäo das suas
hipóteses. A deduçäo lógica pressupöe previamente que o princípio ou lei geral e as
condiçöes antecedentes estäo correctas. Infelizmente, em Psicologia como noutras
ciências, temos verificado vários exemplos de explicaçöes para fenômenos que,
Metodologia da Investigaçäo em Psicologia e Educaçäo 193
aceites num cedo momento, vieram mais tarde a ser recusadas. Por outras palavras,
4 cnunca podemos ter uma segurança absoluta" (McGuigan, 1976, 379) e, desde logo,
alguns problemas de Mem ética se levantam aos investigadores e aos práticos. Se
pensarmos que algumas ideias "nazis" poderäo ter-se fundamentado em teorias
psicológicas em torno da hereditariedade da inteligência... ou que algumas crianças
podem ficar indevidamente privadas do contacto com outras crianças na escola
regular em virtude dos seus resultados em testes de inteligência, convenhamos que
nos devemos preocupar com o fundamento, e aliás com a aplicaçäo, dos nossos
conhecimentos científicos. Desde logo, uma probabilidade estatística näo é uma
certeza, ao mesmo tempo que valores reportados a grupos e a amostras näo respondem
pela singularidade humana existente e que dá sentido a cada indivíduo.
Próximo do conceito de explicaçäo temos um outro, o da prediçäo. A di-
ferença é que, enquanto a prediçäo é apresentada. antes ida observaçäo, a explicaçäo
é posterior. Na prediçäo, quando se encontram definida(s) a(s) lei(s) geral(ais) e as
condiçöes de um fenômeno ou comportamento, derivamos as consequências lógicas.
Em Psicologia e Educaçäo podemos afirmar que se abusou, de alguma forma, deste
conceito. Em linguagem científica diremos que o rigor da informaçäo subjacente à
prediçäo terá que ser superior ao rigor que podemos encontrar na explicaçäo uando
falamos em prediçäo assume-se que explicamos um fenômeno e que somos, inclu-
sive, capazes de o controlar e provocar. Criadas as condiçöes, os fenômenos
assumiriam uma certa forma e os comportamentos tomariam uma determinada
orientaçäo. Na Psicologia, por exemplo, algumas práticas de orientaçäo escolar e de
selecçäo profissional assentam ainda demasiado nos resultados dos indivíduos em
provas psicológicas tomando a capacidade preditiva dos seus resultados. Importa näo
ignorar nessa análise a distância considerável que vai entre a probabilidade associada
a um fenômeno e o seu controlo efectivo, e daí retirar as devidas ilaçöes para o tipo
de práticas e para a -forma como säo usadas tais provas psicológicas.
Consideraçöes éticas da investigaçäo
A produçäo do conhecimento científico coloca algumas exigências ao in-
vesúgadon Ente elas podemos mencionar a curiosidade, a paciência, a objectividade
e a mudança (Christensen, 1985, 20-1). Por curiosidade entende-se a postura de
constante questionamento do investigador em relaçäo aos fenômenos (o quê?
194 Resultados: análise e discussäo
quando? porquê? como?) e uma atitude de abertura em relaçäo à diversidade de
aspectos e de métodos alternativos para a sua análise. Esta abertura é ainda parti-
cularmente necessária face a fenômenos novos e diferentes. Porpaciência ilustra-se
o trabalho moroso do investigador, o esforço exigido, os fracassos e a possibilidade
dos resultados encontrados näo traduzirem o investimento pessoal realizado. A
objectividade do investigador tem a ver com o seu esforço e com a qualidade do seu
planeamento de forma a evitar a interferência dos seus desejos e atitudes nos dados
encontrados.
Por último, a mudança significa a disponibilidade do investigador para alterar
os seus referenciais e métodos, ou partir para a obtençäo de novos dados. Esta
mudança näo deve ser vista como abandono de todo um processo anterior ou de toda
a informaçäo recolhida. Qualquer ciência precisa conhecer estudos que näo provaram
as hipóteses ou cujos resultados contrariam conhecimentos "consolidados". Uma
política editorial ou de elaboraçäo de dissertaçöes acadêmicas pouco favorável à
divulgaçäo de trabalhos cujas conclusöes näo väo no sentido das teorias estabelecidos
pode reforçar a baixa predisposiçäo à mudança por parte dos investigadores. Reto-
mando de novo as palavras de Tukey (1962, in Pinto, 1990, 9) "é preferível uma
resposta aproximada à pergunta certa que por vezes é vaga, do que uma resposta
exacta à pergunta errada, que pode tornar-se sempre precisa". A aceitaçäo da
mudança pressupöe uma atitude crítica prévia por parte do investigador, a começar
pelos seus próprios contrutos e metodologias.
Em relaçäo às investigaçöes no terreno, e mais concretamente ao paradigma
da investigaçäo participativa, outras exigências se colocam ainda ao investigador
(Erasmie & Lima, 1989, 47-8). Em primeiro lugar a capacidade de aprofundar
continuamente o conhecimento da situaçäo através da observaçäo constante, do ouvir
os outros, do questionar ou do participar nas actividades. Este aprofundamento deve
ser extensível à situaçäo política, económica e social das comunidades locais e
nacionais. Em segundo lugar, exige-se uma capacidade de auto-crítica e de estar
aberto a críticas da comunidade. Em face do objectivo de intervençäo destes
projectos, o investigador deve, por outro lado, envolver-se com os problemas da
comunidade, subordinando-se aos interesses e às prioridades das pessoas da comu-
nidade, e ser ao mesmo tempo capaz de colocar perguntas pertinentes e críticas
deixando as decisöes finais para a própria comunidade. Finalmente, o investigador
deve assumir o compromisso de "transferir" todo o seu conhecimento para os
Metodologia da Investígaçäo em Psicologia e Educaçäo 195
membros da comunidade e, com estes, assumir os riscos decorrentes de um processo
de investigaçäo participativa que, frequentemente, provoca rupturas com sistemas
institucionalizados de poder e de influência.
Aspectos éticos na investigaçäo e na observaçäo psicológica
O estudo do comportamento humano envolve uma relaçäo entre o investigador
e os sujeitos, ou entre o investigador, os sujeitos e os contextos. Na investigaçäo a
questäo ética central passa pelo dilema que inclui dois sistemas de valores: por um
lado, a crença no valor e na necessidade da investigaçäo em si mesma, por outro, a
crença na dignidade humana, nos seus contextos de vida e no direito de ambos à
privacidade. Centrada nesta questäo aAmerican PsychologicalAssociation (A.P.A.)
tem sucessivamente editado alguns princípios de índole deontológica para a regu-
lamentaräo da investigaçäo psicológica (A.P.A., 1982). O mesmo procedimento tem
assumido em relaçäo aos testes e à avaliaçäo psicológica em geral. Daremos, neste
livro, uma maior atençäo aos aspectos reportados à investigaçäo, analisando alguns
dos aspectos deste problema tendo, no entanto, presente que devemos analisar e
discutir os princípios éticos na investigaçäo, como sucessivas tentativas para encontrar
a melhor forma de definir a prática científica num determinado momento e contexto
sócio-histórico (Freire, 1994).
Em primeiro lugar, o investigador tem a responsabilidade de fazer uma
avaliaçäo cuidadosa da aceitabilidade ética do seu estudo antes de iniciar a pesquisa.
O investigador deve, assim, evitar estudos que ponham em causa os direitos dos
participantes. Ilustrando, o investigador deve estar atento se os sujeitos em causa
podem sair prejudicados, mesmo do ponto de vista psicológico, pela sua participaçäo
na investigaçäo em causa. Esta situaçäo é particularmente evidente em situaçöes
experimentais de privaçäo do sujeito ou de introduçäo de estimularäo aversiva.
Interessa, ainda, que o investigador, ao assumir fsta responsabilidade, a generalize
aos seus colaboradores na pesquisa (assistentes, estudantes e funcionários).
Em segundo lugar, e excepto no caso das investigaçöes de risco mínimo, o
investigador deve fazer um contrato com os sujeitos onde possa clarificar as
obrigaçöes, os direitos e as responsabilidades mútuas. Neste ponto deve o investigador
ser o mais claro e preciso possível em relaçäo aos aspectos da investigaçäo que
196 Resultados: análise e discussäo
possam vir a afectar os participantes. Só assim podemos assegurar o consentimento
informado do sujeito para a sua participaçäo. Este ponto, no caso da autonomia dos
participantes estar diminuída, deve incluir os seus encarregados de educaçäo ou de
tutela. Quando na investigaçäo, por razöes intrínsecas ao próprio objecto ou plano de
estudo, näo for possível a abordagem com os participantes de todos estes aspectos,
deve o investigador criar medidas adicionais para proteger o bem estar e a dignidade
dos participantes.
Em relaçäo a este ponto, ainda, deve o investigador respeitar a liberdade do
sujeito recusar a sua participaçäo na investigaçäo em qualquer uma das fases da sua
prossecuçäo. Este respeito deve ser devidamente ponderado nas situaçöes em que o
investigador tem algum ascendente sobre os próprios sujeitos ou quando com eles
estabeleceu um contrato que inclui, aliás, o pagamento ou a creditaräo dos indivíduos.
Podemos ilustrar esta situaçäo quando o psicólogo recorre aos trabalhadores da sua
empresa, aos estudantes da sua universidade ou aos sujeitos internados na sua clínica.
Em terceiro lugar, e por razöes êle índole metodológica, os estudos podem
necessitar que os seus objectivos näo sejam explicitados ou, inclusive, que se recorra
à utilizaçäo do engano. Antes de prosseguir o estudo, cabe ao investigador ponderar
se tais procedimentos säo efectivamente necessários, se näo existem outros procedi-
mentos alternativos que näo usem o engano, se estäo criadas as condiçöes para que
os participantes tomem disso conhecimento o mais cedo possível ou se tais procedi-
mentos possuem efectivo valor científico. Quando o investigador tem que fazer uso
do engano, torria-se enäo obrigatória a realizaçäo de uma entrevista após o estudo,
muitas vezes chamada de entrevistapós-experimental (entrevista de debrieffing) para
explicar ao sujeito o que se passou e o porquê de näo se ter revelado mais cedo os
objectivos da investigaçäo ou do estudo particular, bem como explicar o porquê de
determinados comportamentos que possam ter ocorrido por parte do sujeito, salva-
guardando sempre o seu bem-estar. Embora este procedimento tenha algumas
exigências em termos de tempo e esforço, as suas consuquências para o sujeito têm-
se mostrado altamente positivas: a maior parte dos sujeitos adquire uma maior
compreensäo da complexidade da experimentaçäo e adere melhor ao processo de
investigaçäo em geral e à experiência específica em que participou (Aronson et aL,
199,
Em quarto lugar, o investigador deve salvaguardar a integridade física,
Metodologia da Investigaçäo em Psicologia e Educaçäo 197
mental e moral dos participantes. Em geral devem evitar-se investigaçöes que
provoquem danos ou coloquem em perigo a segurança dos participantes. Os proce-
dimentos de investigaçäo que causem danos sérios ou duradouros nos participantes
näo devem ser usados, excepto nas situaçöes em que a impossibilidade de os usar
exponha os participantes a riscos ou a danos maiores. Os participantes devem ser, por
razöes óbvias, devidamente informados e explicitar o seu consentimento. Comple-
mentarmente, deve-se assumir que cabe ao investigador a responsabilidade de
detectar, remover ou corrigir consequências indesejáveis da investigaçäo nos parti-
cipantes.
Em quinto lugar, deve o investigador assumir a confidencialidade dos
resultados obtidos, excepto se algum acordo em sentido contrário foi estabelecido
com os participantes. As referências aos dados da investigaçäo em reuniöes cientí-
ficas, em aulas ou em publicaçöes näo podem, em caso algum, colocar em causa a
confidencialidade dos resultados.
Por último, merecem ser mencionados alguns princípios deontológicos na
experimentaçäo psicológica om animais. O assunto tem vindo a ser cada vez mais
reclamado em face dos movimentos locais e internacionais de protecçäo dos animais.
Só nos Estados Unidos mais de 17 milhöes de animais säo usados anualmente na
investigaçäo(McBurney,1990,328@ debatenoassuntotemsidobastantecaloroso,
estando em causa a questäo de como conciliar que investigaçöes e descobertas no
campo da saúde possam ser limitadas ou impedidas por princípios desta ordem.
Certamente que o assunto deverá ser enquadrado no contexto do estatuto e do uso dos
animais na nossa sociedade (McBurney, 1990, 328@ Desde já, o investigador tem o
dever ético de assegurar dois aspectos no recurso aos animais nas suas experiências.
Em primeiro lugar, esse uso deve ser devidamente justificado ou estritamente
necessário. Em segundo lugar, os animais devem permanecer em condiçöes con-
fortáveis e sanitárias. Para além destes aspectos gerais existem ainda orientaçöes mais
específicas que säo também alvo de publicaçöes pela A,P.A. (1985).
Parece-nos que uma discussäo ética acerca da investigaçäo nunca se esgota,
sendo de referir que, por exemplo, paralelamente à ênfase colocada nas questöes
éticas da relaçäo do investigador com o seu objecto de estudo, devem também ser
ponderadas as questöes éticas relativas à metodologia da investigaçäo psicológica e,
mesmo, as questöes éticas relativas à aplicabilidade dos resultados da investigaçäo
(Freire, 1994). Torna-se evidente que estes três níveis de questöes éticas estäo
198 Resultados: análise e discussäo
interligados ou existem na medida era que é a especificidade do objecto de estudo que
está em c;ausa. Apesar disso, os princípios éticos näo se devem esgotar na definiçäo
de princípios relativos à forma como se deve lidar coam o sujeito enquanto participante
de uma investigaçäo (Freire, 1994).
A concluir, uma referência aos aspectos deontológicos na avaliaçäo psicológica.
As associaçöes de psicólogos na generalidade dos países possui um código deontológico
específico para a avaliaçäo psicológica e para o uso dos testes. Igualmente em
Portugal a Associaçäo dos Psicólogos Portugueses (APPORT) procedeu à discussäo
e aprovaçäo de um regulamento para a área específica da avaliaçäo psicológica
(Almeida, 1993b). Aspecto es . sencial deste documento é a atribuiçäo da responsa-
bilidade ao psicólogo pelos vários momentos da avaliaçäo (a escolha das provas, as
condiçöes de aplicaçäo, a correcçäo e cotaçäo, a padronizaçäo, interpretaçäo e
elaboraçäo do relatório), mesmo quando recorrem a outra pessoa ou a meios técnicos
disponíveis. Um segundo aspecto tem a ver com o dever do psicólogo em se preparar
devidamente tendo em vista o uso correcto das provas e técnicas que utiliza, bem
como estar informado das provas devidamente estudadas para os objectivos e as
populaçöes a observar. Um terceiro aspecto prende-se com o sigilo da informaçäo e
com o direito que assiste ao sujeito, mesmo nos casos de haver uma entidade que
solicitou a avaliaçäo, de conhecer os seus resultados e os procedimentos que o
psicólogo utilizou pare chegar a determinadas conclusöes.
A título de comentário final podemos referir ainda a ideia de que todos os
princípios éticos que se tentam definir näo säo para uso exclusivo dos "investigadores
das universidades". A partir do momento em que se pensa fazer investigaçäo, toda
uma sequência de problemas säo desencadeados e devem ser resolvidos rigorosamen-
te por qualquer profissional esteja ele ligado à universidade ou a qualquer outro
contexto profissional (Freire, 1994).
Aspectos a considerar num relatório científico
Analisando-se os artigos publicados em revistas, nomeadamente as revistas
de especialidade, podemos verificar que eles seguem normalmente uma mesma
estrutura. Utilizando essa estrutura podemos melhor visualizar a sequência dos
passos e das decisöes ao longo de uma investigaçäo e considerar os pontos essenciais
na organizaçäo de um relatório científico. Esta estrutura ou esquema ajuda a
Metodologia da Investigaçäo em Psicologia e Educaçäo 199
sistematizar a informaçäo anterior e a construir uma metodologia de análise dos
artigos de uma forma crítica e, inclusive, mais eficiente.
Algumas normas encontram-se estabelecidos para o efeito, servindo de
orientaçäo e uniformizaçäo de critérios. Na Psicologia, por exemplo, alarga-se o
número de países e revistas que adoptam as normas do American Psychological
Association (A.P.A., 1983). Estas orientaçöes aparecem descritas e comentadas
num dos livros em língua portuguesa que nos tem servido de referência (Pinto, 1990,
cap. 1 1). No esquema seguinte apontam-se os elementos que integram um relatório
ou um artigo científico (quadro V.3).
Quadro V.3 Elementos de um relatório ou artigo científico
12M1
ARMEM Descriçäo
Tilulo Decorre tia natureza do relatório. variáveis estudadas, grupos
tomados ou procedimentos empregues
Autoda Autor(es) e instituiçäo(C)es) de pertença
Resurno Surnariza o problerna, o rnétodo de observaçäo, os resultados, a
interpretaçäo dos (lados e implicaçöes
Introduçäo Introduz o puRAema, síntese bibliografica na área, definiçäo da
hipótese e sua relevância
Modo Descriçäo & l'ornia como as observaçöes foram conduzidas em
lermos de: sujeitos, variáveis, procedimentos, instrumentos...
Resultados 1)csci-iç@'ío dos resultados por tabelas e quadros, doidos (Ia análise
estalística
Discu~ Interpretaçäo tios resubados obtidos em funçäo da teoria. do
problerna inicial, de outras investigaçöes
Conclusäo Principais conclusöes, retiradas do estudo, limitaçöes (ia investiga-
cäo. desenvolvirrientos futuros,
Referências
Bibliografia mencionada no texto
Anexos Docurnentos importantes usados ou produzidos pela investigaçäo
Um relatório ou um artigo iniciam-se por um título que "deve ser conciso e
suficientemente informativo sobre o assunto estudad(," (Pinto, 1990, 157). Em
relatórios este título pode ser mais desenvolvido, especificando contexto, amostras e
procedimentos usados. Algumas vezes, estes elementos säo necessários também ao
título de um artigo como forma de maior explicitaçäo do assunto em análise. Integra-
se, ainda aqui, o nome dos autores e as respectivas instituiçöes, bem como as entidades
que suportam o projecto (nos artigos, por norma, estas últimas informaçöes säo
incluídas em nota de rodapé).
fila
200 Resultados: análise e discussäo
O artigo e relatório inicia-se por uma síntese ou sumário. Aqui, o seu autor
situa o problema em estudo, refere a metodologia, os resultados e as conclusöes. Em
primeiro lugar importa assegurar uma informaçäo genérica sobre o tema ou problema
tratado e respectivo enquadramento teórico ou empírico. Em seguida o sumário deve
conter os aspectos metodológicos mais importantes do trabalho. Por último, deve
incluir uma referência aos principais resultados e conclusöes. Por razöes diversas este
resumo pode ser reproduzido noutras línguas, ao mesmo tempo que em alguns textos
se poderäo indicar (e também traduzir) algumas palavras-chave que melhor descrevem
o teor do texto, relatório ou artigo.
Segue-se uma introduçäo do artigo onde se contextualiza a área de estudo, o
que outros autores já escreveram e referiram sobre o mesmo assunto ou assuntos
próximos, qual o problema a que a investigaçäo se propöe responder, qual a discussäo
teórica e empírica em que o problema se encontra inserido, quais os objectivos ou as
hipóteses de trabalho da presente investigaçäo e sua relevância.
71 parte mais significativa do artigo diz respeito ao método e aos resultados.
O autor descreve as variáveis consideradas, as amostras utilizadas, os instrumentos
de avaliaçäo empregues e o plano, bem como os demais procedimentos considerados
na conduçäo da investigaçäo. Segue-se a descriçäo dos procedimentos estatísticos
usados nas análises, justificando as suas opçöes. Na apresentaçäo dos resultados
deve-se, em primeiro lugar, descrever os dados descritivos mais gerais (tabelas,
quadros), passando de seguida aos dados das análises estatísticas inferenciais.
Passa-se, entäo, à fase de discussäo e de interpretaçäo dos resultados, e à
elaboraçäo das conclusöes mais significativas do estudo. Os resultados säo inter-
pretados e discutidos à luz da bibliografia existente no assunto e no quadro dos
procedimentos metodológicos seguidos. Nas conclusöes do seu trabalho, o autor deve
indicar algumas limitaçöes do estudo, as questöes que ficaram por responder ou
algumas explicaçöes alternativas para os resultados encontrados.
Um relatório ou artigo terminam com a referência às fontes consultadas e à
bibliografia em geral, podendo-se incluir alguns anexos, tabelas e figuras que, por
razöes diversas, näo foram incluídas no texto, e que säo requeridos à própria
apreciaçäo técnica dos resultados e das conclusöes.
Metodologia da Investigaçäo em Psicologia e Educaçäo 201
BibHograGa
Almeida, L. & G9930. Rentabilizar o ensino-aprendizagem escolar para o
sucesso e o treino cognitivo dos alunos. In L. S. Almeida (Coord.), Capacitara escola
para o sucesso. Gaia: Edipsico.
Almeida, L. S. (1993b). Princípios deontológicos no uso dos testes e na
avaliaçäo psicológica. Maga: Assodaçäo dos Psicólogos Portugueses.
A.P.A. (1982). Ethical Principles of the American Psychological
Association. Washington, DC: American Psychological Association.
A.P.A. (1983). Publication Manual of the American Psychological
Association. Washington, DC: American Psychological Association.
A.P.A. (1985). Guide for the Care and Use of Laboratory Animais. Wa-
shington, DC: American Psychological Association.
Aronson, E., Ellsworth, P. C., CarIsmith, J. M., Gonzales, M. H. (1990).
Methods of research in socialpsychology. New York: McGraw-Hill.
Bryrnan, A. & Cramer, D. (1993). Análise de dados em Ciências Sociais:
Introduçäo às técnicas utilizando o SPSS. Oeiras: Celta Editora.
Carraher, T., Carraher, D. & Schliemann, A. (1988). Na vida dez, na escola
zero. Säo Paulo: Cortez Editora.
Christensen, L. B. (1985). Experimental methodology. Boston: Allyn and
]Bacon.
Cruz, M. S. & Almeida, L. S. (1996). Avaliaçäo dinâmica das capacidades
cognitivas de crianças com dificuldades de aprendizagem. In L. S. Almeida, J.
Silvério & S. Araújo (Orgs.), Actas do II Congresso Galaico-Português de
Psicopedagogia. Braga: Instituto de Educaçäo e Psicologia.
Erasmie, Th. & Lima, L. C. (1989). Investigaçäo eprojectos de desenvolvi-
mento em educaçäo. Braga: Universidade do Minho, Unidade de Educaçäo de
Adultos.
202 Resultados: análise e discussäo
Freire, T. (1 994). Princípios éticos na investigaçäo psicológica. In Actas do
Seminário: Deontologia Profissional do Psicólogo. Porto: Associaçäo dos Psicólo-
gos Portugueses.
Gould, S. J. (1991). A falsa medida do homem. Säo Paulo: Livraria Martins
17ontes.
Maia, J. A. 11 (199Q Um discurso metodológico em torno da validade de
construto: Posiçöes de um lisrelita. In L. S. Almeida, S. Araújo, M. M. Gonçalves, C.
Machado & M. R. Simöes (Orgs.), Avaliaçäo Psicológica: Formas e Contextos (vol.
IV). Braga: Associaçäo dos Psicólogos Portugueses.
McBurney, D. H. (1990). Experimental psychology. Belmont, CA:
Wadsworth.
McGuigan, F. J. (1976). Psicologia experimental: Uma abordagem
metodológica. Säo Paulo: EPU.
Pinto, A. C. (1990). Metodologia da investigaçäo psicológica. Porto: Ed.
Jornal de Psicologia.
Metodologia da Investigaçäo em Psicologia e Educaçäo 203
FICI IA DE AUTO-AVALIAÇÄO
Responda a 6 das 8
Diferencie as análises estatísticas paramétricas das näo-paramétricas quer.,na@::::
Oeieri'M quer na anáUse ínheencial doi resubadoL
2. Cornojustifica que os coeficientes estatísticos a calcular estejam condicionadora
pelo grau de homogencidade/heterogencidade das amostras utilizadas?
3. Porque é que a significânda eswdaka pode dizer pouco acerca da relevâncias
psico-educacional de um dado coeficiente estatístico calculado?
4. Porque se afirma que aprediçäo é um objectivo da ciácia mais exigente que a
explicaçäo?
5. Eni que consiste o consentimento infonna(lo na salvaguarda de aspectos éticqs:.
em relaçäo à padicipaçäo doi WWeítos numa investigaçäo?
6. Que cuidados especiais deve ter o investigador antes e após acorieretizaçäo de
uma írivestigaçäo que envolva o uso do engano aos sujeitos?
7. O recurso a animais nas investigaçöes deve obrigar o investigadora alguns
cuidados, prévios. Explicite-os.
S. Otiais os-aspectos.mais relevantes no sumário/resumo de um relatório ou artigo? i
S.
Conclusäo
1 1 V
3,\.
Ao longo dos capítulos deste livro procurámos explicitar formas diversas de
investigaçäo em Psicologia e Educaçäo, explicítando as fases e as principais questöes
m~do3gicas na sua prossecuçäo. Numa perspectiva didáctica, foram apresentados
os fundamentos e as opçöes subjacentes ao rigor metodológico de um estudo.
Certamente, olhando ao seu conjunto, podemos aceitar que um outro esforço seria
necessário se, de uma forma mais clara, pretendêssemos equilibrar perspectivas
divergentes e complementares de investigaçäo. O livro centra-se, sobretudo, num
modelo positivista de investigaçäo. Aliás, tendo havido a preocupaçäo de näo cairmos
em receituários, certo que, relendo os capítulos, algo nos parece apontar nesse
sentido. Acreditamos que um e outro aspecto podem ser assumidos como primeira
incursäo dos autores na área e como primeiro passo, ou um momento necessário e
estruturador da progressiva autonomia dos próprios investigadores nestas questöes.
Esperamos que assim aconteça na consulta deste manual.
Em segundo lugar, tendo havido a intençäo de equilibrar nas preocupaçöes e
conteúdos as referências à Psicologia e à Educaçäo, certo que a primeira saiu
claramente favorecido. A formaçäo, a experiência e os interesses dos autores foram
determinantes e, de uma forma näo deliberada, certo que consideramos os futuros e
actuais psicólogos como nossos primeiros interlocutores. Provavelmente estaríamos
agora em condiçöes de (re)escrever este livro e "forçar" uma maior contextualizaçäo
às problemáticas e investigaçäo educacionais. Numa lógica construtivista, ou de que
nada se perde e tudo se transforma com algum tempo de permeio, a reconstruçäo deste
livro implica necessariamente algum distanciarnento de Rema a näo repetirmos, por
novas palavras, as ideias versadas. Infelizmente, na Psicologia e demais Ciências
Humanas, fica-nos a percepçäo que temos sido mais eficazes na produçäo de novos
discursos para ideias e leituras velhas dos problemas subsistentes do que na mudança
de refuenciais e de construtos na nossa pesquisa. Múltiplos problemas do compor-
tamento e essência humana permanecem täo obscuramente entendidos como quando
um século atrás Wundt criou o primeiro laboratório da Psicologia "dita" científica.
Centrando-nos nos conteúdos e potenciais contributos deste livro junto de
alunos e investigadores nas áreas da Psicologia, Educaçäo e, inclusive, das demais
208 Recolha dos dados: procedimentos e instrumentos
Gências Humanas, houve a preocupaçäo de integrar nos seus capítulos ois blocos
informativos centrados nas fases do método científico. No primeiro, procurámos
explicitar e descrever os momentos preparativos de uma investigaçäo, ou seja os
aspectos a considerar antes de proceder à recolha dos dados. Neste ponto, importa
assegurar uma adequada definiçäo do problema a investigar. Esta necessidade é täo
óbvia quanto ignorada. Ainda hoje persistem dúvidas sobre os reais problemas de
algumas investigaçöes em curso. No limite, poder-nos-emos questionar se toda a
investigaçäo em Psicologia e Educaçäo é efectivamente dirigida por problemas,
sejam eles teóricos ou práticos, no sentido metodológico aqui em apreço.
Definir um problema significa, desde logo, delimitar um assunto a investigar
e postular um modelo de relaçöes entre as variáveis a considerar. Assim, aceitando-
se a confluência de múltiplas circunstâncias e variáveis na explicaçäo do comporta-
mento individual, grupal e social, mais sentido faz a conveniente delimitaçäo do
problema. Perspectivas holísticas, hoje reclamadas, devem estar mais na forma de
olhar, avaliar e interpretar uma realidade ou problema específico do que no querer
tomar múltiplas realidades sem contornos delimitados. Importa o máximo de
globalizaçäo, mas dentro de um quadro relacional devidamente lógico e controlado.
Investigar traz subjacente a preocupaçäo de isolar dimensöes e variáveis, ou de
aprofundar uma eventual pista explicativa para um fenômeno. Um problema
metodologicamente definido integra essa pista explicativa. Por outras palavras, a
investigaçäo organiza-se tendo em vista a testagem de um modelo de organizaçäo dos
efeitos ou das relaçöes entre variáveis. Apenas em estudos exploratórios alguma
legitimidade poderá existir para estudos tendo em vista "ver o que os dados däo".
Mesmo aí, tal legitimidade será tanto maior quanto mais convenientemente orientada.
Uma investigaçäo sem uni modelo claro de relacionamento das variáveis a
testar, como facilmente se depreende, fica mais dependente dos dados obtidos do que
de uma hipótese. O "meio" torna-se o "fulcro" nessa investigaçäo, talvez melhor
definida como uma quasi-investigaçäo. Esta mudança de "papéis" em parte explica
algumas dificuldades explícativas e as múltiplas teorias disponíveis para um mesmo
fenômeno. É possível, inclusive, que alguns problemas e fenômenos possam ter sido
"inventados" por este meio (a verdade é que os construtos em análise na Psicologia
se väo multiplicando ... ). Paralelamente, algumas variáveis tidas até um certo momen-
to como simples variáveis dependentes em face de dados e mais dados empíricos
acumulados, passaram mais tarde a serem assumidas como fontes explicativas do
Conlusäo 209
comportamento. O desenvolvimento psicológico, enquanto variável a investigar,
exemplifica essa mudança de perspectiva. Até um certo momento os dados aponta-
vam para a sua natureza maturacional, o seu sentido sequencial e verificaçäo
universal, defendendo-se a sua funçäo determinante do comportamento - pelo menos
até ao final da adolescência. No presente, o desenvolvimento psicológico vem
progressivamente auferindo um papel de variável dependente, simultaneamente
influenciável e influenciadora, um alvo privilegiado da intervençäo psico-sócio-
educativa ao longo de toda a vida dos indivíduos e grupos.
Um segundo bloco informativo deste livro centra-se nas questöes
metodológicas do plano de concretizaräo da investigaçäo, mais concretamente a
recolha dos dados e respectivas ilaçöes conclusivas. Como se afirmou, os dados
empíricos em que assenta a análise, a discussäo e as conclusöes a retirar encontram-
se fortemente condicionados pelos procedimentos na sua recolha e análise. Rapida-
mente poderemos concluir aquilo que antecipadamente desejamos se, consciente ou
inconscientemente, "manipulamos" os sujeitos avaliados, os instrumentos usados, as
condiçöes da recolha ou, inclusive, as próprias análises estatísticas. Um grande
relativismo se estabelece em toda a investigçäo que produzimos, sobretudo quando
a mesma se assume e concretiza numa lógica de projecto pessoal ou de pequeno
grupo.
Nesta segunda parte do livro, dedicámos um maior espaço à metodologia de
construçäo e aferiçäo dos instrumentos de avaliaçäo. Portugal é apoivado, por parte
dos profissionais e investigadores da Psicologia e Educaçäo, como um País de parcos
recursos na área da avaliaçäo (Almeida, Gonçalves & Simöes, 1995). A prova mais
utilizada internacionalmente, considerando alguns inquéritos realizados junto de
psicólogos de vários países (Oakland & Hu, 1992) para a avaliaçäo cognitiva das
crianças - WISC, WechslerIntelligenceScaleforChíldren - teve o seu estudo normativo
na populaçäo portuguesa nos finais dos anos 60 (Marques, 1970), mantendo-se
mesmo assim em uso apesar do tempo e das transformaçöes sócio-culturais ocorridas
no País, ou apesar das duas versöes mais recentes desta escala entretanto realizadas
(WISC-R em 1974 e WISC-III em 198S - veja-se a este propósito um comentário em
nota de rodapé recentemente produzido sobre os problemas decorrentes desta
situaçäo em Portugal (Simöes, 1996). Na área educativa o problema da falta de
instrumentos repete-se, mesmo atendendo a algumas provas recentemente construidos
no quadro de projectos internacionais de investigaçäo sobre a aprendizagem em
mo Recolha dos dados: procedimentos e instrumentos
algumas matérias (língua materna ou matemática, por exemplo). Nestas circunstân-
cias, sérios limites se podem colocar ao desenvolvimento da investigaçäo e à melhoria
técnica da intervençäo. Näo podemos prescindir dos dados, e estes dependem
fortemente, na sua qualidade, dos instrumentos usados para a sua recolha (isto näo
impede, que mais ao nível da prática, sempre defendemos que o avaliador deve ser
melhor que os instrumetnos que usa ... ).
Terminámos este livro fazendo algumas consideraçöes técnicas e éticas em
torno da análise e discussäo dos resultados. Algumas responsabilidades sociais
devem ser assumidas pelo investigador näo apenas na forma como conduz as suas
,investigaçöes, mas igualmente na forma como delas retira as suas conclusöes.
Alguma padronizaçäo de procedimentos é requerida, e isto sem inibir a necessária
criatividade e espírito inventiva de cada investigador. Devemos saber distinguir o que
é "fOrma" do que é "conteúdo". Sem problemas do ponto de vista formal, uma
investigaçäo pode, mesmo assim, apresentar-se técnica e eticamente reprovável.
Julgamos que este assunto estará cada vez mais presente nas nossas prática profissi-
onais, mesmo nas de investigaçäo. As preocupaçöes sociais nesta área tornaram-se
mais explícitas e incisivas, havendo também maior disponibilidade dos próprios
investigadores para a sua necessária identificaçäo e ponderaçäo.
Ao longo deste livro procurou-se sequencializar as fases numa investigaçäo
e salientar a respectiva interdependência. Se a divisäo procurou responder a uma
lógica procedimental da investigaçäo e, também, a uma lógica pedagógica de
apresentaçäo dos assuntos, importa atender à continuidade das decisöes e dos passos
ao longo de tais fases. Pela nossa experiência de alguma supervisäo e consultadoria
na área, apontamos algumas dificuldades por parte dos investigadores nacionais
(mestrandos, doutorandos e outros) em antecipar as interferências retroactivas e
Ivoactivas das opçöes metodológicas ao longo das várias fases da sua investigaçäo.
Este discurso, para alguns tipicamente metaprocedimental, carece de maior divul-
gaçäo ce aquisiçäo por parte dos investigadores nacionais da Psicologia e Educaçäo.
Acontecem, assim, estudos que ficam pelos primeiros ensaios ou dados recolhidos
que näo chegam a ser analisados. No nosso País ainda é fácil fotocopiar inquéritos e
encontrar grupos de sujeitos MisponíveW para o seu preenchimento. Acreditamos
que a instauraçäo de práticas de maior controlo ou um clima de maiores dificuldades
na traduçäo e reproduçäo abusivas, ou na própria aplicaçäo de instrumentos junto de
grandes amostras, poderäo ser um factor também positivo - apesar da dissonância em
coniusäo 211
presença - no desenvolvimento da investigaçäo nas nossas áreas. Talvez se venha a
fazer mais e melhor investigaçäo com menos investigaçöes...
A concluir, um livro de metodologia de investigaçäo é sempre um produto
mais iniciado do que concluído. Assumido sobretudo como um manual na área, näo
colocamos de lado a hipótese de o retomarmos futuramente. Desde já, pensamos num
segundo trabalho dirigido aos instrumentos de observaçäo e avaliaçäo. Se neste livro
este tópico foi organizado em torno da construçäo e aferiçäo de instrumentos de
avaliaçäo, julgamos que algo mais pode ser sistematizado e dito a propósito dos
modelos e correntes da observaçäo, típologia de instrumentos e comentários em torno
de instrumentos já disponíveis na populaçäo portuguesa. A este propósito refira-se o
trabalho da Associaçäo dos Psicólogos Portugueses (APPORT) com a ediçäo de uma
colectânea "Provas Psicológicas em Portugal" dando conta dos estudos realizados em
Portugal no domínio da construçäo, adaptaçäo e aferiçäo de provas para a avaliaçäo
psicológica (Almeida, Simöes & Gonçalves, 1995). Esse nosso projecto para uma
futura publicaçäo näo se situa, evidentemente, neste campo específico já iniciado pela
APPORT.
Também näo saiu täo valorizada, pelo quanto merecia num livro de metodologia
da investigaçäo, as ferramentas estatísticas disponíveis. Sabemos, aliás, que é uma
das áreas menos desenvolvidas nos nossos meios, assim como um dos domínios de
menor habilitaçäo dos profisMonais e acadénúcos da Psicologia e Educaçäo. Relendo
o livro, verificamos que tal esforço apenas existiu em relaçäo à construçäo e aferiçäo
dos instrumentos. Certamente que a estatística é importante nessa fase, mas ela surge
particularmente reclamada no momento de análise dos dados recolhidos e, mais
concretamente, na tesugem das hipóteses formuladas. Por este facto, fica um outro
ponto a merecer futuras incursöes e desenvolvimentos. Se é verdade que manuais de
estatística epackages informáticos de análise dos dados se encontram hoje em maior
número e acessibilidade, por vezes torna-se necessário o seu melhor enquadramento
nos projectos de investigaçäo de ceda uma das ciências ou uma aproximaçäo dos seus
discursos, fórmulas e deduçöes aos investigadores nas Ciências Humanas. Por outras
palavras, aceitando que cabe ao próprio investigador e profissional a construçäo de
uma progressiva autonomia funcional nestas áreas, é possível ajudá-los através de
andaimes que respeitem as suas especificidades. Neste sentido, e da nossa experiên-
cia na área, fazem sobretudo falta em Portugal andaimes mais perceptivos no seu
conteúdo, forma e posicionamento, no fundo adequados aos potenciais usufrutuários.
22 Recolha dos dados: procedimentos e instrumentos
Vivamente esperamos que isso tenha sido já de algum modo conseguido com este
trabalho...
Bibliografia
Almeida, L. S. (1993). Rentabilizar o ensino-aprendizagem escolar para o
sucesso e o treino cognitivo dos alunos. In L. S. Almeida (Coord.), Capacitara escola
para o sucesso. Vila Nova de Gaia: Edipsico.
Almeida, L. S., Gonçalves, M. M. & Simöes, M. R. (1995). Provas psicoló-
gicas em Portugal: Situaçäo actual, limitaçöes e desafios. In L. S. Almeida, M. R.
Simöes & M. M. Gonçalves (Eds.), Provas Psicológicas em Portugal. Braga: As-
sociaçäo dos Psicólogos Portugueses.
Almeida, L. S., Simöes M. R. & Gonçalves, M. M. (Eds.) (1995). Provas
Psicológicas em Portugal (Vol.1). Braga: Associaçäo dos Psicólogos Portugueses.
Marques, J. H. (1 970). Manual da Escala de Inteligência de Wèchsler para
Crianças (WISC): Adaptaçäo e aferiçäo para Portugal. Lisboa: Instituto de Alta
Cultura.
Oakland, Th. & Hu, Sh. (1992). The top 10 tests, used with children and youth
worldwide. Bulletin of the International Test Commision, 19 (1), 99-120.
Simöes, M. R. (1996). Avaliaçäo neuropsicológica das dificuldades de
aprendizagem (I). Revista Portuguesa de Psicopedagogia, = (2), 263-312.
I -ndice de Autores
'k
1,1
26 Resultados: análise e discussäo
Popper, K. R., 21, 32, 41, 66
Richardson, M., 150, 173
Rincón, D., 31, 108
Roazzi, A., 127,171
Rosenthal, R., 72, 109
Schliemanm, A., 201
Simöes, A., 29, 30, 32, 95, 109
Simöes, M. R., 138,140,172,174,209,211,212
Stanley, J. C., 129, 172
Swaminathan, H., 134,173
TyIer, L. E., 58, 66
Vaz Serra, A., 106, 109, 132, 174
Zedeck, S., 66, 173
Zimmey, G. H., 82,109
Acaso nas respostas 126, 127
Acordo entre observadores 146, 148
Administraçäo das provas 83, 137, 138, 187,
188
Aferiçäo dos resultados 141
Aleatorizaçäo dos grupos 58, 79, 85, 106
Amostra e amostragem 96, 97, 98, 100, 187
Amostra, aleatória estratificaçja 98, 101
Amostra, aleatória simples 98, 99
Amostra, representatividade e significância
102,103
Amostragem acidental ou incidental 105
Amostragem aleatória 98, 10-1
Amostragem intencional 105
Análise factorial 160, 182
Análise factorial confirmatória 185
Análise qualitativa dos itens 120
Análise quantitativa dos itens 122
Avaliaçäo adaptativa/informática 136
Avaliaçäo dinâmica 140
Mancearnento, contrabalancearriento 53
Bipartiçäo dos itens 146, 148
Cálculo dos itens 146, 148
Cálculo das normas 163
Características dos itens 117, 119, 130
Características métricas dos resultados 142
Carga factorial (saturaçäo) 183
Ciência, características 21
Ciência, definiçäo 19
Ciên(Aa, objectivos 20, 24, 191
Classes normalizadas 167
Coeficiente alpha de Cronbach 146, 150, 151
Coeficiente de assimetria 144
Coeficiente de curtose 144
Coeficiente de equivalência 146
Coeficiente de estabilidade 146
Coeficiente de Kuder-Richardson 146, 150
Comunalidade (h2) 184, 185
Condiçöes da avaliaçäo 138
Confidencialidade (ética) 197
Consentimento informado do sujeito 196
Consistência interna dos itens 146, 149
Construto, definiçäo operacional 115
Correcçäo dos resultados 162
Correcçäo Spearman-Brown 149, 151
Correlaçäo 93, 129, 189
Cotaçäo dos resultados 140
Curvas características dos itens 134
Design (cf. planos) 72
Dimensionalidade das escadas 181, 182
Emparelhamento dos grupos 53
Engano, utilizaçäo (ética) 196
Erro padräo da medida 152
Erro padräo da estimativa 158
Erros de tipo I e de tipo II 47
Escadas de medida 58, 60, 63
Escadas de razäo ou proporcionais 58, 62, 63
Escadas intervalares 58, 61, 63
Escadas nominais 58, 60, 63
Escadas ordinais 58, 61, 63, 124, 130, 150
Escadas rectangulares 165
Escadas sigmáticas 168
Estatística: paramétrica versus näo paramétrica 63
Estatística: procedimentos de análise 63
Estudo post-facto 88
Estudos de case, único (single-case) 106
Estudos longitudinais 81
Estudos sequenciais 81
Estudos transversais 81
Ética, consideraçöes 193
Experimentaçäo com animais (ética) 197
Fidelidade dos resultados 142, 145
Fidelidade, métodos 146
Follow-up 80
220
Grupos contrastados 106
Grupos contrastantes 106
Grupos e sujeitos 104, 105, 107, 187
Grupos emparelhados 180
Grupos específicos 106
Grupos independentes 180
Grupos: experimental, controlo e placebo 78,90
Hipótese, aceitaçäo e rejeiçäo 47
Hipótese, classificaçäo 44
Hipótese, definiçäo 43
Hipótese, formulaçäo 39, 46
Hipótese, tipos 45
Homogeneidade dos itens 146, 149
Idade cronológica 168
Idade de base 168
Idade mental 168
Incidentes críticos 107
índice de dificuldade 123, 130
Integridade (ética) 196
Investigaçäo, correlacional 20, 92
Investigaçäo, descritiva 20
Investigaçäo, experimental 20, 82
Investigaçäo, pura versus aplicada 26, 40
Investigaçäo-acçäo 26, 29
Investigaçäo: tipos e modelos 20, 26, 28, 64,
& 9& 94
Linha de base 91
Material da avaliaçäo
Método correlacional 92
Método diferencial 92
Método experimental 82, 92
Método indutivo versus dedutivo 30, 44
Metodologia qualitativa 94
Normalizaçäo dos resultados 1.6í
Normas centradas na frequência 165
Normas centradas na média e desvio-padräo 164
Normas, interdependência 170
Normas, necessidade 163, 170
Notas de idade 168
Notas percentíficas 165, 170
Notas z e Notas T 125, 165, 167, 170
Resultados: análise e discussäo
Organizaçäo dos itens na prova 136
Parâmetros de Lord 134, 135
Parâmetros de ~dida 56
Plano (designo, definiçäo 72, 73
Plano de correlaçäo intervalar cruzada 89
Plano experimental 90
Plano multimétodo-multitraço 161
Plano pré-ex perimental 88
Plano quase-experimental 88
Plano Solomon 91
Plano, características 73
Plano, validade interna e externa 73, 74, 77
Planos factoriais ou multifactoriais 86
Poder discriminativo 128, 129, 130, 132
Pós-teste 80, 90
Pré-teste 80, 90
Probabilidade (cf. significância estatística) 47,
186
Probabilidade: unicaudal e bicaudal 48
Problema, construçäo de um modelo 39, 208
Problema, definiçäo 37, 41, 208
Problema, fases 38, 39
Problema testagem de um modelo 39
Propriedades dos números (cf. variável) 60
Prova: definiçäo, âmbito 114, 115, 164, 188
QI de desvio 170
QI de razäo 169
Reflexäo falada 120
Relatório 198, 199
Relevância e representatividade dos itens 155
Resultados brutos 140
Revisäo bibliográfica 42
Rotaçäo dos flactores 185
Rotaçäo oblíqua ou método oblimin 185
Rotaçäo ortogonal ou varimax 185
Sensibilidade 142,144
Séries temporais de registo 89
Significância estatística (cf. probabilidade) 47,
184 189
Significância intrínseca 186
Sistema "EORC"
índice Temático
Tabela de especificaçöes 155
Tabelas de expectativa dos resultados 159
Teoria clássica dos testes 133, 134
Teoria da resposta ao item @25, 133
Teste, definiçäo 114, 164
Testes referencíados a critério 122, 163
Testes referendados a normas 123, 163
Testing 137, 138
Universo e populaçäo 96
Usabilidade do teste 142
Validade concomitante ou concorrente 157
Validade convergente e discriminante 161
Validade do conceito ou construto 159
Validade de conteúdo 155
Validade dos resultados 142, 153
Validade externa do item 131, 132
221
Validade facial 156
Validade interna dos item (cf. poder
discriminativo) 128
Validade lógica 156
Validade por referência a critério 156
Validade preditiva ou de prognóstico 157
Validade, métodos 155
Valor próprio (eigen-value) 184, 185
Variância: efeitos principais e secundários 84,
87,123, 189
Variável, definiçäo 49
Variável, operacíonalizaçäo 50
Variável, tipos 5 V 54 8@ 86
Variável: discretas versus contínuas 58
Variável: papel, estatuto 51