0% acharam este documento útil (0 voto)
459 visualizações454 páginas

Organização e Representação Do Conhecimento em Múltiplas Abordagens

Trata-se de uma obra que discute correntes atuais em relação ao desenvolvimento teórico e metodológico na área de organização do conhecimento.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
459 visualizações454 páginas

Organização e Representação Do Conhecimento em Múltiplas Abordagens

Trata-se de uma obra que discute correntes atuais em relação ao desenvolvimento teórico e metodológico na área de organização do conhecimento.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 454

Copyright © Pimenta Cultural, alguns direitos reservados.

Copyright do texto © 2022 os autores e as autoras.


Copyright da edição © 2022 Pimenta Cultural.

Esta obra é licenciada por uma Licença Creative Commons: Atribuição-NãoComercial-SemDerivações 4.0
Internacional - (CC BY-NC-ND 4.0). Os termos desta licença estão disponíveis em: <https://creativecommons.
org/licenses/>. Direitos para esta edição cedidos à Pimenta Cultural. O conteúdo publicado não representa a
posição oficial da Pimenta Cultural.

CONSELHO EDITORIAL CIENTÍFICO


Doutores e Doutoras

Adilson Cristiano Habowski Anísio Batista Pereira


Universidade La Salle, Brasil Universidade Federal de Uberlândia, Brasil
Adriana Flávia Neu Antonio Edson Alves da Silva
Universidade Federal de Santa Maria, Brasil Universidade Estadual do Ceará, Brasil
Adriana Regina Vettorazzi Schmitt Antonio Henrique Coutelo de Moraes
Instituto Federal de Santa Catarina, Brasil Universidade Federal de Rondonópolis, Brasil
Aguimario Pimentel Silva Arthur Vianna Ferreira
Instituto Federal de Alagoas, Brasil Universidade do Estado do Rio de Janeiro, Brasil
Alaim Passos Bispo Ary Albuquerque Cavalcanti Junior
Universidade Federal do Rio Grande do Norte, Brasil Universidade Federal de Mato Grosso, Brasil
Alaim Souza Neto Asterlindo Bandeira de Oliveira Júnior
Universidade Federal de Santa Catarina, Brasil Universidade Federal da Bahia, Brasil
Alessandra Knoll Bárbara Amaral da Silva
Universidade Federal de Santa Catarina, Brasil Universidade Federal de Minas Gerais, Brasil
Alessandra Regina Müller Germani Bernadétte Beber
Universidade Federal de Santa Maria, Brasil Universidade Federal de Santa Catarina, Brasil
Aline Corso Bruna Carolina de Lima Siqueira dos Santos
Universidade do Vale do Rio dos Sinos, Brasil Universidade do Vale do Itajaí, Brasil
Aline Wendpap Nunes de Siqueira Bruno Rafael Silva Nogueira Barbosa
Universidade Federal de Mato Grosso, Brasil Universidade Federal da Paraíba, Brasil
Ana Rosangela Colares Lavand Caio Cesar Portella Santos
Universidade Federal do Pará, Brasil Instituto Municipal de Ensino Superior de São Manuel, Brasil
André Gobbo Carla Wanessa do Amaral Caffagni
Universidade Federal da Paraíba, Brasil Universidade de São Paulo, Brasil
Andressa Wiebusch Carlos Adriano Martins
Universidade Federal de Santa Maria, Brasil Universidade Cruzeiro do Sul, Brasil
Andreza Regina Lopes da Silva Carlos Jordan Lapa Alves
Universidade Federal de Santa Catarina, Brasil Universidade Estadual do Norte Fluminense Darcy Ribeiro, Brasil
Angela Maria Farah Caroline Chioquetta Lorenset
Universidade de São Paulo, Brasil Universidade Federal de Santa Catarina, Brasil
Cássio Michel dos Santos Camargo Handherson Leyltton Costa Damasceno
Universidade Federal do Rio Grande do Sul-Faced, Brasil Universidade Federal da Bahia, Brasil
Christiano Martino Otero Avila Hebert Elias Lobo Sosa
Universidade Federal de Pelotas, Brasil Universidad de Los Andes, Venezuela
Cláudia Samuel Kessler Helciclever Barros da Silva Sales
Universidade Federal do Rio Grande do Sul, Brasil Instituto Nacional de Estudos e Pesquisas Educacionais
Cristiane Silva Fontes Anísio Teixeira, Brasil
Universidade Federal de Minas Gerais, Brasil Helena Azevedo Paulo de Almeida
Daniela Susana Segre Guertzenstein Universidade Federal de Ouro Preto, Brasil
Universidade de São Paulo, Brasil Hendy Barbosa Santos
Daniele Cristine Rodrigues Faculdade de Artes do Paraná, Brasil
Universidade de São Paulo, Brasil Humberto Costa
Dayse Centurion da Silva Universidade Federal do Paraná, Brasil
Universidade Anhanguera, Brasil Igor Alexandre Barcelos Graciano Borges
Dayse Sampaio Lopes Borges Universidade de Brasília, Brasil
Universidade Estadual do Norte Fluminense Darcy Ribeiro, Brasil Inara Antunes Vieira Willerding
Diego Pizarro Universidade Federal de Santa Catarina, Brasil
Instituto Federal de Brasília, Brasil Ivan Farias Barreto
Dorama de Miranda Carvalho Universidade Federal do Rio Grande do Norte, Brasil
Escola Superior de Propaganda e Marketing, Brasil Jaziel Vasconcelos Dorneles
Edson da Silva Universidade de Coimbra, Portugal
Universidade Federal dos Vales do Jequitinhonha e Mucuri, Brasil Jean Carlos Gonçalves
Elena Maria Mallmann Universidade Federal do Paraná, Brasil
Universidade Federal de Santa Maria, Brasil Jocimara Rodrigues de Sousa
Eleonora das Neves Simões Universidade de São Paulo, Brasil
Universidade Federal do Rio Grande do Sul, Brasil Joelson Alves Onofre
Eliane Silva Souza Universidade Estadual de Santa Cruz, Brasil
Universidade do Estado da Bahia, Brasil Jónata Ferreira de Moura
Elvira Rodrigues de Santana Universidade São Francisco, Brasil
Universidade Federal da Bahia, Brasil Jorge Eschriqui Vieira Pinto
Éverly Pegoraro Universidade Estadual Paulista Júlio de Mesquita Filho, Brasil
Universidade Federal do Rio de Janeiro, Brasil Jorge Luís de Oliveira Pinto Filho
Fábio Santos de Andrade Universidade Federal do Rio Grande do Norte, Brasil
Universidade Federal de Mato Grosso, Brasil Juliana de Oliveira Vicentini
Fabrícia Lopes Pinheiro Universidade de São Paulo, Brasil
Universidade Federal do Estado do Rio de Janeiro, Brasil Julierme Sebastião Morais Souza
Felipe Henrique Monteiro Oliveira Universidade Federal de Uberlândia, Brasil
Universidade Federal da Bahia, Brasil Junior César Ferreira de Castro
Fernando Vieira da Cruz Universidade de Brasília, Brasil
Universidade Estadual de Campinas, Brasil Katia Bruginski Mulik
Gabriella Eldereti Machado Universidade de São Paulo, Brasil
Universidade Federal de Santa Maria, Brasil Laionel Vieira da Silva
Germano Ehlert Pollnow Universidade Federal da Paraíba, Brasil
Universidade Federal de Pelotas, Brasil Leonardo Pinheiro Mozdzenski
Geymeesson Brito da Silva Universidade Federal de Pernambuco, Brasil
Universidade Federal de Pernambuco, Brasil Lucila Romano Tragtenberg
Giovanna Ofretorio de Oliveira Martin Franchi Pontifícia Universidade Católica de São Paulo, Brasil
Universidade Federal de Santa Catarina, Brasil Lucimara Rett
Universidade Metodista de São Paulo, Brasil
Manoel Augusto Polastreli Barbosa Rosane de Fatima Antunes Obregon
Universidade Federal do Espírito Santo, Brasil Universidade Federal do Maranhão, Brasil
Marcelo Nicomedes dos Reis Silva Filho Samuel André Pompeo
Universidade Estadual do Oeste do Paraná, Brasil Universidade Estadual Paulista Júlio de Mesquita Filho, Brasil
Marcio Bernardino Sirino Sebastião Silva Soares
Universidade Federal do Estado do Rio de Janeiro, Brasil Universidade Federal do Tocantins, Brasil
Marcos Pereira dos Santos Silmar José Spinardi Franchi
Universidad Internacional Iberoamericana del Mexico, México Universidade Federal de Santa Catarina, Brasil
Marcos Uzel Pereira da Silva Simone Alves de Carvalho
Universidade Federal da Bahia, Brasil Universidade de São Paulo, Brasil
Maria Aparecida da Silva Santandel Simoni Urnau Bonfiglio
Universidade Federal de Mato Grosso do Sul, Brasil Universidade Federal da Paraíba, Brasil
Maria Cristina Giorgi Stela Maris Vaucher Farias
Centro Federal de Educação Tecnológica Celso Suckow Universidade Federal do Rio Grande do Sul, Brasil
da Fonseca, Brasil Tadeu João Ribeiro Baptista
Maria Edith Maroca de Avelar Universidade Federal do Rio Grande do Norte
Universidade Federal de Ouro Preto, Brasil Taiane Aparecida Ribeiro Nepomoceno
Marina Bezerra da Silva Universidade Estadual do Oeste do Paraná, Brasil
Instituto Federal do Piauí, Brasil Taíza da Silva Gama
Michele Marcelo Silva Bortolai Universidade de São Paulo, Brasil
Universidade de São Paulo, Brasil Tania Micheline Miorando
Mônica Tavares Orsini Universidade Federal de Santa Maria, Brasil
Universidade Federal do Rio de Janeiro, Brasil Tarcísio Vanzin
Nara Oliveira Salles Universidade Federal de Santa Catarina, Brasil
Universidade do Estado do Rio de Janeiro, Brasil Tascieli Feltrin
Neli Maria Mengalli Universidade Federal de Santa Maria, Brasil
Pontifícia Universidade Católica de São Paulo, Brasil Tayson Ribeiro Teles
Patricia Bieging Universidade Federal do Acre, Brasil
Universidade de São Paulo, Brasil Thiago Barbosa Soares
Patricia Flavia Mota Universidade Federal de São Carlos, Brasil
Universidade do Estado do Rio de Janeiro, Brasil Thiago Camargo Iwamoto
Raul Inácio Busarello Pontifícia Universidade Católica de Goiás, Brasil
Universidade Federal de Santa Catarina, Brasil Thiago Medeiros Barros
Raymundo Carlos Machado Ferreira Filho Universidade Federal do Rio Grande do Norte, Brasil
Universidade Federal do Rio Grande do Sul, Brasil Tiago Mendes de Oliveira
Roberta Rodrigues Ponciano Centro Federal de Educação Tecnológica de Minas Gerais, Brasil
Universidade Federal de Uberlândia, Brasil Vanessa Elisabete Raue Rodrigues
Robson Teles Gomes Universidade Estadual de Ponta Grossa, Brasil
Universidade Federal da Paraíba, Brasil Vania Ribas Ulbricht
Rodiney Marcelo Braga dos Santos Universidade Federal de Santa Catarina, Brasil
Universidade Federal de Roraima, Brasil Wellington Furtado Ramos
Rodrigo Amancio de Assis Universidade Federal de Mato Grosso do Sul, Brasil
Universidade Federal de Mato Grosso, Brasil Wellton da Silva de Fatima
Rodrigo Sarruge Molina Instituto Federal de Alagoas, Brasil
Universidade Federal do Espírito Santo, Brasil Yan Masetto Nicolai
Rogério Rauber Universidade Federal de São Carlos, Brasil
Universidade Estadual Paulista Júlio de Mesquita Filho, Brasil
PARECERISTAS E REVISORES(AS) POR PARES
Avaliadores e avaliadoras Ad-Hoc

Alessandra Figueiró Thornton Jacqueline de Castro Rimá


Universidade Luterana do Brasil, Brasil Universidade Federal da Paraíba, Brasil
Alexandre João Appio Lucimar Romeu Fernandes
Universidade do Vale do Rio dos Sinos, Brasil Instituto Politécnico de Bragança, Brasil
Bianka de Abreu Severo Marcos de Souza Machado
Universidade Federal de Santa Maria, Brasil Universidade Federal da Bahia, Brasil
Carlos Eduardo Damian Leite Michele de Oliveira Sampaio
Universidade de São Paulo, Brasil Universidade Federal do Espírito Santo, Brasil
Catarina Prestes de Carvalho Pedro Augusto Paula do Carmo
Instituto Federal Sul-Rio-Grandense, Brasil Universidade Paulista, Brasil
Elisiene Borges Leal Samara Castro da Silva
Universidade Federal do Piauí, Brasil Universidade de Caxias do Sul, Brasil
Elizabete de Paula Pacheco Thais Karina Souza do Nascimento
Universidade Federal de Uberlândia, Brasil Instituto de Ciências das Artes, Brasil
Elton Simomukay Viviane Gil da Silva Oliveira
Universidade Estadual de Ponta Grossa, Brasil Universidade Federal do Amazonas, Brasil
Francisco Geová Goveia Silva Júnior Weyber Rodrigues de Souza
Universidade Potiguar, Brasil Pontifícia Universidade Católica de Goiás, Brasil
Indiamaris Pereira William Roslindo Paranhos
Universidade do Vale do Itajaí, Brasil Universidade Federal de Santa Catarina, Brasil

PARECER E REVISÃO POR PARES

Os textos que compõem esta obra foram submetidos para


avaliação do Conselho Editorial da Pimenta Cultural, bem
como revisados por pares, sendo indicados para a publicação.
Direção editorial Patricia Bieging e Raul Inácio Busarello
Editora executiva Patricia Bieging
Coordenadora editorial Landressa Rita Schiefelbein
Marketing digital Lucas Andrius de Oliveira
Diretor de criação Raul Inácio Busarello
Assistente de arte Naiara Von Groll
Editoração eletrônica Peter Valmorbida e Potira Manoela de Moraes
Imagens da capa Bizkette1, Starline - Freepik.com
Tipografias Swiss 721, Aileron, Libel Suit
Revisão Maria Amália Cassol Lied
Organizadores Thiago Henrique Bragato Barros
Rita do Carmo Ferreira Laipelt

Dados Internacionais de Catalogação na Publicação (CIP)

O68

Organização e representação do conhecimento em múltiplas


abordagens / Organizadores Thiago Henrique Bragato Barros, Rita
do Carmo Ferreira Laipelt. – São Paulo: Pimenta Cultural, 2022.

Livro em PDF

ISBN 978-65-5939-561-3
DOI 10.31560/pimentacultural/2022.95613

1. Organização do conhecimento. 2. Metodologia.


3. Arquivologia. I. Barros, Thiago Henrique Bragato
(Organizador). II. Laipelt, Rita do Carmo Ferreira (Organizadora).
III. Título.

CDD 020

Índice para catálogo sistemático:


I. Organização do conhecimento
Janaina Ramos – Bibliotecária – CRB-8/9166

PIMENTA CULTURAL
São Paulo . SP
Telefone: +55 (11) 96766 2200
[email protected]
www.pimentacultural.com 2 0 2 2
Prefácio

A Organização do Conhecimento atua como um espaço inter-


disciplinar viabilizando pesquisas que oferecem respostas relaciona-
das à representação para recuperação, preservação e difusão da infor-
mação. Para tanto, pesquisadores e estudiosos se valem de diferentes
tradições de pesquisa, posturas epistêmicas e abordagens metodoló-
gicas, trazendo uma riqueza singular à área.

Muitos são os atores que dão forma à Organização do Co-


nhecimento e juntos partem da premissa de que a representação
do conhecimento lida com contextos, domínios do conhecimento e
comunidades de usuários.

Além da representação dos atributos de um documento e de


seus contextos, a representação do conhecimento trabalha com abs-
trações da realidade, isto é, se vale de sistemas de organização do
conhecimento, que atuam como modelos de mundo, para construir
as pontes que serão trilhadas pelos usuários até os documentos.
Uma vez recuperadas e acessadas, os usuários poderão se apropriar
de informações e terão, assim, seu direito à informação garantido
para exercer plenamente sua cidadania, tomar decisões, construir
novos conhecimentos e vivências culturais.

As formas como essas pontes são construídas, e os sistemas


de organização do conhecimento utilizados para sua estruturação,
vêm sendo investigados por especialistas com diferentes formações.
Para tanto, são desenvolvidas pesquisas que visam analisar ou pro-
por processos, instrumentos ou produtos para organizar e recuperar
informações e documentos. Na mesma medida, são empreendidas
pesquisas sobre a própria área de Organização do Conhecimento e
a literatura sobre sua conceituação, objetivos e diferentes correntes
teóricas que a compõe é vasta.
No bojo da Ciência da Informação, os estudos vão de pesqui-
sas clássicas sobre classificação em bibliotecas, presentes desde
a gênese da Organização do Conhecimento, passando por temas
permeados pelos impactos das tecnologias da informação e comuni-
cação na organização, recuperação e uso da informação, chegando
até estudos de classificação e descrição arquivísticas. É evidente que
a Documentação e a Diplomática trouxeram elementos fundamentais
para as discussões que ocorrem, atualmente, também no bojo da
Organização do Conhecimento.

O Brasil tem presença constante e coesa nos debates acerca


do ensino, pesquisa e atuação profissional no tocante à Organização
do Conhecimento, nacional e internacionalmente, e a obra que aqui se
apresenta é um excelente exemplo disso.

Com o intuito de oferecer uma coletânea de estudos sobre ou


no âmbito da Organização do Conhecimento, foram reunidos autores
brasileiros e estrangeiros, professores, pós-graduandos e profissio-
nais especializados em diferentes temáticas. Destaca-se que o fio
condutor da obra foi construído de forma sólida para acompanhar o
leitor em seu percurso.

Assim, o leitor encontrará, na primeira parte da obra, estudos


sobre aspectos epistemológicos da Organização do Conhecimento,
isto é, estudos que investigam suas premissas, teorias, posturas epis-
têmicas e métodos, assim como seu percurso histórico, paradigmas
e relações. A segunda parte trará ao leitor possibilidades de pensar
sobre contextos aplicados a partir de pesquisas que analisaram ou
desenvolveram processos, aplicaram ou avaliaram sistemas de orga-
nização do conhecimento ou propuseram produtos no âmbito da Or-
ganização do Conhecimento.

Os pesquisadores da área de Organização do Conhecimen-


to a analisam, observam os seus atores e propõem agendas de
pesquisa. Nesse sentido, essa obra contém estudos teóricos que
analisam as variações terminológicas do conceito de representação
de assunto, bem como de que forma se dá a formação de conceitos
partindo da sua existência mental e chegando à sua concepção
como unidade de conhecimento.

Estudos interdisciplinares também são empreendidos e, nesta


oportunidade, destacam-se as contribuições que as taxonomias po-
dem trazer para construção de planos de classificação para documen-
tos de arquivo, bem como as convergências entre a Organização do
Conhecimento e a Arquivologia.

Para se pensar os processos, e o impacto das tecnologias de


informação e comunicação neste fazer, estudos teóricos e aplicados
são apresentados sobre a classificação automática de documentos
de arquivo em sistemas informatizados de gestão de documentos e
sobre análises terminológicas a partir das garantias literária, de usuá-
rio, cultural e outras.

Com vistas à ampliação dos recursos para compreensão da lin-


guagem e uso dos sistemas de informação, estudos sobre análise de
logs são empreendidos, tanto no âmbito dos sistemas de recuperação
da informação, quanto para análise de reduções sintagmáticas no pro-
cesso de indexação. Também são apresentados os benefícios que a
observação da representação colaborativa em plataformas tecnológi-
cas pode trazer para a área.

Os sistemas de organização do conhecimento são os instru-


mentos que viabilizam a comunicação, via linguagem, entre os usuá-
rios e os sistemas e, nesta obra, são pensados a partir da lógica usada
para sua construção e, em uma perspectiva mais aplicada, é analisado
o uso de softwares para criação de tesauros para arquivos.

Analisar os usuários, suas necessidades, comportamentos


e práticas informacionais é fundamental para a Organização do
Conhecimento e essa premissa fica evidente no estudo sobre acesso
e recuperação da informação em arquivos e bibliotecas. Tendências
de pesquisa apontam para a necessária análise do engajamento dos
usuários em redes sociais e, aqui, uma análise dessa abordagem em
temas com viés político é realizada sob a ótica da folksonomia.

Reflexões sociais e políticas acompanham os movimentos de


estudiosos e instituições que amparam a Organização do Conheci-
mento em sua história recente e, nesta obra, são apresentadas refle-
xões éticas no âmbito da Organização do Conhecimento e a presen-
ça das urgentes discussões sobre justiça social no bojo desta área.
O foco é avançar na representação no que diz respeito aos domínios
do conhecimento, principalmente os que necessitam de pesquisas
atualizadas, e de comunidades de usuários, principalmente as que
se encontram às margens dos sistemas de informação.

Representar o conhecimento de forma defensável exige um


exercício constante de reflexões teóricas e metodológicas e a com-
preensão da responsabilidade dos profissionais e estudiosos da Or-
ganização do Conhecimento, sendo assim convido vocês, queridos
leitores, a percorrerem as páginas dessa obra com uma postura ativa
e crítica, afinal, como nos ensina Hope A. Olson, embora o objetivo
possa não ser o de exercer poder, exceto o poder da recuperação da
informação, atuamos no âmbito de um poderoso discurso cultural.

Bons estudos!

Profa. Dra. Suellen Oliveira Milani,


Universidade Federal Fluminense

Niterói, 14 de março de 2022


Apresentação

Esta obra foi organizada com o objetivo de apresentar as pes-


quisas desenvolvidas no âmbito da Organização do Conhecimento
realizadas por membros (pesquisadores, egressos e estudates) do
Grupo de pesquisa Organização e Representação do Conhecimen-
to Abordagens Linguísticas em Arquivos e Bibliotecas – ORCALAB/
UFRGS ou da rede por ele estabelecida.

Os textos foram sistematizados em duas partes no intuito de


destacar na parte I Abordagem Epistemológica na Organização do Co-
nhecimento aspectos teóricos e metodológicos relevantes para a área
e, na parte II Abordagem Aplicada na Organização do Conhecimento,
exemplos de estudos aplicados baseados em grande medida, mas
não apenas, nas teorias e metodologias apresentadas na parte

A rede de pesquisa formada a partir do ORCALAB possui pes-


quisadores de 9 Universidades Brasileiras (UFRGS, UFPA, UFSCAR,
UNIRIO, UFSC, UNB, UFPE, UNESP E UFF) e 4 universidades estran-
geiras (Universidad de la República, Uruguai, Universidade de Coim-
bra, Portugal, Universidad de Leon e University of Western Ontario,
Canada) tratando-se assim de uma obra coletiva, colaborativa e que
busca discutir temáticas da organização do conhecimento de grande
relevância para área.

Não era nosso objetivo sermos exaustivos nem definitivos em


relação às abordagens teóricas, metodológicas e temáticas dos textos
devido às múltiplas possibilidades de pesquisas que a área de Organi-
zação do Conhecimento possibilita. Ainda assim, tentamos contemplar
a maior diversidade possível para questões contemporâneas que per-
meiam a área e que necessitam ser discutidas, não necessariamente
para encontrar respostas conclusivas, mas certamente como um con-
vite à reflexão e a exploração de outros horizontes e perspectivas.
Convidamos todos a leitura e discussão nas múltiplas aborda-
gens da organização do conhecimento na atualidade!

Thiago Henrique Bragato Barros e Rita do Carmo Ferreira Laipelt

Porto Alegre, 16 de maio de 2022


Sumário
Parte 1

Abordagem epistemológica
na organização do conhecimento

Capítulo 1

Uma teoria “modal”


de organização da informação...................................................... 19
A “modal” theory
of information organization
Donald Grant Campbell

Capítulo 2

O assunto, a representação: uma análise


com foco na variação terminológica​​a partir
da série Estudos Avançados em Organização
do Conhecimento (ISKO Brasil)........................................................ 44
The subject, representation: an analysis
with focus on terminological variation from
the series Advanced Studies in Knowledge
Organization (ISKO Brazil)
Brisa Pozzi de Sousa

Capítulo 3

A indeterminação ontológica dos conceitos:


interpretações linguísticas e psicológicas......................................... 94
The ontologic indetermination of concepts:
linguistic and psychological interpretations
Luís Miguel Oliveira Machado
Wilson Roberto Veronez Júnior
Daniel Martínez-Ávila
Capítulo 4

Las garantías más allá del horizonte


de la organización del conocimiento:
proyecciones posibles.................................................................... 124
Warrants beyond the horizon
of knowledge organization:
possible projections
Mario Barité

Capítulo 5

Aspectos éticos em organização


e representação do conhecimento:
uma análise de sua presença na literatura
internacional da ciência da informação.......................................... 149
Ethical aspects in knowledge organization:
an analysis about the theme in the international
literature in information science
Isadora Victorino Evangelista
José Augusto Chaves Guimarães

Capítulo 6

Metodologia de análise de logs


na ciência da informação:
revisão de literatura e melhores práticas......................................... 181
Logs analysis as methodology
for studies on information science:
literature review and best practices
Luciana Monteiro-Krebs
Rita do Carmo Ferreira Laipelt
Rafael Port da Rocha
Capítulo 7

A classificação automática de documentos


de arquivo é uma solução para os problemas
que os usuários encontram com a classificação
funcional? Algumas reflexões e caminhos a percorrer................... 221
Is automatic classification of records a solution
to the problems users encounter with functional
classification? Some thoughts and ways forward
Renato Tarciso Barbosa de Sousa

Parte 2

Abordagem aplicada na organização do conhecimento

Capítulo 8

Reduções sintagmáticas e indexação:


uma análise a partir de logs de pesquisa
dos usuários de um sistema
de recuperação da informação...................................................... 252
Syntagmatic reductions and indexing:
an analysis from user search logs
of an information retrieval system
Isabel Cristina Pereira dos Santos

Capítulo 9

As taxonomias no contexto
da arquivologia............................................................................. 281
Taxonomies in the context of archives
Carine Melo Cogo Bastos
Thiago Henrique Bragato Barros
Capítulo 10

Reflexão sobre folksonomia


e engajamento político................................................................. 296
Reflection on folksonomy
and political engagement
Talita Morgana Arruda Tavares
Fabio Assis Pinho

Capítulo 11

Organização e recuperação da informação:


desafios na Arquivologia e na Biblioteconomia............................... 320
Organization and information retrieval:
challenges in Archival Science and Librarianship
Andréa Fontoura da Silva
Bruna Carballo Dominguez de Almeida
Joana Peregrina Hernandes

Capítulo 12

Desdobramentos da transcrição colaborativa


nas abordagens teórico-metodológicas
da organização do conhecimento............................................... 341
Developments of collaborative transcription
in knowledge organization
theoretical-methodological approaches
Camila Monteiro de Barros
Edgar Bisset Alvarez
Capítulo 13

O software Thesa como SOC no contexto


arquivístico: uma proposta de modelo teórico.............................. 365
Thesa software as SOC in the archival
context: a proposal for a theoretical model
Adriana Carla Ribeiro dos Santos
Raí Rocha Costa
Marcos Oliveira da Costa

Capítulo 14

A justiça social na organização


do conhecimento.......................................................................... 391
Social justice in Knowledge Organization
Lucas Andrade Sá Corrêa
Natália Bolfarini Tognoli

Capítulo 15

Organização do conhecimento e Arquivologia:


diálogos e prospecções................................................................. 418
Knowledge organization and Archival Science:
dialogues and prospects
Leolíbia Luana Linden

Sobre os organizadores............................................................... 442

Sobre os autores.......................................................................... 443


Prate 1

Abordagem
epistemológica
Parte
Abordagem epistemológica 1
na
organização do conhecimento

na organização
do conhecimento
1
Capítulo 1

Uma teoria “modal” de organização


da informação
A “modal” theory of
information organization

Donald Grant Campbell

Donald Grant Campbell

Uma teoria “modal”


de organização da informação
A “modal” theory
of information organization
DOI: 10.31560/pimentacultural/2022.95613.1
Abstract:
This paper applies Northrop Frye’s theory of modes to the development of
professional tools of information organization. In Words with Power, Frye dis-
tinguishes between two modes of discourse. “Description” is a discourse
common in scientific writing, in which the author strives to describe some ex-
ternal reality as faithfully and accurately as possible. Controlled vocabularies
such as the Library of Congress Subject Headings strive for such accuracy,
seeking to create uniform and unique headings that are coextensive with their
subjects. “Dialectic,” on the other hand, is a discourse common in philosophi-
cal argument, where meaning is generated internally, by the rules and patterns
of the language and the argument. As simple controlled vocabularies evolve
into thesauri and ontologies, they create internal rules of relationship between
the two terms: relationships of equivalence, hierarchy, and association. Mea-
ning in controlled vocabularies, therefore, emerges through a combination of
what Frye calls centripetal and centrifugal force. On the one hand, the terms of
a vocabulary refer outward, “centrifugally,” to the external world, establishing
a firm and useful relationship between the index term and the phenomenon to
which it refers. On the other hand, the terms refer inwardly, “centripetally,” to
the network of relationships within the vocabulary, establishing firm and useful
distinctions between each index term and other terms to which it is related.

Keywords: Modes; controlled vocabularies; discourse.

sumário
20
Resumo:
Esta pesquisa aplica a teoria dos “modos”, de Northrop Frye, ao desenvolvi-
mento de ferramentas profissionais de organização da informação. Em Words
with Power, Frye distingue entre dois tipos de discurso: “Descrição” e “Concep-
tual”. “Descrição” é um discurso comum na escrita científica, em que o autor
se esforça para descrever uma realidade externa da forma mais fiel e precisa
possível. Vocabulários controlados, como os termos de indexação da Biblioteca
do Congresso, buscam essa precisão para criar termos uniformes e únicos, que
são coextensivos com os assuntos descritos. “Conceptual”, por outro lado, é
um discurso comum na argumentação filosófica em que o significado é gerado
internamente pelas regras e padrões da linguagem e do argumento. À medida
que os vocabulários controlados evoluem para os tesauros e ontologias, eles
criam regras internas das relações entre os termos: relações de equivalência,
hierarquia e associação. O significado, nos vocabulários controlados, então,
surge por uma combinação do que Frye chama de uma força centrípeta e uma
força centrífuga. De um lado, os termos de um vocabulário referem-se ao mun-
do externo, para fora, estabelecendo uma relação firme e útil entre o termo e o
fenômeno ao qual ele representa. De outro lado, os termos referem-se de forma
centrípeta, para as relações dentro do vocabulário, estabelecendo as distinções
entre cada termo e os outros termos relacionados.

Palavras-Chave: Modos; vocabulários controlados; discurso.

sumário
21
1 INTRODUCTION

The concepts of “bias” and “neutrality” continue to vex us in In-


formation Organization, particularly in relation to the tools we design for
information access. In the decades, since Sanford Berman first began to
challenge the Library of Congress to revise its subject headings to remove
implicit biases (1971), theorists and practitioners of information organiza-
tion have become increasingly aware that the “neutrality” to which libraries
have traditionally aspired is illusory and even dangerously mistaken.

While most of us in the field accept that absolute neutrality is im-


possible, the strategies for dealing with the problem vary. Some, like
Rick Szostak, suggest that information professionals circumvent the
contested ideas in different fields by diving below them and focusing
on the non-contested building blocks such as terminology, which he
calls “basic concepts”:
It has generally not been difficult to render expert advice in ter-
minology (i.e. basic concepts) that will have a broadly shared
understanding — well enough for the purposes of guiding diver-
se users to documents or objects — outside of the field of the
expert. The classificationist need not and should not take sides
on theoretical disputes within a field but should rather seek a
structure that has a place for any phenomenon identified either
theoretically or empirically in the field (SZOSTAK, 2019).

This approach does not sit well with Birgir Hjørland, who argues
that we should design and use such tools as classification systems in
full awareness of the biases that prevail, not only in the fields we are
classifying, but in ourselves as information theorists and professionals.
Taking his cue from overtly feminist analyses of information organization
systems, Hjørland urges us to engage explicitly with scholarly debates
in the field we are classifying, and to profess our own epistemological
positions in the process:

sumário
22
In order to classify a given domain one must examine how it is
classified according to contemporary knowledge (including diffe-
rent views), to discuss the basis, the epistemological assumptions,
and which interests are served by proposed classifications and fi-
nally to suggest a motivated classification. This is a highly qualified
scholarly activity, and it normally implies taking sides in scholarly
disputes at many levels, including the epistemological level. … Be-
sides studying the fields to be classified, we also need to study our
own assumptions in KO and LIS (HJØRLAND, 2020, p. 474).

In this paper, I support Hjørland’s position. I also support his dry


understatement: “important assumptions are often hidden, making their
study more difficult.” Biases are notoriously difficult to identify, in oursel-
ves and in others, no matter how honest or self-aware we may be. Even
the most disarmingly frank confession of an epistemological position
can be self-deceptive: some biases are easier to confess than others,
and some are deeply cloaked in denial. The consequences of these
biases are also difficult to identify: too often we assume that good in-
tentions produce good outcomes. If the road to hell is paved with good
intentions, many roads to intolerance, injustice and atrocity begin with
simple attempts to place things in categories and put labels on them.

This study offers a theoretical approach whereby we might take up


Hjørland’s challenge to engage with biases both in the fields we classify
and in ourselves. I begin with “mode”: a concept that emerged in both
philosophy and music, and became a cornerstone of the literary and lin-
guistic theories of Northrop Frye. I then apply the concept of mode as
a metaphorical tool to explore the biases of three different knowledge
organization tools: The Library of Congress Subject Headings (LCSH), the
National Library of Medicine’s Medical Subject Headings (MeSH), and the
Tesauro de Folclore e Cultura Popular Brasileira, produced by the Centro
de Folkclore e Cultura Popular Brasileira. The comparison will involve two
subjects: mental illness, and alternative medicine.

sumário
23
2 THE CONCEPT OF THE MODE

The concept of “the mode” originated in philosophy as a prin-


ciple of arrangement and combination. For Aristotle, mode refers to
the specific combination of propositions within a syllogism necessary
for that syllogism to be valid (GARBER, 1999, p. 577). Spinoza defines
mode as the qualities of an entity that are received from some other
entity; hence, human beings are modes of the divine substance which
is God (SPINOZA, 2000, p. 75). In these cases, “mode” refers to a
process of creating complex structures by combining simple or basic
elements. But the concept of “mode” implies that these structures are
not random: they emerge from consistent patterns and principles.

Music theorists through the ages have used the term “mode” to
denote widely-accepted patterns and arrangements of tones that we tra-
ditionally associate with certain qualities and moods. Some music theo-
rists refer to the major and minor keys of Western music as modes, with
the “major” key typically associated with happiness and confidence, and
the minor sadness and reflection (RAMOS & Mello, 2021). But modes
predate the standard tonal scales of Western music, and many different
musical cultures retain a set of standard modes: systems of arranged
tones and melodic formulas which have “ethical, emotional and cosmolo-
gical connotations” (KOLINSKI, 2000). As in philosophy, the term “mode”
in music refers to the underlying patterns and elemental principles that
silently govern and control creativity, both intellectual and musical.

In 1957, the Canadian literary critic Northrop Frye adopted the


term “mode” in the first essay of his seminal work, The Anatomy of Criti-
cism (1971). Frye argues that literary works can be classified according
to a hierarchically-arranged sequence of modes: myth, romance, tra-
gedy, comedy and satire. Later, Frye revised and adapted his theory of
modes in an ambitious attempt to understand the relationship between
literature and the Bible, and it is this adaptation of modal theory that I will

sumário
24
be using in this analysis. In Words with Power (1990), Frye argues that
human discourse is conventionally governed by four primary modes:

• descriptive: in which the author attempts to describe the world


beyond the written work;

• conceptual: in which the author strives to produce an argument


that conform s to rules of internal consistency;

• rhetorical: in which the author urges the reader to some form


of action;

• imaginative: in which the author takes the outer world and


transforms it into some form of artistic or literary expression
(FRYE, 1990, p. 3-29).

This study uses the first two modes, descriptive and concep-
tual, to analyze the different patterns and arrangements that we find in
knowledge organization tools. The descriptive mode is most commonly
associated with scientific and empirical research: for the writer in the
descriptive mode, validity is achieved through faithful fidelity to the outer
world that the author is describing: “The overriding criterion of descrip-
tive writing is, speaking practically, objective truth” (FRYE, 1990, p. 5).
The conceptual mode, on the other hand, defines and measures value
according to internal rather than external standards: the logical cohe-
rence of the argument, the validity of its propositions, the clarity of the
writing, and the coherence of its argumentative structure:
The conceptual writer, like the descriptive one, is searching
for whatever objective truth words can give him, and he is still
appealing to the conscious mind and its sense of objectivity. But
he is searching for it within the verbal order he is constructing,
and this shows itself in an intense tightening up of the narrative
movement. It is most important that sentence B should ‘follow’
from sentence A, and rules of logic are developed to ensure that
such following is correct throughout (FRYE, 1990, p. 9).

sumário
25
Clearly, these two modes of discourse are not mutually exclusive.
As any scholarly writer will attest, a piece of empirical research must
strive, at all times, to tell the truth, while at the same time following a
recognizable process of illustration and persuasion. Nonetheless, the
concept of descriptive and conceptual modes provides a useful means
of exploring the tensions in many forms of discourse. Frye makes fre-
quent use of a concept in physics to describe such tensions:

• centrifugal force: which propels the reader’s attention outward


from a center;

• centripetal force: which pulls the reader’s attention towards the


center (FRYE, 1990, p. 3).

The descriptive mode has a centrifugal momentum, drawing the


reader’s attention from the text to the outer world, while the conceptual
mode has a centripetal momentum, drawing the reader’s attention to
the internal integrity of the writing itself.

Useful as this distinction might be, it can be complex, and even


treacherous. Authors who set their plays and films in “real time,” insis-
ting that the time for the audience match the time of the narrative, are
appealing to a descriptive credibility while observing tightly rigorous ru-
les of composition. On the other hand, a human figure in a cubist pain-
ting by Picasso, while bearing no resemblance to how a human looks in
the outer world, is nonetheless expressing, through faceted techniques
of composition, a truth about human figures in the real world that might
not be obvious to the naked eye.

3 MODES IN INFORMATION ORGANIZATION

The metaphor of centripetal and centrifugal force has been


used before to describe the multidisciplinary nature of knowledge or-
ganization research (CAMPBELL, 2002). This paper, however, links the

sumário
26
metaphor to Frye’s definition of descriptive and conceptual modes, in
hopes that it will provide a means of illuminating the complex posi-
tion of knowledge organization tools such as controlled vocabularies,
classifications, thesauri and ontologies in relation to disputes over
neutrality, bias, veracity and consistency.

In designing and maintaining tools for organizing information in


various fields of study, knowledge organization experts work within both
descriptive and conceptual modes. On the one hand, they frequently
need to address the world outside their tools, often in areas of contest
and dispute. Such disputes might include debates between qualitative
and quantitative methods in the field of social sciences; evolution and
creationism in theology; conventional and alternative therapies in medi-
cine. They must also address the distortions and injustices perpetrated
by their systems, particularly in relation to marginalized or underserved
populations, through overt or covert ideological assumptions or biases.

On the other hand, access tools such as controlled vocabularies,


classifications and ontologies require conceptual focus as well. Elaine
Svenonius, for instance, argues that such tools look inward to a collection
of documents, rather than outward to what those documents signify:
Subject language terms differ referentially from words used in
ordinary language. The former do not refer to objects in the
real world or concepts in a mentalistic world but to subjects.
As a name of a subject, the term Butterflies refers not to actual
butterflies but rather to the set of all indexed documents about
butterflies. In a natural language the extension, or extensional
meaning, of a word is the class of entities denoted by that word,
such as the class consisting of all butterflies. In a subject lan-
guage the extension of a term is the class of all documents
about what that term denotes, such as all documents about
butterflies (SVENONIUS, 2009, p. 130).

To what degree do the descriptive and conceptual modes over-


lap in KO tools? This preliminary exploration takes two examples, invol-
ving two concepts:

sumário
27
• Mental Illness: defined by the American Psychiatric Association
(S.d.) as “health conditions involving changes in emotion, thinking
or behavior (or a combination of these)... associated with distress
and/or problems functioning in social, work or family activities” (ht-
tps://www.psychiatry.org/patients-families/what-is-mental-illness);

• Traditional Medicine: defined by the World Health Organization


(2021) as “the sum total of the knowledge, skill, and practices ba-
sed on the theories, beliefs, and experiences indigenous to diffe-
rent cultures, whether explicable or not, used in the maintenance
of health as well as in the prevention, diagnosis, improvement or
treatment of physical and mental illness” (https://www.who.int/heal-
th-topics/traditional-complementary-and-integrative-medicine).

Both concepts, “Mental illness” and “Traditional medicine,” may


be said to have a basis in the field of medicine, but both appear in pu-
blications beyond medicine as well. The three tools are very different in
origin and purpose:

• Library of Congress Subject Headings (LCSH): As the Library


of Congress’s principal list of subject headings, this is the oldest
of the three tools: a pre-coordinate list of subjects, determined
by the literary warrant of the LC’s own collection, and thus repre-
senting a vast range of different subjects, fields and professions;

• Medical Subject Headings (MeSH): As the National Library of


Medicine’s controlled vocabulary for its vast database of me-
dical research, MeSH is also a pre-coordinate list of subject
headings, but more rigorously designed from a tree-structu-
re classification, and designed primarily for electronic access
through databases such as PubMED.

• Tesauro de Folclore e Cultura Popular Brasileira (TFCBP):


Created by the Centro Nacional de Folclore e Cultura Popular,

sumário
28
this multidisciplinary thesaurus provides index terms for a wide
range of documents and museum artifacts.

Both LCSH and MeSH have headings representing the pheno-


menon of mental illness. Both MeSH and TFCBP contain terms repre-
senting the phenomenon of traditional medicine.

4 “MENTAL ILLNESS” IN THE LIBRARY


OF CONGRESS, AND THE NATIONAL
LIBRARY OF MEDICINE

Both the Library of Congress Subject Headings (LCSH) and the


Medical Subject Headings (MeSH) contain a heading for mental illness.
Both offer a subject heading that is co-extensive with the concept, and
both contain the following standard features of controlled vocabularies:

• an authorized heading;

• syndetic references, both from equivalent terms to the authori-


zed term, and from the authorized term to broader, narrower and
related terms; and

• a scope note which defines the extent of the subject represented


by the authorized term.

The Library of Congress selects as its authorized heading the


phrase, Mental illness; the National Library of Medicine ops for the
phrase, Mental Disorders. The LC heading suggests a single phe-
nomenon: an “illness” which afflicts the mind, and implicitly requires
that we distinguish it from illness of the body. The National Library of
Medicine, on the other hand, adopts a plural term that suggests a
range of phenomena classified together.

sumário
29
The NLM’s list of equivalent terms for Mental Disorders, such
as “Behavior Disorders,” “Mental Illness,” “Psychiatric Diseases” and
“Psychiatric Illness,” are all terms that one might reasonably expect to
encounter in the medical literature that forms the collection of the Natio-
nal Library of Medicine. In addition, since mental disorders do, indeed,
arise for many different reasons and from many different causes, the list
of narrower terms is extensive, including such terms as Anxiety Disor-
ders, Dissociative Disorders, Neurocognitive Disorders and Sleep
Wake disorders. In this sense, one can argue that the MeSH heading
operates credibly within the descriptive mode: the heading and its refe-
rences refer centrifugally to an external reality borne out by the medical
research to which it provides access.

The LC heading, Mental illness, is less credible when measu-


red by what we know empirically of mental disorders. The narrower
terms—Astrology and mental illness, Dual diagnosis, Genius and
mental illness, and Neurobehavioral disorders—make no pretence
of completion or compreheiveness: they are merely the terms that re-
flect the literary warrant of the Library of Congress itself, and hence
operate primarily in the conceptual mode: they tell us less about mental
illness than they do about the library’s collection. One equivalent term
—“Madness”—is hardly reliable as a referent to what we now unders-
tand about mental disorders. It does, however, refer to a concept that
has a powerful social history: the concept of “madness” as represented
in such fields as literature, the fine arts and law as a specific condi-
tion and the antithesis of reason and sanity. The descriptive, centrifugal
quality of the heading, therefore, exists in the form of an anticipation of
cultural norms that Charles Cutter once called “the public’s habitual way
of looking at things” (1904, p.6). It refers, not necessarily to the physical
reality of mental illness, but to an implied cultural construction assumed
to be held by those who use the library. Furthermore, these cultural
constructions evolve over time, and as outdated terms like “madness”
are replaced by more appropriate ones, the old headings are gene-
rally preserved as equivalent terms, not because they are necessarily

sumário
30
equivalent, but because they provide important links to older materials.
In this sense, the Library’s UF terms for Mental illness partly represent
a synchronic set of equivalents and partly a diachronic history of the ter-
minological development of the concept within the Library’s collection.

The scope notes of the two headings show the sharpest contrast.
The MeSH heading is entirely descriptive, and consists of a definition
of mental disorders:
Psychiatric illness or diseases manifested by breakdowns in the
adaptational process expressed primarily as abnormalities of
thought, feeling, and behavior producing either distress or im-
pairment of function (NATIONAL LIBRARY OF MEDICINE, 2021).

The LCSH scope note, by contrast, operates entirely in the con-


ceptual mode in its focus on disambiguating the various authorized
terms that the user might confuse with Mental illness:
Here are entered popular works and works on social aspects of
mental disorders. Words on legal aspects of mental illness are
entered under Insanity (Law). Systematic descriptions of mental
disorders are entered under Psychology, Pathological. Works on
clinical aspects of mental disorders, including therapy, are ente-
red under Psychiatry (LIBRARY OF CONGRESS, S.d.).

The scope note serves to emulate the internal order and con-
sistency of the subject headings, to ensure that the user does not use
the Mental illness to find works on the treatment of mental disorders
through psychotherapy.

In the case of mental illness, therefore, the two headings both


provide coherence through different combinations of the descriptive
and conceptual modes. The National Library of Medicine provides
conceptual, centripetal coherence through its carefully-constructed
tree structure and comprehensive cross-references. It provides des-
criptive, centrifugal coherence through its scope note and choice of
authorized terms that reflect scientific and medical consensus on the

sumário
31
empirical truth of mental disorders. The Library of Congress, on the
other hand, makes tentative centrifugal gestures towards a vaguely-
-implied cultural view, but its scope note and references focus almost
entirely inward, illuminating the coherence and order of the tool itself.
This contrast makes perfect sense, given that the Library of Congress
caters to a far less well-defined user base, and that its collection con-
tains works that address mental illness, not just from a medical stan-
dpoint, but also from imaginative and artistic standpoints as well.

This example might tempt us to conclude that collections su-


pporting empirical research, such as bio-medical collections, tend to
emphasize the descriptive mode over the conceptual mode, and are
far more likely to be “neutral” and less defined by cultural norms and
biases. Unfortunately, the matter is more complicated, as this second
example will show.

5 “TRADITIONAL MEDICINE” IN THE NATIONAL


LIBRARY OF MEDICINE AND THE TESAURO DE
FOLCLORE E CULTURA POPULAR BRASILEIRA

Our first example compared a specialized vocabulary to a general


or universal one. The second example uses the concept of “traditional
medicine” to compare two specialized vocabularies, both containing
the concept, but in very different contexts. For this second example, we
will once again use the Medical Subject Headings as one vocabulary.
The other vocabulary, however, comes from a tool very different from the
Library of Congress Subject Headings: we will use the Tesauro de Folclore
e Cultura Popular Brasileira, a thesaurus designed to support libraries,
archives and museums devoted not just to documents, but to various
and diverse artifacts related to the history of Brazilian popular culture.

sumário
32
The National Library of Medicine’s treatment of this concept
has less centrifugal momentum than its treatment of mental disorders.
The subject heading is Medicine, Traditional, and it falls under the ge-
neral heading of Therapeutics and the more specific heading of Com-
plementary therapies. The scope note for Complementary therapies
places greater emphasis on disambiguation than on definition:
Therapeutic practices which are not currently considered an
integral part of conventional allopathic medical practice. They
may lack biomedical explanations but as they become better re-
searched some (PHYSICAL THERAPY MODALITIES; DIET; ACU-
PUNCTURE) become widely accepted whereas others (humors,
radium therapy) quietly fade away, yet are important historical
footnotes. Therapies are termed as Complementary when used
in addition to conventional treatments and as Alternative when
used instead of conventional treatment (DeCS, 2022)

The scope note defines this heading as, in some respects, a


waiting area, containing headings that represent practices which do
not proceed from conventional allopathic medical practice, and which
are not as yet, supported by empirical bio-medical research. The NLM
concedes that some of the therapeutics included under this head, such
as acupuncture, may well acquire such support, and will presumably
be moved elsewhere in the MeSH tree structure. Others, such as the
concept of the “humors,” are retained only for their historical value. In
addition, the NLM treats “Complementary therapies” and “Alternative
therapies” as equivalents, but with an important proviso. The preferred
term, Complementary medicine, suggests that, at least for the users of
PubMed, such therapies would complement standard medical proce-
dures rather than replace them. The entry term, “Alternative medicine,”
refers to the use of such therapies instead of conventional methods, a
practice the NLM presumably would not expect its user to prefer.

Within Complementary therapies we find Medicine, Traditional


as a term which applies to documents dealing with

sumário
33
Systems of medicine based on cultural beliefs and practices
handed down from generation to generation. The concept inclu-
des mystical and magical rituals (SPIRITUAL THERAPIES; PHY-
TOTHERAPY); and other treatments which may not be explained
by modern medicine (DeCS, 2022)

When it comes to traditional methods, the NLM provides increa-


sed conceptual scaffolding, drawing the user’s attention centripetally
inward, seeking to clarify potential confusion. This very centripetal ef-
fort, paradoxically, provides some descriptive insight: the headings,
it seems, are referring outward, not necessarily to an accepted view
of medical “reality,” but to a contested and conflicted area of medical
practice, marked by a division between conventional “Western” medi-
cine and a range of alternate fields of knowledge and practice which
draw varying degrees of skepticism. And the conceptual, centripetal
mechanisms of the MeSH headings reflect this conflict.

The Tesauro de Folclore e Cultura Popular Brasileira, on the


other hand, subsumes medicine within a commitment to folkore and
popular culture. And, like the MeSH headings, the thesaurus is de-
signed to sustain both a descriptive mode, with centrifugal fidelity
to an external “reality,” and a conceptual mode, with a concomitant
centripetal tendency to internal order. In so doing, the thesaurus dis-
tinguishes between thing and process. Medicamento refers to the
substances used to effect cures, while the activities associated with
medicine appear within two different facets. Farmacopéia popular
refers to the production of medicines through traditional techniques,
and is contained in the facet, Atividade produtiva. Medicino popu-
lar, on the other hand, is contained within the generic term, Atividade
ritual: a term that includes such activities as dance, religious practice
and storytelling. Traditional medicine, in the Tesauro, rests not within
the context of Western bui-medical research; instead, it is classed as
an activity of sacred and/or profane character, marked by a tradition
that contains special meaning for a specific cultural group.

sumário
34
The heading itself, Medicina popular, might surprise someone
used to MeSH headings, in that it embraces empiricism in its scope note:
Atividade ritual que abrange o conjunto de práticas adotadas
pelo povo, com base no conhecimento empírico, destinadas a
prevenir ou curar males físicos e espirituais. Envolve componen-
tes herdados que vão sendo reinterpretados e somados a ele-
mentos resultantes de diferentes influências. São empregados
materiais e recursos tais como vegetais, animais e minerais iso-
ladamente ou em composições. Entre as formas adotadas para
a realização das curas estão procedimentos de caráter religioso
e mágico. Nesses casos são comuns gestos, rituais, passes, re-
zas bentinhos, escapulários, etc. para reforçar as terapias (CEN-
TRO NACIONAL DE FOLCLORE E CULTURA POPULAR, 2021).

Activities and practices of a religious and magical nature co-exist


with practices based on empirical knowledge: all such activities are cul-
tural, social and ritualistic activities.

Whether or not one agrees with this perspective, the Thesaurus,


in its centrifugal dimensions, exerts as great a fidelity to its external rea-
lity as the MeSH headings do to theirs. Indeed, the Thesaurus succeeds
in clarifying what the MeSH headings fail to acknowledge: that a com-
mitment to bio-medical empirical evidence is, in itself, a cultural activity
and an epistemological commitment that shapes the very coherence of
the headings themselves. The MeSH headings confine “culture to the
heading, Medicine, Traditional, insisting that is headings refer outward
to a reality governed and defined by empirical evidence, ignoring the
fact that such a commitment is, in itself, a cultural gesture of belief.

6 DISCUSSION AND CONCLUSIONS

At first sight, neither of these examples appears to suggest any-


thing we don’t already know. We have seen scholars analyze classifi-
cation systems and controlled vocabularies as texts, using strategies

sumário
35
such as text linguistics (BEGHTOL, 1986). Nor should the differences
between the tools surprise us. The Library of Congress does not pro-
fess to be a sophisticated tool of bio-medical research, and a thesaurus
of folklore and popular culture will naturally refer to belief systems and
traditional narratives rather than to bio-medical research.

What, then, does the concept of “mode” bring to the study of KO


tools and concepts? While these examples make no pretence of being
a thorough and complete study, they provide some glimpses into the
nature of our tools that could prove helpful in negotiating some of the
vexed controversies surrounding bias and neutrality.

If we look at the definitions which open Spinoza’s Ethics, we


find that he distinguishes “mode” from the concepts of “attribute” and
“substance.” A substance is “that which is in itself and is conceived
through itself,” while an “attribute” is “that which intellect perceives of
substance”; the “mode” constitutes “the affections of substance, or,
that which is in something else, through which it is also conceived”
(SPINOZA, 2000, p. 75). For Donald Garret (2017), the mode of a subs-
tance “constitutes a ‘way’ in which the existence of the substance is
expressed (p. 14). A mode, in this sense, is something that reveals the
presence and nature of something else: for Spinoza, particular things
in the world are modes of God’s attributes (GARRETT, 2017, p. 97).
Everything particular offers, besides itself, a fragmentary glimpse of so-
mething larger, greater, to which it refers.

We have become accustomed, in modern popular culture, to the


use of “picture mosaics,” in which a collection of images is arranged on
a massive collection of small tiles to assemble into a larger image, as in
this poster from the Stratford Shakespeare Festival of Canada, in which
tiny photographs from the various productions are arranged to form a
composite image of Shakespeare himself (see Figure 1).

sumário
36
Figure 1 – Picture Mosaic from the Stratford Shakespeare Festival of Canada

Source: https://www.pinterest.com/pin/402157441701090491/.
Accessed on:10/05/2021.

Studies of global-local processing in psychology have shown


us that a complex relationship exists between how we perceive things
individually and how we perceive their parts in a greater whole. Of par-
ticular interest is the issue of congruence and incongruence between
the small and larger image, such as the Navon hierarchical letters
experiment, which tests the recognition of vowels and consonants in
instances where the large figure is not congruent with the smaller one
(CHAMBERLAIN et al., 2017, p. 249):

sumário
37
Figure 2 – Navon Selective Attention Task

Source: Chamberlain, et al., 2017.

For the examples in this study, a philosophically-based theory of


modes might help us discern the relationship between local and global
patterns of relationship. Both the Medical Subject Headings and the
Tesauro display primarily a descriptive mode: while their structures of
internal coherence are constructed with care and precision, the scope
notes reveal a commitment to harmonizing the tool’s terms and refe-
rences with a reality that lies beyond it. In the case of MeSH, the terms
refer to a body of knowledge dominated by biological-medical empirical
research. In the case of the Tesauro, the terms refer to cultural concepts

sumário
38
rather than the empirically-perceived physical world; however, the des-
criptive mode is no less prominent.

The Library of Congress Subject Headings, on the other hand,


illustrate a primarily conceptual mode. While the Library attempts to use
accurate and up-to-date terminology, the scope notes suggest that the
Library’s collection prevails over the outer world that the collection: the
Library is using scope notes, at least in these examples, to disambigua-
te authorized headings with overlapping meanings. And the Used-For
terms, in addition to providing terms that can currently be considered
“equivalent,” also serve to maximize access to the Library’s historical
collection through the inclusion of outmoded terms.

What, then, is the figure in the design in each of these tools?


What is the global image, or the substance, that emerges from the mo-
des of these tools? In the case of MeSH, we would say that the subs-
tance is the bio-medical research. In TFPCB, the substance is Brazilian
popular culture throughout the country’s history. In the case of LCSH,
we would say that the substance is the Library’s own collection.

If we examine the concept of “mode” in musical terms, further


possibilities present themselves. A mode is a prescribed arrangement
of notes that provides the building blocks for a variety of melodies. Ho-
wever diverse the melodies might be, their conformance to a particular
mode lends them a powerful effect on the listener, not just on their own
merits, but through their signification of a larger whole with distinct cha-
racteristics (KOLINSKI, 2000).

The larger whole conveyed by a particular mode could, for ins-


tance, express an allegiance to a specific community or a specific set of
beliefs. The tightly-controlled modes of Gregorian chants, for instance,
demonstrated adherence to Christian faith, while the Indian raga, which
permitted free improvisation, often expressed an individual’s explora-
tion of a personal relationship with a deity (POWERS, 1958, p. 451).

sumário
39
The mode could be an expression of a community-held sentiment, in
which the composer or singer offers up a personally-felt expression of a
communal experience. The Jewish nigun mode, for instance, expresses
the sentiments of exile: “[the nigun] aims to express the unexpressible,
to give voice to that which is too intimate to be uttered in words . . .
There is a mystic idea that also tunes are in exile, and may be liberated
by leading them back to serve a holy purpose” (AVENARY, 1964, p. 61).

Most important for our purposes, modes can be abused: ma-


nipulated for their evocative power to inspire false expectations and
inappropriate emotions in the listener. Plato, in The Republic, urges that
the ideal society banish modes that drain citizens of courage and ener-
gy, such as the “wailing” Lydian mode and the “slack” Ionian mode
(PLATO, 1968, p. 77). Vaughan Williams’s use of modes such as the
Dorian gave his treatments of English folk music a unique and haunting
quality. However, some music theorists have argued that in so doing
Vaughan Williams and other composers of the English Folksong Revi-
val movement misrepresented English folk music by deliberately using
older modes: “Holding up the modes as the defining characteristic of
‘true’ folk songs . . . the revivalists essentially denied that folk song
was of the urban working class and so at a single stroke devalued and
marginalized the culture of an urban proletariat that they unconsciously
sought to control” (ONDERDONK, 1999, p. 611).

If modes can be deceptive in the way they evoke the larger body
that they partially reveal, perhaps modal theory can be used to help us
understand why the controversies around neutrality and bias persist in
knowledge organization tools. When the Library of Congress first al-
tered its syndetic references in the Subject Headings, changing them
from “SEE” and “SEE ALSO” references to “BT,” “NT,” “RT” and “UF”
references, Mary Dykstra accused the Library of disguising the subject
headings as a thesaurus (DYKSTRA, 1988, p. 42). Thesaural syndetic
references are a distinct aspect of the tool’s conceptual mode: carefully-
-structured scaffolding that gives the thesaurus its internal coherence and

sumário
40
order. By adopting the same reference style, Dykstra argued, the Library
of Congress was evoking the aura of thesaural coherence, without ac-
tually providing that coherence. A modal theory might provide a means of
exploring that discordance between the expectations that a tool implicitly
inspires and the results that a tool can actually deliver.

At the end of his treatment of political and apolitical epistemolo-


gies in knowledge organization, Hjørland challenges the field to adopt
more hermeneutical and reflective methods of inquiry: “the most politi-
cized epistemologies may be those that do not realize that there can be
no such thing as a non-political epistemology: it is better to have explicit
subjectivity than subjectivity disguised as objectivity” (HJØRLAND, 2020,
p. 474). This paper accepts that challenge in a small way. I suggest that a
theory of modes, adapted to the field of knowledge organization, enhan-
ces our vocabulary for understanding and articulating the hidden patter-
ns in both our tools and our assumptions. Such a theory might also help
us recognize how the cognitive authority that our tools inspire may be
misplaced, and that we are creating and presenting tools within a modal
context that arouses expectations that we cannot satisfy.

7 ACKNOWLEDGEMENTS

I wish to acknowledge the generous assistance of Nair Hassan,


Portuguese language instructor, and Helen Jacob-Stein of the Royal
Conservatory of Music, in formulating the ideas in this paper.

8 REFERENCES
AMERICAN PSYCHOLOGICAL ASSOCIATION. What Is Mental Illness? S.d.
https://www.psychiatry.org/patients-families/what-is-mental-illness. Accessed
on: 7 Dec. 2021.

sumário
41
AVENARY, Hanoch. The Hasidic Nigun—Ethos and Melos of a Folk Liturgy.
Journal of the International Folk Music Council, v. 16, Cambridge University
Press, Jan. 1964, p. 60–63. Available on: https://doi.org/10.2307/835078.
BEGHTOL, Clare. Bibliographic Classification Theory and Text Linguistics:
Aboutness Analysis, Intertextuality and the Cognitive Act of Classifying Docu-
ments. Journal of Documentation, v. 42, n. 2, Jan. 1986, p. 84–113. Available
on: https://doi.org/10.1108/eb026788.
CAMPBELL, D. Grant. Centripetal and Centrifugal Forces in Bibliographic
Classification Research. Proceedings of the 13th ASIS SIG/CR Classifica-
tion Research Workshop, 2002. p. 8–15.
CENTRO NACIONAL DE FOLCLORE E CULTURA POPULAR. Tesauro de
Folclore e Cultura Popular Brasileira. Available on: http://www.cnfcp.gov.br/
tesauro/apresentacao.html. Accessed on: 12 Dec. 2021.
CHAMBERLAIN, Ruth van der Hallen; REBECCA, Hanna Huygelier; CRUYS,
Sander van de; WAGEMANS, Johan. Local-Global Processing Bias Is Not a
Unitary Individual Difference in Visual Processing. Vision Research, v. 141, Dec.
2017, p. 247–57. Available on: https://doi.org/10.1016/j.visres.2017.01.008.
CUTTER, Charles Ammi. Rules for a Dictionary Catalog. U.S. Government
Printing Office, 1904.
DYKSTRA, Mary. LC Subject Headings Disguised as a Thesaurus. Library
Journal, v. 113, n. 4, 1988, p. 42–46.
FRYE, NORTHROP. Anatomy of Criticism: Four Essays. Princeton: Princeton
paperback ed., Princeton University Press, 1971.
FRYE, Northrop. Words with Power: Being a Second Study of “The Bible and
Literature.” Penguin Books, 1990.
GARBER, Daniel. “Mode.” The Cambridge Dictionary of Philosopy. Second
edition. Cambridge: Cambridge University Press, 1999.
GARRETT, Donald. The Indiscernibility of Identicals and the Transitivity
of Identity in Spinoza’s Logic of the Attributes. Spinoza’s Ethics: aCritical
Guide, edited by Yitzhak Y. Melamed: Cambridge University Press, 2017. p.
12–42. Available on: https://doi.org/10.1017/9781316339213.002. Accessed
on: 12 Dec. 2021.
HJØRLAND, Birger. “Political Versus Apolitical Epistemologies in Knowledge
Organization.” Knowledge Organization, v. 47, n. 6, 2020, p. 461–85. Available
on: https://doi.org/10.5771/0943-7444-2020-6-461. Accessed on: 12 Dec. 2021.

sumário
42
HUCKE, Helmut. Toward a New Historical View of Gregorian Chant. Journal
of the American Musicological Society, v. 33, n. 3, p. 437–67, 1980. Availab-
le on: https://doi.org/10.2307/831302. Accessed on: day month year.
KOLINSKI, Mieczyslaw. “Mode”. Encyclopedia Britannica, 5 Oct. 2000.
Available on: academic-eb-com.proxy1.lib.uwo.ca/levels/collegiate/article/
mode/110124. Accessed on: 12 Dec. 2021.
LIBRARY OF CONGRESS. Library of Congress Subject Headings. Classi-
fication Web, S.d.. Available on: https://classweb.org/min/minaret?table=1&-
menu=/Menu/&mod=Search&app=Auth. Accessed on: 12 Dec. 2021.
NATIONAL LIBRARY OF MEDICINE. Medical Subject Headings - Home
Page. U.S. National Library of Medicine, https://www.nlm.nih.gov/mesh/me-
shhome.html. Accessed on: 12 Dec. 2021.
ONDERDONK, Julian. Vaughan Williams and the Modes. Folk Music Journal,
v. 7, n. 5, English Folk Dance + Song Society, p. 609–26, 1999.
PLATO. The Republic of Plato. Translated by Allan Bloom. S.l.: Basic Books, 1968.
POWERS, Harold S. Mode and Raga. The Musical Quarterly, v. 44, n. 4,
Oxford University Press, p. 448–60, 1958.
RAMOS, Danilo; MELLO, Eduardo K. S. Communication of Emotions in Music
between Brazilian Composer, Performers, and Listeners - ProQuest. Psycho-
musicology: Music, Mind and Brain, v. 31, n. 1, Mar. 2021, p. 1–17.
SPINOZA, Benedictus de. Ethics. Oxford: Oxford University Press, 2000.
SVENONIUS, Elaine. The Intellectual Foundation of Information Organiza-
tion. London: MIT Press, 2009.
SZOSTAK, Rick. Basic Concepts Classification (BCC). 2019. Available on:
https://www.isko.org/cyclo/bcc.. Accessed on: 12 Dec. 2021.
WORLD HEALTH ORGANIZATION. Traditional, Complementary and Integrative
Medicine. 2021. Available on: https://www.who.int/westernpacific/health-topics/
traditional-complementary-and-integrativemedicine. Accessed on: 12 Dec. 2021.

sumário
43
2
Capítulo 2

O assunto, a representação: uma


análise com foco na variação
terminológica​​a partir da série
estudos avançados em organização
do conhecimento (ISKO Brasil)

The subject, representation: an analysis


with focus on terminological variation
Brisa Pozzi de Sousa

from the series advanced studies in


knowledge organization (ISKO Brazil)
O assunto, a representação:
uma análise com foco na variação
Brisa Pozzi de Sousa
terminológica​​a partir da série Estudos
Avançados em Organização
do Conhecimento (ISKO Brasil)

The subject, representation:


an analysis with focus on terminological
variation from the series Advanced
Studies in Knowledge Organization (ISKO Brazil)

DOI: 10.31560/pimentacultural/2022.95613.2
Resumo:
O entendimento a respeito da representação de assunto torna-se primordial na
atualidade, sobretudo, pelo constante fluxo e acesso à informação, situação
que envolve os conteúdos que estão em documentos de diferentes formatos,
como também, na web. É possível notar que aspectos relacionados à repre-
sentação de assunto tornaram-se, de fato, uma questão estratégica evidencia-
da pelos formatos de metadados. A organização e o acesso à produção de
informação em diferentes documentos, variando os suportes e lugares de ar-
mazenamento, desde a forma impressa, como em livros, até o que pode estar
na web em repositórios digitais ou, qualquer outro sistema de informação, são
preocupações da Organização do Conhecimento. Considerando esse contex-
to, o propósito da investigação é conjecturar variações terminológicas sobre a
representação de assunto​. O objetivo é explorar quais termos são abordados
em estudos de Organização do Conhecimento nacionalmente. Busca-se, nas
publicações dos eventos da Sociedade Brasileira para Organização do Conhe-
cimento (ISKO Brasil), denominada Série Estudos Avançados em Organização
do Conhecimento, atualmente composta por cinco volumes, artigos que apre-
sentam discussões sobre a representação de assunto, a fim de compreender
como e quais termos a área contempla. ​O corpus de análise desse estudo
foi constituído por nove artigos que explicitaram terminologicamente em seus
conteúdos a expressão representação de assunto. Pela análise realizada do
corpus, constatou-se que a expressão representação de assunto, segundo
as publicações da ISKO Brasil​, tem como elemento recorrente o processo de
indexação, que envolve o uso de diferentes instrumentos – inclusive os de
classificação – e geram produtos variados. Entretanto, é preciso considerar a
existência das diversas abordagens teóricas, construídas em momentos histó-
ricos e culturais distintos e que estão presentes na literatura.

Palavras-Chave: Representação de assunto; assunto; variação terminológica.

sumário
45
Abstract:
The understanding of the subject representation becomes essential nowa-
days, especially due to the constant flow and access to information, a situation
that involves the contents that are in documents of different formats, as well
as on the web. It is possible to notice that aspects related to the subject re-
presentation became, in fact, a strategic issue evidenced by the metadata for-
mats. The organization and access to the production of information in different
documents, varying the supports and storage places, from the printed form,
such as books, to what can be on the web in digital repositories, or any other
information system, is a concern of the Knowledge Organization. Considering
this context, the purpose of the investigation is to conjecture terminological va-
riations on the subject representation. The objective is to explore which terms
are covered in Knowledge Organization studies nationally. The publications of
the events of the Brazilian Society for Knowledge Organization (ISKO Brazil),
called Advanced Studies in Knowledge Organization, currently composed of
five volumes, are searched for articles that present discussions on subject
representation, in order to understand how and which terms the area contem-
plates. The corpus of analysis of this study consisted of nine articles that termi-
nologically explained in their contents the expression subject representation.
Through the analysis of the corpus, it was found that the expression subject
representation, according to ISKO Brazil publications, has as a recurrent ele-
ment the indexing process, which involves the use of different instruments –
including classification ones – and generate different products. However, it is
necessary to consider the existence of different theoretical approaches, built in
different historical and cultural moments, and that are present in the literature.

Keywords: Subject representation; subject; terminological variation.

sumário
46
1 INTRODUÇÃO

Nos dias de hoje, a palavra assunto pode se relacionar a diferen-


tes contextos, como, por exemplo, “o assunto que está na mídia”, “um
assunto da vida particular”, “ir a um buscador e recuperar um assunto”,
“o assunto de um e-mail”, dentre uma infinidade de possibilidades.
Já assunto, com enfoque nos estudos que relacionam a Organização
do Conhecimento, assume diferentes aspectos que ajudam a pensar
a sua manipulação, mas deve ser entendido com as perspectivas teó-
ricas que o sustenta e não isoladamente.

Este trabalho lança olhar para o assunto e sua manipulação


pela representação, com foco nas variações terminológicas. Embora
qualquer reflexão envolva um recorte teórico para o entendimento de
um quadro referencial, no caso da presente investigação, o assunto,
ao recorte temporal, juntam-se elementos que integram, mas também
delimitam a pluralidade do que se quer compreender. Olhar para as
terminologias de qualquer área, em um determinado período, ajuda a
entender como elas se expressam por meio de linguagem própria, o
que, por sua vez, permite o fortalecimento da sua identidade.

De forma ampla, conjecturar as variações terminológicas sobre


a representação de assunto é o propósito da investigação. De forma
mais específica, explorar quais termos são abordados em estudos
da Organização do Conhecimento nacionalmente, compõe o objetivo
do presente trabalho. Busca-se, nas publicações dos eventos da So-
ciedade Brasileira para Organização do Conhecimento (ISKO Brasil),
denominada Série Estudos Avançados em Organização do Conhe-
cimento, atualmente composta por cinco volumes (dos respectivos
anos: 2012, 2013, 2015, 2017 e 2019), artigos que apresentam dis-
cussões sobre a representação de assunto, a fim de compreender
como e quais termos a área contempla.

sumário
47
Seguindo esse objetivo, a ideia é identificar o que a comunida-
de ISKO Brasil tem tratado ao abordar a manipulação do assunto, ou
seja, a representação e sua respectiva variação terminológica, com o
propósito de identificar resultados que auxiliam o entendimento sobre
o que é sinalizado quando se fala de assunto.

2 DELIMITAÇÃO SOBRE ASSUNTO

Não há uma única abordagem sobre o que seja assunto, pois


sua compreensão varia de acordo com a influência teórica considera-
da. Mas, tendo em vista a importância da sua manipulação, que resulta
na representação temática, ou seja, na representação de assunto, é
fato visualizar as diferentes vertentes que se caracterizam de forma
geográfica a partir de duas principais influências: anglo-saxã e euro-
peia. Nesse contexto, o acúmulo de saber da Biblioteconomia fornece
subsídios para a compreensão de aspectos significativos ao assunto.

De forma geral, pensar a representação de documentos em


ambientes informacionais, como bases de dados, catálogos, repo-
sitórios, dentre outros, visa à recuperação do registro que, por sua
vez, remete ao documento, possibilitando seu acesso. Vários atribu-
tos podem ser representados em um registro, que é composto por
partes e, para sua elaboração, uma estrutura deve ser seguida de
acordo com a política informacional institucionalizada. A representa-
ção de assunto em um registro resulta em um conjunto de termos que
exercem a função de ponto de acesso a esse registro. Há mais de um
século, foi proposta a entrada por assunto em fichas catalográficas
compondo um lugar no catálogo. Com o registro on-line, a função da
entrada por assunto continuou relevante, pois o contexto automatiza-
do dos computadores não dispensa os fundamentos anteriores de
organização da informação, mas reafirma a necessidade de resgate

sumário
48
do que foi construído ao longo do tempo e olhar para isso reforça a
compreensão sobre como a área está pautada.

Usando como exemplo os catálogos de bibliotecas, por vezes,


foram compreendidos como ferramentas para inventariar acervos, mas,
na Antiguidade e em grande parte da Idade Média, a história da Catalo-
gação mostra que não é explícita a diferença entre catálogos e inventá-
rios. Foi, no final do século XV, pelo avanço das atividades bibliográficas
e, a partir do século XVIII em diante, que o catálogo passou a ser uma
ferramenta de busca e recuperação. Esse contexto é permeado pelo
desenvolvimento e crescimento de bibliotecas no contexto europeu.

Nesse desenvolvimento, a produção dos registros é realizada


pelos aspectos do assunto abarcado pelo processo de catalogação.
A Catalogação inclui a Catalogação Descritiva e a Catalogação de
Assunto, as quais respondem pela construção completa do catálogo.
No entanto, segundo Guimarães (2009), o aspecto temático (ou do
assunto) envolve mais de uma perspectiva: além da Catalogação de
Assunto, existe a Indexação e a Análise Documentária.

Vertentes constituíram-se com suas respectivas abordagens, mas


elas não existem separadamente, tornando necessária a reflexão sobre
o que é mais consistente e funcional, haja vista que essas diferenças re-
sultam na formação de conceitos da área. Sem esse entendimento, além
de uma confusão conceitual, os fundamentos acabam restringidos a um
patamar de processamento técnico, pecando contra a potencialidade
de instaurar uma efetiva comunicação entre documentos e usuários(as).

Contemporaneamente, no Brasil, para a representação da infor-


mação, são adotados os termos “representação descritiva” e “represen-
tação temática”, que indicam as etapas para a construção dos registros
de informação, quanto aos processos específicos em causa. Por exem-
plo, a primeira ocupa-se dos aspectos formais que permitem identifi-
car o documento, a qual também pode ser chamada de catalogação

sumário
49
descritiva ou somente catalogação. Já a segunda opera com os proces-
sos de indexação e elaboração de resumos. Mas, em alguns currículos
dos cursos de Biblioteconomia no Brasil, por exemplo, é possível encon-
trar os termos Representação Descritiva e Representação Temática de
forma articulada, respectivamente, com a Catalogação e com a Indexa-
ção. No entanto, alguns instrumentos, como os sistemas de classifica-
ção, podem compor os currículos enquanto Sistemas de Organização do
Conhecimento (SOCs), mas esse termo é empregado para abordar várias
linguagens (como as de indexação e as de classificação). Nesse sentido,
é preciso considerar as diferenças entre os processos e os instrumentos.

Importante ressaltar que a classificação de documentos traba-


lha com vários atributos, dentre eles, o assunto. A diferença entre clas-
sificação e indexação pode ser evidenciada pela constatação de que
a primeira é um método para a ordenação ou arranjo de documentos,
do qual decorre que vários de seus atributos são considerados; já, na
indexação, opera-se com a atribuição de conteúdos temáticos (assun-
tos) ao documento. Desse modo, os produtos também são distintos:
notações classificatórias (a depender do sistema adotado) e termos de
indexação, respectivamente.

Ainda relativo ao contexto brasileiro, o termo “representação


temática” também é adotado de forma ampla para referir-se aos
processos de indexação e elaboração de resumos. A despeito da
complexidade teórica e prática, a construção de um registro de in-
formação gera representações que referenciam o documento por
diferentes aspectos, dentre eles o temático. Assim, na indexação,
pontos de acesso por assunto remetem ao registro que, por sua vez,
referenciam os documentos representados. Na mesma medida de
importância, um texto objetivo e conciso do conteúdo do documento
pode ser elaborado no registro, sendo chamado de resumo, com o
propósito do(a) usuário(a) selecionar documento(s) que gostaria de
acessar. Eventualmente, as palavras do resumo podem compor o
índice de busca, mas ele não existe em função disso.

sumário
50
Com essa breve exposição, é possível observarmos diferentes
nuances que envolvem o entendimento sobre assunto e, por conse-
quência, sua representação. Na mesma medida, há variações termi-
nológicas em jogo.

Compreender os termos empregados por pesquisadores e pes-


quisadoras nos eventos da Sociedade Brasileira para Organização do
Conhecimento (ISKO Brasil), para caracterizar uma reflexão conceitual
sobre a representação de assunto, é uma forma de contribuição. Dito
de outra forma, busca-se compreender como pesquisadores e pesqui-
sadoras do capítulo brasileiro da ISKO relacionam a representação de
assunto com as possíveis variações terminológicas.

Fato é que não há uma única abordagem sobre o que seja o as-
sunto. Sua manipulação ocorre através da representação e sua com-
preensão varia de acordo com a influência teórica considerada.

Tendo em vista a importância dessa representação, as ideias se-


rão evidenciadas pela “decomposição do assunto” a partir da influência
do Classification Research Group (CRG). Considera-se que os estudos
do referido grupo englobam o que é possível entender como desdo-
bramento do pensamento anglo-saxão no século XX, ou seja, o desdo-
bramento da vertente Catalogação de Assunto. Esse desdobramento é
considerado, pois, seguindo um recorte geográfico para delimitação do
entendimento a ser alcançado, estudos iniciais no contexto anglo-saxão
do século XIX marcaram a interseção de teóricos como Anthony Panizzi,
Charles Jewett e Charles Cutter. Entretanto, para fins de recorte teórico,
geográfico e temporal e pelo limite de páginas que esse trabalho requer,
a vertente Catalogação de Assunto não será explorada.

Para contextualizar a variação terminológica em jogo, a perspectiva


da Indexação faz parte do recorte bibliográfico. Não há pretensão de co-
brir a totalidade de autores/publicações do CRG, mas de lançar olhar para
a variação terminológica que envolve a representação de assunto, que,
por consequência, esbarra nas variações terminológicas sobre assunto.

sumário
51
3 O ASSUNTO, A REPRESENTAÇÃO:
DO DESCRITOR A OUTROS TERMOS

As apropriações efetivas de terminologias de qualquer área en-


volvem esforços intelectuais do seu coletivo. Assim, vários pesquisa-
dores e pesquisadoras trabalharam e trabalham na tentativa de forne-
cer escopo científico a elementos teóricos que são basilares.

Para tratar do escopo científico sobre o assunto, na perspectiva


da Indexação, consideramos Foskett (1973), que cita Eric J. Coates, o
sistema PRECIS (PREserved Context Indexing System), de Derek Austin
e Jason Ferradane, como referenciais contemporâneos que envolve-
ram a abordagem temática da informação.

Coates, em 1960, publicou o livro Subject Catalogues Headings


and Structure, que abordou a ordem dos cabeçalhos compostos e
buscou compreender a razão que levou Kaiser a optar pelo concre-
to ao invés do processo como ponto de entrada dos cabeçalhos.
Seu desafio consistiu em buscar a aplicação da sua teoria no British
Technology Index, pois foi o redator responsável do projeto. Coates
estabeleceu a ordem de importância das entradas pela fórmula Coi-
sa-Parte-Material-Ação.

O PRECIS foi idealizado por Derek Austin, a partir de 1968, e


consistiu na mecanização da produção de índices em inglês, como
também em outras línguas, caracterizando-se por ser um sistema de
indexação pré-coordenado, feito para produzir automaticamente os ín-
dices de assunto da British National Bibliography (FUJITA, 1988). Nesse
sentido, o avanço “[...] que o PRECIS [...] [representou foi a] elabora-
ção de um enunciado básico que pode ser processado pelo compu-
tador, a fim de proporcionar um conjunto completo de cabeçalhos.”
(FOSKETT, 1973, p. 62). O sistema foi elogiado por propiciar ao usuário
visualizar de forma completa cada cabeçalho.

sumário
52
Já Farradane, segundo Foskett (1973), elaborou um sistema de
operadores relacionais embasado em conceitos sobre o processo de
aprendizagem. Com base na psicologia infantil, adotou nove operado-
res relacionais que vinculava termos através de aspectos delimitados
no tempo e no espaço.

O movimento que congrega esses autores é o de institucionali-


zação dos estudos de Ranganathan, na Inglaterra, a partir de 1952, rea-
lizado pelo Classification Research Group (CRG). O grupo contou com
a participação de inúmeros pesquisadores, dentre eles Derek Austin
(Inglaterra), Eric Coates (Estados Unidos), Jason Farradane (Canadá),
Ingetraut Dahlberg (Alemanha), dentre outros nomes (FUJITA, 1988).

Para Metcalfe (1973), Farradane teria introduzido o isolado de


Ranganathan como um termo técnico, pois, em 1950, ele apresentou
o que chamou de teoria científica da classificação e suas aplicações
práticas. Já Coates, no British Technology Index, ainda segundo Met-
calfe (1973), considerou o artigo de Ranganathan1 sobre cabeçalho de
assunto e análise de facetas (discutido por Hjørland [2017]), mas não
incluiu qualquer terminologia de Ranganathan em seu livro (Subject
Catalogues Headings and Structure). Todavia, Coates abordou Melvil
Dewey (criador da CDD), Cutter e Kaiser como autores que foram an-
teriores a Ranganathan, no sentido de ter havido uma continuidade das
discussões entre eles, apesar dos diferentes aspectos que os distan-
ciam e as particularidades teóricas que os sustentam. Mas, foi em Kai-
ser que Coates viu a solução “[...] do problema da importância relativa
dos componentes de um assunto composto no ponto em que Cutter
tinha deixado” (METCALFE, 1973, p. 324, tradução nossa).

Em sentido amplo, a partir de Guimarães (2008, p. 80), é possí-


vel inferir que o quadro teórico apresentado indicou

1 RANGANTHAN, S. R. Prolegomena to library classification. Bombay: Ásia Publishing


House, 1961.

sumário
53
[...] as experiências investigativas de Kaiser (EUA, 1911) relati-
vamente à composição do binômio concreto/processo para a
estruturação de enunciados de assunto e o trabalho teórico de
Ranganathan (Índia, 1933) quanto a uma análise em facetas –
Personalidade, Matéria, Energia, Espaço e Tempo – do conteú-
do temático dos documentos.

Igualmente há de se registrar as experiências investigativas do


Classification Research Group (Inglaterra, 1952), que ampliou
para doze as cinco categorias fundamentais de Ranganathan,
e de Derek Austin (Inglaterra, 1968) e do grupo de Bangalore
(Índia, 1969) que, por meio dos sistemas PRECIS e POPSI,
lançaram as bases para uma aplicação da análise facetada em
sistemas automatizados.2

Embora haja outros referenciais que tenham contribuído com


diferentes discussões no contexto temático, o ponto em comum foi
a transição de algo explícito no documento com fins de organização
dos acervos. A decomposição e os possíveis relacionamentos entre os
assuntos foram percebidos à medida que o contexto linear de sintaxe
dos cabeçalhos (de assunto) não deram conta de conferir sentido à
padronização das formas de entrada.

Por outro lado, os cabeçalhos de assunto não se tornavam efi-


cazes, pois sua elaboração foi marcada pelo aspecto morfológico da
palavra. Taylor (1995, p. 484, tradução nossa) exemplifica que “[...] o
conceito de busca por assunto permaneceu com má reputação”. A au-
tora relata que, na conferência da American Library Association (ALA),
em 1994, houve um movimento que contestou a ênfase dada ao uso
da Library of Congress Subject Headings (LCSH).

Taylor (1995) ainda menciona que Ray R. Larson apontou, em arti-


go, na mesma conferência da ALA, a obviedade sobre o declínio nas por-
centagens de uso do índice de assuntos da LCSH e a compensação das

2 POPSI (POstulated-based Permuted Subject Indexing Linguage) originou-se de estudos


realizados, a partir de 1969, por A. Neelamegham e colaboradores no Documentation Re-
search and Training Center de Bangalore, Índia. Neelamegham fez parte do Classification
Research Group (FUJITA, 1988).

sumário
54
buscas realizadas no índice de palavras-chave por título. A autora conti-
nua explanando que, desde 1985, a LC busca reestruturar regras para a
LCSH, como, por exemplo, de caminhos hierárquicos para os termos dos
cabeçalhos. Em 1991, a LC realizou uma conferência com o propósito de
cooptar sugestões sobre como poderiam melhorar o sistema existente
de subdivisões da LCSH e a ação resultou em mudanças na referida lista.

A discussão que Taylor (1995) propõe envolver um olhar per-


manente para o registro de assunto no catálogo, visando à busca por
conteúdo temático dos documentos pelos usuários. Não se falou na
possibilidade de se mudar o instrumento, mas isso não era usual, pois
seria uma demanda de alto custo.

Ademais, presume-se que o contexto propiciou demanda por


linguagens pós-coordenadas. Foskett (1973) refere-se que o tipo de
linguagem de indexação reflete o resultado do processo na saída da
informação para o usuário, mas também na análise para a entrada do
assunto. As listas de cabeçalhos de assunto são linguagens pré-or-
denadas, pois os termos de busca empregados no sistema de recu-
peração prescrevem a combinação. Já uma linguagem pós-coorde-
nada permite a combinação de termos no sistema de recuperação,
como acontece com o uso dos tesauros. Nota-se que o assunto no
sistema de recuperação evidencia-se pelo controle do vocabulário na
forma apresentada pela linguagem.

No mínimo, dois caminhos podem ser apontados em relação ao


aspecto da representação de assunto: um que visa coletar termos para
construir um vocabulário controlado, portanto uma linguagem; e outro
que envolve a sistematização de aspectos metodológicos da indexação
de assuntos. Porém, ainda com a estrutura das listas de cabeçalhos de
assunto, sobretudo da LCSH, sustentando entre os cabeçalhos apenas
relações de sinonímia (see – ver) e de associações (see also – ver tam-
bém), predominou a necessidade de mecanismos que dessem conta de
aperfeiçoar o sistema de recuperação com vínculo semântico.

sumário
55
Simões (2017, p. 166) afirma que “as remissivas foram-se al-
terando ao longo do tempo, quer no que respeita à nomenclatura, ao
princípio e à função.” A autora alerta que a nomenclatura alterou-se
para relações semânticas.

Mas, as relações para um vocabulário envolvem um controle, que


[...] não significa apenas padronizar as formas de entrada
(significantes) ou registrar a sinonímia: significa operar sobre
a significação (significante/significado) dos termos, o que de-
pende inteiramente de delimitações de sentido conferidas pela
rede de relações lógico-semânticas amparadas por definições
(LARA, 2001, p. 6).

Com a difusão do uso do computador e das fichas perfuradas,


Calvin Mooers, na década de 1950, introduz o uso do termo descritor
(descriptor). Fundou a Zator Company e desenvolveu um sistema pró-
prio de recuperação da informação, o Zatocoding, no contexto dos
estudos de information retrieval (IR).

Segundo Mooers (1951, p. 21, tradução nossa), seu sistema foi


de “[...] especial importância para o documentalista porque lhe dá o
poder de uma nova ferramenta de especificação de ideias para a re-
cuperação de informações armazenadas.” Seu propósito foi de agili-
zar a recuperação por assunto, através da sobreposição de padrões
aleatórios de códigos no registro. Esses padrões de código formavam
a representação de descritores por ideias, ou seja, o conhecimento
sobre o assunto do documento a ser registrado em informação.

Em linhas gerais, o sistema operava através da


[...] memória de filme com o campo de codificação de cada
quadro possuindo 216 posições que podem ser marcadas por
opacidades. Assumindo uma coleção de 5.000.000 documen-
tos – comparáveis à Biblioteca do Congresso – um padrão do
Zatocoding de 8 pontos por assunto pode ser usado. O cam-
po de codificação pode conter até 18 padrões de assunto, e

sumário
56
seleções podem ser feitas em qualquer combinação desses
padrões. O tamanho do vocabulário descritivo do Zatocoding é
ilimitado (MOOERS, 1951, p. 22, tradução nossa).

Nesse panorama, o tratamento empregado pelo sistema Zato-


coding, através das fichas perfuradas, usava as suas margens e má-
quinas seletoras que, a partir de uma lista de codificação, registrava os
assuntos. O padrão da codificação proporcionava a recuperação pelo
código numérico de cada descritor.

O emprego do termo “descritor” por Mooers ocorreu para uma


aplicação específica do seu sistema, com funcionamento independente,
mas ele entendia que os “[...] descritores [...] constituem as melhores
unidades conceituais possíveis (científica ou tecnologicamente) para o
trabalho específico de recuperação” (MOOERS, 1985, p. 253, tradução
nossa). De acordo com Henderson (1996, p. 660, tradução nossa),
Mais tarde Mooers observou que o neologismo, “descritor”,
sofreu um triste destino: o termo foi introduzido para “sintetizar
um conceito cuidadosamente elaborado no uso de unidades
de significado para recuperação”, mas veio a ser usado como
sinônimo de entradas de índice de qualquer tipo. Por exemplo,
desde a publicação dos anais da Conferência Internacional so-
bre Informação Científica, realizada em Washington, D.C., em
1958, o termo “descritor” foi equiparado a “termos de índice”
e “palavras-chave” no índice dos anais. Na visão de Mooers,
isso era “a maior corrupção semântica.”

No entanto, conforme exposto por Henderson (1996), o termo


“descritor”, empregado por Mooers, inicialmente na concepção do seu
sistema de recuperação, baseado em um processo mecânico, perdeu-
-se em meio ao emprego de outros produtos documentários. De fato,
Mooers demonstrou interesse sobre métodos mecânicos de recupe-
ração por assunto em coleções de documentos, como demonstram
suas investigações sobre recuperação da informação.

sumário
57
À medida que sua investigação deflagrou interesse, conforme
trabalho apresentado no ano de 1962, na University of Minnesota, mas
reimpresso em 1985, Mooers abordou a linguagem de indexação em
sistemas de recuperação da informação. Para ele, a linguagem de in-
dexação é o meio responsável por mediar as informações armazena-
das nos documentos, tornando-se “[...] a ponte, a conexão entre os
usuários e as informações” (MOOERS, 1985, p. 249, tradução nossa).
Ele demonstrou interesse por essas linguagens, mas centrou-se em
entender como as máquinas poderiam manipulá-las.

Para esse autor, uma lista de cabeçalho de assunto, por


exemplo, determinaria um arquivo científico de palavras com sintaxe
específica, conforme “Lubrication – high temperature – non-hydro-
carbon”. Explica que esse cabeçalho possui diferentes conceitos
unitários, como “lubrication”, “high temperature”, “non-hydrocar-
bon”, que permitem outras combinações, mas que ele chamou de
descritor. Propõe o descritor como composto por duas partes: um
rótulo ou etiqueta (label) e a definição (definition), que pode ser um
verbo ou uma palavra. A partir do rótulo e da definição, considerou
alguns princípios básicos úteis à recuperação da informação.

Segundo Mooers (1985), a linguagem de indexação auxiliaria o


isolamento dos conceitos através de um rótulo (label), exemplificando
com o termo “lubrication” que pode ser um descriptor label (rótulo do
descritor), mas que também precisaria, segundo ele, de um significado.
Por sua vez, esse significado relacionado com o sistema de recuperação
não estaria baseado em definições de dicionários, pois “[...] toda orga-
nização ou laboratório com um sistema de recuperação de informações
tem seu ponto de vista especial sobre cada tópico ou conceito de impor-
tância para ele. Portanto, este ponto de vista especial deve ser escrito na
definição do rótulo.” (MOOERS, 1985, p. 253, tradução nossa).

Seria possível, a todo descritor, a inclusão de sua definição ane-


xada ao rótulo como uma ideia pronta, o que o autor denominou ideia
empacotada (packaged idea) “[...] como um conceito que deve ser

sumário
58
usado principalmente para recuperação em algum sistema de recupe-
ração específico.” (MOOERS, 1985, p. 253, tradução nossa). Com isso,
haveria a constituição de uma lista, com rótulos e definições acopladas
a um conjunto de seis características definidas.

A primeira característica refere-se ao vocabulário com os rótulos


associados a um conjunto pequeno de descritores (250 a 350), sendo
que, em casos especiais, esse número poderia ser maior, chegando
a mil. A segunda é a do uso de um descritor ou mais para formar um
conjunto a ser adotado na caracterização dos documentos. A terceira é
a de que cada descritor seria definido por uma nota de escopo (scope
note). A quarta é a necessidade de sutileza, segundo denominação
de Mooers, pois o conjunto de descritores, como também cada um
deles individualmente, deveriam ser adaptados para um trabalho es-
pecífico de recuperação. A quinta característica é a de que seria dese-
jável organizar o conjunto de rótulos dos descritores em uma folha de
papel, com o propósito de programar e exibir, agrupar ou classificar;
a classificação serviria apenas para individualizar os descritores, não
implicando uma hierarquia que, na visão de Mooers, seria incômoda e
deveria ser evitada. A sexta e última característica é a escolha dos des-
critores para a busca. Ao escolher um, dois ou três descritores, seria
possível usá-los de forma concomitante, como um “conjunto prescrito”
(prescribing set), com a finalidade de conduzir a busca pela informa-
ção desejada. A pesquisa, considerando a prescrição de descritores,
aprimoraria a busca dos documentos, tornando-a mais específica.

De acordo com Mooers (1985), seu sistema não tinha equivalência


com o Uniterm (Unitermo), criado por Mortimer Taube, em 1952, o qual
adotou como método de indexação a extração de palavras diretamente
do texto. Para o autor, a maior dificuldade do Unitermo seria o controle de
sinônimos, pois o sistema baseou-se em palavras ao invés de conceitos.
Da mesma forma, as duas propostas não se aproximavam do tesauro,
em função da ausência de relacionamentos entre os termos, controle
terminológico, definições, dentre outros aspectos a serem considerados.

sumário
59
De forma geral, o trabalho de Mooers relacionou a linguagem
de indexação à recuperação da informação, pois considerou os des-
critores a partir da coleção. O descritor foi o fundamento para distin-
guir o que ele propunha e que não era idêntico ao contexto de outros
sistemas, como aqueles constituídos por cabeçalhos de assunto, pa-
lavras-chave, dentre outros elementos de controle. Mas, seu interesse
primeiro foi o de subsidiar um sistema que tivesse a capacidade de
melhorar a recuperação da informação.

Considerando o exposto, é possível notar que a busca por sis-


tematização de aspectos metodológicos, com base no trabalho de
Mooers, tem relação direta com a representação de assunto para recu-
peração. Entretanto, a repercussão do termo descritor marca de forma
significativa a Indexação. Compreender os termos que compõem a
constituição científica de uma área é um contínuo exercício de revisão
dos seus fundamentos.

Na subseção seguinte, o foco está na ampliação de termos


em torno do assunto e, por consequência, na variação terminoló-
gica que deflagra dispersão de abordagens. Subjacente a esta va-
riação terminológica encontram-se aspectos distintos elaborados
em função de abordagens diferenciadas sobre o mesmo processo:
a representação do assunto.

3.1 VARIAÇÃO TERMINOLÓGICA: ABOUTNESS, TOPIC,


CONTENT, SUBJECT – ASSUNTO, TEMA, MATÉRIA
– CONTENIDO, MATERIA EPÍGRAFE, TEMA

Na década de 1970, discussões relacionadas à análise de do-


cumentos para transformá-los em representações seguiram o que al-
guns pesquisadores chamaram de aboutness. Guedes (2009), a partir
de Moraes e Guimarães (2006), explica que inicialmente foi Hutchins

sumário
60
(1977; 1978) o responsável em dar destaque ao termo. Por sua vez,
Hutchins (1977) indica responsabilidade a Fairthorne (1969).

A preocupação inicial de Hutchins (1977, p. 17) partiu de como


compreender o “tópico de um documento” (topic of a document) no
contexto de um sistema de informação. Conforme o autor, uma res-
posta superficial seria entender esse tópico como assunto de uma
entrada em um índice, com correspondência ao documento. Mas, a
descrição do assunto simplesmente não contempla uma fórmula ou
equação, tornando-se instigante alcançar “o que o documento trata”
(what the document is about).

Segundo o autor, a linguagem documentária (documentary lan-


guage) adotada pode ser um facilitador da “formulação de descrições
de assunto” (formulation of subject descriptions), pois o propósito seria
expressar “todo o tópico” (whole topic) do documento. De outro modo,
o tópico de um documento (the topic of a document) envolve a sumari-
zação do seu conteúdo para a recuperação em um sistema, de forma
independente da linguagem documentária empregada.

Ao considerar o documento em um contexto temático especí-


fico, sua possibilidade de recuperação será abarcada por esse con-
texto, porém, antes das ferramentas e recursos disponibilizados, há
uma descrição particular do conteúdo. Nesse entendimento, Hutchins
(1977, p. 18, tradução nossa) interroga-se: “O que queremos dizer com
o conteúdo de um documento? Para responder a isso, precisamos ser
claros sobre a distinção entre o ‘sentido’ de uma expressão linguística
e a ‘referência’ dessa expressão.”

Ao vincular o contexto linguístico, Hutchins (1977, p. 18, tradu-


ção nossa) explica que “o sentido de uma palavra determina o alcance
de seus potenciais referentes.” De forma isolada, “uma palavra tem
sentido, mas não tem um referente real; pode ter um referente apenas
em um contexto textual específico.”

sumário
61
O autor traça uma distinção entre o sentido de um texto e a
sua referência. Explica que o entendimento do texto não implica as
referências ou o que o autor teve em mente ao escrevê-lo e, se a
preocupação consistir na busca da verdade ou falsidade do que foi
escrito, o conhecimento dos sentidos das expressões não se torna
suficiente. Cita, como exemplo, Bertrand Russell e a condição de “rei
da França é careca”. Hutchins (1977) explica não ser possível dizer
se a afirmação é verdadeira ou falsa fora de uma situação referencial
específica (outside a particular referential situation). O referente seria
a França do século XVIII e, com isso, haveria a possibilidade de testar
a verdade ou a falsidade da declaração. “Assim, enquanto o sentido
permanece constante, a referência varia – e assim também, em con-
sequência, o valor de verdade” (HUTCHINS, 1977, p. 18, tradução
nossa). O autor completa, com base em Fairthorne (1961), que os
indexadores centram atenção no sentido dos textos que “significa o
conteúdo dos documentos” (this is what is meant by the content of
documents) e, para ele, assim deve ser. Afirma que o sentido do texto
independe do autor, como se alcançasse uma existência autônoma,
“como parte do que Karl Popper chamou de ‘Mundo 3’” (as part of
what Karl Popper has called ‘World 3’) (HUTCHINS, 1977, p. 18).

Com isso, o autor afirma que o problema linguístico de sumariza-


ção necessita de compreensão da estrutura do texto. Isso envolve uma
progressão temática e semântica no que Fairthorne (1969), segundo
Hutchins (1977), estabeleceu haver uma distinção entre o caráter ex-
tensional de um texto e sua intencionalidade. O primeiro é definido
pelos tópicos de partes componentes de um texto, os tópicos de seus
parágrafos, seções, capítulos etc. O último é o tópico do texto como
um todo, representando algo a mais que os tópicos de suas partes.

De acordo com Beghtol (1986), para Fairthorne, o aboutness ex-


tensional (extensional aboutness) “é o assunto inerente ao documento”
(is the inherent subject of the document); já o aboutness intencional

sumário
62
(intensional aboutness) é a razão ou propósito para o qual o docu-
mento foi adquirido de acordo com o interesse dos usuários. Explica
que qualquer documento possui mais de um assunto, dependendo de
quem o solicita, por que e para quê. Nesse contexto de forte aproxi-
mação com o assunto, ainda segundo Beghtol (1986), com base em
Boyce (1982)3, os termos “topicality” (aboutness) e “informativeness”
(meaning), concatenam-se ao significado do documento, que não é
algo pronto e fixo, pois variará de acordo com diferentes fatores, den-
tre eles, sociais, culturais, institucionais etc. Esse recorte demonstra
que, no aboutness extensional e no “topicality”, permanece a ideia de
algo pronto, estável, enquanto, no aboutness intencional e “informati-
veness”, há presença de uma ideia mutável e não fixa. Cabe destacar
a dificuldade de tradução dos termos para língua portuguesa.

Ademais, o objetivo de Beghtol (1986) foi aproximar o aboutness


dos sistemas de classificação bibliográfica, pois, segundo a autora,
os classificacionistas projetam os sistemas, realizam todo um trabalho
conceitual e notacional, mas não consideram os significados particu-
lares intrínsecos, uma vez que o documento muda quando um sig-
nificado particular é atribuído a ele ou quando são usados de modo
particular por usuários.

Segundo Lancaster (2004, p. 13), o aboutness, traduzido no seu


livro por “atinência”, busca subsidiar a expressão “de que trata um do-
cumento” que, para ele, é sinônimo de “tem por assunto”. De acordo
com o autor, “estas expressões talvez não sejam muito precisas e não
é fácil definir ‘trata de’ [about] e ‘tem por assunto’ [aboutness]. Apesar
disso, são expressões que soam aceitáveis para a maioria das pessoas,
sendo por elas compreendidas.” Lancaster (2004, p. 13) ainda afirma ser
difícil explicar a situação no que tange à indexação de assuntos, e auto-
res como “Beghtol (1986) e Hutchins (1978) recorreram à linguística do

3 BOYCE, B. Beyond topicality: a two-stage view of relevance and the retrieval process.
Information Processing and Management, 18, p. 105-109, 1982.

sumário
63
texto ao examinar essa questão”, porém houve autores que recorreram
ao recorte probabilístico e até outros que afirmaram tratar de um aspecto
“‘intratável’, visto ser tão difícil decidir do que trata um documento.”

O assunto, considerado como um dos atributos do documento,


pois é uma característica que permite a estrutura do registro de infor-
mação compondo sua natureza temática, é a forma de expressar os
potenciais epistemológicos do documento, porém, isso se dá confor-
me a ótica de quem o descreve. Nessa concepção, Hjørland (1992)
considera o conceito de assunto (subject ou subject matter) em dois
aspectos: idealístico subjetivo e idealístico objetivo.

O primeiro aspecto envolve percepções ou visões de um ou


mais indivíduos, pois assuntos são subjetivamente compreendidos
e, assim, o seu conceito reside no estudo das mentes de algumas
pessoas, como, por exemplo, os autores ou usuários de documen-
tos. “Do ponto de vista da epistemologia, o idealismo subjetivo é
caracterizado por tornar a percepção e o pensamento independente
de uma maneira subjetivista. O positivismo é o representante mais
comum do idealismo subjetivo.” (HJØRLAND, 1992, p. 174, tradução
nossa). Esse ponto de vista enfatiza a interpretação do documento,
acarretando o que Hjørland (1992) nomeia ser uma concepção ag-
nóstica do assunto (agnostic conception of subject), a qual leva à
impossibilidade de saber como ele deve ser determinado.

O autor faz crítica ao idealismo subjetivo, pois aponta ser impos-


sível determinar assuntos examinando a mente de autores, usuários ou
qualquer outro grupo específico de pessoas. No documento há
[...] as intenções do autor, seu ponto de vista do assunto, e outros
novos aspectos que a ele se relaciona. Isso deu origem ao con-
ceito de “aboutness” na literatura da biblioteconomia e ciência da
informação, interesse que, a meu ver, representa um beco sem
saída, uma tentativa de escapar das dificuldades do conceito de
assunto [...] (HJØRLAND, 1992, p. 174, tradução nossa).

sumário
64
O que chama atenção no extrato acima é a dificuldade sobre
o conceito de assunto. O termo aboutness, que não possui tradução
consensual para o português do Brasil, não deve ser considerado si-
nônimo de assunto. Situação parecida acontece no espanhol, pois se
encontra dificuldade em estabelecer definição para contenido e mate-
ria, quando se refere à palavra assunto em inglês: subject.

Quanto ao aspecto idealístico objetivo, o assunto é enfatizado a


partir da análise teórica, de um ponto de vista absoluto, independen-
temente da consciência humana. Nessa concepção, os documentos
compartilham ideias que estão expressas em um assunto e “essas
ideias existem fora da consciência humana (ou dentro dela como per-
cepções a priori) e também são anteriores aos conceitos individuais
expressos nos documentos individuais.” (HJØRLAND, 1992, p. 177,
tradução nossa). Ainda segundo Hjørland (1992), o aspecto idealísti-
co objetivo expressa que o assunto pode ser identificado de maneira
independentemente do contexto que será empregado, mesmo a partir
de um sistema de classificação.

A fim de compreender o que seja o assunto dos documentos,


torna-se necessário algum tipo de análise, pois o objetivo é realizar a
representação temática: “[...] a informação é procurada em bibliotecas
ou bases de dados em que os documentos (transportadores de infor-
mação) são registrados por assunto” (HJØRLAND, 1992, p. 179, tra-
dução nossa). Acontece que a construção do conceito de assunto não
elimina ou descarta seu caráter intangível e, com isso, a dificuldade
em defini-lo. Duas razões, segundo Hjørland (1992), constituem esse
quadro: os documentos possuem infinitas propriedades e estas não
podem ser estabelecidas de uma única vez. Sendo assim, apesar do
registro de informação possibilitar a recuperação temática, o assunto
depende da análise de fatores contextuais.

O termo “assunto”, no contexto das listas de cabeçalhos, foi bas-


tante adotado de uma forma mais prática que teórica, como produto do

sumário
65
processo de catalogação de assunto. Em relação a esse termo, no Dicio-
nário da Língua Portuguesa (2004, p. 166), assunto é definido como “ma-
téria de que se trata; objecto; tema; motivo (Do lat. assumptu-, <<assu-
mido>>).” No Dicionário de Latim-Português (FERREIRA, 1987, p. 139),
a etimologia assumptus refere-se ao assumo - “1. Tomar, tomar para si,
tomar consigo, associar a. 2. Adaptar, atribuir, arrogar, aplicar.”

No dicionário Aulete (on-line), sua origem também é identificada


a partir do latim “assumptus, a, um”, mas no sentido em “que se elevou;
ELEVADO”. Outra definição: “aquilo sobre o que se conversa, fala ou
escreve; TEMA; MATÉRIA” (AULETE, s.d.). Indica-se primeiro sua origem
latina, vinculando-se às regras da língua portuguesa, pois, pelo radical, é
possível incluir, por exemplo, afixos4 para formação de outras palavras.
Observam-se também outros conceitos, como “tema” e “matéria”.

Faria e Pericão (2008, p. 111), no Dicionário do Livro, definem


assunto como “aquilo que, numa obra literária, constitui o conteúdo de
pensamento sobre o qual se exerceu o talento criador do autor. Aquilo
sobre o que se aplicou a reflexão do escritor numa obra científica ou
didáctica. O tema, matéria ou argumento de uma obra, mencionado ou
não no título.” Essa definição de um dicionário especializado sobre o
livro, seja ele apresentado em suporte tradicional ou eletrônico, aborda
o assunto relacionado ao documento desde a escrita ao conteúdo in-
telectual, entendido como “tema, matéria”.

Já no dicionário de Biblioteconomia, em idioma espanhol, a defini-


ção para assunto, que corresponde à palavra materia é: “assunto, tema
ou argumento que uma obra literária é composta, etc.” (BUONOCORE,
1976, p. 298, tradução nossa). Com exceção dos dois primeiros dicio-
nários, que não são especializados, ou seja, são dicionários de língua,
as respectivas definições trazem em comum os termos tema e matéria.

4 “Os afixos são elementos que se agregam ao radical para modificar-lhe o significa-


do. Os afixos que se antepõem ao radical chamam-se prefixos; os que a ele se pos-
põem, sufixos.” (CUNHA, on-line).

sumário
66
Para Hjørland (1992, p. 172, tradução nossa), “uma ligação mui-
to estreita existe entre o que os assuntos são, e como estamos a co-
nhecê-los.” De acordo com a abordagem até aqui adotada, é possível
observar nitidamente as variações terminológicas para abordá-lo.

A relação entre a ideia de um assunto e os documentos foi sis-


tematizada no trabalho de Cutter pelo catálogo dicionário e, segundo
Miksa (2012, p. 15, tradução nossa), constitui-se como “[…] referente
primário […] [e] seu status formal em relação ao domínio classificatório
natural do conhecimento humano. Em contraste, a ideia de um assun-
to como um atributo de um livro ou de qualquer documento tendia a
ser de menor importância.”Portanto, a ideia de assunto, naquele mo-
mento, não foi uma proposição teórico-metodológica de elementos de
manipulação do texto.

Levando em consideração a palavra assunto em inglês, subject,


no dicionário de Biblioteconomia e Ciência da Informação, Reitz (2014,
on-line, tradução nossa), define:
Qualquer um dos tópicos ou temas de uma obra, explicitamente
declarado no texto ou título ou implícito em sua mensagem. [No
processo de] catalogação em bibliotecas, é atribuído a um livro
ou outro item um ou mais cabeçalhos de assunto como pontos
de acesso, para ajudar os usuários a localizar seu conteúdo por
assunto. Nos serviços de indexação e resumos, os cabeçalhos
designados para representar o conteúdo de um documento
são chamados de descritores. Abreviação subj. Veja também:
aboutness e análise de assunto.

Em um sentido mais geral, qualquer tópico de estudo ou discus-


são, tema expresso por escrito, ou objeto ou cena retratado na
pintura, desenho, fotografia, etc. Na Classificação Decimal de
Dewey (CDD), os assuntos são organizados por disciplina. Por-
que um assunto pode ser estudado em mais de uma disciplina
(exemplo: casamento em lei, psicologia, religião, sociologia, etc.),
as escolhas feitas na classificação são governadas por regras.

sumário
67
Nesse extrato, tópico e tema são igualmente identificados como
assunto. O autor resgata a tradição, segundo Cutter, de como os as-
suntos dos livros podem ser representados com uso de palavras siste-
matizadas em cabeçalhos. Apresenta também os descritores adotados
nos serviços de indexação e resumos (em geral, sistemas especializa-
dos) e faz referência aos sistemas de classificação bibliográfica, como
a CDD, referindo-se aos assuntos, agrupados por disciplinas, mas sem
especificar o processo que esse instrumento contempla. Quanto aos
termos relacionados, cita aboutness e análise de assunto. A definição é
ampla e abarca o que já foi tratado neste trabalho. Portanto, aproxima
as vertentes Catalogação de Assunto e Indexação. Se, “para Cutter, a
estabilidade dos assuntos depende do processo social em que seu
significado é estabilizado em um nome ou designação” (HJØRLAND,
2017, p. 56, tradução nossa), o cenário muda de configuração ao ob-
servar conceitos como aboutness e análise de assunto.

Hjørland (2001) explica não ser fácil entender o conceito de as-


sunto (subject), pois seu contexto histórico imprime abordagem no
processamento de livros em catálogos de bibliotecas. O autor ponde-
ra ao especificar que o assunto de um documento é o objetivo de um
serviço de informação, definindo-o “[…] como os potenciais epistemo-
lógicos ou informativos dos documentos. [Afirma ainda que] A melhor
análise de assunto é aquela que faz o melhor prognóstico do uso futuro
do documento” (HJØRLAND, 2001, p. 776, itálico do autor, tradução
nossa). O autor destaca a palavra potencial (potentials), que significa
possibilidade, algo que pode vir a ser, portanto não real (AULETE, on-
-line; s.d.), pois deverá corresponder ao uso do documento.

Desse modo, Hjørland (2001) relaciona outros termos que por


vezes são considerados sinônimos, como aboutness, tópico (topic),
tema (theme) e conteúdo (content). Com exceção do primeiro, os de-
mais corroboram as orientações que seguem. Ao abordar o termo “tó-
pico”, o autor usa como explicação ele ser uma parte específica em

sumário
68
relação ao que um cientista trabalha em um campo mais amplo e, assim,
remete à concepção do específico em relação a uma cobertura ampla.
Para explicar o termo “tema”, faz aproximação com o que é individua-
lizante e caracterizador. Cita-o como um elemento que direciona uma
conferência ou um número especial de periódico e, portanto, fornece
o aspecto central sobre o que está sendo abordado. Já em relação ao
“conteúdo”, o autor faz aproximação com um texto, indicando que ele
tem semelhança com um comentário que pormenoriza um determinado
assunto. Sendo assim, aproxima à análise de conteúdo a determinação
de assuntos dos documentos. Essas definições básicas podem carac-
terizar e relacionar os termos, porém são limitadas frente às demandas
que poderiam ser colocadas para discussão da noção de assunto.

A conjugação do assunto como parte do registro de informa-


ção em catálogos e bases de dados deve reconhecer aspectos con-
ceituais presentes no documento, os quais variam com a experiência
de quem realiza a análise, o contexto, o público que fará uso, dentre
outros fatores. Desse modo, a defesa dos assuntos serem potenciais
epistemológicos ou informativos dos documentos (HJØRLAND, 2001)
concorre para uma forma que seja procedimental e significativa, como,
por exemplo, o assunto gerado a partir da análise.

Embora Hjørland (1992, p. 187, tradução nossa) explore diferen-


tes linhas epistemológicas para estruturar o conceito do assunto como
um elemento informativo, pensar a sua descrição envolve “[...] ava-
liação e atribuição de prioridades para as propriedades de um docu-
mento com relação a uma categorização e uma descrição do assunto
desse documento.” Se, em termos gerais, essa descrição é precedida
por alguma forma de análise, ela é “[...] contínua e decisiva para a
‘visibilidade’ do documento em bibliotecas e bases de dados, e assim
para seu papel potencial no desenvolvimento futuro do conhecimento.”

Se o assunto abarca, de algum modo, adequação para indicar


o que se quer representar e recuperar nos documentos, a análise

sumário
69
de assunto, também denominada, conforme Dias e Naves (2013),
análise conceitual, análise temática, análise documentária e análise
de conteúdo, deve almejar implicações significativas para a constitui-
ção de uma representação contextualizada. Entretanto, é importante
destacar que essa variação terminológica tem reflexo a partir de di-
ferentes vertentes teóricas, mas também se relaciona à imprecisão
que assumem as palavras conceito, tema, assunto, conteúdo e ma-
téria. Além disso, há distinções de significado relacionado aos termos
“análise de assunto” e “análise documentária”.

Com base na citação acima e a partir do livro de Dias e Naves


(2013, p. ix), encontra-se na “Apresentação” um alerta ao leitor para “os
problemas de variação terminológica” que, segundo os autores, é per-
cebida, inclusive, na literatura de língua estrangeira. Mas, na literatura
nacional, o cenário não é tão diferente. A despeito de os autores faze-
rem o alerta, no decorrer do livro, percebe-se ausência de uma discus-
são sobre essas diferenças. Da mesma forma que, no inglês, é difícil
estabelecer uma única definição para subject e aboutness, fato similar
acontece no espanhol, em relação às palavras contenido e materia.

Na Catalogação, o termo epígrafe, em espanhol, é usado em


linhas gerais para definir palavra ou palavras que são empregadas nos
cabeçalhos das fichas de assunto dos catálogos dicionários, expres-
sando o que a obra trata (ROVIRA, 1966; LITTON, 1971; BUONOCO-
RE, 1976). Penna (1945) preferiu usar encabezamientos de materia em
detrimento de epígrafes de materia, da mesma forma que Litton (1971)
realizou essa escolha. Buonocore (1976, p. 189) destaca que os en-
cabezamientos de materia ou asuntos recebem o nome de epígrafe,
traduzido para o português brasileiro como “rubrica”.

O principal responsável em propagar a definição de epígrafe,


segundo Rovira (1966), foi Jorge Aguayo, objetivando que a Biblio-
teconomia formasse seu próprio vocabulário em espanhol. Na visão
de Rovira (1966), pareceu aceitável usar epígrafe em detrimento de

sumário
70
encabezamiento de materia, entretanto, a incorporação do termo evi-
denciou-se na literatura de Cuba, país que Aguayo desenvolveu longo
trabalho na Universidad de La Habana.

Buonocore (1976, p. 198, tradução nossa), ao definir o termo


epígrafe, demonstrou reflexão sobre a prática profissional iniciada no
século XIX e explica que:
Embora os termos título e epígrafe sejam sinônimos em lingua-
gem natural, a terminologia profissional os diferencia. O título
é a palavra ou frase com a qual o autor denomina oficialmente
sua obra e como decide estampar, como se sabe, na capa des-
ta. A epígrafe, por outro lado, é o título atribuído pelo cataloga-
dor da obra e para isso ele escolhe a palavra mais específica
e expressiva do conteúdo desta, usando uma lista previamente
preparada – a de Lasso de la Vega, a Sears, por exemplo, – ou,
caso contrário, mantendo um registro dos cabeçalhos usados
no catálogo da biblioteca para padronizar critérios e estabelecer
relações entre as diferentes epígrafes.

Nesse panorama e mesmo com o exemplo de Aguayo que bus-


cou consolidar o termo citado em língua espanhola, o fato não alterou a
influência do arcabouço anglo-saxão na Catalogação. Considerando a
obra de Cutter antiquada em muitos aspectos, Rovira (1966, p. 7, tradu-
ção nossa) expressou que os autores de textos da área “[...] se limitavam
a aconselhar a adoção de listas impressas, a ensinar seu uso e a dar
algumas indicações práticas e princípios gerais deduzidos destas.”

Em Portugal, constata-se, a partir de Peixoto (1962, p. 26), refe-


rência à epígrafe como sinônimo de encabeçamento ou cabeçalho de
assunto, compondo “[...] a palavra ou palavras que, postas na parte
superior das fichas de matérias, nos dão o tema ou assunto concre-
to [...]”. Ainda, para o autor, “a expressão terminológica do assunto”
(p. 26, destaque do autor) é a epígrafe e, “a expressão numérica” (p.
27, destaque do autor) é a classificação, disposta a partir da notação
(também numérica) de um sistema classificatório, como, por exemplo,

sumário
71
a Classificação Decimal Universal (CDU). Desse modo, o autor trata
das modalidades de epígrafes, conforme definições a seguir:

1. Epígrafes temáticas que designam a principal expressão termi-


nológica do contexto da espécie bibliográfica a ser tratada cata-
lograficamente. Ex.: Educação.

2. Epígrafes geográficas, que designam a expressão terminológica


do espaço geográfico do contexto. Ex.: Portugal – Educação.

3. Epígrafes cronológicas ou históricas, que designam a expres-


são terminológica da época histórica ou cronológica. Ex.: Re-
nascimento; Século XIII.

4. Epígrafes onomásticas ou biográficas, que designam uma pessoa


individual ou colectiva tratada no seu aspecto biográfico ou his-
tórico, etc., usando-se sempre o mesmo nome, quer se trate do
catálogo de autores ou de assuntos. Ex.: Tomás de Aquino (Santo).

5. Epígrafes de título ou didascálicas, que se usam para desig-


nar como tema ou assunto uma obra apenas conhecida pelo
título. Ex.: Diário de Notícias; Funchal e as lendas marítimas
(PEIXOTO, 1962, p. 27).

Para Peixoto (1962), a disposição do catálogo alfabético de


matérias (ou seja, de assuntos) é oriunda da tradição anglo-saxã do
catálogo dicionário, que é a fusão do catálogo de autores, títulos e
de matérias. Sobre o catálogo dicionário, Peixoto (1962, p. 26) expli-
ca que bibliotecários europeus mostraram-se “[...] relutantes em o
aceitar. [...] nota-se uma certa tendência para o abandonar, [...] em
virtude de ele crescer desmedidamente. [...] outros afirmam que o
catálogo-dicionário, ao juntar o de autores e o de matérias, confunde
duas fases da investigação, que são bem distintas.” De fato, a tradi-
ção europeia separou a elaboração do catálogo de assunto, por meio
da construção do catálogo sistemático.

sumário
72
Litton (1971) explica que, pelo exame do livro, é possível indicar
seu assunto (materia) e, assim, elegê-lo em uma lista de cabeçalho, o que
compatibilizaria, segundo ele, a natureza da publicação. Contudo, tam-
bém explicitou que, pelo cabeçalho, é possível descrever “[...] o conteúdo
dos livros registrados no catálogo da biblioteca apenas em grau relativo.
De todo modo, são mais uniformes e corretos para a interpretação do
conteúdo das obras quando a instituição adota e adere estritamente a
uma lista autorizada” (LITTON, 1971, p. 81, tradução nossa). Nessa con-
dição, o assunto do documento seria preconcebido a partir da lista de
cabeçalho mantendo vinculação com um plano explícito de palavras do
documento. Essa relação, permeada por “[...] variações praticamente ili-
mitadas dos temas abordados nos livros, [e] a análise destes através dos
cabeçalhos e das tabelas de classificação não é tão suscetível à formu-
lação de um corpo de regras [...]” (LITTON, 1971, p. 77, tradução nossa).

No âmbito das fichas, a representação temática dos documentos


comportou a identificação do que se denominou contents (conteúdo).
Taylor (1948) abordou que essa compreensão envolveu aspectos de
uma obra possuir vários volumes e, assim, a identificação requerer uma
nota de conteúdo (contents note). Outra situação para o reconhecimento
desse aspecto, segundo a autora, seria o de uma obra apresentar capí-
tulos escritos por diferentes autores. Ainda segundo Taylor (1948, p. 91,
tradução nossa, destaque da autora), na ficha catalográfica:
A nota de conteúdo é iniciada meio centímetro abaixo da última
linha da entrada. A palavra conteúdo começa na margem interna,
é indicada em itálico [...] e seguida por dois pontos. Depois vêm
os detalhes do conteúdo, sendo estes levados de volta para a
margem externa e cada item separado por um longo traço. Um
centímetro para cima a partir da parte inferior da ficha deve ser
deixado em branco, exceto para as palavras (continua na próxima
ficha), pois a parte inferior é difícil de ser vista quando se está
em pé em uma gaveta do catálogo. Ao continuar numa segunda
ficha, numere esta (2), repita o cabeçalho e o título brevemente,
seguidos por um espaço de dois centímetros e Conteúdo (con-
tinuação). Deixe meio centímetro e comece a listar o restante do
conteúdo sem qualquer recuo de parágrafo na margem interna.

sumário
73
A identificação do contents (conteúdo) na ficha catalográfica
alcançou relativa estabilidade através da nota de conteúdo, e não pro-
priamente no tange à representação temática. Por sua vez, Buonocore
(1976, p. 143, tradução nossa), com base em Jorge Aguayo, afirma que
a descrição do contenido “[...] é o índice colocado nos livros seguindo
a mesma ordem dos capítulos.” Neste caso, ele está se referindo ao
recurso que chamamos mais frequentemente de sumário. O conteú-
do, através da nota concebida logicamente por palavras extraídas do
documento, apresentou uma proposta de padronização envolvendo a
pontuação e o lugar de apresentação na ficha, porém não houve em-
basamento metodológico para essa construção.

Ainda, no que tange às fichas, a entrada secundária, explica


Litton (1971), rege o desdobramento, ou seja, a elaboração de fichas
secundárias, a partir da ficha principal ou única (tarjeta única). Nessa
tradição, ao identificar o assunto (materia), quem catalogou deve en-
contrá-lo na lista de cabeçalho e, assim, indicá-lo no lugar da entrada
secundária na ficha principal. Após essa escolha e seguindo o padrão
da ficha secundária de assunto,
O cabeçalho selecionado é transcrito no espaço acima da linha
do autor, a partir da segunda margem. Para destacá-lo, uma
dessas duas regras é geralmente seguida: a) as letras são to-
das escritas em maiúsculas e em preto; e b) todas as letras são
transcritas em maiúsculas e em vermelho.

Quando um cabeçalho não se encaixa na linha a ele desti-


nada, terá que elevá-lo mais para a borda da ficha, de modo
que a segunda parte possa ocupar a segunda linha a partir
da terceira margem.

[...]

Quando um cabeçalho é composto por várias partes, elas po-


dem ser separadas umas das outras por meio de: a) um ponto
e dois espaços; e b) uma linha com dois traços (nunca um)
(LITTON, 1971, p. 138, tradução nossa).

sumário
74
De modo análogo, conforme Penna (1945, p. 85, tradução nos-
sa) expressa, “[...] as fichas de assunto são as que representam os
livros de acordo com seu conteúdo.” Para o autor, essa aproximação
parte das fichas de materia (fichas de assunto) de um catálogo di-
cionário se relacionarem com o modo de ser do catálogo sistemático
através dos seus símbolos classificadores (símbolos clasificadores).
Ainda, segundo o autor, antes de decidir esse símbolo e o cabeçalho,
quem cataloga deve buscar o tema (tema) tratado na obra através da
leitura do seu prefácio, sumário, dentre outros elementos e, se neces-
sário, recorrer à consulta de terceiros, ou a fontes adequadas como
bibliografias e outros catálogos. Após determinar o tema da obra, o
autor explica que as tarefas de indicação do símbolo classificador e do
cabeçalho não são idênticas, pois no primeiro caso “[...] será neces-
sário ter um raciocínio que nos leve exatamente ao lugar do sistema
que, pela disposição lógica das ciências, corresponda ao livro que se
busque localizar [...].” Já para o segundo, “[...] devemos procurar a
palavra que expresse de forma mais determinante o conteúdo do livro
[...]” e dessa forma ambos os processos “[...] se diferem de forma tão
fundamental.” (PENNA, 1945, p. 85, tradução nossa).

A disposição das fichas nesse tipo de catálogo segue a ordem


alfabética agrupando autores, títulos e assuntos, mas os cabeçalhos
de assunto (encabezamientos de materia) assumem relevância “[...]
pois são os que agrupam em determinadas partes do catálogo todas
as fichas de obras que tratam do mesmo tema” (PENNA, 1945, p. 85,
tradução nossa). Ainda, segundo esse autor, o conteúdo seria a subs-
tância do texto formando as partes do livro e, através do seu exame, se
determinaria o tema. Portanto, a partir do tema, o assunto seria indicado
pelo cabeçalho e, representado na ficha, congregaria o primeiro vincu-
lando-o com a descrição controlada do instrumento. Com esse aspecto,
depreende-se que o assunto seria o resultado do tema, pois o primeiro é
esquematizado no cabeçalho e o segundo resultaria da análise.

sumário
75
A despeito da relação apontada por Penna (1945), a atribuição
de um símbolo classificador ao documento forneceria uma localização
no acervo, de acordo com o mapeamento das ciências dado no siste-
ma bibliográfico e, com o cabeçalho, o uso de uma palavra específica
resultaria no assunto. Em ambos os casos, a representação continuou
privilegiando aspectos genéricos dos instrumentos e se baseou no do-
cumento como um todo.

Sharp (1964), ao abordar as tarefas de classificação e cataloga-


ção de assunto, explica que a entrada secundária de assunto nas fichas
fornece um caminho que amplia o processo de análise por conta das
referências cruzadas que podem ser construídas. Critica apontando
que houve frequente negligenciamento na relação dessas construções
e que “muito já foi dito sobre os méritos de disposição dos assuntos nas
respectivas formas dos catálogos dicionário e classificado [...]” (SHARP,
1964, p. 334, tradução nossa). Mas o autor, sob o viés anglo-saxão,
também se restringiu metodologicamente em torno da prática tão di-
fundida e igualmente já apontada nos livros de Catalogação (PENNA,
1945; TAYLOR, 1948; MANN, 1962; LITTON, 1971). A sistematização
para o assunto fornecida por Cutter, na forma de um cabeçalho, foi
influente na construção da vertente da Indexação, mas tomou outra di-
reção a partir da ideia de índice e das metodologias de indexação.

Nessa diferença entre vertentes, o processo de indexação é co-


mum, mas a ideia de uma entrada secundária, não é. Nos catálogos
em fichas ou on-line, há entrada secundária de assunto, mas, nas ba-
ses de dados científicas, elas não existem como tal, pois se trabalha
com pontos de acesso de assunto. Com isso, o ponto de acesso tido
como principal empregado por um nome, termo ou signo são utiliza-
dos para encontrar uma entidade ou um conjunto de entidades em
uma ficha catalográfica e seus desdobramentos são possibilitados
pelas entradas secundárias. Porém, com as bases de dados, vários
pontos podem ser disponibilizados para a recuperação e a palavra
principal perdeu a função original.

sumário
76
A exposição efetuada permite verificar que o desdobramento da
vertente anglo-saxã é constituído por fragmentos, mas com aspectos
comuns, como o da entrada por assunto. Ademais, o assunto é um
atributo relevante, mas prevalece a dispersão e, por consequência, a
variação terminológica em torno da sua compreensão. Do ponto de
vista da organização, instrumentos condicionam o assunto, como a
lista de cabeçalhos, que centram na morfologia e na sintaxe, enquanto
o tesauro na semântica. Do ponto de vista da representação, o assunto
é construído e não extraído do documento.

4 BUSCA DOS OLHARES SOBRE


A REPRESENTAÇÃO DE ASSUNTO NA SÉRIE
ESTUDOS AVANÇADOS EM ORGANIZAÇÃO
DO CONHECIMENTO (ISKO BRASIL)

Com base na exposição teórica levantada, é possível observar


a variação terminológica que envolve o termo “assunto”. Essa tentativa
de trabalhar o escopo científico sobre o assunto e, por consequência,
sua representação, pauta-se em elementos aparentemente similares
ou complementares, mas pertencentes a diferentes perspectivas que
convergem e divergem ideias sobre o que é o assunto. Por consequên-
cia, há relação direta com o resultado da manipulação do assunto, que
se dá pela representação.

A motivação em identificar a presença do termo “represen-


tação de assunto” e se, junto a ele, há variação terminológica, ob-
servando o levantamento feito – descritor; aboutness, topic, content,
subject – assunto, tema, matéria – contenido, materia epígrafe, tema
– tem como intuito compreender qual(is) termo(s) marca(m) presença
na literatura dos eventos do capítulo brasileiro da ISKO. Essa tentativa
de olhar para os termos que coexistem na literatura das cinco edições

sumário
77
dos eventos nacionais é um movimento que auxilia a (re)conhecer o
que é trabalhado quando se trata da representação de assunto.

Para identificar os trabalhos, foram realizadas buscas de forma


automática, usando o recurso localizar, nos cinco arquivos em PDF,
que compõem os volumes da Série Estudos Avançados em Organi-
zação do Conhecimento5. A expressão empregada foi “representação
de assunto”, incluindo o plural “assuntos”, de modo a verificar a ocor-
rência. É oportuno explicitar que trabalhos com a referida expressão
somente nas considerações finais ou com citação para exemplificar
algo uma única vez não foram selecionados para compor o corpus da
análise. Seguindo esse critério há dois trabalhos no volume 5 que não
foram selecionados.
A partir da busca realizada, foram recuperados, nos volumes
1, 2 e 5, um trabalho em cada e, nos volumes 3 e 4, três em cada,
totalizando nove trabalhos, conforme sistematização no quadro 1.

Quadro 1 – Identificação do corpus para análise

Ano do evento/ Autor(es)(as) Título do trabalho Uso da expressão Presença dos


volume/fonte representação termos:
de assunto descritor; about-
ness, topic, content,
subject – assunto,
tema, matéria –
contenido, materia
epígrafe, tema
2012, v. 1 Carlos H. Organização e Representação de assunto
Marcondes representação do assuntos compos-
(GUIMARÃES; conhecimento tos (Ranganathan)
DODEBEI, 2012) em ambientes
digitais: as relações
entre ontologia e
Organização do
Conhecimento

5 Todos os volumes estão disponíveis no site da ISKO Brasil (https://isko.org.br/), na aba


publicações. Observar que as entradas das referências dos volumes variam de acordo
com os(as) organizadores(as).

sumário
78
Fabio Assis Metáfora e ortofe- Representação de assunto;
2013, v. 2 Pinho; Suellen mismo na represen- assunto - substi- conteúdo tópico
de Oliveira tação de assunto tutos documentais dos documentos
(DODEBEI; GUI- Milani (por exemplo:
MARÃES, 2013) índices, resumos
e notações de
classificação);
poder de nomear
(Olson, 2002)
2015, v. 3 Graziela Mar- A representa- Representação assunto;
tins de Medei- ção de assunto de assunto; organização e repre-
(GUIMARÃES; ros; Leolíbia no escopo da indexação de sentação da infor-
DODEBEI, 2015) Luana Linden; arquivologia: uma assuntos (Norma mação arquivística
Luciane Paula análise de artigos Brasileira de Des-
Vital; Marisa científicos crição Arquivística
Bräscher nacionais e –NOBRADE)
internacionais
Gustavo Silva Poole, o índice e as Indexação de as- assunto;
Saldanha; fraturas: indexação suntos (Lancaster); termos extraídos
Naira Christo- e publicações Representação de de um documen-
foletti Silveira seriadas nos assuntos (plural); to – descritores;
Estados Unidos Representação
do oitocentos temática
Vera Lucia As linguagens Representação de conteúdo;
Ribeiro Guim; de indexação e a assuntos (Classi- assuntos (plural)
Mariângela análise de domínio ficação Decimal
Spotti Lopes Universal – CDU)
Fujita

sumário
79
2017, v. 4 Maria Carolina Linguagem de Representação assunto;
Andrade e indexação no con- de assuntos; conteúdos atribuí-
(PINHO; Cruz; Mariân- texto da política de Tratamento Temáti- dos aos documen-
GUIMARÃES, gela Spotti indexação: estudo co da Informação; tos da biblioteca;
2017) Lopes Fujita; em bibliotecas Representar o conteúdo temático
Luciana Beatriz universitárias conteúdo dos do documento;
Piovezan documentos;
dos Santos Indexação de
assuntos
Helen de As crianças como Representação assunto
Castro Silva comunidades de assunto
Casarin; Thaís de usuários e
Guedes Ferrei- os Sistemas de
ra; Suellen de Organização do
Oliveira Milani Conhecimento: uma
análise da literatura
Suellen de Problemas rela- Representação assunto;
Oliveira Milani; cionados a biases de assunto; conteúdo
José Augusto em Sistemas de Atribuição de rótu-
Chaves Organização do los (Olson, 2002)
Guimarães Conhecimento:
perspectivas para
a representação
de assunto
2019, v. 5 Marcos Luiz O Islamismo Representação assunto;
Cavalcanti na CDD e CDU: de assunto; assuntos
(BARROS; de Miranda; religião e cultura Classificação
TOGNOLI, 2019) Fábio Gomes periféricas nos es- de assunto
da Silva quemas de classifi-
cação bibliográfica
Fonte: Elaborado pela autora, 2021.

Cabe destacar o quantitativo de trabalhos em cada volume: no


1, há 39 trabalhos, com participação de 72 autores(as) (GUIMARÃES;
DODEBEI, 2012, p. 18); no 2, 46 trabalhos e participação de 85 auto-
res(as) (DODEBEI; GUIMARÃES, 2013, p. 14); no 3, 75 trabalhos (GUI-
MARÃES; DODEBEI, 2015, p. 16), mas sem indicação do número de
autores(as). Já a contabilização de trabalhos do volume 4 (com 46) e
do volume 5 (com 56) não constam nos prefácios e foram levantados
manualmente pela autora.

sumário
80
A partir da leitura integral dos nove artigos recuperados, foi pos-
sível identificar, mesmo que de forma breve, como as autoras e os
autores empregaram a representação de assunto (penúltima coluna
do quadro 1) nas suas abordagens. Também, por esse movimento, foi
possível identificar se há presença de variação terminológica, confor-
me apontado na última coluna do referido quadro. Nesse panorama, a
análise do corpus levantado segue na próxima subseção.

4.1 ANÁLISE E POSSÍVEIS DISCUSSÕES

Após a leitura e análise dos nove artigos, constata-se que há


presença de variação dos termos para referir-se a assunto e, por con-
sequência, sua representação, conforme os apontamentos a seguir:

O artigo recuperado no volume 1 (MARCONDES, 2012) propõe


um esboço das relações entre Organização do Conhecimento (OC), a
partir da Teoria da Classificação Facetada de Ranganathan, e Ontologia,
buscando o diálogo interdisciplinar. O autor indica trabalhar os funda-
mentos de ambas as disciplinas e identificar o papel da OC na gestão
do conhecimento em ambientes digitais. O autor busca relacionar a re-
presentação de assunto no contexto web. Não se constatou presença
de variação terminológica. O trabalho foi vinculado ao eixo denominado
“A dimensão epistemológica da organização do conhecimento”.

No volume 2, o artigo recuperado (PINHO; MILANI, 2013) tem


como objeto de discussão a ausência de precisão terminológica no
processo de indexação, situação que pode levar a vieses na represen-
tação, envolvendo outros diferentes problemas, como os relativos ao
preconceito, proselitismo, questões de gênero, categorizações dico-
tômicas, dentre outros. Pinho e Milani (2013) abordam que o proces-
so de indexação é permeado por subjetividade e o(a) profissional, ao
organizar a informação, a rotula. Ressaltam que essa ação não pode

sumário
81
ser dissociada do contexto cultural e ideológico de quem indexa e do
sistema de informação. A representação de assunto, para o autor e a
autora, consiste em atribuir nomes ou rótulos ao conteúdo tópico dos
documentos. Constata-se que há presença de outro termo para tratar
do assunto, que comunga com a proposta do estudo. Ele foi vinculado
ao eixo denominado “A dimensão social, cultural e política da Organi-
zação e Representação do Conhecimento”.

Já no volume 3, Medeiros, Linden, Vital e Bräscher (2015) abor-


dam a representação de assunto no escopo da Arquivologia, indican-
do haver escassez de aprofundamento teórico nesse escopo. Verifica-
ram como a representação de assunto em documentos de arquivo é
tratada nas publicações da área de Ciência da Informação. É possível
notar que a expressão organização e representação da informação ar-
quivística é empregada de forma sinônima a representação de assun-
to. Esse trabalho diferencia-se por enfocar a visão da Arquivologia e foi
vinculado ao eixo denominado “A dimensão aplicada da Organização
e Representação do Conhecimento”.

O segundo artigo recuperado no volume 3, de Saldanha e Sil-


veira (2015), trabalha elementos epistemológicos para a discussão de
conceitos, de métodos, de abordagens e de experimentos dos estu-
dos informacionais. Objetiva discutir, a partir de um enfoque teórico,
o desenvolvimento de ferramentas de recuperação da informação no
âmbito da produção seriada no século XIX, considerando a figura de
William Frederick Poole e o seu Índice Poole. De acordo com Salda-
nha e Silveira (2015), o trabalho de Poole marcou a consolidação de
um pensamento americano em “recuperação temática de artefatos”,
principalmente no âmbito dos periódicos. Por terem como foco um
instrumento específico da indexação (o índice), o autor e a autora em-
pregam outras expressões que tem relação com o processo em jogo.
O trabalho foi vinculado ao eixo “A dimensão epistemológica da Orga-
nização e Representação do Conhecimento”.

sumário
82
No último artigo recuperado do volume 3, Guim e Fujita (2015)
abordam diferentes linguagens de indexação, pré e pós-coordenadas,
sendo: Classificação Decimal de Dewey (CDD), Classificação Decimal
Universal (CDU), tesauro e cabeçalhos de assunto. Enfocam serem lin-
guagens construídas artificialmente que visam, de maneira sucinta, re-
presentar o conteúdo do documento. Aliam a importância da análise de
domínio como embasamento teórico para atualização e construção de
linguagens de indexação. Enfocam a expressão representação de as-
suntos ao instrumento CDU. O trabalho foi vinculado ao eixo “A dimensão
epistemológica da Organização e Representação do Conhecimento”.

Tratando do volume 4, o artigo de Cruz, Fujita e Santos (2017)


aborda as linguagens de indexação e sua função no processo de
tratamento temático dos documentos. Enfocam como sua aplicação
repercute no resultado da indexação e a importância da política de in-
dexação nesse contexto, pois ela garante que os critérios preestabe-
lecidos para o processo de representação sejam seguidos por quem
realiza o processo. Investigam os procedimentos adotados quanto
ao uso das linguagens de indexação, no contexto das bibliotecas
universitárias, olhando para a inconsistência no controle de vocabu-
lário, que causa imprecisão na representação temática nos catálogos
das bibliotecas e, consequentemente, disparidades na recuperação
da informação. O trabalho apresenta variedade de expressões com
termos que compõem a perspectiva da indexação. Foi vinculado ao
eixo “Dimensão Aplicada da Organização do Conhecimento”.

Continuando no volume 4, o artigo de Casarin, Ferreira e Mila-


ni (2017) relaciona os estudos sobre comportamento informacional e
como, por meio deste, é possível viabilizar a identificação de caracterís-
ticas e necessidades de grupos específicos de indivíduos a fim de trazer
subsídios aos processos de organização do conhecimento. O estudo
propõe-se a analisar a produção científica da área de organização do
conhecimento, no que diz respeito às crianças e, para isso, realizou-se

sumário
83
um levantamento bibliográfico em periódicos internacionais especializa-
dos. As autoras relacionam a representação de assunto à organização
do conhecimento e, por consequência, aos sistemas que dão base a
essa representação. Nesse contexto, incluem os sistemas de classifi-
cação, listas de cabeçalhos de assunto, listas de autoridades, tesauros,
ontologias, taxonomias, terminologias e outros instrumentos que servem
para a representação de assunto de um documento por meio de uma
estruturação semântica (HODGE, 2000). O trabalho foi vinculado ao eixo
“Dimensão Política e Social da Organização do Conhecimento”.

O último artigo recuperado do volume 4, de Milani e Guimarães


(2017), aborda dilemas éticos no processo de representação de assun-
to. Sinalizam que o uso de instrumentos, tais como esquemas de clas-
sificação e linguagens de indexação, juntamente à representação de
assunto não realizada de uma forma defensável, pode promover, cen-
surar, omitir e distorcer informações. Nesse contexto, a autora e o autor
direcionam que o(a) bibliotecário(a) precisa considerar valores éticos
e barreiras culturais e linguísticas, pois estará diante de dilemas que
exigirão tomadas de decisão éticas. A partir do momento em que o(a)
bibliotecário(a) reconhece o fato de que dilemas éticos não resolvidos
podem causar danos às comunidades de usuários(as), sua postura pe-
rante tal circunstância deverá ser respeitosa. Considerando relatos de
artigos extraídos da literatura internacional especializada em organiza-
ção do conhecimento, o trabalho propõe uma reflexão sobre a forma
pela qual os sistemas de organização do conhecimento podem fomen-
tar dilemas éticos na atuação do(a) bibliotecário(a). Milani e Guimarães
(2017) apontam que a representação de assunto insere-se no âmbito da
organização do conhecimento, que é um marco teórico conceitual para
a Biblioteconomia e Ciência da Informação. O trabalho foi vinculado ao
eixo “Dimensão Política e Social da Organização do Conhecimento”.

O último trabalho que compõe o corpus selecionado e está no


volume 5, de Miranda e Silva (2019), investiga a existência de desvios

sumário
84
na representação de assuntos referentes às culturas não alinhadas à
cultura ocidental, no que tange o Islamismo. Emprega a 23ª edição
da Classificação Decimal de Dewey e a 2ª Edição Padrão Internacio-
nal em Língua Portuguesa da Classificação Decimal Universal. Aborda
a construção do conceito de Islamismo no Ocidente, considerando
as transformações de sentido moduladas pelo contexto sociocultural,
conferindo, ao Islã, a imagem da violência e realiza estudo comparativo
junto aos dois sistemas de classificação mencionados. Os resultados
do estudo dos esquemas de classificação demonstraram a existên-
cia de desvios (biases) de representação na Classificação Decimal de
Dewey, evidenciados tanto na seleção terminológica quanto em sua
estrutura conceitual; e as correções de biases de representação pela
abordagem classificatória (analítico sintética e facetada) da Classifi-
cação Decimal Universal. É possível indicar que a representação de
assunto está alinhada à classificação. O trabalho foi vinculado ao eixo
“Dimensão Política e Social da Organização do Conhecimento”.

Com base no corpus selecionado, observa-se que o elemento


recorrente à representação de assunto é o processo de indexação, que
envolve o uso de diferentes instrumentos – inclusive os de classifica-
ção – e geram produtos variados. Sendo assim, a recorrência vai ao
encontro do cenário teórico levantado.

Também, conforme apontado no referencial teórico, é preciso


considerar a existência das diversas abordagens, construídas em mo-
mentos históricos e culturais distintos, e que estão presentes na lite-
ratura. Assim, é importante compreender como esses elementos con-
vergem, considerando a fundamentação que os envolvem, mas sem
esquecer das particularidades teórica que os individualizam.

Confirma-se com a análise que no mínimo dois amplos cami-


nhos podem ser apontados em relação ao aspecto da representação
de assunto: um que visa refletir/coletar/estruturar termos para cons-
truir um vocabulário controlado, portanto uma linguagem; e outro

sumário
85
que envolve a sistematização de aspectos metodológicos da própria
indexação, que se dá pelos assuntos. O processo não é isento de
neutralidade e fundamentos denominados éticos estão presentes.

Nenhum dos trabalhos recuperados tratam de elementos concei-


tuais do assunto e/ou da sua representação. Também não empregam
termos distantes dos que foram elencados para abarcar assunto, mas
foi recorrente o uso do termo conteúdo. Sobre a expressão “represen-
tação de assunto”, foi interessante observar os termos correlacionados.
Ademais, com exceção do trabalho de Medeiros, Linden, Vital e Bräs-
cher (2015), todos estão vinculados ao contexto da Biblioteconomia.

5 PARA FINALIZAR: BREVES CONSIDERAÇÕES

(Re)conhecer o que é trabalhado sobre a representação de as-


sunto, através das publicações da comunidade do capítulo brasilei-
ro da ISKO, é um grande desafio. Se, por um lado, a sistematização
desse esforço pode prover contribuição para a consolidação do que
é produzido em um determinado momento, por outro, a análise inicial
requer que outras sejam realizadas.

Nas pesquisas iniciais para esta investigação, percebeu-se que


a palavra assunto deflagra diferentes nuances da representação, que
é temática, fazendo perceber outros termos também adotados para
nomear este tipo de representação. Deve-se considerar a existência de
abordagens diversas, construídas em momentos históricos e culturais
distintos, e que estão presentes na literatura da área. De acordo com a
exploração da literatura realizada, vertentes constituíram-se com suas
respectivas abordagens, mas elas influenciam-se umas as outras,
pois, apesar dos fundamentos que as distinguem, elas se aproximam
por um propósito: a representação de assunto.

sumário
86
Analisar a variação terminológica que envolve o assunto e, por
consequência, sua representação e relacionar o referencial trabalhado,
sinaliza diferentes tempos e lugares. Resgatar esse cenário colabora
para o fortalecimento da Organização do Conhecimento ao demons-
trar que a representação de assunto envolve a busca por teorias e me-
todologias rigorosamente fundamentadas, de base intelectual. Além
disso, há forte relação com a Biblioteconomia.

No que tange as denominações dos eixos que englobam os


trabalhos da Série Estudos Avançados em Organização do Conheci-
mento, cabe destacar alteração de nomenclaturas, especificamente na
expressão Organização e Representação do Conhecimento para Or-
ganização do Conhecimento. Também é importante salientar que hou-
ve alteração dos formatos dos trabalhos que compõem os volumes da
referida série: de resumos expandidos passaram para texto completo.

É desejo que a apropriação realizada nesse trabalho possibilite


outras discussões, pois, além de ser tema do projeto de pesquisa6
coordenado pela autora, abrem-se portas para o aprofundamento de
críticas às questões em torno do assunto e da sua representação.

6 REFERÊNCIAS
AULETE Digital. Disponível em: http://www.aulete.com.br/assunto. Acesso
em: 22 nov. 2021.
BARROS, Thiago Henrique Bragato; TOGNOLI, Natalia Bolfarini (orgs). Orga-
nização do conhecimento responsável: promovendo sociedades demo-
cráticas e inclusivas. Belém: ED. da UFPA, 2019. Série: Estudos Avançados
em Organização do Conhecimento, v. 5. Disponível em: https://isko.org.br/

6 Título do projeto: A representação de assunto entre o contexto analógico ao digital: pers-


pectivas teórico-prática dos processos, produtos e instrumentos. Cadastrado no ‘Por-
tal da Pesquisa’ da Diretoria de Pesquisa, vinculada a Pró-Reitoria de Pós-Graduação,
Pesquisa e Inovação (PROPGPI) da UNIRIO: http://sistemas.unirio.br/projetos/projeto/
index?ID_PROJETO=9978.

sumário
87
publicacoes/serie-estudos-avancados-em-organizacao-e-representacao-do-
-conhecimento/. Acesso em: 20 out. 2021.
BEGHTOL, Claire. Bibliographic classification theory and text linguistics:
aboutness analysis, intertextuality and the cognitive act of classifying docu-
ments. Journal of Documentation, London, v. 42, n. 2, p. 84-113, june. 1986.
BUONOCORE, Domingo. Diccionario de Bibliotecologia. 2. ed. aum. Bue-
nos Aires: Marymar, 1976.
CASARIN, Helen de Castro Silva; FERREIRA, Thaís Guedes; MILANI, Suellen
de Oliveira. As crianças como comunidades de usuários e os Sistemas de
Organização do Conhecimento: uma análise da literatura. In: PINHO, Fabio
Assis; GUIMARÃES, José Augusto Chaves (orgs). Memória, tecnologia e
cultura na organização do conhecimento. Recife: Ed. UFPE, 2017. Série:
Estudos Avançados em Organização do Conhecimento, v. 4. Disponível em:
https://isko.org.br/publicacoes/serie-estudos-avancados-em-organizacao-e-
-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
CRUZ, Maria Carolina Andrade e; FUJITA, Mariângela Spotti Lopes; SAN-
TOS, Luciana Beatriz Piovezan dos. Linguagem de indexação no contexto da
política de indexação: estudo em bibliotecas universitárias. In: PINHO, Fabio
Assis; GUIMARÃES, José Augusto Chaves (orgs). Memória, tecnologia e
cultura na organização do conhecimento. Recife: Ed. UFPE, 2017. Série:
Estudos Avançados em Organização do Conhecimento, v. 4. Disponível em:
https://isko.org.br/publicacoes/serie-estudos-avancados-em-organizacao-e-
-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
CUNHA, Celso. Gramática básica do português contemporâneo. In: AULE-
TE Digital. Gramática básica. Disponível em: http://www.aulete.com.br/site.
php?mdl=gramatica. Acesso em: 15 out. 2021.
DIAS, Eduardo Wense; NAVES, Madalena Martins Lopes. Análise de assun-
to: teoria e prática. Brasília: Briquet de Lemos, 2013.
DICIONÁRIO da língua portuguesa: dicionários editora. Porto: Porto Editora, 2004.
DOBEDEI, Vera; GUIMARÃES, José Augusto Chaves (orgs). Complexidade e
organização do conhecimento, desafios de nosso século. Rio de Janeiro:
ISKO-Brasil; Marília: FUNDEPE, 2013. Série: Estudos Avançados em Organi-
zação do Conhecimento, v. 2. Disponível em: https://isko.org.br/publicacoes/
serie-estudos-avancados-em-organizacao-e-representacao-do-conhecimen-
to/. Acesso em: 20 out. 2021.
FAIRTHORNE, Robert A. Content analysis, specification and control. Annual
Review of Information Science and Technology, v. 4, p. 73-109. 1969.

sumário
88
FARIA, Maria Isabel; PERICÃO, Maria da Graça. Dicionário do livro: da escri-
ta ao livro electrónico. Coimbra: Almedina, 2008.
FERREIRA, António Gomes. Dicionário de latim-português. Porto:
Porto Codex, 1987.
FOSKETT, Antony Charles. A abordagem temática da informação. São Paulo;
Brasília: Editora da Universidade de Brasília; Editora Polígono, 1973.
FUJITA, Mariângela Spotti Lopes. Sistema de indexação precis. I – PRECIS:
perspectiva histórica e técnica do seu desenvolvimento e aplicação (conti-
nua). Revista Brasileira de Biblioteconomia e Documentação, São Paulo,
v. 21, n. 1/2, p. 21-45. 1988.
GUEDES, Emanuel Guedson Ferrerira. O conceito de aboutness na organi-
zação e representação do conhecimento. 2009. 90 f. Dissertação (Mestra-
do em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universi-
dade Estadual Paulista, Marília, 2009.
GUIM, Vera Lucia Ribeiro; FUJITA, Mariângela Spotti Lopes. As linguagens de
indexação e a análise de domínio. In: GUIMARÃES, José Augusto Chaves;
DODEBEI, Vera (orgs). Organização do conhecimento e diversidade
cultural. Marília: ISKO-Brasil: FUNDEPE, 2015. Série: Estudos Avançados
em Organização do Conhecimento, v. 3. Disponível em: https://isko.org.br/
publicacoes/serie-estudos-avancados-em-organizacao-e-representacao-do-
-conhecimento/. Acesso em: 20 out. 2021.
GUIMARÃES, José Augusto Chaves. A dimensão teórica do tratamento temá-
tico da informação e suas interlocuções com o universo científico da Interna-
tional Society for Knowledge Organization (ISKO). Revista Ibero-Americana
de Ciência da Informação, Brasília, v. 1, n. 1, p. 77-99, jan./jun. 2008.
GUIMARÃES, José Augusto Chaves. Abordagens teóricas de tratamento
temático da informação: catalogação de assunto, indexação e análise docu-
mental. Ibersid, Zaragoza, v. 3, p. 105-117. 2009.
GUIMARÃES, José Augusto Chaves; DODEBEI, Vera (orgs). Desafios e
perspectivas científicas para a organização e representação do conheci-
mento na atualidade. Marília: ISKO-Brasil: FUNDEPE, 2012. Série: Estudos
Avançados em Organização do Conhecimento, v. 1. Disponível em: https://
isko.org.br/publicacoes/serie-estudos-avancados-em-organizacao-e-repre-
sentacao-do-conhecimento/. Acesso em: 20 out. 2021.
GUIMARÃES, José Augusto Chaves; DODEBEI, Vera (orgs). Organização do
conhecimento e diversidade cultural. Marília: ISKO-Brasil: FUNDEPE, 2015.

sumário
89
Série: Estudos Avançados em Organização do Conhecimento, v. 3. Disponí-
vel em: https://isko.org.br/publicacoes/serie-estudos-avancados-em-organi-
zacao-e-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
HENDERSON, Madeline M. Calvin N. Mooers, October 24, 1919 - December
1, 1994. Journal of the American Society for Information Science, Mary-
land, n. 47, n. 9, p. 659-661. 1996.
HJØRLAND, Birger. Subject (of Documents). Knowledge Organization,
Würzburg, v. 44, n. 1, p. 55-64. 2017.
HJØRLAND, Birger. The concept of “subject” in information science. Journal
of Documentation, London, v. 48, n. 2, p. 172-200. 1992.
HJØRLAND, Birger. Towards a theory of aboutness, subject, topicality, theme,
domain, field, content... and relevance. Journal of the American Society for In-
formation Science and Technology, Maryland, v. 52, n. 9, p. 774-778, jul. 2001.
HODGE, Gail. Systems of Knowledge Organization for digital libraries:
beyond traditional authority files. Washington, DC: The Digital Library Fede-
ration, 2000. Disponível em <http://old.diglib.org/pubs/dlf090/dlf090.pdf.>.
Acesso em: 20 out. 2021.
HUTCHINS, John W. On the problem of “aboutness” in document analysis.
Journal of Informatics, v. 1, n. 1, p. 17-35, April. 1977.
HUTCHINS, John W. The concept of ‘aboutness’ in subject indexing. Aslib
Proceedings, v. 30, n. 5, p. 172-181. 1978.
LANCASTER, Frederick Wilfrid. Indexação e resumos: teoria e prática. 2. ed.
Brasília: Briquet de Lemos, 2004.
LARA, Marilda Lopes Ginez de. Dos sistemas de classificação bibliográfica
às search engines (II). São Paulo: Associação Paulista de Bibliotecários,
2001 (Ensaios APB, n. 91).
LITTON, Gaston. Classificação e catálogos. São Paulo: Mcgraw-hill, 1971.
MANN, Margaret. Catalogação e classificação de livros. Rio de Janeiro:
Editôra Fundo de Cultura, 1962.
MARCONDES, Carlos H. Organização e representação do conhecimento em
ambientes digitais: as relações entre ontologia e Organização do Conheci-
mento. In: GUIMARÃES, José Augusto Chaves; DODEBEI, Vera (orgs). De-
safios e perspectivas científicas para a organização e representação do
conhecimento na atualidade. Marília: ISKO-Brasil: FUNDEPE, 2012. Série:
Estudos Avançados em Organização do Conhecimento, v. 1. Disponível em:

sumário
90
https://isko.org.br/publicacoes/serie-estudos-avancados-em-organizacao-e-
-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
MEDEIROS, Graziela Martins de; LINDEN, Leolíbia Luana; VITAL, Luciane
Paula; BRÄSCHER, Marisa. A representação de assunto no escopo da
arquivologia: uma análise de artigos científicos nacionais e internacionais. In:
GUIMARÃES, José Augusto Chaves; DODEBEI, Vera (orgs). Organização do
conhecimento e diversidade cultural. Marília: ISKO-Brasil: FUNDEPE, 2015.
Série: Estudos Avançados em Organização do Conhecimento, v. 3. Disponí-
vel em: https://isko.org.br/publicacoes/serie-estudos-avancados-em-organi-
zacao-e-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
METCALFE, John. When is a Subject not a Subject? In: RAWSKI, Conrad
H. (ed.). Towards a theory of Librarianship. New York: Scarecrow Press,
1973. p. 303-338.
MIKSA, Francis Louis. The legacy of the library catalogue for the present.
Library Trends, Champaign, v. 61, n. 1, p. 7-34. 2012.
MILANI, Suellen de Oliveira; GUIMARÃES, José Augusto Chaves. Proble-
mas relacionados a biases em Sistemas de Organização do Conhecimento:
perspectivas para a representação de assunto. In: PINHO, Fabio Assis;
GUIMARÃES, José Augusto Chaves (orgs). Memória, tecnologia e cultura
na organização do conhecimento. Recife: Ed. UFPE, 2017. Série: Estudos
Avançados em Organização do Conhecimento, v. 4. Disponível em: https://
isko.org.br/publicacoes/serie-estudos-avancados-em-organizacao-e-repre-
sentacao-do-conhecimento/. Acesso em: 20 out. 2021.
MIRANDA, Marcos Luiz Cavalcanti de; SILVA, Fábio Gomes da. O Islamismo
na CDD e CDU: religião e cultura periféricas nos esquemas de classifica-
ção bibliográfica. In: BARROS, Thiago Henrique Bragato; TOGNOLI, Natalia
Bolfarini (orgs). Organização do conhecimento responsável: promovendo
sociedades democráticas e inclusivas. Belém: ED. da UFPA, 2019. Série:
Estudos Avançados em Organização do Conhecimento, v. 5. Disponível em:
https://isko.org.br/publicacoes/serie-estudos-avancados-em-organizacao-e-
-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
MOOERS, Calvin N. The indexing language of an information retrieval
system. In: CHAN, Lois Mai; RICHMOND, Phyllis A.; SVENONIUS, Elaine
(eds.). Theory of subjects analysis: a sourcebook. Colorado: Libraries
Unlimited, 1985. p. 247-261.
MOOERS, Calvin N. Zatocoding applied to mechanical organization of kno-
wledge. American Documentation, v. 2, p. 20-32, jan. 1951. Disponível em:

sumário
91
https://courses.engr.illinois.edu/cs473/fa2013/misc/zatocoding.pdf.
Acesso em: 22 nov. 2021.
MORAES, João Batista; GUIMARÃES, José Augusto Chaves. Análise docu-
mental de conteúdo de textos literários: em busca do diálogo entre as con-
cepções de aboutess/meaning e de percurso temático/percurso figurativo.
Scire, Zaragoza, v. 12, n. 1, en./jun. 2006.
PEIXOTO, Jorge. Técnica bibliográfica: subsídio para a bibliografia portu-
guesa. II parte – catalogação. Coimbra: Atlântida, 1962.
PENNA, Carlos Victor. Catalogacion y classificacion de libros. Buenos
Aires: ACME Agency, 1945.
PINHO, Fabio Assis; GUIMARÃES, José Augusto Chaves (orgs). Memória,
tecnologia e cultura na organização do conhecimento. Recife: Ed. UFPE,
2017. Série: Estudos Avançados em Organização do Conhecimento, v. 4.
Disponível em: https://isko.org.br/publicacoes/serie-estudos-avancados-em-
-organizacao-e-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
PINHO, Fabio Assis; MILANI, Suellen de Oliveira. Metáfora e ortofemismo na
representação de assunto. In: DOBEDEI, Vera; GUIMARÃES, José Augusto
Chaves (orgs). Complexidade e organização do conhecimento, desafios
de nosso século. Rio de Janeiro: ISKO-Brasil; Marília: FUNDEPE, 2013. Sé-
rie: Estudos Avançados em Organização do Conhecimento, v. 2. Disponível
em: https://isko.org.br/publicacoes/serie-estudos-avancados-em-organiza-
cao-e-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
REITZ, Joan M. Online Dictionary for Library and Information Science.
Califórnia: ABC-CLIO Corporate, 2014. Disponível em: https://www.abc-clio.
com/ODLIS/odlis_s.aspx. Acesso em: 22 nov. 2021.
ROVIRA, Carmen. Los epigrafes en el catalogo diccionário. 2. ed. rev.
Washington: Union Panamericana, 1966.
SALDANHA, Gustavo Silva; SILVEIRA, Naira Christofoletti. Poole, o índice e as
fraturas: indexação e publicações seriadas nos Estados Unidos do oitocentos.
In: GUIMARÃES, José Augusto Chaves; DODEBEI, Vera (orgs). Organização
do conhecimento e diversidade cultural. Marília: ISKO-Brasil: FUNDEPE,
2015. Série: Estudos Avançados em Organização do Conhecimento, v. 3.
Disponível em: https://isko.org.br/publicacoes/serie-estudos-avancados-em-or-
ganizacao-e-representacao-do-conhecimento/. Acesso em: 20 out. 2021.
SHARP, Henry Alexander. Cataloging: a textbook for use in libraries. Lon-
don: Allied Publishers Private, 1964. Disponível em: https://archive.org/

sumário
92
stream/in.ernet.dli.2015.533483/2015.533483.cataloguing-a#page/n5/mo-
de/2up. Acesso em: 22 nov. 2021.
SIMÕES, Maria da Graça de Melo. Do conceito e dos princípios metodológicos
de indexação. Subsídios para uma análise crítica. In: JORENTE, Maria José
Vicentini; PADRÓN, Dunia Ilanes (orgs.). Una mirada a la ciencia de la infor-
mación desde los nuevos contextos paradigmáticos de la posmodernidad.
Marília: Oficina Universitária; São Paulo: Cultura Acadêmica, 2017. p. 151-176.
TAYLOR, Arlene G. On the subject of subjects. The Journal of Academic
Librarianship, v. 21, n. 6, p. 484-491, nov. 1995.
TAYLOR, Margaret S. Fundamentals of practical cataloguing. London: Geor-
ge Allen and Unwin, 1948.

sumário
93
3
Capítulo 3

A indeterminação ontológica
dos conceitos: interpretações
linguísticas e psicológicas

The ontologic indetermination


of concepts: linguistic and
psychological interpretations
Luís Miguel Oliveira Machado

Wilson Roberto Veronez Júnior


Luís Miguel Oliveira Machado
Daniel Martínez-Ávila
Wilson Roberto Veronez Júnior

A indeterminação
Daniel Martínez-Ávila

ontológica dos conceitos:


interpretações linguísticas
e psicológicas

The ontologic
indetermination of concepts
linguistic and psychological
interpretations

DOI: 10.31560/pimentacultural/2022.95613.3
Resumo:
No âmbito da Organização do Conhecimento (OC), o foco ontológico encon-
tra-se pouco presente em estudos relativos à natureza do conceito. O estudo
apresenta uma análise com esse propósito, questionando possíveis modos
de existência dos conceitos (como representações mentais, habilidades cog-
nitivas ou objetos abstratos), enquadrados em quatro diferentes leituras: a
linguística, a psicológica, a epistemológica e a ontológica, com enfoque nas
duas primeiras. A adequação à utilização do conceito como unidade elementar
dos Sistemas de Organização do Conhecimento (SOC) é analisada de acordo
com as diferentes perspectivas sobre este. De entidade mental, passando para
outra existente em um reino não mental, embora também não físico, seguindo
para uma outra com existência linguística objetiva.

Palavras-Chave: Conceito; ontologia; organização do conhecimento; sistemas


de organização do conhecimento.

sumário
95
Abstract:
In the context of Knowledge Organization (KO) the ontological focus is sometimes
overlooked in studies related to the nature of the concept. This study presents an
analysis with this purpose, questioning possible modes of existence of concepts
(such as mental representations, cognitive abilities or abstract objects), framed in
four different readings: a linguistic one, the psychological one, the epistemological
one, and the ontological one; and focuses on the two first ones. The suitability
of using the concept as an elementary unit of Knowledge Organization Systems
(KOS) is analyzed according to the different perspectives. From a mental entity,
passing to another one that exists in a non-mental realm, although also non-physi-
cal, moving on to another one with an objective linguistic existence.

Keywords: Concept; ontology; knowledge organization; knowledge organization


systems.

sumário
96
1 INTRODUÇÃO

Os estudos relativos ao conceito, enquanto objeto de estudo


em si mesmo, são de grande relevância para a Organização do Co-
nhecimento (OC), entendida como área ou domínio disciplinar. Essa
importância é enfatizada por Van den Heuvel e Smiraglia (2010) que
apontam como central para a “ciência da ordem do conhecimento” o
estudo desse “fenômeno inexplicável”:
Como é que a ordem do que é conhecido pode depender de
um fenómeno inexplicável? E, ainda assim, é nesse contexto
que o domínio da organização do conhecimento se encontra.
Enquanto não efetuarmos uma exploração aprofundada e empí-
rica relativa aos parâmetros do fenômeno central do “conceito”
não compreenderemos completamente a ciência da ordem do
conhecimento.” (VAN DEN HEUVEL; SMIRAGLIA, 2010, p. 54,
tradução livre dos autores7).

No âmbito da OC, o foco ontológico encontra-se pouco presente


em estudos relativos ao conceito, em que predomina uma abordagem
essencialmente epistemológica, (e.g., HJØRLAND, 2009; MACHADO;
MARTÍNEZ; SIMÕES, 2019; MACULAN; LIMA, 2017; MARRADI, 2012;
SMIRAGLIA; VAN DEN HEUVEL, 2013). As duas abordagens ao estudo
dos conceitos, a ontológica e a epistemológica, não deverão ser con-
fundidas com as possíveis leituras para o termo conceito.

No que diz respeito às diferentes leituras, quatro grandes in-


terpretações poderão ser descritas: a linguística, a psicológica, a
epistemológica e a ontológica. Uma possível análise ontológica seria
questionar o modo de existência dos conceitos associados a essas

7 Texto original: “how can it be that the order of that which is known is dependent upon the
behavior of an unexplained phenomenon? And yet that is where the domain of knowledge or-
ganization finds itself. Until we thoroughly and empirically explore the parameters of the central
phenomenon of “concept” we will not fully understand the science of the order of knowledge.”

sumário
97
leituras, na linha da descrição efetuada por Smith (2008, p. 84, ênfase
no original, tradução livre dos autores8):
Na visão linguística, os conceitos são termos gerais cujos sig-
nificados foram de alguma forma regulados (ou, em algumas
variantes, os conceitos são esses próprios significados). Na vi-
são psicológica, os conceitos são entidades mentais análogas
a ideias ou crenças. Na visão epistemológica, os conceitos são
unidades de conhecimento, tais como o conceito de gato ou de
quadrado de uma criança. E na visão ontológica, os conceitos
são abstrações de tipos ou de propriedades (ou seja, de pa-
drões invariantes gerais) pertencentes a entidades do mundo.

Esses possíveis modos de existência dos conceitos não se


encontram em uma relação unívoca de subsunção com os três
possíveis estatutos ontológicos apontados por Margolis e Lauren-
ce (2019, sec. 1). Desses três estatutos – representações mentais,
habilidades cognitivas ou objetos abstratos –, apenas se encontra
uma correspondência direta entre as entidades associadas à leitura
psicológica e às representações mentais, para as restantes varia-
ções, a relação apresenta-se mais complexa.

Pela descrição da citação de Smith, é possível conformar as


“abstrações de gêneros e propriedades” tanto ao estatuto de objetos
abstratos quanto ao de habilidades cognitivas, situação indicada na
posição de Lowe (2006, p. 85). Para esse autor, os conceitos seriam
“formas de pensar ou apreender entidades”, isto é, seriam proprie-
dades mentais que, de uma forma geral, os sujeitos cognoscentes
possuem e, de forma individual, os conceitos seriam modos particu-
lares de um indivíduo apreender o que o rodeia: “um conceito, assim,
é um modo pelo qual alguém pode estar pensando em uma entidade.
Entendidos como universais, os conceitos são atributos mentais e

8 Texto original: “on the linguistic view, concepts are general terms whose meanings have
been somehow regimented (or, as on some variants of the view, they are these meanings
themselves). On the psychological view, concepts are mental entities analogous to ideas or
beliefs. On the epistemological view, concepts are units of knowledge, such as your child’s
concept of a cat or of a square. And on the ontological view, concepts are abstractions of
kinds or of properties (i.e., of general invariant patterns) belonging to entities in the world.”

sumário
98
entendidos como particulares são modelos mentais. Os objetos que
os possuem são sujeitos pensantes, isto é, pessoas” (LOWE, 2006,
p. 85, ênfase no original, tradução livre dos autores9).

Similarmente, nas “unidades do conhecimento”, pode-se asso-


ciar os dois estatutos como aparenta ser o caso da visão dos conceitos
como “unidades funcionais” dos SOC, de Peponakis e outros, em que
a perspectiva psicológica é também integrada:
Reconhecendo que a noção de conceito é multifacetada, es-
tudamos os conceitos no contexto mais amplo da cognição
e no contexto dos SOCs com base no princípio de que ‘os
conceitos devem ser considerados os blocos de construção
de todas os tipos de SOC’ [7, p. 38]. Todos os tipos de SOCs,
verbais ou não, baseiam-se na capacidade da mente huma-
na de criar e gerenciar categorias; os SOCs do domínio BCI
não são excepção. Claramente, nem todas as categorizações
constituem uma classificação [15]; contudo, a categorização
é uma pré-condição.” (PEPONAKIS et al., 2019, p. 435–436,
ênfase no original, tradução livre dos autores10).

Quanto aos “termos gerais,” estes podem ser encarados como


um conjunto estruturado de sinais usados para “materializar” uma en-
tidade não substancial como serão os significados: “porque não po-
demos perceber com os nossos sentidos o próprio significado, sendo
este uma entidade abstrata, podemos nos relacionar apenas com os
conjuntos de signos que o representam (isto é, com proposições escri-
tas, faladas ou fisicamente expressas),” (ZINS, 2007, p. 487, tradução
livre dos autores11). Mesmo no contexto dos vocabulários controlados,
9 Texto original: “a concept, then, is a way someone can be thinking of an entity. Understood
as universals, concepts are mental attributes and understood as particulars they are mental
models. The objects that possess them are thinking subjects, that is, persons.”
10 Texto original: “acknowledging that the notion of concept is multi-layered, we study con-
cepts in the wider context of cognition and in the context of KOSs based on the principle
that “concepts should be considered the building blocks of all forms of KOS” [7, p. 38]. All
types of KOSs, verbal or not, are based on the ability of the human mind to create and ma-
nage categories; KOSs of the LIS domain are no exception. Clearly, not every categorization
constitutes a classification [15]; however, categorization is a precondition.”
11 Texto original: “because we cannot perceive with our senses the meaning itself, which is
an abstract entity, we can relate only to the sets of signs (i.e., written, spoken, or physically
expressed propositions), which represent it.”

sumário
99
no qual é possível uma relação de um-para-um entre termos e signi-
ficados, os termos são encarados como “etiquetas” ou “representa-
ções” dos respectivos significados (HARPRING, 2010, p. 16; PEPO-
NAKIS et al., 2019, p. 435). Ontologicamente, os significados desses
termos gerais poderão ser encarados pelas três perspectivas. Embora
talvez a mais óbvia seja a referida por Zins, como entidades abstra-
tas, seguindo a tradição dos sentidos de Gottlob Frege (1848-1925) ou
uma versão “algorítmica” mais atual:
Deve-se notar, no entanto, que algoritmos são, em algum sentido,
‘coisas’, ‘entidades’ ou ‘objetos’ e que as palavras por eles usa-
das são nomes para as coisas que estes ‘chamam’ ou ativam;
assim, aqueles que postularam entidades platônicas para os sig-
nificados podem não estar inteiramente errados, embora, como
é óbvio, não tenham previsto entidades complexas ou abstratas
como os algoritmos. … Esta abordagem ‘procedural’ ou ‘algorít-
mica’ do significado tem algo de comportamental ou experimen-
tal” (GOGUEN, 1974, p. 546, tradução livre dos autores12).

A abordagem processual de Goguen leva também a um en-


tendimento dos significados como habilidades. Perspectiva igual-
mente presente na abordagem ao significado de Thornley e Gibb,
a qual foi influenciada pela posição tardia de Ludwig Wittgenstein
(1889-1951)13, enfatizando a relevância do “contexto sobre o conteú-
do para o estudo do significado” (THORNLEY & GIBB, 2009, p. 134).
Nessa abordagem, os autores aliam o uso contextual do significado

12 Texto original: “it should be noted, however, that algorithms are “things”, “entities”, or
“objects”, in some sense, and that words are then names for the things they “call” or acti-
vate; thus those who postulated Platonic entities for meanings may not have been entirely
wrong, although they did not of course envisage any such complex or abstract entities. …
This “procedural” or “algorithmic” approach to meaning has something of a behavioral or
experimental tinge to it.
13 A distinção entre as duas posições de Wittgenstein, a primeira expressa no “Tractatus
Logico-Philosophicus” (1922) e a segunda na obra “Investigações Filosóficas” (1953), é
comumente efetuada com as designações, respetivamente, “Wittgenstein inicial” (early Wit-
tgenstein) e “Wittgenstein tardio” (later Wittgenstein). Na abordagem inicial, o filósofo segue
a linha da linguagem ideal procurando uma “aplicação da lógica moderna à metafísica,”
na segunda, Wittgenstein “critica toda a filosofia tradicional”, incluindo a sua própria fase
inicial, enveredando pela filosofia da linguagem comum, desenvolvendo as teorias dos
“jogos de linguagem” e da “semelhança de família” (BILETZKI & MATAR, 2020).

sumário
100
à experiência subjetiva do entendimento desse mesmo significado,
implicando alguma forma de representação mental:
Neste documento, o significado é entendido como uma relação
complexa e frequentemente conflituosa entre o subjetivo e o ob-
jetivo (Thornley, 2005; Thornley e Gibb, 2007). A relação entre
conteúdo e contexto existe no âmbito da relação geral subjetivo/
objetivo. O conteúdo é normalmente do que se trata o significa-
do no sentido daquilo a que se refere. Esse conteúdo pode ser
entendido tanto como um objeto externo quanto como a expe-
riência subjetiva de compreender o significado da palavra que
descreve o objeto. Assim, argumenta-se que, em alguns casos,
o significado é melhor compreendido procurando a sua refe-
rência ou conteúdo, mas esse processo só pode ser entendido
dentro do contexto mais amplo de seu uso e propósito (THORN-
LEY; GIBB, 2009, p. 134–135, tradução livre dos autores14).

A dificuldade em individualizar um estatuto ontológico para cada


uma das quatro leituras, à exceção da perspectiva psicológica, aliada
à presença desta, explícita ou implícita, em várias abordagens de dife-
rentes autores, será indicativa da sua centralidade nesta questão. Ra-
zão pela qual se considera relevante aprofundar um pouco mais esta.

2 REPRESENTAÇÕES MENTAIS

Defensores da leitura psicológica, Laurence e Margolis descre-


vem os conceitos como “representações mentais particulares subpro-
posicionais”:

14 Texto original: “in this paper meaning is understood as a complex and often conflicting rela-
tionship between the subjective and the objective (Thornley, 2005; Thornley and Gibb, 2007).
The relationship between content and context exists within the general subjective/objective
relationship. Content is normally what meaning is about in the sense of that to which it refers.
This content can be understood as both an external object and also the subjective experience
of understanding the meaning of the word that describes the object. Thus it is argued that in
some cases meaning is best understood by looking for its reference or content but that this
process can only be understood within the broader context of its use and purpose.”

sumário
101
As representações no nível de pensamentos completos – isto é,
aqueles que podem expressar proposições inteiras – são gran-
des demais para serem conceitos. Consequentemente, toma-
remos os conceitos como representações mentais subpropo-
sicionais. ... De acordo com praticamente todas as discussões
de conceitos em psicologia, assumiremos que os conceitos são
pormenores mentais.” (LAURENCE; MARGOLIS, 1999, p. 4-5,
ênfase no original, tradução livre dos autores15).

Para esses autores, os outros dois estatutos ontológicos, os


conceitos como habilidades ou como objetos abstratos, são compatí-
veis com a sua própria perspectiva. Enquanto habilidades, os autores
rejeitam liminarmente que estas possam ser comportamentais aten-
dendo às limitações que estes implicam: “o behaviorismo nos limita
a disposições causais, mas mesmo as tarefas cognitivas simples ten-
dem a exigir processos psicológicos extensos – cadeias complexas
em que um estado mental causa um outro” (MARGOLIS; LAURENCE,
2007, p. 591 [nota 21], tradução livre dos autores16). Enquanto habili-
dades psicológicas, não só estas seriam compatíveis com a visão dos
autores como estariam dependentes de processos e representações
mentais subjacentes (LAURENCE; MARGOLIS, 1999, p. 5 [nota 3]).

Em relação à perspectiva dos conceitos como objetos abstra-


tos, é necessário, primeiramente, clarificar a diferença entre esta e a
defendida por Margolis e Laurence. Na “visão psicológica”, defendida
pelos autores (MARGOLIS; LAURENCE, 2007, p. 563, 565, tradução
livre dos autores17): “conceitos são representações mentais; eles são os

15 Texto original: “representations at the level of complete thoughts—that is, ones that may ex-
press whole propositions—are too big to be concepts. Accordingly, we will take concepts to
be subpropositional mental representations. … In accordance with virtually all discussions
of concepts in psychology, we will assume that concepts are mental particulars.”
16 Texto original: “behaviorism limits us to causal dispositions, yet even simple cognitive tasks
tend to require extensive psychological processes—complex chains where one mental sta-
te causes another.”
17 Texto original: “concepts are mental representations; they are the constituents of proposi-
tional attitudes such as beliefs and desires. … Concepts are abstract objects; they are the
constituents of Fregean propositions.”

sumário
102
constituintes de atitudes proposicionais tais como crenças e desejos”;
enquanto na “visão semântica”, baseada nos sentidos fregeanos, “con-
ceitos são objetos abstratos; eles são os constituintes de proposições
Fregeanas”. O ponto que os autores entendem ser distintivo entre am-
bas se encontra na admissão ou não da existência de conceitos particu-
lares (token concepts), além da sua “forma partilhada” (type concepts):
Seguimos Sutton ao tomar como ponto central o facto de, em
tais pontos de vista [onde os conceitos são objetos abstratos],
os conceitos individuais não admitirem uma distinção de tipo-to-
ken. Em contraste, a Visão Psicológica abraça totalmente a ideia
de que os conceitos têm tokens (tokens de conceitos exem-
plares são tokens de representações mentais).” (MARGOLIS;
LAURENCE, 2007, p. 587 [nota 7], tradução livre dos autores18).

Admitindo a distinção, Laurence e Margolis (1999) argumen-


tam ser possível sustentar a visão dos conceitos serem representa-
ções mentais particulares e, simultaneamente, ser possível partilhar
o “mesmo conceito”:
Quando alguém diz que duas pessoas têm o mesmo conceito,
não há necessidade de supor que ela esteja dizendo que ambas
possuem o mesmo token de conceito. Faria tanto sentido dizer
que duas pessoas não podem proferir a mesma sentença porque
ambas não podem produzir o mesmo token de sentença. Clara-
mente, o que importa para poder pronunciar a mesma frase, ou
manter o mesmo conceito, é poder ter tokens do mesmo tipo”
(MARGOLIS; LAURENCE, 1999, p. 7, tradução livre dos autores19).

18 Texto original: “we follow Sutton in taking the central point to be that on such views [where
concepts are abstract objects] individual concepts don’t admit of a type-token distinction. In
contrast, the Psychological View fully embraces the idea that concepts have tokens (token
concepts are token mental representations).” O termo “token” apresenta dificuldades na
tradução para a língua portuguesa, embora de forma aproximada se possa usar termos
como “particular” ou “exemplar,” entendeu-se ser preferível manter o termo original.
19 Texto original: “when someone says that two people have the same concept, there is no need
to suppose that she is saying that they both possess the same token concept. It would make
as much sense to say that two people cannot utter the same sentence because they cannot
both produce the same token sentence. Clearly what matters for being able to utter the same
sentence, or entertain the same concept, is being able to have tokens of the same type.”

sumário
103
Uma vantagem, de acordo com os autores citados, dessa
perspectiva está nela continuar consistente, com ou sem os sentidos
fregeanos. A razão para tal está na afirmação que as representações
mentais têm significados e não que estas são significados. Deixando
em aberto a questão desses significados serem entidades, Margolis
e Laurence tornam a sua “visão psicológica” compatível com as duas
alternativas: com a reivindicação destes serem entidades, nomeada-
mente sentidos fregeanos; como com a posição que argumenta não
existirem tais entidades (MARGOLIS; LAURENCE, 2007, p. 590 [nota
14]). Os sentidos, independentemente do seu estatuto ontológico,
são usados pelos autores para auxiliar a explicar a tipificação das
representações mentais e proporcionar parte das condições neces-
sárias à individualização de conceitos:
Neste modelo, as crenças e outras atitudes proposicionais
envolveriam tokens de representações mentais que têm ou-
tras representações—conceitos—como seus constituintes.
Os sentidos seriam os valores semânticos destas representa-
ções. Ou seja, além de ter objetos e propriedades mundanas
como seus referentes, as representações mentais (como as
palavras, no relato original de Frege) também teriam sentidos.
Desta forma, os sentidos ajudam a tipificar a representação
mental; eles fornecem parte das condições para individualizar
conceitos” (MARGOLIS; LAURENCE, 1999, p. 8, ênfase adicio-
nada, tradução livre dos autores20).

A compatibilidade referida, entre a visão psicológica e os obje-


tos abstratos da visão semântica, resulta na “visão mista dos concei-
tos” que procura incorporar os pontos fortes das duas tradições:
A Visão Mista visa combinar as forças explicativas das duas
tradições dominantes no estudo dos conceitos. Seguindo a Vi-
são Psicológica, ela abraça de forma plena as representações

20 Texto original: “On this model, beliefs and other propositional attitudes would involve token
mental representations that have other representations—concepts—as their constituents.
Senses would come in as the semantic values of these representations. That is, in addi-
tion to having worldly objects and properties as their referents, mental representations (like
words, on Frege’s original account) would have senses too. In this way, senses help to type
mental representation; they provide part of the conditions for individuating concepts.”

sumário
104
mentais. As representações mentais explicam a produtividade
do pensamento e o facto de que os processos mentais pode-
rem ser, de uma só vez, físicos e lógicos. Ao mesmo tempo,
seguindo a Visão Semântica, o apelo aos sentidos fornece uma
explicação para o facto de duas expressões (incluindo duas
expressões mentais) poderem ter a mesma referência, mas
terem um significado cognitivo diferente. A sugestão é das re-
presentações mentais poderem apresentar um referente de di-
ferentes formas em virtude da expressão de sentidos diferentes.
Os sentidos continuam a ser entidades intermediárias, situando-se
entre expressões e referências, só que agora as expressões em
questão ocorrem num sistema interno de representação” (MAR-
GOLIS; LAURENCE, 2007, p. 569, tradução livre dos autores21).

Se bem que Margolis e Laurence considerem a “visão mista”


coerente, não a defendem. Para os autores, a visão psicológica, além
de explicar a produtividade do pensamento humano e os aspectos
físicos e lógicos dos processos mentais, não necessita recorrer a
entidades abstratas, como os sentidos fregeanos, para explicar como
diferentes expressões com o mesmo referente podem ter distintos
significados cognitivos ou “modos de apresentação,” como diria Fre-
ge (1892/1948, p. 210). Esses modos são identificados com “proprie-
dades mentais” e não com objetos abstratos de um “terceiro reino”,
como os sentidos fregeanos:
A Visão Psicológica tem várias opções promissoras para lidar
com este problema [do modo de apresentação]. O que estes
partilham é a ideia de que os modos de apresentação devem
ser identificados com propriedades de representações men-
tais. Ao psicologizar os modos de apresentação, já não há um
enigma sobre como são apreendidos ou porque não podem ser

21 Texto original: “the Mixed View aims to combine the explanatory strengths of the two do-
minant traditions in the study of concepts. Following the Psychological View, it wholehear-
tedly embraces mental representations. Mental representations explain the productivity of
thought and the fact that mental processes can be, at once, physical and rational. At the
same time, following the Semantic View, the appeal to senses provides an explanation for
the fact that two expressions (including two mental expressions) can have the same refe-
rent yet differ in cognitive significance. The suggestion is that mental representations can
present a referent in different ways in virtue of expressing different senses. Senses continue
to be intermediary entities, standing between expressions and referents, only now the ex-
pressions in question occur in an internal system of representation.”

sumário
105
apreendidos de diferentes maneiras. Isto é pela simples razão
de já não existir uma lacuna entre as mentes e os modos de re-
presentação. Os modos de apresentação estão diretamente in-
corporados nas nossas mentes e no seu funcionamento” (MAR-
GOLIS; LAURENCE, 2007, p. 581, tradução livre dos autores22).

A potencial solução para a apreensão de diferentes modos de


apresentação ou sentidos para o mesmo referente, apresentada por
esta visão psicológica dos conceitos, acresce às vantagens proces-
suais enumeradas. Apesar desse potencial explicativo, se o posiciona-
mento relativo aos conceitos não for operacional, a colocação destes
na mente não será adequada ao seu uso como unidades elementares
dos SOC. Quanto aos abstratos “conceitos-tipo partilháveis”, dentro
da visão psicológica, estes não deixam de ser considerados mentais,
como é possível verificar na exposição de Davis (2003 p. 312, 314, 317,
ênfase no original, tradução livre dos autores23):
Os pensamentos neste sentido [no sentido objetivo] são eventos,
especificamente, eventos mentais. Os pensamentos são o tipo de
eventos que ocorrem às pessoas ou outros seres inteligentes, e
qualquer ser em que um pensamento ocorre ipso facto tem uma
mente. Para que um pensamento ocorra é necessário a ocorrên-
cia de um ato de pensar. Os pensamentos neste sentido são,
no entanto, eventos-tipo e não eventos-token. Os pensamentos
são de fato abstratos, mas apenas porque são eventos-tipo. Além
disso, o pensamento de que o céu é azul é um tipo de evento
mental. … Usaremos os termos ideia e conceito para significar
pensamentos ou partes cognitivas de pensamentos”.

22 Texto original: “the Psychological View has several promising options for dealing with this
[mode of presentation] problem. What these share is the idea that modes of presentation
are to be identified with properties of mental representations. By psychologizing modes
of presentation, there is no longer a puzzle about how they are grasped or why they can’t
be grasped in different ways. This is for the simple reason that there is no longer a gap
between minds and modes of representations. Modes of presentation are directly built
into our minds and how they function.”
23 Texto original: “thoughts in this sense [in the objective sense] are events, specifically, mental
events. Thoughts are the sorts of events that occur to people or other intelligent beings,
and any being to which a thought occurs ipso facto has a mind. For a thought to occur
is for some thinking to take place. Thoughts in this sense are event-types, however, rather
than event-tokens. … Thoughts are indeed abstract, but only because they are event-types.
Moreover, the thought that the sky is blue is a type of mental event. … We will use the terms
idea and concept to mean thoughts or cognitive parts of thoughts.”

sumário
106
O caráter subjetivo, inerente à representação mental dos con-
ceitos, não se adequa à objetividade pretendida para as unidades
dos SOC. Em contrapartida, na tese de Frege, essa caraterística ob-
jetiva é reclamada:
O próprio Frege descarta as representações mentais, alegando
que são muito subjetivas. Ele argumenta que a comunicação
requer significados compartilhados, mas que as pessoas não
podem literalmente ter as mesmas representações mentais,
uma vez que as representações mentais são componentes de
nossas experiências subjetivas individuais. Os sentidos, por ou-
tro lado, são objetivos e eminentemente compartilháveis” (MAR-
GOLIS; LAURENCE, 2007, p. 566, tradução livre dos autores24).

Na próxima seção, essa potencial ligação será explorada, pro-


curando-se clarificar a noção dos abstratos sentidos fregeanos.

3 ABSTRAÇÕES NÃO MENTAIS

A importância da tese de Frege para a OC, especificamente


no que concerne aos conceitos como unidade do conhecimento, é
explicitada por Dahlberg (1992 p. 65–66, ênfase no original, tradução
livre dos autores25):

24 Texto original: “Frege himself dismisses mental representations, claiming they are too
subjective. He argues that communication requires shared meanings but that people
can’t literally have the same mental representations since mental representations are
components of our individual subjective experiences. Senses, on the other hand, are
objective and eminently shareable.”
25 Texto original: “now, what indeed is a concept? The German philosophers Immanuel Kant
(3) and Gottlieb Frege (4) inferred already the generation of concepts by predication. Our
assumption that a concept is created by predicating about an object of concern, a so
called referent is rooted in the writings of these philosophers. … What we need to mention
here, however, is the understanding of a concept as a knowledge unit. In the preceding
section we stated that a concept is generated by predications. One cannot predicate a
true fact without expressing one’s knowledge of something. Thus every predication yields
a knowledge element and the necessary sum total of predications can be synthesized into
the corresponding knowledge unit.”

sumário
107
Agora, o que é de facto um conceito? Os filósofos alemães
Immanuel Kant (3) e Gottlieb Frege (4) inferiram já a geração
de conceitos por predicação. A nossa suposição de que um
conceito é criado pela predicação de um objeto de interesse,
o chamado referente, está enraizado nos escritos destes filó-
sofos. ... O que precisamos de mencionar aqui, contudo, é a
compreensão de um conceito como uma unidade de conheci-
mento. Na secção anterior, afirmámos que um conceito é ge-
rado por predições. Não se pode predicar um facto verdadeiro
sem se expressar o conhecimento de algo. Assim, cada pre-
dicação produz um elemento de conhecimento e a soma total
das predições necessárias pode ser sintetizada na unidade de
conhecimento correspondente.

Outro autor da área da OC, Frické, não limita a relação da tese de


Frege à fundamentação para o seu entendimento do que seria um con-
ceito. O autor faz corresponder a sua posição relativamente aos concei-
tos com os objetos abstratos existentes em um “terceiro reino fregeano”:
Então, o que é um conceito? Neste contexto, a palavra ‘con-
ceito’ é usada de forma bastante semelhante à do discurso
comum, equivalendo aproximadamente à de ‘noção geral’ ou
de ‘ideia geral’ ou mesmo de ‘significado’. Muitos descrevem
conceitos como sendo mentais ou construções mentais; con-
tudo, consideramo-los como abstrações ou objetos abstratos
(no padrão Fregeano do terceiro reino) (FRICKÉ, 2012, p. 33,
tradução livre dos autores26).

Frické relaciona esse “terceiro reino” de Frege ao “mundo 3” do


“conhecimento objetivo” de Karl Popper (1902-1994):
Frege invocou um ‘terceiro reino’. E esse terceiro reino consistia
em abstrações (que não eram ideias mentais ou psicológicas).
A visão de Frege foi mais tarde retomada por outros; por exemplo,
o filósofo do século XX Karl Popper distinguiu entre três mundos:

26 Texto original: “so, what is a concept? In this context, the word ‘concept’ gets used in
pretty well the same way as in ordinary speech and life, and that amounts roughly to ‘ge-
neral notion’ or ‘general idea’ or even ‘meaning’. Many describe concepts as being mental
or mental constructions; however, we regard them as abstractions or abstract objects (in
the standard Fregean third realm).”

sumário
108
o mundo físico, o mundo mental, e o mundo dos conteúdos abs-
tratos” (FRICKÉ, 2012, p. 30, tradução livre dos autores27).

A ligação é assumida pelo próprio Popper (1994, p. 106, tradu-


ção livre dos autores28): “o meu terceiro mundo assemelha-se mais ao
universo do conteúdo objetivo do pensamento de Frege”. Frege inclui
no seu “universo de conteúdo objetivo” os sentidos e os pensamentos,
distinguindo-os de um outro construto – as concepções, estas sim en-
tendidas como mentais e pessoais:
A concepção é subjetiva: a concepção de um homem não é a de
outro. ... Isso constitui uma distinção essencial entre a concepção
e o sentido do signo, que pode ser propriedade comum de mui-
tos e, portanto, não é uma parte ou um modo da mente individual.
Pois dificilmente se pode negar que a humanidade possui um
estoque comum de pensamentos que são transmitidos de uma
geração para outra. … Até agora consideramos o sentido e os
referentes apenas de tais expressões, palavras ou sinais que cha-
mamos de nomes próprios. Agora indagamos sobre o sentido e o
referente de uma sentença declarativa inteira. Tal frase contém um
pensamento.5 [nota 5: por pensamento entendo não o desempe-
nho subjetivo do pensamento, mas seu conteúdo objetivo, que
pode ser propriedade comum de vários pensadores” (FREGE,
1948, p. 212, 214 nota incluída, tradução livre dos autores29).

27 Texto original: “Frege invoked a ‘third realm’. And that third realm consisted of abstractions
(which were not mental or psychological ideas). Frege’s view was later taken up by others;
for example, the twentieth century philosopher Karl Popper distinguished between three
worlds: the physical world, the mental world, and the world of abstract contents.”
28 Texto original: “my third world resembles most closely the universe of Frege’s objective
contents of thought.”
29 Texto original: “The conception is subjective: One man’s conception is not that of another. …
This constitutes an essential distinction between the conception and the sign’s sense, which
may be the common property of many and therefore is not a part or a mode of the individual
mind. For one can hardly deny that mankind has a common store of thoughts which is trans-
mitted from one generation to another. … So far we have considered the sense and referents
only of such expressions, words, or signs as we have called proper names. We now inquire
concerning the sense and referent of an entire declarative sentence. Such a sentence contains
a thought.5 [note 5: by a thought I understand not the subjective performance of thinking but
its objective content, which is capable of being the common property of several thinkers.”

sumário
109
Na terminologia de Frege, não será o sentido e sim a conce-
ção que mais se aproxima do conceito da visão psicológica. Sendo a
subjetividade mental restrita às conceções, a objetividade dos objetos
físicos, por seu turno, não poderia ser idêntica à objetividade que o
filósofo atribui aos sentidos e pensamentos. Na tese de Frege, esses
sentidos e pensamentos assemelham-se, por um lado, às conceções
pelo fato de não serem perceptíveis aos cinco sentidos e, por outro,
aos objetos físicos pela sua natureza intersubjetiva e por não necessi-
tarem de um portador (BONEVAC, 2017, pt. 13:25). Similarmente à dis-
tinção type-token, relativa aos conceitos da visão psicológica, apenas
as manifestações de sentidos e pensamentos fregeanos necessitariam
de um portador. Entretanto, esses sentidos e pensamentos distinguem-
-se tanto das conceções quanto dos objetos físicos no modo como as
pessoas os podem possuir. Se o ato de obtenção, por parte de um ser
humano, de um objeto físico pode ser entendido como sendo extrínse-
co e o de uma conceção intrínseco, a apreensão (grasp) de um senti-
do é suposto ser um meio-termo entre os dois, embora com maiores
similaridades com a via intrínseca (BONEVAC, 2017, pt. 33:20).

A dificuldade está na clarificação deste ato de apreensão dos


sentidos: “mas em que consiste exatamente a apreensão? Claramente,
a apreensão é uma metáfora para uma relação cognitiva que precisa
de ser explicada” (MARGOLIS; LAURENCE, 2007, p. 580, tradução li-
vre dos autores30). Frege não só não clarifica essa questão como pare-
ce não lhe atribuir grande importância: “Frege não aborda diretamente
esta questão, nem parece estar preocupado com a pobreza fenome-
nológica da apreensão” (SCHWEIZER, 1991, p. 275, tradução livre dos
autores31). Não fosse a atribuição, da parte de Frege, de uma natureza
não mental aos sentidos e pensamentos, a solução dos “eventos-tipo
mentais” de Davis poderia ser uma resposta:

30 Texto original: “but what exactly does grasping consist in? Clearly, grasping is a metaphor
for a cognitive relation that needs to be explicated.”
31 Texto original: “Frege does not directly address this issue, nor does he seem to be concer-
ned with the phenomenological poverty of grasping.”

sumário
110
Para que você tenha o pensamento de que o céu é azul é neces-
sário que esse evento-tipo mental lhe ocorra. Daí que esse even-
to-tipo ocorra a um sujeito sempre e onde quer que este esteja
a pensar que o céu é azul. É isso que é ‘apreender’ ou ‘ter’ um
pensamento. Duas pessoas ‘partilham’ um pensamento se o
mesmo ocorrer a ambas. Um pensamento não tem localização
espaçotemporal em si, embora todos os seus tokens tenham,
assim como um tipo de sentença não tem localização espaço-
temporal, embora todos os seus tokens tenham. … Acreditar,
desejar, pretender, ou esperar que o céu seja azul envolve mais
do que a ocorrência do pensamento de que o céu é azul, mas
não podemos, portanto, inferir que pensar o pensamento con-
siste em mais do que a ocorrência do pensamento, ou que o
pensamento não é mental. … Nem a visão da relação objetiva
implica que pensar envolve ver pensamentos em qualquer sen-
tido, ou ter algo na mente “direcionado” ao pensamento (FREGE
1918: 26). Isso tornaria o pensamento misterioso” (DAVIS, 2003,
p. 315, ênfase no original, tradução livre dos autores32).

Contudo, para Frege, o pensamento é o significado ou conteúdo


não mental de um estado psicológico e não o estado em si: “vale a
pena notar que Frege usa o termo ‘pensamento’ para significar pro-
posições, por isso para Frege os pensamentos não são estados psi-
cológicos, mas sim significados de estados psicológicos” (Margolis &
Laurence, 2019, sec. 1.3, tradução livre dos autores33). A procura de
uma resposta não psicológica torna a situação mais complexa. Não
para o próprio Frege, dado o seu aparente conformismo com esta, mas

32 Texto original: “for you to think the thought that the sky is blue is for that mental event-type
to occur to you. Hence that type occurs to a subject whenever and wherever the subject
is thinking the thought that the sky is blue. That is what it is to “grasp” or “have” a thought.
Two people “share” a thought if it occurs to both of them. A thought has no spatio-temporal
location itself, although all of its tokens do, just as a sentence type has no spatio-temporal
location, although all of its tokens do. … Believing, desiring, intending, or hoping that the
sky is blue all involve more than the occurrence of the thought that the sky is blue, but we
cannot therefore infer that thinking the thought consists in more than the occurrence of the
thought, or that the thought is not mental. … Nor does the objective relation view entail that
thinking involves viewing thoughts in any sense, or having something in the mind “aimed at”
the thought (FREGE 1918: 26). That would make thinking mysterious.”
33 Texto original: “it is worth noting that Frege uses the term ‘thought’ to stand for proposi-
tions, so for Frege thoughts are not psychological states at all but rather the meanings of
psychological states.”

sumário
111
para os seus seguidores. Schweizer, por exemplo, sugere uma solu-
ção, algo rebuscada, que envolve uma analogia com o fenômeno da
“visão cega”34. De forma similar ao que ocorre na “visão cega,” apreen-
der um sentido (grasping a sense), segundo Schweizer, corresponderia
a um fenômeno perceptivo, no qual as manifestações da relação entre
uma “entidade semântica externa” e o genuíno “objeto da consciência”
correspondente não incluem um vasto leque de ideias conscientes:
Para tanto, será desenvolvida e explorada uma forma de vi-
são ligeiramente modificada, na qual o objeto físico da visão
não produz nenhuma apresentação consciente. Esta forma
ampliada de visão, aqui apelidada de ‘ver*’, se mostrará
aplicável tanto aos autômatos quanto aos seres humanos, e
como o ver* reflete de perto a fenomenologia real do entendi-
mento humano, é assim possível restaurar a analogia básica
entre visão e cognição. ... Assim, se apreender é interpretado
simetricamente com o ver*, então o realismo semântico de
Frege torna-se compatível com grande parte da fenomeno-
logia real da aquisição e uso da linguagem” (SCHWEIZER,
1991, p. 275–276, 277, tradução livre dos autores35).

A viabilidade desta, ou quaisquer outras possíveis respostas, não


será aqui discutida. Embora esta seja relevante para os proponentes
da equiparação dos conceitos aos sentidos fregeanos, para a presente
investigação, interessa o estatuto ontológico destes e a sua ligação com
o que Frege entende por conceito. Isto porque, para o filósofo, nem as
conceções nem os sentidos são conceitos. Na sua teoria, Frege atribui
maior proximidade ontológica entre sentidos e conceitos que entre estes

34 “A Visão cega é a capacidade de reconhecer objetos num ambiente mesmo sem ter a
consciência de os conseguir ver. O efeito ocorre em cegueiras corticais, onde o cérebro
consegue processar informações que os olhos recebem. O cego é capaz, se for treinado,
de reconhecer cores e expressões faciais.” Disponível em: https://icnagency.com/neuro-
cards/a-visao-cega. Acesso em: 30 de out. 2021.
35 Texto original: “to this end, a slightly modified form of vision will be developed and explo-
red, in which the physical object of sight does not produce any conscious presentations.
This extended form of vision, herein dubbed ‘seeing*’, will be shown to be applicable
both to automata and to human beings, and since seeing* closely reflects the actual
phenomenology [sic] of human understanding, it is thereby possible to restore the basic
analogy between sight and cognition. ... Thus if grasping is interpreted symmetrically with
seeing*, then Frege’s semantic realism becomes compatible with much of the actual
phenomenology of language acquisition and use.”

sumário
112
e as conceções, atendendo à natureza mental, isto é, subjetiva, destas
últimas ao contrário da objetividade conferida aos outros dois.

4 OBJETIVIDADE LINGUÍSTICA

Tal como os sentidos, os conceitos, para Frege, são ontologica-


mente objetivos. Mas, mais uma vez, a objetividade dos conceitos não
é a mesma da dos objetos físicos e, dentro da teoria de Frege, nem da
dos sentidos. A distinção implica uma subordinação da análise onto-
lógica à linguística:
Uma característica distintiva desta visão é que as categorias
ontológicas estão implícitas e são determinadas pelas catego-
rias linguístico-lógicas. ... Como princípio metafísico e metodo-
lógico básico, é independente dos detalhes da lógica de Frege
e da sua ontologia específica de objetos e funções. Por razões
profundas que dizem respeito ao essencial da sua lógica, Fre-
ge considerava as categorias lógicas de nomes e predicados
assimetricamente: embora ambas as categorias sejam essen-
ciais, há um sentido em que os nomes formam a categoria
básica e os predicados são concebidos em termos de nomes;
além disso, os termos funcionais dividem-se em níveis, en-
quanto a categoria de nomes é homogénea - todos os nomes
são tratados da mesma forma; não há distinção lógica entre,
por exemplo, concreto e abstrato ou entre universal e particu-
lar. Os critérios para as categorias são puramente lógicos e,
nessa perspectiva, estas distinções não importam” (BAR-ELLI,
2015, p. 292–293, tradução livre dos autores 36).

36 Texto original: “a distinctive characteristic of this view is that the ontological categories are
implied and determined by the linguistic-logical categories. … As a basic metaphysical and
methodological principle it is independent of the details of Frege’s logic and of his specific
ontology of objects and functions. For deep reasons that pertain to the essentials of his logic
Frege regarded the logical categories of names and predicates asymmetrically: though both
categories are essential, there is a sense in which names form the basic category and predi-
cates are conceived in terms of names; moreover, functional terms divide into levels, while the
category of names is homogenous – all names are treated alike; there is no logical distinction
between e.g. concrete and abstract, between universal and particular. The criteria for the
categories are purely logical, and from this perspective these distinctions don’t matter.”

sumário
113
Frege segue uma abordagem lógico-linguística, descartando as
distinções ontológicas tradicionais, tais como particular-universal e con-
creto-abstrato (BAR-ELLI, 2015, p. 288), ao estabelecer a sua teoria de
referência (bedeutung) e sentido (sinn). Nesta, as duas categorias es-
senciais, “objetos” e “funções,” pertencem ao “reino” das referências,
atribuindo aos sentidos um estatuto ontológico sui generis fora desse
“reino” (BAR-ELLI, 2015, p. 288). A distinção entre os dois “reinos” é
essencial para entender a diferença entre sentido e conceito em Frege.

Os conceitos fregeanos são entendidos como referências de


predicados gramaticais: “o conceito (como eu entendo a palavra) é pre-
dicativo.1 [nota 1: é, de facto, a referência de um predicado gramatical”
(Frege, 1951, p. 169 nota incluída, tradução livre dos autores37). Aten-
dendo ao seu caráter predicativo, Frege considera-os funções: “vemos
assim quão estreitamente aquilo a que se chama um conceito em lógica
está ligado àquilo a que chamamos uma função. De fato, podemos di-
zer imediatamente: um conceito é uma função cujo valor é sempre um
valor-verdade” (Frege, 1997, p. 139, tradução livre dos autores38). Esta
particularidade, de ter sempre um dos dois possíveis “valores-verdade”
(a verdade ou o falso), permitiria determinar de forma lógica os “objetos”
que “caem dentro” de um conceito, isto é, a sua extensão:
Frege (1892) fez uma distinção entre conceito e objeto, definindo
um conceito como uma função que possui um valor de verda-
de. O valor de um objeto para um argumento pode ser um dos
objetos abstratos ‘o Verdadeiro’ ou ‘o Falso’. Segundo Frege,
o conceito de ser humano é entendido como uma função que
tem ‘o Verdadeiro’ como valor para qualquer argumento que seja
humano, e ‘o Falso’ como valor para todo o resto. Na termino-
logia de Frege, um objeto para o qual um conceito tem valor ‘o

37 Texto original: “the concept (as I understand the word) is predicative.1 [note 1: is, in fact, the
reference of a grammatical predicate.]”
38 Texto original: “we thus see how closely that which is called a concept in logic is connected
with what we call a function. Indeed, we may say at once: a concept is a function whose
value is always a truth-value.”

sumário
114
Verdadeiro’ diz-se que ‘cai sob’ o respetivo conceito” (FRIED-
MAN; SMIRAGLIA, 2013, p. 23, tradução livre dos autores39).

É conveniente referir que os conceitos, para Frege, são apenas


um caso particular de função, existindo outras como, por exemplo, as
propriedades e as relações. Em comum, todas estas funções têm a
“necessidade lógica” de um “objeto auto-subsistente” (da categoria
“objetos”) para ficarem completas, ou “saturadas,” na terminologia
fregeana (BAR-ELLI, 2015, p. 292). Tendo em mente que a ontologia
em Frege é subordinada às exigências da lógica e de uma teoria do
significado da linguagem, as categorias objetos e funções são “ape-
nas” referentes e, como tal, insuficientes para os intentos do filósofo.
É nesse contexto que uma terceira categoria, os sentidos, é adicionada,
de forma a explicar os diferentes conteúdos cognitivos, ou “modos de
apresentação,” que os referentes podem apresentar em proposições:
Um resultado importante foi uma ontologia consistida por ob-
jetos e funções categoricamente distintos, mas ambos reais e
objetivos. Vimos também que ele chegou à conclusão de que os
sentidos - maneiras como as coisas nos são dadas como refe-
rências de termos em proposições – são, portanto, necessários
tanto na lógica como numa teoria do significado. Assim, a rea-
lidade, segundo ele, deve consistir não apenas nas referências
de termos de proposições verdadeiras, mas também em seus
sentidos” (BAR-ELLI, 2015, p. 295, tradução livre dos autores40).

Em termos linguísticos, na tese de Frege, os nomes próprios es-


tão associados à categoria “objetos” e os nomes comuns às funções

39 Texto original: “Frege (1892) made a distinction between concept and object, by defining
a concept as a function that has a truth-value. An object’s value for an argument can be
either of the abstract objects “the True” or “the False.” According to Frege, the concept of
being human is understood as a function that has “the True” as value for any argument that
is human, and “the False” as the value for everything else. In Frege’s terminology, an object
for which a concept has value “the True” is said to “fall under” the concept.”
40 Texto original: “an important outcome was that ontology consists of objects and functions,
which are categorically distinct, but are both real and objective. We have also seen that he
came to the conclusion that senses - ways things are given to us as the references of terms in
propositions - are thus required in logic and in a theory of meaning. So reality, according to him,
must consist not only of the references of terms of true propositions, but also of their senses.”

sumário
115
específicas a que o filósofo chama de “conceitos”. Assim, na lingua-
gem lógica de aplicação à ciência de Frege, além dos sentidos que os
nomes deverão ter (para serem “legitimamente” nomes), deverão ter
também referentes (objetos para os nomes próprios e conceitos para
os comuns). A importância da relação referencial leva Frege a prefe-
rir usar a designação “nome conceitual” em vez de “nome comum”.
O uso desses nomes comuns deverá ser entendido como estando a
nomear um conceito e não uma pluralidade de objetos:
A palavra “nome comum” leva erroneamente a supor que o
nome comum se relaciona com os objetos, no essencial, do
mesmo modo que o faz o nome próprio, apenas com a diferen-
ça de que este só nomeia um único objeto enquanto que aque-
le se aplica em geral a diversos objetos. Isto, porém, é falso,
e por essa razão prefiro dizer “termo conceitual” (Begrifftwort)
em lugar de “nome comum” (Gemeinname). Um nome próprio
deve ter pelo menos um sentido (na acepção em que entendo
essa palavra), senão ele será apenas uma mera sequência va-
zia de sons, e seria ilegítimo chamá-lo de nome. Mas para que
tenha um uso em ciência deve-se exigir também que ele tenha
uma referência, que designe ou nomeie um objeto. … Também
o termo conceitual deve ter um sentido e, para que tenha um
uso científico, deve ter uma referência; esta, porém, não é nem
um objeto, nem uma pluralidade de objetos, mas um conceito
(FREGE, 2009, p. 168, ênfase no original).

Fulcral na relação referencial, em ambos os casos (nomes pró-


prios e “conceituais”), é o papel de mediação do sentido entre nomes e
respectivos referentes. Mediação que, no contexto da linguagem lógica
desenvolvida por Frege, deverá ser claramente determinada e objetiva:
O nome próprio se relaciona, mediante o sentido, e só me-
diante o sentido, com o objeto. … Um termo conceitual pode,
do ponto de vista lógico, ser absolutamente impecável sem
que haja um objeto com o qual ele se relacione mediante seu
sentido e sua referência (o próprio conceito). Esta relação [do
termo conceitual] com um objeto é, como se vê, uma rela-
ção mais indireta e inessencial, de modo que parece pouco
conveniente classificar os termos conceituais segundo caiam

sumário
116
sob o conceito correspondente, um, vários ou nenhum objeto.
A lógica deve exigir, tanto do nome próprio como do termo
conceitual, que a transição do nome para o sentido e a do
sentido para a referência sejam determinadas sem deixar mar-
gem a dúvidas. Do contrário, não mais se poderia falar de uma
referência (Frege, 2009, p. 168–169).

Atendendo ao descrito relativamente às relações entre nomes,


sentidos e referentes na teoria de Frege, estas são de distintas nature-
zas. A relação entre nomes e sentidos poderá ser considerada essencial
devido à necessidade intrínseca dos primeiros para a sua legitimação.
Na relação entre os sentidos e os referentes, o filósofo apresenta-a como
necessária para que os nomes tenham utilidade científica, sendo estes
essenciais na sua abordagem lógico-linguística. A ligação entre nomes
e referentes mediada pelos sentidos pode, assim, ser encarada como
a união das duas relações parcelares (ver Figura 1). Por fim, a relação
“indireta e inessencial”, entre um nome conceitual e um objeto, pode
também ser entendida da mesma forma, como um percurso que passa,
necessariamente, pelos sentidos e conceitos respetivos (ver Figura 1).

Figura 1 – Esquema interpretativo das relações entre


‘nomes’, ‘sentidos’ e ‘referentes’ na teoria de Frege

Fonte: Elaborado pelos autores, 2021.

Apesar da importância da relação de mediação dos sentidos,


mais uma vez, a minguada informação que Frege fornece a respeito
da sua exata atuação leva à procura de possíveis soluções exteriores
à teoria do filósofo. Uma interpretação comum é efetuada usando a
“teoria das descrições” de Russell:

sumário
117
Infelizmente, Frege não nos diz muito sobre como exatamen-
te estes objetos abstratos escolhem ou apresentam as suas
referências. Exatamente o que é que faz sentido uma “forma
de determinar” ou “modo de apresentar” uma referência?
Na esteira da teoria das descrições de Russell, um sentido
Fregeano é frequentemente interpretado como um conjunto
de informações descritivas ou critérios que escolhem a sua
referência em virtude da simples referência satisfazendo ou
encaixando essa informação descritiva” (KLEMENT, c2021,
sec. 4, tradução livre dos autores41).

Será esta função predicativa e descritiva de um referente a in-


fluência fregeana que Dahlberg refere. A descrição da autora relativa-
mente à formação de um conceito assim o indicia:
Cada afirmação verdadeira sobre um determinado item de re-
ferência fornece um elemento de conhecimento sobre ele jun-
tamente com uma característica de seu conceito. A soma de
afirmações necessárias sobre tal item de referência forma o
conjunto das características de seu conceito apresentando dis-
tintamente o conteúdo do mesmo” (DAHLBERG, 2009, p. 171,
tradução livre dos autores42).

A natureza definível dos conceitos, explicitada por Dahlberg,


também pode ser encontrada na perspectiva de Frege:
Central, portanto, na teoria de conceitos de Frege não é que
os conceitos sejam funções cujos valores são sempre valores
de verdade - por mais importante que esta tese seja - mas a
sua afirmação universal de que todos os conceitos, para serem
conceitos, devem ser fechados: compostos de conjuntos defi-
nitivos de características que determinam a classificação exata

41 Texto original: “unfortunately, Frege does not tell us very much about exactly how these
abstract objects pick out or present their references. Exactly what is it that makes a sense
a ‘way of determining’ or ‘mode of presenting’ a reference? In the wake of Russell’s theory
of descriptions, a Fregean sense is often interpreted as a set of descriptive information or
criteria that picks out its reference in virtue of the reference alone satisfying or fitting that
descriptive information.”
42 Texto original: “each true statement about a certain item of reference delivers a knowledge
element about this together with a characteristic of its concept. The sum of necessary sta-
tements about such an item of reference forms the whole of characteristics of its concept, it
presents distinctly the contents of it.”

sumário
118
dos objetos e o uso correto da linguagem (WEITZ, 1988, p. 198,
tradução livre dos autores43).

Ambos, Dahlberg e Frege, atribuem um caráter “fechado” aos


conceitos através de um conjunto completo e definitivo de caraterís-
ticas que os claramente definem. Apesar da proximidade na posição
de Dahlberg, há um alargamento da restrita função predicativa, que
Frege atribuía aos conceitos, ao incluir nestes o papel desempenha-
do pelos sentidos fregeanos. Enquanto Frege entendia que o con-
ceito tinha uma existência categorial de “referente” separada da dos
sentidos, na teoria de Dahlberg, os dois podem ser entendidos como
componentes do conceito como uma única entidade.

A definição dessa entidade: “um conceito é uma unidade de co-


nhecimento que integra as características de um referente por um termo
ou um nome” (DAHLBERG, 1978, p. 144, ênfase no original, tradução
livre dos autores44) apresenta, de forma simples, os três componentes
desta: o referente, suas características e respetiva forma verbal. A “sim-
plicidade” da definição encerra uma entidade complexa, não só pela
abrangência dos seus componentes como pelo caráter instrumental que
Dahlberg lhe confere. Para a autora, o conceito como unidade do conhe-
cimento de um SOC ganha uma objetividade “concreta” com o propó-
sito de “materializar” o conhecimento a ser representado. Ideia explici-
tada em um dos fundamentos da teoria da classificação defendida por
Dahlberg (1976 p. 89, tradução livre dos autores45): “o reconhecimento
do conceito como o elemento material dos sistemas de classificação”.

43 Texto original: “central, then, in Frege’s theory of concepts is not that concepts are functions
whose values are always truth values - as important as this thesis is - but his universal claim
that all concepts, to be concepts, must be closed: composed of definitive sets of characte-
ristics that determine exact classification of objects and correct use of language.”
44 Texto original: “a concept is a knowledge unit comprising the characteristics of a referent by
a term or a name.”
45 Texto original: “the recognition of the concept as the material element of classification systems”.

sumário
119
5 NOTA CONCLUSIVA

O estudo apresentou uma abordagem a possíveis modos de


existência do conceito nas quais este foi, de certa forma, tornando-se
mais “concreto”. De entidade mental, passando para outra existente
em um reino não mental, embora também não físico, seguindo para
uma outra com existência linguística objetiva e, por fim, para a sua
“concretização material” como unidade elementar de um SOC. Essa
complexa “unidade do conhecimento” exige um estudo dedicado que
se pretende efetuar no futuro.

6 REFERÊNCIAS
BAR-ELLI, Gilead. On the Ontological Status of Senses (Sinne) in Frege. Revis-
ta Portuguesa de Filosofia, v. 71, n. 2/3, p. 287–305, 2015. DOI 10/gmvf62.
BILETZKI, Anat; MATAR, Anat. Ludwig Wittgenstein. (Edward N. Zalta, ed.) In:
The Stanford Encyclopedia of Philosophy. Spring 2020 Stanford: Stanford Uni-
versity, 2020. Disponível em: https://plato.stanford.edu/entries/wittgenstein/.
Acesso em: 12 abr. 2021.
BONEVAC, Daniel. Frege on Thought. The Analytic Tradition, Spring 2017.
[S. l.: s. n], 2 mar. 2017. Disponível em: https://youtu.be/3MWb0GXF5Z0.
Acesso em: 13 abr. 2021.
DAHLBERG, Ingetraut. Classification theory, yesterday and today. International
Classification, v. 3, n. 2, p. 85–90, 1976.
DAHLBERG, Ingetraut. A referent-oriented, analytical concept theory for IN-
TERCONCEPT. International Classification, v. 5, n. 3, p. 143–151, 1978. DOI
10.5771/0943-7444-1978-3-142.
DAHLBERG, Ingetraut. Knowledge organization and terminology: philosophi-
cal and linguistic bases. International Classification, v. 19, n. 2, p. 65–71,
1992. DOI 10.5771/0943-7444-1992-2-65.
DAHLBERG, Ingetraut. Concepts and terms: ISKO’s major challenge. Know-
ledge Organization, vol. 36, no. 2/3, p. 169–177, 2009. DOI 10.5771/0943-
7444-2009-2-3-169.

sumário
120
DAVIS, Wayne A. Meaning, expression, and thought. Cambridge: Cambrid-
ge University, 2003. p. 293–550.
FREGE, Gottlob. Sense and Reference. The Philosophical Review, v. 57,
n. 3, p. 209, May 1948.
FREGE, Gottlob. On Concept and Object. trans. by P. T. Geach; Max Black.
Mind, vol. 60, no. 238, p. 168–180, 1951. DOI 10/fgh5zn.
FREGE, Gottlob. Function and Concept. In: MELLOR, D. H.; OLIVER, Alex
(eds.). Properties. Oxford readings in philosophy. Oxford: Oxford University,
1997. p. 130–149.
FREGE, Gottlob. Digressões sobre o Sentido e a Referência. Lógica e Fi-
losofia da Linguagem. Trad. Paulo Alcoforado. 2a ed. São Paulo: Cultrix,
2009. p. 159–170.
FRICKÉ, Martin. Logic and the Organization of Information. New York:
Springer, 2012.
FRIEDMAN, Alon; SMIRAGLIA, Richard P. Nodes and arcs: concept map,
semiotics, and knowledge organization. Journal of Documentation, v. 69, n.
1, p. 27–48, 2013. DOI 10/f4psd3.
GOGUEN, Joseph A. Concept representation in natural and artificial langua-
ges: Axioms, extensions and applications for fuzzy sets. International Journal
of Man-Machine Studies, v. 6, n. 5, p. 513–561, Sep. 1974. DOI 10/fr78sg.
HARPRING, Patricia. What Are Controlled Vocabularies? Introduction to
controlled vocabularies: Terminology for art, architecture, and other cultural
works. Los Angeles: Getty Research Institute, 2010. p. 12–26.
HJØRLAND, Birger. Concept theory. Journal of the American Society for
Information Science and Technology, v. 60, n. 8, p. 1519–1536, 2009. DOI
10.1002/asi.21082.
KLEMENT, Kevin C. Frege, Gottlob. (James Fieser & Bradley Dowden, eds.)
In: Internet Encyclopedia of Philosophy. [S. l.: s. n.], c2021. Disponível em:
https://iep.utm.edu/frege/. Acesso em: 26 mar. 2021.
LAURENCE, Stephen; MARGOLIS, Eric. Concepts and Cognitive Science.
In: MARGOLIS, Eric; LAURENCE, Stephen (eds.). Concepts: Core readings.
Cambridge: MIT Press, 1999. p. 3–81.
LOWE, E. Jonathan. The four-category ontology: a metaphysical foundation
for natural science. Oxford: Clarendon Press, 2006.

sumário
121
MACHADO, Luís Miguel Oliveira; MARTÍNEZ ÁVILA, Daniel; SIMÕES, Maria
da Graça. Concept theory in library and information science: an epistemolo-
gical analysis. Journal of Documentation, v. 75, n. 4, p. 876–891, 2019. DOI
10.1108/JD-11-2018-0195.
MACULAN, Benildes Coura Moreira dos Santos; LIMA, Gercina Ângela Borém
de Oliveira. Buscando uma definição para o conceito de “conceito”. Perspec-
tivas em Ciência da Informação, v. 22, n. 2, p. 54–87, 2017. DOI 10/gmvf65.
MARGOLIS, Eric; LAURENCE, Stephen. The Ontology of Concepts: Abs-
tract Objects or Mental Representations? Noûs, v. 41, n. 4, p. 561–593,
2007. DOI 10/c22c65.
MARGOLIS, Eric; LAURENCE, Stephen. Concepts. (Edward N. Zalta, ed.) In:
The Stanford Encyclopedia of Philosophy. Summer 2019 Stanford: Stanford
University, 2019. Disponível em: https://plato.stanford.edu/entries/concepts/.
Acesso em: 18 nov. 2021.
MARRADI, Alberto. The Concept of Concept: Concepts and terms. Knowledge
Organization, v. 39, n. 1, p. 29–55, 2012. DOI 10.5771/0943-7444-2012-1-29.
PEPONAKIS, Manolis; MASTORA, Anna; KAPIDAKIS, Sarantos; DOERR, Mar-
tin. Expressiveness and machine processability of Knowledge Organization
Systems (KOS): an analysis of concepts and relations. International Journal
on Digital Libraries, v. 20, n. 4, p. 433–452, 2019. DOI 10/gmvf63.
POPPER, Karl R. Objective knowledge: an evolutionary approach. 1979. 8th
Rev. Oxford: Clarendon Press, 1994.
SCHWEIZER, Paul. Blind grasping and Fregean senses. Philosophical
Studies, v. 62, n. 3, p. 263–287, 1991. DOI 10/fnfqg6.
SMIRAGLIA, Richard P.; VAN DEN HEUVEL, Charles. Classifications and
concepts: towards an elementary theory of knowledge interaction. Journal of
Documentation, v. 69, n. 3, p. 360–383, 2013. DOI 10.1108/JD-07-2012-0092.
SMITH, Barry. New Desiderata for Biomedical Terminologies. In: MUNN,
Katherine; SMITH, Barry (eds.). Applied Ontology: an Introduction. Heusens-
tamm: Ontos Verlag, 2008. p. 83–107.
THORNLEY, Clare; GIBB, Forbes. Meaning in philosophy and meaning in
information retrieval (IR). Journal of Documentation, v. 65, n. 1, p. 133–150,
2009. DOI 10/dvfcq6.
VAN DEN HEUVEL, Charles; SMIRAGLIA, Richard P. Concepts as particles:
Metaphors for the universe of knowledge. In: GNOLI, Claudio; MAZZOCCHI,

sumário
122
Fluvio (eds.). Paradigms and conceptual systems in knowledge orga-
nization: 11th ISKO conference proceedings, 23-26 February 2010, Rome.
Würzburg: Ergon, 2010. p. 50–56.
WEITZ, Morris. Theories of Concepts: a history of the major philosophical
tradition. London: Routledge, 1988.
ZINS, Chaim. Conceptual Approaches for Defining Data, Information, and Kno-
wledge. Journal of the American Society for Information Science and Tech-
nology, v. 58, n. 4, p. 479–493, 2007. DOI https://doi.org/10.1002/asi.20508.

sumário
123
4
Capítulo 4

Las garantías más allá del horizonte


de la organización del conocimiento:
proyecciones posibles

Warrants beyond the horizon


of knowledge organization:
possible projections

Mario Barité Mario Barité

Las garantías más allá


del horizonte de la organización
del conocimiento:
proyecciones posibles

Warrants beyond the horizon


of knowledge organization:
possible projections

DOI: 10.31560/pimentacultural/2022.95613.4
Resumen:
La organización del conocimiento (OC) guarda una referencia temática estable
y directa con la bibliotecología y la ciencia de la información (BCI) y se inserta
en su tradición científica y de ejercicio profesional. También se reconoce al
mismo tiempo, que la OC es un dominio de composición interdisciplinaria que
ha evolucionado por el aporte de áreas como lingüística, terminología, recupe-
ración de la información y ciencias cognitivas entre otras. No se ha estudiado
con igual profundidad la batería de aportes que la OC puede ofrecer a otros
dominios. A partir de una revisión de la literatura pertinente y una síntesis crítica
de la misma, en este trabajo se actualiza la descripción del área de garantías
(literaria, de usuario, cultural y otras) como formas de validación de terminolo-
gía. Se analiza el potencial de utilización en ámbitos externos a la OC, tomando
como estudio preliminar de caso a la lexicografía. Entre las conclusiones des-
taca la necesidad de promover el conocimiento acumulado sobre las garantías
en publicaciones y congresos de áreas que podrían estar interesadas en inte-
grarlo, tales como lexicografía, terminología e ingeniería del lenguaje.

Palavras-Chave: Garantías. Organización del conocimiento. Terminología.


Lexicografía.

sumário
125
Abstract:
Knowledge organization (KO) has a direct and stable thematic relationship with
library and information science (LIS). Therefore, it is inserted in their scientific and
professional practice tradition. At the same time, it is also recognized that KO is
an interdisciplinary domain that has evolved through the contribution of linguistics,
terminology, information retrieval, and cognitive sciences, among others. The con-
tributions that KO can offer to other domains have not been studied to the same ex-
tent. Based on a review of the relevant literature and a critical synthesis, this paper
updates the description of warrants (literary, user, cultural, and others) as forms of
terminology validation. The potential of use in areas beyond KO is analyzed, taking
as a preliminary case study the field of lexicography. Among the conclusions, it is
highlighted that it is necessary to promote the accumulated knowledge on war-
rants collected in publications and congresses of areas interested in integrating
warrants, for example, lexicography, terminology, and language engineering.

Keywords: Warrants; Knowledge organization, Terminology; Lexicography.

sumário
126
1 INTRODUCCIÓN

La organización del conocimiento (OC) mantiene una conexión


temática estable y directa con la Ciencia de la información (CI) y se
inserta en su tradición científica y de ejercicio profesional. Es lo que
establece Smiraglia cuando afirma que la OC “is critical for the proper
functioning of the science of information”, debido a que “without that
which is learned in knowledge organization, information retrieval cannot
work” (SMIRAGLIA, 2014, p. 3). En la misma línea Hjørland señala que
la OC es la disciplina central de la CI (HJØRLAND, 2008, p. 86).

Esa centralidad se caracteriza, en palabras de Lara, por “la noción


de información y sus relaciones con el usuario” (LARA, 2007, p. 104), lo
que se expresa en aspectos concretos y significativos del procesamiento
de información que están a cargo de la OC: la organización, el proceso
y la recuperación de documentos y de información a través – he aquí el
elemento principal- de llaves temáticas. Dicho de otra manera, lo que
importa en nuestro campo es la utilidad que puede brindar para distintos
propósitos, la agrupación de documentos y referencias por temas, así
como el modo en que las búsquedas por temas pueden resolver distin-
tos problemas de información de las personas.

Se reconoce asimismo que la OC es un dominio de composición


interdisciplinaria que ha evolucionado con el aporte de diversas áreas
que la fundamentan y la enriquecen: “mathematics, systems theory,
psychology, science in general, semantics, grammar problems, online re-
trieval systems and technologies, terminology, translation” (DAHLBERG,
2006, p. 15), así como “computer science, linguistics, natural language
processing, theory of knowledge, theory of social organization (…) cog-
nition and communication” (HJØRLAND, 2008, p. 98). Esta diversidad
de fluencias se manifiesta en la terminología del área. Por ese motivo es
frecuente encontrar en la literatura específica de OC términos de infor-
mática (base de datos, banco de datos), lingüística (sintaxis, lenguaje,

sumário
127
vocabulario), recuperación de información (acceso, frecuencia, ocurren-
cia, revocación), clasificación de las ciencias (género, especie, árbol de
Porfirio, clasificación dicotómica), filosofía clásica (categoría, accidente,
materia, propiedades) y matemáticas (algoritmo, álgebra booleana).

Sin embargo, no se ha estudiado con igual profundidad la ba-


tería de contribuciones que la OC puede ofrecer a otras áreas del co-
nocimiento desde perspectivas teóricas, metodológicas, o aplicativas.
El objetivo de este trabajo es explorar los aportes que en concreto se
pueden hacer desde una conceptualización propia de la OC, nacida y
desarrollada en su seno, y que parece haber alcanzado un punto de
madurez suficiente para extender su potencial de aplicación a otros
dominios del saber: la noción de garantía. Para ello se realiza en primer
lugar, una visita de su concepto. En segundo término se establece el
estado de situación de las diferentes garantías en la OC. A continua-
ción se analiza el potencial de aplicación en el dominio de la lexicogra-
fía, aprovechando su caudal teórico y práctico. Finalmente, por tratarse
de un trabajo exploratorio, se establecen conclusiones preliminares.

2 NOCIÓN DE GARANTÍA

Hulme (1911) inauguró la historia del concepto, al acuñar la ex-


presión ‘garantía literaria’ (literary warrant) por la cual estableció que
solo un volumen de libros (o por extensión, cualquier otro tipo de do-
cumentos) que trate específicamente sobre un tópico determinado,
puede justificar la creación de un símbolo representativo de su con-
tenido para fines de clasificación y recuperación en bibliotecas. En su
expresión actual, este símbolo puede tratarse de un código numérico,
alfabético o mixto propio de un sistema de clasificación, una expre-
sión del lenguaje natural (palabra clave, tag) o un término normalizado
(descriptor, encabezamiento de materia, etiqueta) que se integra a un

sumário
128
sistema de organización del conocimiento. En ese documento iniciáti-
co, Hulme introduce la idea de garantía como “test of validity” (HULME,
1911, p. 448) para la inclusión o exclusión de tópicos (que él llamaba
clases) en un sistema de clasificación.

Hay que esperar hasta 1986 para que Beghtol, hablando en


su caso de “semantic validity”, realizara un estudio pormenorizado de
antecedentes de cuatro garantías (literaria, científico-filosófica, educa-
cional y cultural), al tiempo de realizar algunas apreciaciones sobre la
que mencionó como garantía académica. En ese trabajo, establece
la siguiente definición que expande y profundiza los elementos que
caracterizan a una garantía:
The warrant of a classification system can be thought of as the
authority a classificacionist invokes first to justify and subse-
quently to verify decisions about what classes/concepts to inclu-
de in the system, in what order classes/concepts should appear
in the schedules, what unit classes/concepts are divided into,
how far subdivision should proceed, how much and where syn-
thesis is available, whether citation orders are static or variable
and similar questions (BEGHTOL, 1986, p. 110).

Desde este enfoque, se convalida la idea de que las garantías


son una expresión de autoridad para justificar la toma de decisiones, y
además se extiende su justificación no solo a los términos candidatos a
integrar un sistema de clasificación, sino además a las relaciones que se
establecen entre ellos, los criterios de ordenación de términos, la manera
en que se subdividen y la profundidad de estas subdivisiones. De este
modo, cada término, cada relación y en suma todo el sistema nocional
que sostiene la estructura de un sistema de organización del conoci-
miento, se organiza en función de la utilización consistente de garantías.

Los autores que han avanzado en diversas direcciones en el es-


tudio de las garantías, encontraron en esta definición un acuerdo bási-
co, un punto de partida común para tomar decisiones de índole teórica
y metodológica (COCHRANE, 1993; DUFF, 1998; BEGHTOL, 2002a,

sumário
129
2202b, CAMPBELL, 2008; BARITÉ, 2011, 2018, 2019; BULLARD, 2017;
LEE, 2017). Por ese motivo, Bullard afirma con convicción que “warrant is
a common thread across a wide variety of systems ranging from traditional
library classification to in-application menus and categories for web-ba-
sed collections” porque “all designers of textual organizing schemas must
look to some source for terminology” (BULLARD, 2017, p. 76).

Una garantía afianza en primer lugar, la pertinencia y la adecua-


ción de un término para representar un concepto, de modo tal que
ese término pueda ser utilizado para la clasificación o para la indiza-
ción de datos, documentos o información. Dicho así, parecería que la
cuestión de las garantías se dirime término a término. Sin embargo,
conviene que prevalezca una visión de conjunto, porque el diseño de
un sistema de organización del conocimiento es, antes que nada, un
proyecto intelectual. Esto quiere decir que toda garantía debe ofrecer
terminología que favorezca una representación temática consistente
y actualizada del contenido de los documentos, así como debe pre-
sentar un mapa integral de un dominio, que contenga elementos de
su desarrollo, su evolución y su proyección.

Para fundar mejor la necesidad de una perspectiva epistemológi-


ca integrada, Olson (2004) rastreó el fondo de la noción de garantía en
la obra clasificatoria del conocimiento de Francis Bacon, y sus reflejos
en los sistemas bibliotecológicos de clasificación. En ese trabajo señala
que Bacon creó una estructura de conocimiento basada en una epis-
teme común, sobre la que los clasificacionistas han ido montando sus
propios diseños de sistemas desde el siglo diecinueve hasta el presente.
Y concluye: “perhaps we should also follow his epistemological warrant
and let our classifications not only reflect knowledge, but also have a role
in directing the creation of new knowledge” (OLSON, 2004, p. 4).

De algún modo, los clasificacionistas alimentaron, a lo largo de


un siglo y medio, una visión epistemológica presuntamente común, bajo
la idea de que los preceptos de las ciencias son objetivos, neutrales y

sumário
130
de alcance universal. De forma más soterrada quizás también fue insta-
lándose el pensamiento de que la justificación de la terminología de un
sistema de organización del conocimiento debería tomarse en forma
íntegra, ya del lenguaje formal de las ciencias y de la educación de las
ciencias (BLISS, 1929), ya de las evidencias terminológicas que ofrece
la documentación (HULME, 1911). Ese esquema tradicional, basado
en la pretendida –o al menos, esperable- objetividad y neutralidad del
lenguaje de las ciencias y la tecnología se fue quebrando poco a poco,
al proponerse nuevas garantías basadas en los valores y las creencias
culturales de una comunidad (garantía cultural), en el lenguaje elegido
por los usuarios de un sistema de información para buscar información
(garantía de uso y garantía de usuario), en la terminología interna de
una organización (garantía organizacional), o incluso en las denomina-
ciones y los alcances variables que un mismo concepto (por ejemplo,
uno del área de la geología) recibe en diferentes regiones, en base a,
siguiendo el ejemplo de la geología, las características peculiares de
los suelos, o las particularidades lingüísticas de cada lugar.

En cualquier caso, no se refuta la idea de que las garantías


constituyen criterios necesarios de selección de términos para su
inclusión en los sistemas de organización del conocimiento, con el
objetivo principal de favorecer las búsquedas y las recuperaciones
basadas en tópicos o asuntos.

3 ESTADO DE SITUACIÓN
DE LAS GARANTÍAS EN OC

La elección de una garantía adecuada a las finalidades que se


persiguen con el diseño de un sistema de organización del conoci-
miento, debería expresarse en un mayor rigor metodológico en la elec-
ción, depuración y sistematización de la terminología. También debería

sumário
131
proveer términos representativos del estado del arte de un dominio, en
sus consensos, en sus disensos, y en la presentación equilibrada de
diferentes corrientes o teorías. Debería por tanto, evitar la selección de
términos ambiguos, demasiado genéricos, demasiado específicos, u
obsoletos (salvo que se pretenda atender colecciones documentales
de espectro diacrónico amplio).

Sin embargo, la relación directa entre la aplicación rigurosa de


una garantía y la calidad del producto final parece ponerse en entredi-
cho por el hecho de que se han propuesto una veintena de garantías
en la literatura, más de la mitad de ellas en los últimos veinticinco años.
Ello estaría sugiriendo cierto grado de insatisfacción en los equipos de
clasificacionistas, con relación a las soluciones aportadas por las ga-
rantías tanto clásicas como recientes. Las causas de esa insatisfacción
pueden ser, en principio, las siguientes:

• la insuficiencia de cada garantía en particular, para decidir


en todas y cada una de las instancias en las que se requiere
seleccionar terminología para representar conocimiento y re-
cuperar información;

• la carencia de soluciones universales;

• la comprobación de que la terminología de un dominio cual-


quiera puede ser organizada de diferentes maneras, todas ellas
válidas para determinados usuarios o contextos, conforme a di-
versas perspectivas epistemológicas o prácticas.

A continuación se presenta un cuadro actualizado con las garan-


tías identificadas en la literatura de OC, y que cuentan con una base
mínima de documentos que la referencian. El cuadro presenta a las ga-
rantías ordenadas en orden cronológico de aparición, comenzando por
las más antiguas. Se ofrecen los nombres de las garantías en inglés y
en español, los autores que las propusieron y el año de acuñación en
cada caso. Se incluye además una columna de comentarios.

sumário
132
Cuadro 1 – Tipo de garantías

Nombre en inglés Nombre en español Autor y año Comentario


Usage /Use Uso Cutter, 1876 Antecedente de
garantía de uso
Literary warrant Garantía literaria Hulme, 1911
Scientific /philosophi- Garantía científico / Bliss, 1929 Antecedente de
cal and educational filosófica y educa- garantía académica
warrant (consensus) cional, y consenso
Cultural warrant Garantía cultural Lee, 1976
User warrant Garantía de usuario Lancaster, 1977
Logical warrant Garantía lógica Fraser, 1978
Concrete institutional Garantía institu- Coates, 1978
warrant cional concreta
Enquiry warrant Garantía de consulta CRG, 1984, citado
por Beghtol 1986
Semantic warrant Garantía semántica Beghtol, 1986 Nombre genérico que
comprende las garan-
tías literaria, cultural,
científico / filosófica,
educacional y cultural
Education/aca- Garantía educacio- Beghtol, 1986
demic warrant nal o académica
Gender warrant Garantía de género Olson and Ward, 1998 Quizás un tipo de
garantía cultural
Phenomenological Garantía fenomenológica Ward, 2000
warrant
Structural warrant Garantía estructural Svenonius, 2000
Use warrant Garantía de uso Svenonius, 2000
Ethical warrant Garantía ética Beghtol, 2002b Relacionada con la
garantía cultural
Academic warrant Garantía académica Sachs and Smi- Similar a la garantía
(also named raglia, 2004 científico /filosófia
scholarly warrant) y relacionada con
la educacional
Organizational warrant Garantía organizacional National Information
Standards
Organization, 2005

sumário
133
Autopoietic warrant Garantía autopoiética Mai, 2011 Basada en Rafferty
and Hidderley, 2007.
Quizás un tipo de
garantía de usuario
Textual warrant Garantía textual Tennis, Thornton
and Filer, 2012
Market warrant Garantía de mercado Martínez Ávila, 2012
Indigenous warrant Garantía indigenista Doyle, 2013 Un tipo de
garantía cultural
Genre warrant Garantía de géneros Andersen, 2015 Un tipo de
garantía cultural
Epistemic warrant Garantía epistémica Budd and Martí-
nez Ávila, 2016
Policy warrant Garantía en políticas Hjørland 2017 ¿Un tipo de
(corresponding to garantía cultural?
policy based indexing)
Fuente: Barité (2018), modificada con datos de Martínez-Ávila y Budd (2017)

No todos los autores utilizaron explícitamente la palabra ‘garan-


tía’ aunque quedó claro en los textos respectivos que, en sustancia,
se estaba hablando de la autoridad invocada para representar cono-
cimiento a través de descriptores, epígrafes, palabras clave, números
de clasificación, taxones u otros símbolos. Las garantías se distinguen,
como es de presumir, por la apelación a distintas fuentes de autoridad
para recoger términos.

La literatura generada por estas garantías es bastante desigual.


La garantía literaria es la que más atención ha recibido, por ser la más
antigua y consecuentemente, establecer un marco de referencia. Cuenta
con un cuerpo más o menos consolidado de conocimiento acumulado
en torno a la garantía literaria: artículos canónicos (RODRÍGUEZ, 1984;
BEGHTOL, 1986), estudios abarcativos y tesis de posgrado (BARITÉ,
2011; 2018), producción regular en los últimos años (HOWARTH; JAN-
SEN, 2014; BULLARD, 2017), así como un análisis recurrente de la
aplicación de la garantía literaria a la Clasificación de la Biblioteca del

sumário
134
Congreso (por ejemplo, HALLOWS, 2015) o a la Clasificación Decimal
Dewey (por ejemplo, VIZINE-GOETZ and BEALL, 2004).

Un segundo grupo se forma con el volumen de documen-


tos que se ha ido generando en torno a la garantía cultural (LEE,
1976; BEGHTOL, 2002a), la garantía de usuario (LANCASTER, 1977;
HJØRLAND, 2013); la garantía académica o científica (BLISS, 1929;
SACHS; SMIRAGLIA, 2004) y la garantía organizacional (NATIONAL
INFORMATION STANDARDS ORGANIZATION, 2005). A un segundo
grupo de garantías se les ha dedicado un conjunto limitado de traba-
jos, en los cuales se encuentran habitualmente introducciones gené-
ricas y aproximaciones generales a las características, los propósitos
y las utilidades que puede ofrecer cada garantía. Es el caso de la
garantía cultural, la garantía de usuario, la garantía organizacional,
la garantía académica, y más recientemente la garantía indígena o
indigenista. Un tercer grupo reúne a las garantías que han sido pro-
puestas y/o mencionadas puntualmente, y que no tienen un desarrol-
lo ulterior significativo, como en la garantía de mercado, la estructural
o la autopoiética. Estos dos últimos grupos de garantías no cuentan
todavía con suficiente análisis crítico, y necesitan del mismo.

El resto de las garantías han sido solo esporádicamente trata-


das, en general por sus autores, y no cuentan todavía con una expre-
sión teórica, metodológica y crítica de envergadura. No obstante, se
entiende que son opciones abiertas, con una base asegurada de fia-
bilidad, que pueden ser aplicadas en contextos particulares con éxito.
Por ejemplo, la garantía institucional y la garantía organizacional son
dos formas de justificación que toman como sustrato la existencia de
formas de expresión propias de instituciones y empresas. En algunos
casos, solo son útiles para la comunicación interna entre funcionarios;
en otros, permiten establecer índices de productos o de servicios; y
aún en otros es posible que afiancen el conocimiento social o en el
mercado, de determinados conceptos que son impulsados desde la
misión y la visión particular de cada organismo, sea público o privado.

sumário
135
Se ha discutido si las garantías pueden utilizarse en forma combi-
nada, o si es preferible mantener una garantía única para toda la termi-
nología seleccionada en el proceso de construcción de un sistema de
organización del conocimiento. Svanberg establece que “the diverging
warrants may be used to complement each other. Besides complemen-
ting each other, warrants may be contrary to each other” (SVANBERG,
1996). Aitchison, Gilchrist and Bawden (2000) aportan una visión inclu-
siva, cuando dicen la justificación de terminología puede provenir tanto
de la selección de fuentes de referencia en la literatura corriente como
del análisis de las búsquedas en el sistema de información, y el conoci-
miento aportado por usuarios e indizadores. En la misma dirección, Ten-
nis establece que hoy día “warrant is based on literature, users, scholarly
opinion and is culturally biased” (TENNIS, 2005, p. 85).

Para Huvila las garantías funcionan como herramientas analíticas


y como un soporte para el diseño, incluso cuando se aplican dos o más
que pueden dar resultados opuestos (HUVILA, 2006, p.78). En cualquier
caso, no parece haber razón para excluir la combinación entre garantías,
siempre y cuando exista la necesidad. De hecho, explica Bullard “the va-
rious warrants available to classification designers represent contradictory
positions in classification theory yet they compete and are combined by
classification designers in daily practice” (BULLARD, 2017, p. 77). Final-
mente, Lee genera ideas para entender la naturaleza del conflicto entre
varias garantías semánticas, y ofrece algunas alternativas de negocia-
ción de su uso y combinación, en el marco de los procesos de evalua-
ción de sistemas de organización del conocimiento (LEE, 2017).

4 APLICACIÓN DE GARANTÍAS FUERA DE LA OC

En este apartado se analiza el potencial de utilización de las


garantías en ámbitos externos a la OC, con la finalidad de explorar su
posible extrapolación, desde perspectivas teóricas y metodológicas.

sumário
136
No se trata de que la OC tenga algo que enseñar a otras disciplinas,
sino de explorar con especialistas de esas disciplinas, las posibilida-
des de intersección y utilización de ideas, técnicas y procedimientos,
con la perspectiva de generar espacios de trabajo interdisciplinario, en
los que el sentido del tráfico sea bidireccional.

En principio, la exploración se concentra en posibles puntos de


encuentro con la lexicografía, dedicada a la producción de diccionarios
generales de las lenguas y a repertorios similares.

Se reconoce en la actualidad que la lexicografía (generalmente


considerada una subdisciplina de la lingüística), tiene al menos dos
vertientes: una práctica, dedicada a compilar, escribir o editar diccio-
narios; otra teórica o metalexicográfica, dirigida al estudio de los funda-
mentos del análisis y la descripción del vocabulario de una lengua par-
ticular, así como de la estructura del sistema semántico de relaciones
que se producen entre las palabras diccionarizadas, y el proceso de
evaluación de diccionarios (ANGLADA ARBOIX, 1991; BERGENHOLTZ
y GOUWS, 2012). Algunos autores dudan de la claridad de esta di-
visión de la disciplina, y trasladan la duda a la definición misma del
campo, porque “the exact scientific meaning of the word lexicography
is continuously changing and can only be determined on the basis of an
up-to-date knowledge of the theoretical and practical development of
this branch of human activity” (TARP, 2010, 454).

Una cuestión crucial a la que se enfrentan los lexicógrafos de


todas las lenguas es ¿qué palabras se deben elegir para incluir en un
diccionario de la lengua, de qué manera y con cuáles argumentos?

La rica tradición lexicográfica existente en la producción de dic-


cionarios de la lengua castellana o de sus regionalismos, lo que se ex-
presa principalmente (pero no exclusivamente) en la producción de un
diccionario ‘oficial’ de la lengua, publicado en sucesivas ediciones a lo
largo de más de trescientos años, ha permitido consolidar los criterios de

sumário
137
selección de sus lemas. También ha permitido la incorporación –restrin-
gida pero continua- de voces de especialidad, procedentes de distintas
áreas del saber. Por ese motivo, la terminología, con una historia mucho
más reciente desde su constitución formal como dominio a principios
del siglo veinte, ha tomado enseñanza de los métodos de la lexicografía
para la elaboración de diccionarios y glosarios especializados.

Un criterio histórico para fundamentar la inclusión de una pala-


bra o una voz especializada en un diccionario de la lengua general, es
la documentación, entendida como el rastreo de voces y expresiones
en un conjunto predefinido de fuentes (llamado corpora). Ese conjunto
puede formarse con obras literarias, filosóficas, históricas o científicas.

La documentación ofrece la seguridad de que la palabra existe


o ha sido usada por un autor reconocido. Por otra parte, la voz puede
ser datada considerando la fecha de publicación de las obras en las
que comparece. La desventaja más notoria de este método es que
limita las posibilidades de que se haga visible el lenguaje popular,
coloquial o festivo, y puede concentrar en forma excesiva registros
cultos o poco usuales. En su forma clásica, el argumento principal a
favor de la documentación radicaba en el respaldo de las opiniones
autorizadas, que por este motivo pasaban a llamarse autoridades.
Por esa razón, no extraña que la primera edición del diccionario de la
Real Academia Española, publicado entre 1726 y 1739, se llame Dic-
cionario de Autoridades. La corpora ”constituía para los académicos
un repertorio de escritores y obras que se consideraban modélicos y
que, por lo tanto debían ser el fundamento del repertorio lexicográfico
de la academia” (FREIXAS ALÁS, 2003, p. 177).

Con el paso del tiempo, otras opiniones se han hecho escuchar.


Al discutir los criterios para incorporar neologismos a los diccionarios,
Bernal, Freixa y Torner examinan con cierto detalle las siguientes cuatro
alternativas de justificación: de frecuencia, formales, semánticas y lexi-
cográficas, conforme a la síntesis que se realiza a continuación.

sumário
138
1) Criterio de frecuencia, que se subdivide a su vez en cinco:

1.1 Frecuencia absoluta de uso. “A mayor frecuencia de un neo-


logismo, mayores son sus posibilidades de estabilización en la lengua
y, por consiguiente, mayor es su grado de diccionaribilidad” (BERNAL,
FREIXA y TORNER, 2020, p. 595).

1.2. Extensión de uso. “Los neologismos son más diccionariza-


bles si se emplean de forma igualmente frecuente en textos de diferen-
te tipología” (BERNAL, FREIXA y TORNER, 2020, p. 596).

1.3. Estabilidad en el uso. El uso frecuente sostenido en el tiem-


po constituye un índice de estabilización que actúa a favor de la diccio-
nariabilidad (BERNAL, FREIXA y TORNER, 2020, p. 596).

1.4. Cambio longitudinal en la frecuencia. Si el uso de una pala-


bra crece con el paso del tiempo no solo muestra una tendencia a su
estabilización; en muchos casos pasa “de tener un carácter meramen-
te testimonial a una elevada frecuencia de uso. El cambio longitudinal
en la frecuencia indica que un vocablo existente ha pasado a ser un
vocablo necesario” (BERNAL, FREIXA y TORNER, 2020, p. 596).

1.5 Extensión (geográfica) en el uso. “Los neologismos que se


emplean en dialectos particulares difícilmente pasan a formar parte de
la lengua general, por lo que se ha considerado que los utilizados en
distintas variedades geolectales son mejores candidatos a ser recogidos
en diccionarios de lengua”. (BERNAL, FREIXA y TORNER, 2020, p. 596).

2) Criterios formales. “A mayor conformidad con las reglas de


formación de la lengua, mayores las posibilidades de que la nueva
unidad léxica se consolide en el uso y, por lo tanto, deba ser reperto-
riada en las obras lexicográficas” (BERNAL, FREIXA y TORNER, 2020,
p.597). Los criterios formales permiten establecer los alcances de los
procesos derivativos, que producen familias de palabras o términos,
a partir de una raíz común.

sumário
139
3) Criterios semánticos. Bernal, Freixa y Torner (2020) mencio-
nan dos criterios de este orden, la impredictibilidad semántica y la ne-
cesidad denominativa. Explican que cuanto menos predecible sea el
significado de una unidad léxica mayor será su grado de diccionariabi-
lidad. Lo mismo acontece, según estas autoras, con derivados que na-
cen de una base que también es neológica. En cuanto a la necesidad
denominativa plantea las dificultades de implantación de neologismos
cuando ya existe una alternativa en la lengua, lo que puede provocar la
coexistencia de sinónimos.

4) Criterios documentales. En este caso, Bernal, Freixa y Torner


(2020) abogan por un tipo específico de documentación, aquel que
se apoya en la inclusión previa de una palabra o un término en otros
diccionarios, preferentemente de prestigio, para establecer la posible
diccionariabilidad de la expresión candidata. Todos los criterios men-
cionados no son de expresión lineal; por lo contrario, admiten en la
lexicografía matices, excepciones o contextos que pueden favorecer o
desaconsejar algunos de ellos.

A partir de la enumeración realizada, puede establecerse una


relación bastante cercana entre los criterios lexicográficos de selección
de lemas y aquellos proporcionados por las garantías en los procesos
de decisión sobre términos a incorporar a los sistemas de organización
del conocimiento. Así se expresa en el cuadro siguiente.

Cuadro 2 – Correlación criterios lexicográficos - garantías

Criterios lexicográficos Tipos de garantía


Documentación Garantía literaria
Frecuencia Garantía de uso, garantía de usuario
Criterios formales ¿Garantía formal?
Criterios semánticos Garantías semánticas
Criterios documentales Garantía literaria
Fuente: El autor

sumário
140
La documentación y la garantía literaria suelen ser los dos cri-
terios tradicionales utilizados en la lexicografía y la organización del
conocimiento respectivamente. El fundamento último se encuentra en
el hecho de que toda expresión que representa a un concepto que es
reconocido como valioso o necesario, en virtud de sus evidencias o de
la autoridad personal que los respalda, se documenta en alguna parte
(libros, artículos, ponencias a congresos, monografías y otras expresio-
nes, principalmente textuales).

Más recientemente, los criterios vinculados al uso han comen-


zado a prevalecer y se han valorizado a partir de las posibilidades que
brinda la tecnología y el desarrollo de algoritmos, en el manejo y la
gestión de grandes cantidades de datos.

Los criterios formales procedentes de la lexicografía constituyen


un punto de apoyo importante en la organización del conocimiento,
en lo relativo a la configuración gráfica de los términos, aunque esa
vertiente se canaliza a través de los estándares de construcción de
vocabularios controlados (por ejemplo, NATIONAL INFORMATION
STANDARDS ORGANIZATION, 2005). De todos modos, no sería des-
cabellado aventurar la posibilidad de desarrollar una garantía formal,
que permita fundamentar la inclusión de series derivativas de términos
en sistemas de organización del conocimiento.

Cabe considerar que al menos algunas de las garantías no men-


cionadas en el cuadro 2, podrían utilizarse también por parte de los
lexicógrafos en circunstancias puntuales. Es el caso de la garantía éti-
ca o la garantía cultural, que puede orientar la selección de los lemas
más apropiados en determinadas circunstancias. Esto implicaría tomar
partido por expresiones políticamente convenientes por sobre meca-
nismos meramente descriptivos de la lengua, lo que puede abrir un
frente amplio para el debate.

sumário
141
Lo que puede extraerse de esta primera aproximación al tema
estudiado es que el conocimiento acumulado sobre garantías podría
ser aprovechado por la lexicografía, para favorecer diversas instancias
de justificación en el proceso de diccionarización de lemas. Por su
parte, la organización del conocimiento podría aprovecharse de los
criterios lexicográficos que traen tras de sí una tradición de varios siglos
de desarrollo, para complementar, fortalecer o incluso poner en cues-
tión las formas de aplicación de alguna de sus garantías.

5 CONCLUSIONES

Las garantías son vistas en la actualidad como un componente


ineludible en el proceso de construcción, evaluación y revisión de siste-
mas de organización del conocimiento, en la medida en que su adecua-
da comprensión y aplicación deberían asegurar una terminología con-
sistente, actualizada y ajustada a los propósitos de los diseñadores de
sistemas, y a las necesidades de información temática de los usuarios.

Luego de un siglo y medio de evolución como concepto, como


herramienta analítica y como soporte para el diseño de sistemas, su
eficacia y su utilidad parecen no necesitar ya el respaldo de nuevas ar-
gumentaciones en OC. Sí quedan aún muchas puertas abiertas para la
investigación, sobre todo en materia metodológica. En efecto, ¿cómo
orientar la elección de una garantía y no de otra?; ¿cómo decidir cuál
es la garantía más apropiada a cada sistema?; ¿cómo se evalúa el
'rendimiento' de una garantía en función de principios como los de con-
sistencia, actualidad, exhaustividad, adecuación temática, adecuación
lingüística y otros indicadores que pueden proponerse?; ¿qué benefi-
cios se pueden obtener de los avances tecnológicos para fortalecer la
calidad de aplicación de las garantías?; o ¿cómo se vinculan las garan-
tías con la indización por lenguaje natural? Todas ellas son preguntas

sumário
142
que no tienen todavía respuestas totalmente satisfactorias. Se trata de
espacios ciegos que pueden aprovecharse para la investigación, en
un ámbito en el cual han sido constantes tanto la aparición de nuevos
tipos de sistemas de organización del conocimiento (ontologías, taxo-
nomías web, folksonomías y clasificaciones sociales entre otros), como
de innovaciones tecnológicas que han impactado en las costumbres y
en los hábitos en relación con la búsqueda y el acceso a la información.

No obstante esas cuestiones pendientes, las teorías y las me-


todologías garantistas exhiben ya un estado de desarrollo que habilita
a favorecer espacios de diálogo con otros dominios del conocimien-
to, con vistas a la articulación con teorías y métodos similares o afi-
nes. En este trabajo en particular se exploraron las posibilidades que
se ofrecen a la lexicografía, en lo relativo a la fundamentación de las
palabras y los términos candidatos a transformarse en lemas o voces
especializadas de referencia en diccionarios.

Hay otras áreas a las que se puede extender el uso de garan-


tías, pues reforzarían la utilización de criterios lingüísticos y/o termi-
nológicos consistentes, y la presentación homogénea de datos. Entre
ellas está la asignación de etiquetas temáticas en sitios y portales
web, o la elaboración de índices temáticos. En internet se multiplican
espacios dedicados a culturas de grupos minoritarios, terminologías
alternativas propuestas por pensadores o movimientos sociales -en
especial los contraculturales-, o incluso por los proveedores de nue-
vas tecnologías. En contraposición suelen faltar glosarios ordenados
y actualizados con voces nuevas, que estén debidamente respalda-
das por renovadas figuras de autoridad.

Quizás lo que más haya que valorar es que el tópico de las


garantías mantiene vigencia debido a la importancia que se asigna
hoy a la recuperación temática en Internet, en bases y bancos de
datos y en otras fuentes y sistemas de información, vinculados con la
ciencia, el comercio, el gobierno electrónico, la cultura y las industrias

sumário
143
del entretenimiento. Su proyección y utilidad tienen, por consiguiente,
un amplio horizonte para afianzarse.

Por lo expuesto, se destaca la necesidad de promover la difu-


sión del conocimiento acumulado sobre las garantías dentro de la OC,
en publicaciones y congresos de áreas tales como la lexicografía, la
terminología y las diversas ingenierías del lenguaje, en procesos co-
munes de exploración.

6 REFERENCIAS
AITCHISON, Jean, GILCHRIST, Alan and BADWEN, David (2000). Thesaurus
construction and use: a practical manual. London: ASLIB, 2000.
ANDERSEN, Jack. Re-describing knowledge organization: A genre and
activity-based view. In: ANDERSEN, Jack. (Ed.). Genre theory in information
studies. Bingley: Emerald, 2015. p. 13-42.
ANGLADA ARBOIX, Emilia. Lexicografía, metalexicografía, diccionario,
discurso. Sintagma, n.3, p. 5-11, 1991.
BARITÉ, Mario. Towards a general concept of warrants: first notes. Knowledge
Organization, v. 46, n. 8, p. 647-655, 2019.
BARITÉ, Mario. Literary warrant. Knowledge Organization, v. 45,
n. 6, p. 517-536, 2018.
BARITÉ, Mario. La garantía literaria como herramienta de revisión de sis-
temas de organización del conocimiento: modelo y aplicación. Tesis de
doctorado. Granada: Universidad de Granada, 2011.
BEGHTOL, Clare. Universal concepts, cultural warrant and cultural hospitality.
Advances in Knowledge Organization, v. 8, p. 45-49, 2002a.
BEGHTOL, Clare. A proposed ethical warrant for global knowledge repre-
sentation and organization systems. Journal of Documentation, v. 58,
n. 5, p. 507-532, 2002b
BEGHTOL, Clare. Semantic validity: concepts of warrant in bilbliographic
classification systems. Library Resources & Technical Services, v. 30,
n. 2, p. 109-123, 1986.

sumário
144
BERGENHOLTZ, Henning; GOUWS, Rufus H. What is lexicography? Lexikos,
n. 22: p. 31-42, 2012.
BERNAL, Elisenda; FREIXA, Judit; TORNER, Sergi. Criterios para la diccionari-
zación de neologismos: De la teoría a la práctica. Revista Signos: Estudios de
Lingüística, v. 53, n. 104, p. 592–618, 2020. Disponível em: https://www.scielo.cl/
pdf/signos/v53n104/0718-0934-signos-53-104-592.pdf. Acceso el 15 nov. 2021.
BLISS, Henry Evelyn. The organization of knowledge and the system of the
sciences. New York: Holt, 1929.
BUDD, John M.; MARTÍNEZ ÁVILA, Daniel. Epistemic warrant for categoriza-
tional cctivities in knowledge organization. Advances in Knowledge Organi-
zation, v. 15, p. 142-145, 2016.
BULLARD, Julia. Warrant as a means to study classification system design.
Journal of Documentation, v. 73, n. 1, p. 75-90, 2017.
CAMPBELL, D. Grant. Derrida, logocentrism and the concept of warrant on the
semantic web. Advances in Knowledge Organization, v. 11, p. 222-228, 2008.
COATES, Eric J. The Broad System of Ordering (BSO). In: TAYLOR, P.J., (Ed.),
New trends in documentation and information: proceedings of the 39th
FID Congress,University of Edinburgh, 25-28 September 1978. London:
Aslib, 1978, p.260.
COCHRANE, Pauline. Warrant for concepts in classification schemes. Advan-
ces in Classification Research, v. 4, p. 35-46, 1993.
CUTTER, Charles A. Rules for a dictionary catalog. Washington, D.C.:
Government Printing Office, 1876.
DAHLBERG, Ingetraut. Knowledge organization: A new science? Knowledge
Organization, v. 33, n. 1, p. 11-19, 2006.
DOYLE, Ann Mary. Naming, claiming, and (re)creating: Indigenous know-
ledge organization at the cultural interface: doctoral dissertation. 2013.
Disponible en: https://circle.ubc.ca/handle/2429/44262.
DUFF, Wendy M. Harnessing the power of warrant. American Archivist, v. 61,
n. 1, p. 88- 105, 1998.
FRASER, Walter J. Literary, user and logical warrants as indexing constraints.
In: The Information age in perspective: proceedings of the ASIS Annual
Meeting 1978. White Plains, Knowledge Industry Publications, New York,
1978, p. 130-132.

sumário
145
FREIXAS ALÁS, Margarita. Las autoridades en el primer diccionario de la
Real Academia Española. Tesis doctoral dirigida por José Manuel Blecua
Perdices. Bellaterra: Universitat Autónoma de Barcelona. 2003.
HALLOWS, Kristen M. It’s all enumerative: reconsidering Library of Con-
gress Classification in U.S. law libraries. Law Library Journal, v.106, n. 1,
p. 85-99, 2015.
HJØRLAND, Birger. What is knowledge organization (KO)? Knowledge Orga-
nization, v. 35, n. 2/3, p. 86-101, 2008.
HJØRLAND, Birger. Theories of knowledge organization—theories of knowled-
ge. Knowledge Organization, v. 40, n. 3, p. 169-181, 2013.
HJØRLAND, Birger. Subject (of documents). Knowledge Organization, v. 44,
n.1, p. 55-64, 2017.
HOWARTH, Lynne C.; JANSEN, Eva Hourihan. Towards a typology of warrant
for 21st century knowledge organization systems. Advances in Knowledge
Organization, v. 14, p. 216-221, 2014.
HULME, Edward Wyndham. Principles of book classification: chapter III: On
the definition of class headings, and the natural limit to the extension of book
classification. Library Association Record, n. 13, p. 444-449, 1911.
HUVILA, Isto. The Ecology of information work: a case study of bridging
archaelogical work and virtual reality based knowledge organisation. Åbo:
Åbo Akademi University Press, 2006. Disponible en: https://oa.doria.fi/bitstream/
handle/10024/4153/TMP.objres.83.pdf?sequence=1 Acceso el 15 nov. 2021.
LANCASTER, Frederick Wilfrid. Vocabulary control in information retrieval
systems. Advances in Librarianship, v. 7, p. 1-40, 1977.
LARA, Marilda Lopes Ginez de. Ciencias del lenguaje, Terminología y Ciencia
de la Información: relaciones interdisciplinarias y transdisciplinariedad.
En: RODRÍGUEZ BLANCO, Blanca; ALVITE DÍEZ, María Luisa (eds.). La
interdisciplinariedad y la transdisciplinariedad en la organización del
conocimiento científico = Interdisciplinarity and transdisciplinarity in
the organization of scientific knowledge: Actas del VIII Congreso ISKO-
-España, León, 18, 19 y 20 de Abril de 2007. León: Universidad de León,
Secretariado de Publicaciones, 2007, p. 101-110.
LEE, Joel M. E. Wyndham Hulme: A reconsideration. In: RAYWARD. W.B.
(Ed.). The variety of librarianship: essays in honour of John Wallace Met-
calfe. Sydney: LAA, 1976.

sumário
146
LEE, Wan Chen. Conflicts of semantic warrants in cataloging practices.
Presented at the North American Symposium on Knowledge Organization,
Urbana-Champaign, Illinois, 2017. Disponible en: http://www.iskocus.org/
NASKO2017papers/NASKO2017_paper_25.pdf. Acceso el 15 nov. 2021.
MAI, Jens-Erik. Folksonomies and the new order: authority in the digital disor-
der. Knowledge Organization, v. 38, n. 2, p. 114-122, 2011.
MARTÍNEZ-ÁVILA, Daniel. DDC-BISAC switching as a new case of reader-
-interest classification: tesis de doctorado. Getafe: Universidad Carlos III de
Madrid, 2012.
MARTÍNEZ-ÁVILA, Daniel; BUDD, John M. Epistemic warrant for categoriza-
tional activities and the development of controlled vocabularies. Journal of
Documentation, v. 73, n. 4, 2017
NATIONAL INFORMATION STANDARDS ORGANIZATION. Guidelines for
the Construction, Format and Management of Monolingual Controlled
Vocabularies: An American National Standard Developed by the National
Information Standards Organization: ANSI/NISO Z39.19-2005 (r2010).
Bethesda: NISO Press, 2005. Disponible en: http://www.niso.org/apps/group_
public/download.php/12591/z39-19-2005r2010.pdf. Acceso el 15 nov. 2021.
OLSON, Hope A. Bacon, warrant and classification. ASIS&T SIG-CR wor-
kshop, november 13, 2004.
OLSON, Hope A. and WARD, Dennis B. Charting a journey across knowledge
domains: feminism in the Decimal Dewey Classification. Advances in know-
ledge organization, v. 6, p. 238-244, 1998.
RAFFERTY, Pauline; HIDDERLEY, Rob. Filckr and democratic indexing: dialo-
gic approaches to indexing. Aslib Proceedings, v. 59, p. 397-410, 2007.
RODRÍGUEZ, Robert D. Hulme’s concept of literary warrant. Cataloging &
Classification Quarterly, v. 5, n. 1, p. 17-26, 1984.
SACHS, Moshe Y.; SMIRAGLIA, Richard P. From Encyclopedism to domain-ba-
sed ontology of knowledge management: the evolution of the Sachs Classifica-
tion (SC). Advances in Knowledge Organization, v. 9, p. 167-172, 2004.
SMIRAGLIA, Richard P. The elements of knowledge organization.
NY: Springer, 2014.
SVANBERG, Magdalena. Classification, warrants and principles. Swedish
Library Research, v. 2, n. 3, p. 66–75, 1996.
SVENONIUS, Elaine. The intellectual foundation of information organiza-
tion. Cambridge MA: MIT Press, 2000.

sumário
147
TARP, Sven. Reflections on the academic status of lexicography. Lexikos,
n. 20, 450-465, 2010.
TENNIS, Joseph T. Experientialist epistemology and classification
theory”. Knowledge Organization, v. 32, n. 2: p. 79-92, 2005.
TENNIS, Joseph T., THORNTON, K.; FILER, A. Some temporal aspects of
indexing and classification: toward a metrics for measuring scheme change.” In
Proceedings of the North American Symposium on knowledge organization,
2012. Disponible en: https://ssrn.com/abstract=2881557 Acesso el 15 nov. 2021.
VIZINE-GOETZ, Dianne; BEALL, Julianne. Using literary warrant to define a
version of the DDC for automated classification services. Advances in Know-
ledge Organization, v. 9, p. 147-152, 2004.
WARD, Martin. Phenomenological warrant: the case for working from the
user’s viewpoint. Managing Information, v.7, n. 9, p. 68–71, 2000.

sumário
148
5
Capítulo 5

Aspectos éticos em organização e


representação do conhecimento: uma
análise de sua presença na literatura
internacional da ciência da informação

Ethical aspects in knowledge


Isadora Victorino Evangelista
organization: an analysis about
José Augusto Chaves Guimarães
the theme in the international
literature in information science
Aspectos éticos em organização
eIsadora
representação do conhecimento:
Victorino Evangelista
uma análise de sua presença
José Augusto Chaves Guimarães
na literatura internacional
da ciência da informação

Ethical aspects
in knowledge organization:
an analysis about the theme
in the international literature
in information science

DOI: 10.31560/pimentacultural/2022.95613.5
Resumo:
No âmbito da Ciência da Informação, as atividades relacionadas à organi-
zação e representação do conhecimento são responsáveis pelo uso de pro-
cessos e instrumentos que atuam como mediadores entre o documento e a
necessidade informacional dos usuários. Essas atividades não são neutras,
uma vez que são elaboradas por profissionais que possuem preconceitos,
visões de mundo e tendenciosidades construídos ao longo de sua vida. É a
partir dessa premissa que uma dimensão ética é identificada nesse âmbito,
justificada pelo fato de que os profissionais envolvidos nesses processos
podem negar ou dar acesso ao conhecimento, atuando de modo cooperati-
vo ou excludente. Dessa forma, o objetivo do presente capítulo é apresentar
uma análise das questões éticas especificamente presentes na organização
e representação do conhecimento (ORC), em aspectos como preconceitos
e tendenciosidades encontrados em sistemas de organização do conheci-
mento, o impacto do multiculturalismo em tais instrumentos, e o perigo das
marginalizações – por exemplo, de mulheres, negros e homoafetivos – em
tais contextos, entre outros aspectos. A partir de uma revisão da literatura
internacional da área nessa temática específica, realizada diacronicamente
a partir da década de 1970, analisam-se e discutem-se os outros aspectos
éticos que ali se fazem presentes até que se chegue aos impactos éticos
sofridos por essa área no atual contexto de pluralidade do ambiente digital.

Palavras-Chave: Ética. Ciência da Informação. Organização e Representação


do Conhecimento.

sumário
150
Abstract:
In the field of Information Science, the activities associated with the knowledge
organization are responsible for the use of processes and instruments that
act as mediators between the document and the informational need of users.
These activities are not neutral, as they are developed by professionals who
have prejudices, worldviews and tendencies built up throughout their lives. It is
from this premise that an ethical dimension is identified, by the fact that the pro-
fessionals involved in these processes can deny or give access to knowledge.
In this way, the objective of this chapter is to present an analysis of the ethical
issues specifically presented in the knowledge organization field, in aspects
such as prejudices and tendencies found in knowledge organization systems,
the impact of multiculturalism on instruments, and the danger of marginaliza-
tions – for example, of women, blacks and homosexuals – in such contexts,
among other aspects. Based on a review of the international literature in the
area on this specific theme, carried out diachronically from the 1970s onwards,
other ethical aspects are analyzed and discussed, that reach the ethical im-
pacts in the current context of plurality of the digital environment.

Keywords: Ethics. Information Science. Knowledge Organization and


Representation.

sumário
151
1 INTRODUÇÃO

A Ciência da Informação, enquanto área que se preocupa com


as questões relacionadas ao processamento, ao comportamento e à
otimização do uso da informação (BORKO, 1968), possui, em seu cer-
ne, um conjunto de atividades que envolvem processos, produtos e
instrumentos de natureza mediadora. Essas atividades, de forma mais
ampla, estabelecem a conexão entre um conhecimento produzido e,
socializado e registrado e o seu uso e apropriação possibilitando a
contínua geração de novo conhecimento, em um movimento de natu-
reza helicoidal (GUIMARÃES, 2006).

Essas atividades, relativas à organização e representação do co-


nhecimento, não são neutras, estando passíveis de influência de visões
de mundo, preconceitos e tendenciosidades dos profissionais que as
realizam, dos idealizadores dos instrumentos e mesmo dos produtores
do conhecimento. Nesse sentido, uma dimensão ética é identificada,
visto que os profissionais envolvidos, com o seu “poder de nomear” (OL-
SON, 2002), acabam podendo dar ou negar acesso ao conhecimento,
atuando de modo cooperativo ou excludente (SOUZA, 2002).

Desse modo, pretende-se, no presente capítulo, apresentar


uma análise das questões éticas especificamente presentes na or-
ganização e representação do conhecimento (ORC), em aspectos
como os preconceitos e tendenciosidades encontrados em sistemas
de organização do conhecimento, o impacto do multiculturalismo em
tais instrumentos, e o perigo das marginalizações – por exemplo de
mulheres, negros e homoafetivos – em tais contextos, entre outros.
Nesse sentido, e a partir de uma revisão da literatura internacional da
área nessa temática específica, realizada diacronicamente a partir da
década de 1970, analisam-se e discutem-se os aspectos éticos que ali
se fazem presentes até que se chegue aos impactos sofridos por essa
área no atual contexto de pluralidade do ambiente digital.

sumário
152
2 A QUESTÃO ÉTICA NOS PROCESSOS,
PRODUTOS E INSTRUMENTOS DE
ORGANIZAÇÃO E REPRESENTAÇÃO
DO CONHECIMENTO

O primeiro trabalho que menciona essas questões no universo


da ORC é a obra seminal Prejudices and anthipatie: a tract of Library of
Congress Subjects Headings concerning people, publicada por Sanford
Berman, em 1971. Na obra, o autor busca ressaltar todos os preconcei-
tos encontrados na referida linguagem, amplamente utilizada em várias
partes do mundo. O livro é dividido em seis capítulos: “Chauvinismo,
‘Síndrome de Bwana’ e o terceiro mundo”; “Raças, nacionalidades, fés e
grupos étnicos”; “Políticas, paz, trabalho, aplicação da lei etc.”; “Homem/
mulher/sexo”; “Crianças, adolescentes, ‘idiotas’ e o ‘subterrâneo” e, por
último, “Faça você mesmo”. Cada um dos capítulos fornece exemplos
claros de discriminações sofridas por esses grupos na linguagem do-
cumentária e uma sugestão de como esses preconceitos poderiam ser
evitados caso houvesse uma transformação da linguagem.

Após a publicação do referido livro e pelo fato de a terminologia


de representação da informação passar sucessivamente por revisões,
alguns cabeçalhos foram alterados – uma vez que os valores da socie-
dade se alteraram ao longo do tempo. É importante ressaltar, no entan-
to, o quanto as linguagens eram produzidas sem uma preocupação de
natureza ética e como refletiam uma visão de mundo na qual a norma
era o homem, branco e cristão (BERMAN, 1971).

No mesmo ano, A. C. Foskett (1971) publica um artigo semelhan-


te, denominado “Misogynists all: a study in critical classification”, em que
analisa como as classificações podem se demonstrar preconceituosas
e tendenciosas, principalmente no que tange aos homossexuais e mu-
lheres. Uma das críticas do autor é que, embora as classificações devam

sumário
153
refletir uma verdade “externa e eterna”, o que realmente ocorre é que
elas estão longe de ser objetivas, refletindo os preconceitos do período
em que são elaboradas e das pessoas que as elaboram.

Em 1984, Foskett se aprofunda nessas questões. Para o autor,


foram vistas mudanças maiores nas ferramentas e produtos que utili-
zamos do que na maneira e teoria de como classificamos. O autor de-
monstra, por meio de exemplos da CDD – 19ª ed., que, na classe “Cos-
tumes Gerais (394)”, podem ser classificados documentos que tratem
de assuntos como palavrões, suicídio e canibalismo; na classe “Controle
de população (304.66)”, podem ser listadas práticas como genocídio
ou infanticídio; na classe “Ética das relações sociais (177)”, aparecem
assuntos como amor e amizade, de maneira conjunta com assuntos
completamente diferentes, como escravidão e práticas discriminatórias,
profanidade, suicídio, homicídio, genocídio etc.; entre outros.

No ano de 1981, Anthony Judge apresenta uma série de vieses


(ou biases, como o autor utiliza) que são identificadas no momento da
construção de um tesauro. Essas tendências são classificadas pelo
autor como: a relação estática que alguns tesauros estabelecem, sem
considerar a dinamicidade da linguagem; o fato de os tesauros serem
elaborados de acordo com o modo de pensar e a linguagem ociden-
tal; o padrão conservador das ferramentas; a rigidez das estruturas na
construção de tesauros; a disfuncionalidade desses instrumentos, ela-
borados sem considerar ou ressaltar as relações entre fenômenos; o
viés demonstrado pela hierarquia de classes; e, por fim, a polarização
encontrada nas representações dicotômicas.

Em 1991, Hazel K. Bell elenca cinco possíveis fontes de tenden-


ciosidade no momento da indexação: atitudes autoritárias, quando o
indexador reforça opiniões “fortes” expressas pelo autor; indexadores
intrusivos, quando o profissional reforça seus próprios preconceitos na
representação do documento; imposição da classificação, quando a lin-
guagem demonstra-se inflexível, com cabeçalhos de assunto que não

sumário
154
correspondem da maneira correta (ou ideal) às suas subdivisões; limita-
ções linguísticas pelo fato de as modificações linguísticas ocorrerem mais
lentamente do que as alterações sociais (atualmente, há problemas de
identificação de minorias na linguagem, subdivisões que podem ofender
essas minorias e ainda o sexismo patriarcal); e, por último, a supressão
de assuntos, que também pode ser considerada um fator de censura.

Ingetraut Dahlberg, fundadora da International Society for Kno-


wledge Organization – ISKO, elabora, em 1992, um editorial de fas-
cículo da revista Knowledge Organization em memória a Rangana-
than. Neste, a autora pondera sobre algumas implicações éticas na
organização do conhecimento, como, por exemplo, quando se utiliza
um sistema de classificação como base para a criação de outro sem
a devida permissão do autor; quando documentos são indexados
ou classificados de maneira negligente e sem o zelo apropriado; ou,
ainda, quando um sistema de informação é comprado por um valor
considerável, mas não cumpre com o que se compromete.

Cinco anos após o editorial de Dahlberg, Michele Hudon (1997)


reforça a preocupação ética no âmbito da indexação, como já ressalta-
do por outros autores anteriormente. Em seu artigo, a autora demons-
tra atenção em relação aos tesauros multilíngues. Para a autora, com
o avanço das tecnologias, a linguagem tornou-se uma barreira ainda
mais crítica e uma forma de evitar dificuldades é promover uma lingua-
gem controlada que abarque diferentes idiomas, o que permitiria que
estrangeiros pudessem acessar os dados dos sistemas de recupera-
ção da informação. No entanto, alguns obstáculos são encontrados ao
desenvolver ferramentas como esta: ampliar uma linguagem para que
abarque conceitos estrangeiros pode fazê-la ficar pouco reconhecível
para seus próprios falantes; transferir toda uma estrutura conceitual de
uma cultura para outra, mesmo quando não pareça adequado; a tradu-
ção literal de termos de um idioma para outro sem carregar consigo os
conceitos próprios. Segundo a autora, produzir um tesauro multilíngue

sumário
155
vai além de achar termos equivalentes em idiomas diferentes, há uma
dimensão cultural no processo, o que transforma essa ferramenta em
um tesauro multicultural. Nesse contexto, a experiência bilíngue do Ca-
nadá (francesa e inglesa) ultrapassa a dimensão linguística na medida
em que os termos de cada uma das línguas para a representação de
um dado conceito trazem consigo a visão de mundo que aquela cultu-
ra tem a respeito (HUDON, 1997).

Um tesauro multicultural é um instrumento que oferece a ter-


minologia e os conceitos de determinados idiomas e toda a estrutura
semântica de um tesauro – relações de equivalência, hierárquicas e
por afinidade, de maneira fidedigna. Dessa forma, independentemente
do idioma da pesquisa, as informações semânticas recuperadas serão
as mesmas (HUDON, 1997).

No que concerne à representação da comunidade homoafetiva,


Campbell (2000) declara que esse grupo é geralmente marginaliza-
do em ferramentas consideradas universais, pois os termos utilizados
usualmente são arcaicos ou inválidos, não satisfazendo às necessida-
des informacionais desses usuários. Outro problema ressaltado pelo
autor é o fato de o processo de indexação ser um ato subjetivo, que
varia entre indexadores, com diferentes perspectivas.

Para compreender melhor essas questões, o autor analisa os


conceitos de aboutness – o principal assunto de um documento – e
meanings – os usos específicos de determinado documento –, relacio-
nando-os com teorias queer. De acordo com Campbell (2000), esses
conceitos são especialmente frágeis na literatura homoafetiva, pois
são documentos que, em geral, recebem diversos tipos de interpreta-
ção e, embora os assuntos permaneçam relativamente estáveis, seus
diversos usos se alteram de acordo com a comunidade ou o período.

Beghtol (2002) também reflete sobre as questões culturais na


elaboração de sistemas de representação, principalmente relacionadas

sumário
156
aos aspectos éticos no desenvolvimento desses sistemas diante do
avanço das novas tecnologias. Para a autora, o ponto essencial re-
side nos conceitos de garantia e hospitalidade cultural, em que dife-
rentes culturas podem estar inseridas em uma mesma sociedade e
elas devem ser representadas pelos sistemas de maneira igualitária.
A autora ressalta que a própria cultura reside na informação, visto que
as necessidades informacionais daquele grupo de pessoas, como as
informações são utilizadas, o que eles valorizam e escolhem perpetuar,
podem auxiliar na definição dos aspectos culturais.

A autora propõe o conceito de “hospitalidade cultural”, relacio-


nando-o com o conceito de garantia cultural. Para Beghtol (2002), a
hospitalidade cultural assegura que as necessidades individuais de
usuários de comunidades específicas que se utilizam do sistema se-
jam representadas no sistema, permitindo tanto a escolha individual do
usuário quanto a representação coletiva de uma comunidade muitas
vezes marginalizada pelos sistemas de organização do conhecimento.

A preocupação com os sistemas de organização do conheci-


mento, especificamente as linguagens de indexação, também é re-
forçada por Olson (2002). A autora deixa explícita a importância do
nomear inerente à indexação e como, muitas vezes, esse ato demons-
tra-se preconceituoso e enviesado, principalmente quando represen-
tando assuntos relacionados a mulheres, latinos e homossexuais. Para
a autora, o ato de nomear é uma necessidade básica da comunicação
e, como bibliotecários, nós decidimos o que deve ser representado e o
que não deve ser nomeado, afetando o acesso e o uso da informação.

Para Olson, os problemas relacionados a essa prática pos-


suem dois aspectos principais: o ato de nomear reflete valores so-
ciais e não há neutralidade nesse processo ou em suas ferramentas,
que são geralmente construídas a partir de visões patriarcais. A es-
colha dos conceitos que serão incluídos no vocabulário controlado
demonstra suas limitações, o que é incluído na linguagem e o que

sumário
157
não é permitido, muitas vezes desconsiderando variáveis individuais
dos documentos e impondo uma linguagem universal que pode não
ser a utilizada pelo usuário (OLSON, 2002).

A respeito das classificações, Olson (2002) afirma que, apesar


de elas terem a pretensão de serem universais, são, na verdade, cul-
turalmente específicas, refletindo o mainstream da sociedade em que
são elaboradas, e diferentes paradigmas culturais, conforme a evolu-
ção do tempo podem afetar as ferramentas de representação. O ele-
mento da globalização contribuiu muito para que esses instrumentos
se demonstrassem imperialistas e culturalmente homogêneos. Um
exemplo desse fator é a Classificação Decimal de Dewey (CDD), que é
uma ferramenta produzida no contexto anglo-saxão, em uma estrutura
hierárquica do geral para o mais específico – o que também pode ser
entendido como do mais para o menos importante, ou estabelecendo
a ordem de todo-parte –, mas que foi traduzida para mais de 30 idio-
mas e utilizada por culturas completamente diferentes (OLSON, 2002).

No mesmo ano, García-Gutierrez (2002) remete ao conceito de


“cultura de fronteira” para nos propor uma “ética transcultural de me-
diação”. De acordo com o autor, vivemos em uma época de permanen-
te mutação, com as posições se alterando constantemente, em que se
torna complexo definir onde são os limites e fronteiras dos territórios
e, portanto, sistemas fechados e rígidos não podem ser aceitos nesse
paradigma. Para tanto, o autor propõe a ideia de “epistemografia inte-
rativa”, em que redes semânticas se configuram de maneira aberta e
horizontal, diferentemente de uma posição vertical e hierárquica, per-
mitindo, assim, que a diversidade não seja reduzida46.

46 Vale ressaltar que o ano de 2002 foi especialmente importante para a discussão das ques-
tões éticas em ORC, pois além da obra seminal de Olson (2002), merece especial destaque
a realização da 7ª. Conferência Internacional da ISKO, em Granada, Espanha, cujo tema foi
relativo aos desafios na representação do conhecimento para o século XXI, mais especi-
ficamente no que tange às possibilidades – e necessidades – de integração ao longo das
fronteiras (geográficas, culturais etc.).

sumário
158
No que concerne às teorias de classificação, Mai (2004) ressalta
a importância de um novo paradigma, focado nos estudos de usuários
e nas estruturas dos domínios por meio de uma visão construtivista.
Dessa maneira, de acordo com o autor, o ideal no momento de criar
uma classificação é estudar o universo da unidade de informação que
fará uso dessa ferramenta, estudando o discurso daquela comunidade
e suas principais atividades e conhecendo os termos utilizados pelos
usuários para que os sistemas de organização do conhecimento cor-
respondam a suas necessidades (MAI, 2004).

Ainda relacionado ao âmbito das linguagens de indexação e


classificação, Van der Walt (2004) salienta adversidades que podemos
encontrar diante da norma básica da Organização do Conhecimento,
que é dar acesso à informação. Dentre elas: diferentes usuários pos-
suem necessidades informacionais diversas e, portanto, um termo de
indexação pode não servir a todos; o processo de indexação deve
ser subjetivo, os assuntos em potencial do documento devem ser re-
conhecidos; e nós ainda não temos uma teoria sedimentada sobre a
relação entre documentos.

Esses fatores implicam problemas éticos, como uma má inde-


xação, termos não correspondentes – de maneira a atribuir uma maior
“popularidade” ao documento – e uma representação tendenciosa ou
preconceituosa. Para refletir sobre esses problemas, o autor traz alguns
questionamentos que merecem maior aprofundamento, como estabele-
cer quais são os conflitos éticos em ORC, quais são as diretrizes éticas
que devem conduzir essa área, quais são as responsabilidades sociais
da área, além de reflexões sobre o aspecto pedagógico das unidades
informacionais e o acesso livre à informação (VAN DER WALT, 2004).

Feinberg (2007) demonstra grande preocupação com as biases


implícitas aos sistemas de organização do conhecimento considerado
universal. A autora afirma que, mesmo em abordagens como a aná-
lise de domínio – proposta na Ciência da Informação por Hjørland e

sumário
159
Albrechtsen (1995) –, é ainda provável que ocorram tendenciosidades
e que, possivelmente, a melhor opção não seja estabelecer um único
domínio, mas ter em mente que múltiplos domínios coexistem entre si
e não apenas diferentes perspectivas em um mesmo domínio.

Para a autora, caso não seja viável eliminar todos os tipos de vie-
ses, o ideal seria ser mais responsável sobre eles, explicitar sua presen-
ça e defender a perspectiva que o sistema está adotando. Desse modo,
para elaborar um sistema de organização do conhecimento é necessá-
rio “tomar partido” sobre como aquele domínio do conhecimento está
sendo interpretado e, para tanto, é necessário que esteja claro como a
informação é avaliada, incluída, excluída e mantida pela organização.
Mesmo que ocorra algum tipo de bias, será de uma maneira respon-
sável, com as perspectivas do sistema e da unidade claras. Deve-se,
ainda, estar ciente e ser responsável pelas possíveis consequências que
esse posicionamento pode acarretar (FEINBERG, 2007).

Refletindo sobre a teoria crítica racial como abordagem para a


análise da CDD, Furner (2007) atenta para a legitimação da ideolo-
gia dominante por esquemas de classificação e que o baixo nível de
usuários negros em unidades informacionais pode se dever ao fato de
eles não se sentirem representados por esses esquemas, ademais a
essas unidades não se encontrarem predominantemente em regiões
pobres e suburbanas. Por essas circunstâncias, a teoria crítica racial
seria de grande valia para bibliotecários: pelo comprometimento social
dessas instituições e pela potencial aplicabilidade dessa teoria nesses
espaços, de maneira a evitar ao máximo o racismo institucionalizado.

Assim, ao fazer referência a um serviço justo de biblioteca, Fur-


ner (2007) cita alguns objetivos – ou valores éticos – que devem ser
perseguidos pela equipe da unidade. Por exemplo: a satisfação do
usuário, o amparo aos usuários, a equidade de oportunidades, a divul-
gação dos serviços oferecidos, a liberdade de escolha, as recomen-
dações de qualidade, a responsabilidade na prestação de contas, a

sumário
160
eficiência, a diversidade, conformidade com as normas e padrões e a
busca pela estabilidade, evitando-se a opressão, de tal modo que uma
biblioteca justa possa ser aquela em que os recursos são utilizados de
maneira ativa, de forma a dar suporte às mudanças sociais e reconhe-
cendo os direitos dos grupos oprimidos.

A partir da primeira conferência em Ética na Organização da


Informação, realizada na University of Wisconsin-Milwaukee em maio
de 2009, a questão ética na Organização e Representação do Conhe-
cimento assumiu um espaço investigativo institucionalizado. A confe-
rência foi publicada na revista Cataloging and Classification Quarterly
referindo-se a temáticas como a abordagem retórica na tecnologia da
informação (BADE, 2009); a falta de reflexão das necessidades dos
usuários na prática da catalogação (HOFFMAN, 2009); os aspectos
éticos da classificação na segurança nacional (UNSWORTH, 2009);
a análise da tabela auxiliar 5 da CDD sobre etnias e grupos nacionais
e sua relação com os padrões de representação dessa linguagem
(BEALL, 2009); e a análise dos padrões de descrição dos recursos e
suas implicações éticas (SMIRAGLIA, 2009).

Em 2012, ocorreu a segunda conferência em Ética na Organi-


zação da Informação e, dessa vez, igualmente em Milwaukee, os arti-
gos geraram um número especial da revista Knowledge Organization.
Esses artigos versam sobre: aspectos relativos à globalização e aos
efeitos na relação entre bibliotecários e editores (MARTÍNEZ-ÁVILA;
KIPP; OLSON, 2012), a folksonomia de nomenclaturas sexuais e a li-
berdade de classificação nesse universo (KEILTY, 2012); as implica-
ções éticas de dar nome aos metadados sobre objetos visuais (SEE-
MAN, 2012); as consequências éticas da digitalização de documentos
de arquivo e sua representação (ZHANG, 2012), a representação das
ideias e visões de mundo dos autores dos documentos no momento
da descrição arquivística (GILLILAND, 2012); a responsabilidade dos
bibliotecários no desenvolvimento de coleções e suas atitudes diante

sumário
161
de livros considerados “ruins” perante normas éticas (HOMAN, 2012),
a apresentação de um modelo para o desenvolvimento do trabalho do
bibliotecário enquanto um ofício majoritariamente intelectual (COPE,
2012); a análise de linguagens documentárias brasileiras e a forma
como representam termos homoafetivos (PINHO; GUIMARÃES, 2012);
o uso de social tagging como alternativa à utilização de linguagens
disciplinárias como a da Biblioteca do Congresso (ADLER, 2012); a
análise das responsabilidades morais das instâncias de desenvolvi-
mento e uso dos sistemas de organização do conhecimento (FOX;
REECE, 2012); e a análise dos conceitos de disfemismo, eufemismo
e ortofemismo e as discussões em indexação (MILANI; PINHO, 2012).

Baseando-se na filosofia dos movimentos de Artes do século


XX, na teoria crítica da organização do conhecimento e na filosofia do
budismo, Tennis (2013) propõe uma organização do conhecimento
eticamente comprometida, destacando o trabalho de catalogação e
classificação como de natureza não apenas técnica, mas artística,
de tal modo que a industrialização e a produção em massa podem
afetar sua realização. Indo além, o autor ressalta a necessidade de
decisão responsável durante a indexação ou a classificação, ciente
de que a ausência desse cuidado pode gerar um ato de violência
contra o usuário. Para tanto, evoca trabalhos de Slavoj Žižek e sua
sistematização de violência objetiva – aquela presente em linguagens
de grupos específicos e em consequência de sistemas políticos e
econômicos –, o que se encontra presente nas atividades de indexa-
ção, razão pela qual a prática da indexação deve estar comprometida
com ações corretas e responsáveis (TENNIS, 2013).

Nessa seara, tem lugar a intenção do indexador, que pode es-


colher entre agir de maneira a beneficiar ou a prejudicar outros. Para
que se possa medir as intencionalidades, o autor propõe cinco níveis:
um ato praticado sem intenção nenhuma de prejudicar alguém – como
pisar acidentalmente em um inseto; agir de maneira incorreta mesmo

sumário
162
sabendo os possíveis danos, mas quando está fora do controle de si,
como bêbado ou apaixonado; realizar um ato prejudicial, mas quando
se está enganado sobre a parte prejudicada; agir de maneira incorreta
mesmo consciente sobre o que está fazendo e de maneira premedita-
da; e o último nível é semelhante ao primeiro, mas, nesse caso, o autor
da ação não reconhece que está agindo de modo danoso.

Refletindo sobre o conceito de harm – ou dano – na organiza-


ção do conhecimento, Adler e Tennis (2013) ponderam sobre como a
linguagem utilizada de forma errônea pode ser considerada um ato
de violência e, por conseguinte, as classificações estão sempre sus-
cetíveis a causar algum dano. Como no trabalho citado anteriormen-
te, os autores vão além da perspectiva de “poder do acesso” que as
ferramentas – e os bibliotecários – possuem, pois esses instrumentos
podem ser empregados de maneira violenta e autoritária, uma vez que
eles impõem e controlam a partir de suas utilizações. Esse poder é
disciplinado e quem o exerce determina a posição dos que serão clas-
sificados ou transformados em categorias. Assim, para evitar esse tipo
de violência, os autores elaboraram uma taxonomia do dano, centran-
do-se em três questões relativas ao momento da classificação: o que
acontece, quem participa e quem e como pode ser afetado.

Para responder à primeira questão, os autores relembram algu-


mas ações que podem acontecer no momento da classificação e que
tendem a ser danosas, como excepcionalismo, omissão, terminologia
enviesada, estrutura do padrão inapropriada, entre outras. Pensando so-
bre a salubridade dessas ações, reforça-se que os classificadores pos-
suem a responsabilidade de causar o menor dano possível, e, para tan-
to, deve-se recorrer a atitudes sábias e conscientes. Outro componente
considerado essencial pelos autores é a intencionalidade desses atos
– o que já havia sido alertado por Tennis (2013). Por último, devem-se
considerar as implicâncias desses atos, pois, ao invés de darem acesso
aos recursos, esses sistemas centrados na objetividade e padronização
acabam por impedir o uso desses documentos (ADLER; TENNIS, 2013).

sumário
163
Sobre a participação dos envolvidos, os autores questionam so-
bre os níveis de cooperação desses participantes. Quem produz esses
sistemas possui um poder elevado em relação àqueles que escolhem,
dentre os termos determinados, quais utilizar; este segundo grupo
possui um poder maior que um terceiro grupo, daqueles que apenas
importam os dados desses registros sem modificá-los. Em qualquer
um desses níveis é possível uma decisão ética e crítica em relação a
essas ferramentas (ADLER; TENNIS, 2013).

Sobre as possíveis lesões causadas por essas questões, os au-


tores reforçam que ainda que a principal lesão seja a falta de acesso à
informação, esses danos se estendem à propagação de discursos do-
minantes e premissas discriminatórias. Como exemplo desses danos,
os autores citam o uso do termo “parafilia” pela Biblioteca do Congres-
so, de forma a representar “desvios sexuais” e o termo “eugenia”, utili-
zado pela CDD até a década de 1950 e depois excluído, mesmo sendo
o termo utilizado pela literatura, possivelmente pelo fato de representar
algo que “negativo” para a sociedade (ADLER; TENNIS, 2013).

Em 2015, teve lugar a terceira edição da conferência sobre Ética


em Organização da Informação. Nesta, discorreu-se sobre: o desenvol-
vimento de uma taxonomia das críticas à organização do conhecimen-
to (GROSS, 2015); a cobertura de artigos relativos à temática em ética
em organização do conhecimento em duas bases de dados impor-
tantes da área – Web of Science e Library and Information Science and
Technology Abstracts (MARTÍNEZ-ÁVILA; GUIMARÃES; PINHO; FOX,
2015); a análise das temáticas dos livros banidos pela American Library
Association (KIPP; BEAK; GRAF, 2015); a representatividade do público
infantil em sistemas de organização do conhecimento (BEAK, 2015); a
representação de músicas tradicionais em sistemas de organização do
conhecimento (WEISSENBERGER, 2015); a análise do RDA e de uma
faceta do modelo conceitual FRBR focado no bibliocentrismo da repre-
sentação descritiva (SMIRAGLIA, 2015); o estudo sobre o conceito de

sumário
164
cultura e como ele pode ser levado em consideração no momento da
construção de sistemas de classificação para diferentes grupos (LEE,
2015); o feito das práticas de classificações sobre dietas no desenvol-
vimento de manuais nacionais para a saúde e o entendimento sobre
esse assunto pela população (McTAVISH, 2015); os aspectos éticos
envolvidos em práticas acadêmicas como plágio, coautoria ou citações
(ORAVEC, 2015); a análise de conceitos bakhtinianos em relação aos
profissionais da organização do conhecimento e sua responsabilidade
em mediar discursos no momento da representação (ARBOIT; GUIMA-
RÃES, 2015); a análise de valores como representação fidedigna, aces-
sibilidade e controle em esquema de metadados arquivístico no âmbito
artístico (McQUEEN, 2015); a proposta de um modelo analítico para a
avaliação de práticas de classificação (McCOURRY, 2015); a análise de
valores éticos para processos de descrição e classificação arquivística
por meio de códigos de ética da área (SILVA; GUIMARÃES; TOGNO-
LI, 2015); a proposta de recomendações para um código de ética em
catalogação (SHOEMAKER, 2015); e o estudo sobre a classificação
utilizada por serviços como a Netflix para recomendações de serviços
e sua falta de neutralidade (LAWRENCE, 2015).

3 CENÁRIO BRASILEIRO NO ÂMBITO ÉTICO


EM ORGANIZAÇÃO DO CONHECIMENTO

A temática de pesquisa relativa aos aspectos éticos em organi-


zação do conhecimento teve forte repercussão na Ciência da Informa-
ção brasileira, em especial pelo forte componente social que a integra.
Assim, no ano 2000, José Augusto Chaves Guimarães apresentou um
conjunto de compromissos éticos do profissional da informação, divi-
didos em cinco instâncias: com o usuário, com a organização, com a
informação, com a profissão e consigo mesmo. O primeiro compro-
misso considera que o usuário não é meramente o destinatário de uma

sumário
165
entrega, mas aquele que irá se apropriar da informação e produzir um
novo conhecimento; a organização ou unidade de informação consti-
tui-se como compromisso do profissional, pois é ali que ele encontra
os meios para a realização da profissão; em relação à profissão, seu
compromisso ético deve estar expresso para que haja “(…) aspirações
conjuntas e práticas integradas” (GUIMARÃES, 2000, p. 66); por últi-
mo, há o compromisso consigo mesmo, do profissional como indiví-
duo que possui preferências, ideias e perspectivas de autorrealização.

Em 2006, Guimarães propões uma série de valores ou premis-


sas éticas, dessa vez voltadas às atividades de organização e repre-
sentação do conhecimento. Para o autor, faltava uma sistematização
desses compromissos éticos, que eram subjacentes a esses proces-
sos. Dessa forma, o autor chama a atenção para fatores como pre-
cisão, tempo, especificidade, garantia literária, revocação, preconcei-
tos nas linguagens documentárias, entre outros, que até então eram
visualizados como meros aspectos, mas que, na verdade, implicam
responsabilidade do profissional que os executa.

O autor identifica, a partir de uma análise no periódico Ethics and


Information Technology, um grupo de cinco valores éticos que mere-
cem destaque nas atividades de organização do conhecimento: priva-
cidade, propriedade intelectual, compromisso, segurança e liberdade.
São reconhecidos ainda um grupo de valores diretamente ligados ao
desenvolvimento tecnológico, como diversidade na representação,
desvios ou representação insuficiente e má-fé na representação.

Considerando o exposto pela literatura pesquisada, Guimarães


(2006) formula então um grupo de problemas concretos que podem
ocorrer por conta do descumprimento desses valores. Estes são: os
preconceitos que residem nos sistemas de organização do conheci-
mento, as categorias dicotômicas estabelecidas por essas linguagens,
suas visões de mundo específicas, problemas relacionados à precisão

sumário
166
dos termos utilizados, a polissemia dos termos e ainda a questão do
politicamente correto na representação.

Também em 2006, Fábio Pinho elabora sua dissertação fazen-


do uma triangulação entre os conceitos de epistemografia interativa,
de García Gutiérrez, o de multilinguismo, de Hudon, e as concepções
de garantia e hospitalidade cultural preconizadas por Beghtol. Para o
autor, há aspectos convergentes entre os discursos desses autores,
como, por exemplo, a ideia de epistemografia interativa difundida por
García Gutiérrez como um grupo de diretrizes para a elaboração de
representações em meio a um universo de diferentes culturas e dis-
cursos por meio de uma linguagem documentária comprometida com
a representação da diversidade e utilizando-se, principalmente, de re-
lações associativas, para que nenhum assunto seja priorizado. Nessa
perspectiva, encontra-se uma maneira de se efetivar esse instrumento
por meio dos estudos de Hudon a respeito da elaboração de um tesau-
ro multilíngue enquanto ferramenta que respeita e pode ser inserida em
diferentes sociedades e culturas (PINHO, 2006).

García Gutiérrez e Hudon ainda trazem conceitos como “purifi-


cação conceitual” e “imperialismo linguístico”, respectivamente, para
refletir sobre a predominância de determinados idiomas nos documen-
tos científicos, o que afeta seu acesso e uso por nações não falantes de
idiomas dominantes, muitas vezes sendo essas caracterizadas como
subdesenvolvidas. Esses conceitos vão ainda ao encontro do que
Beghtol afirma ser necessário: uma integração entre o conhecimento
e a ciência mediante um sistema de representação efetivo e agrega-
dor. A autora ainda evoca o conceito de “ética transcultural”, de García
Gutiérrez, no sentido de que, para um sistema possuir garantia cultural,
sem que outras culturas se sintam excluídas, é necessário que haja um
elemento de união entre essas diferentes culturas (PINHO, 2006).

No tocante aos problemas e valores éticos em OC, Guima-


rães et al. (2008) analisaram um grupo de seis revistas internacionais

sumário
167
importantes na área — Journal of the American Society for Information
Science and Technology — JASIST, Journal of Documentation, Knowl-
edge Organization, Cataloging & Classification Quarterly, The Indexer
e Ethics and Information Technology. Para recuperar os artigos rela-
cionados à temática, foram estabelecidos dois domínios conceituais:
Ética (por meio dos termos ethics, ethical, ethos, deontology, value(s),
conduct e moral) e Organização do Conhecimento (por meio dos
termos knowledge organization, knowledge representation, indexing,
classification, subject cataloguing, subject analysis, content analysis,
abstracting, thesaurus(i) e subject headings), compreendendo como
período de busca os anos de 1995 a 2004.

Desse modo, chegaram a um grupo de valores intrinsicamente


relacionados à ORC. Este pode ser dividido em três dimensões: valo-
res superiores que devem guiar as atividades profissionais – respeito
à privacidade, direitos autorais, acessibilidade, liberdade, segurança,
equidade, diversidade e minimização de riscos; valores reconhecidos
enquanto requisitos profissionais – competência, eficiência, flexibili-
dade, confiabilidade, reconhecimento profissional, atualidade, auto-
nomia, consciência de poder e cooperação; e, por fim, valores antes
vistos apenas como medidas, mas que foram reconhecidos enquan-
to parte do universo axiológico da OC – precisão, revocação, garan-
tia cultural, exaustividade, consistência, usabilidade e hospitalidade
(GUIMARÃES et al., 2008).

Por meio do corpus, chegou-se ainda a um grupo de problemas


éticos associados à OC. Estes estão divididos em: problemas não es-
pecíficos à OC, mas onipresentes na atualidade – segregação digital,
pornografia, lixo eletrônico, profissionais substituídos pela tecnologia e
violência; e problemas diretamente relacionados às atividades de OC
– vigilância, censura, falta de garantia cultural, negligência, informação
direcionada, ineficiência profissional, má representação, racismo, am-
biguidade, marginalização, imparcialidade ou crença na neutralidade,

sumário
168
idiossincrasia, inacessibilidade informacional, terminologia tendencio-
sa e traduções inadequadas (GUIMARÃES et al., 2008).

No que tange ao universo feminino, Milani (2010) buscou anali-


sar, nas ferramentas de indexação, como esse grupo é representado.
Por meio dos termos feminilidade, feminina(s), feminino(s), feminis-
mo(s), feminista(s), materna(o), maternal, mulher(es) e seus respectivos
equivalentes em inglês, a autora realizou uma busca nas linguagens
do Vocabulário Controlado da Universidade de São Paulo, Vocabulário
Controlado Básico do Senado Federal, Terminologia de Assuntos da
Fundação Biblioteca Nacional e Classificação Decimal de Direito para
analisar como esses termos eram representados. Na referida obra, a au-
tora estabelece uma distinção conceitual entre os vieses negativos (bia-
ses) e os vieses sem essa conotação (slants). Por meio dessa análise,
a autora identificou uma série de biases – tendenciosidades – nessas
linguagens, como, por exemplo: a violência conjugal vista como uma
questão apenas de saúde pública, negligenciando os aspectos socio-
lógicos e criminais; a mulher enquanto um tipo específico e o homem
como geral (mulheres delinquentes, mulheres casadas, mulheres na
ciência etc.); qualificadores de gênero sem a devida necessidade (edu-
cação feminina); o sufixo –ismo em lesbianismo, que caracteriza ser
uma doença, ao invés de condição afetiva; entre outras (MILANI, 2010).

Buscando aprofundar-se na temática relacionada às linguagens


de indexação no que tange aos grupos marginalizados, Pinho e Gui-
marães (2012) realizaram uma análise da representação dos homos-
sexuais masculinos em linguagens brasileiras. O ponto de partida dos
autores é que as linguagens podem estar carregadas de eufemismos
preconceituosos, visto que, muitas vezes, principalmente no universo
da homossexualidade, elas representam conceitos-tabus e são con-
sideradas impróprias. Esses eufemismos nem sempre estão claros,
o que pode revelar uma tentativa de “abafar” o termo ou atribuir-lhe
uma perspectiva de politicamente correto. Como exemplo, o autor cita

sumário
169
que a expressão “garoto sensível e educado”, dita para referir-se a um
homossexual, pode, além de mascarar o que a pessoa realmente quer
dizer, ser ofensiva ou irônica para a pessoa referenciada.

Como universo de pesquisa, Pinho e Guimarães (2012) selecio-


naram três das mais importantes linguagens controladas do país, a sa-
ber: Vocabulário Controlado Básico do Senado Federal, o Vocabulário
Controlado da Universidade de São Paulo e a Terminologia de Assun-
tos da Fundação Biblioteca Nacional. Para realizar a análise, os autores
selecionaram um grupo de termos oriundos de artigos publicados em
revistas científicas de destaque na temática homossexual – Journal of
Homosexuality, Sexualities e Journal of Gay & Lesbian Mental Health – e
os comparou com os termos utilizados pelas linguagens documentárias.

Como resultados, os autores puderam perceber que grande


parte dos termos utilizados pela comunidade representada – aqueles
advindos das revistas da área – não se encontra refletido nas lingua-
gens documentárias analisadas. Uma das justificativas para esse fato
é que esses termos geralmente são tratados de maneira periférica,
sem uma efetiva reflexão sobre sua representatividade. Para Pinho e
Guimarães (2012), visto que é impossível representar todo o conheci-
mento humano, deve-se, pelo menos, ter em mente a sua pluralidade
e, para tanto, os estudos éticos tornam-se especialmente necessários.

Novamente no âmbito axiológico da área, utilizando-se metodo-


logia semelhante a pesquisas anteriores, Guimarães, Milani e Evange-
lista (2015) expandem o universo de busca para os anos de 1990-1994
e 2005-2012 e incluem também a série Advances in Knowledge Organi-
zation e os Proceedings da North American Society for Knowledge Orga-
nization, de maneira a ampliar os resultados de Guimarães et al. (2008)
e atualizar esse grupo de valores e problemas. Nessa nova pesquisa,
foram incluídos valores como respeito ao propósito específico de cada
linguagem de indexação, multiculturalismo, comprometimento com as
bases filosóficas da organização da informação e postura mediadora

sumário
170
na indexação. Em relação aos problemas, foi possível identificar ainda
biases na representação de assunto, falta de comprometimento com a
catalogação descritiva, distorção da informação, categorias remanes-
centes gerando empecilhos ao fluxo informacional.

De maneira a abordar em dois valores específicos, que até então


eram vistos apenas como medidas, Evangelista, Simões e Guimarães
(2016) realizaram um estudo analisando a exaustividade e a especifici-
dade enquanto valores éticos da organização do conhecimento. Para
tanto, foram recuperados artigos das bases de dados B-On, EBSCO e
Search Direct, da Elsevier, visto que esse estudo foi realizado durante
um estágio de pesquisa na Universidade de Coimbra e estas serem as
bases mais relevantes ao nível português. Dessa forma, identificaram-
-se variáveis que vêm à tona nesses processos: o número de conceitos
extraídos de um documento, a forma e o nível de especificidade que
são representados são diretamente proporcionais à informação que
pretende representar-se; os níveis de exaustividade e de especificida-
de concorrem para o impacto na recuperação informacional; elevados
níveis de exaustividade concorrem a uma maior atribuição de termos
a um documento, que se fará de acordo com o serviço e o usuário;
um elevado nível de especificidade concorre para uma maior precisão
do documento; a especificidade pode contribuir para a elaboração de
uma rede semântica consistente no que diz respeito a relações hie-
rárquicas; um conjunto significativo de termos específicos atribuídos
a um documento expressa de forma mais precisa os conceitos; a ar-
ticulação entre a exaustividade e a especificidade concorre para uma
maior recuperação informacional; a exaustividade corresponde a um
nível elevado de revocação; a especificidade corresponde a níveis ele-
vados de precisão; a exaustividade traz regularidade e densidade à
indexação; e, por fim, as relações semânticas entre termos-conceitos
são identificadas de forma mais precisa a partir de meios intelectuais
(EVANGELISTA, SIMÕES, GUIMARÃES; 2016; EVANGELISTA, 2016).

sumário
171
De maneira a identificar esses valores éticos, mas no âmbito
arquivístico, Silva, Tognoli e Guimarães (2017) realizaram estudo relati-
vo às atividades de descrição e classificação consideradas nucleares
para a representação arquivística. Para constatar esses valores, foram
recuperados 16 códigos de ética da profissão que compreendiam dez
países e uma associação internacional, que, após uma primeira análise
– relativa à presença ou não dos termos classificação e representação
–, chegou-se a um corpus de análise de dez artigos. Foi, assim, pos-
sível identificar, referente ao processo de classificação, valores como:
acesso à informação; respeito à proveniência; respeito à ordem ori-
ginal; preservação do valor arquivístico do documento; preservação;
conservação; confiabilidade; autenticidade; custódia; e imparcialida-
de. Na segunda categoria de análise, o processo de descrição, che-
gou-se a valores como: acesso à informação; respeito à proveniência;
respeito à ordem original; preservação; confiabilidade; custódia; e im-
parcialidade (SILVA; TOGNOLI; GUIMARÃES, 2016).

A preocupação de a linguagem refletir sua comunidade usuá-


ria, principalmente no que tange aos usuários homossexuais masculi-
nos, também é objeto de reflexão de Guimarães, Nascimento e Pinho
(2017). Os autores abordaram essa realidade na região do Cariri, no
interior do Ceará, que, embora seja conhecida por seus hábitos reli-
giosos, possui minoria que foge à normativa heterossexual. De forma
a representar essa comunidade até então marginalizada, os termos
utilizados por essa população foram categorizados, chegando-se a
um total de 815 termos metafóricos, que podem ser divididos em três
categorias temáticas: nomes femininos; partes do corpo, geralmente
fazendo referência a órgãos sexuais; e ações geralmente relativas a
ações sexuais e traços de personalidade. Em aspectos linguísticos,
os autores perceberam uma forte influência de termos indígenas e
estrangeiros e identificaram que as figuras de linguagem constituem
uma forma de essa comunidade construir sua identidade, utilizando-
-se, muitas vezes, de metáforas, o que é um grande desafio para a
ORC (GUIMARÃES; NASCIMENTO; PINHO, 2017).

sumário
172
Posteriormente, os autores, em coautoria com Campbell e Martí-
nez-Ávila, relacionaram esses resultados com a questão do “poder de se
autonomear”, em alusão ao termo evocado por Olson (2002) “poder de
nomear”. Para os autores, esses padrões terminológicos utilizados por
essas comunidades reforçam três aspectos: o poder de afirmar sua iden-
tidade, o poder de ironizar ou realizar uma crítica social e ainda o poder
que evoca a autoproteção dessa população. Esses fatores devem ser
considerados no momento da construção de uma linguagem documen-
tária que abarque regiões como a estudada (CAMPBELL et al., 2017).

Por meio de uma reflexão da área, Guimarães (2017) propõe


que a perspectiva ética nos processos, produtos e instrumentos em
Organização do Conhecimento deve sempre pautar-se nos eixos es-
paço e tempo, sem os quais ela se torna descontextualizada. Para o
autor, esse campo é afetado por influências geográficas e diacrônicas,
socialmente dinâmico, o que reflete na construção terminológica das
ferramentas inerentes a esse campo científico, o que pressupõe uma
variedade cultural e linguística. Nesse sentido, Guimarães afirma que é
necessário encontrar um equilíbrio entre o respeito por especificidades
locais e a necessidade de um acesso global à informação. De acordo
com o autor, o reconhecimento desses eixos tempo e espaço demons-
tram sua importância quando consideramos que: evita-se preconceitos
presentes e disseminados até então; reconhece os diferentes grupos
e comunidades usuárias das unidades informacionais; promove uma
ética intercultural, evitando danos no futuro.

4 CONSIDERAÇÕES FINAIS

Por meio da revisão de literatura exposta neste capítulo, apre-


sentada diacronicamente de modo a melhor situar como a temática
foi se desenvolvendo ao longo do tempo, foi possível perceber que,

sumário
173
embora a temática relativa aos aspectos éticos Organização e Re-
presentação do Conhecimento tenha dado os primeiros passos há
cerca de cinquenta anos, ainda há um caminho a ser percorrido que
o tempo todo é atualizado face aos novos contextos tecnológicos e
sociais encontrados atualmente.

Ainda que as pesquisas descritas não sejam classificadas de


maneira explícita pelos autores como investigações na dimensão éti-
ca da Ciência da Informação, as preocupações foco das pesquisas
analisadas mostram o inconformismo dos autores com preconceitos
evidenciados nessas ferramentas, ainda que de maneira velada, e
como esses fatores podem afetar o acesso e recuperação da infor-
mação de grupos marginalizados.

Considerando a importância de estudos nesse sentido e que


a mudança nessas ferramentas só ocorre com dados científicos, re-
comenda-se fortemente que essas pesquisas continuem a ocorrer
e que, mais do que isso, que esses estudos sejam sistematizados
e reunidos a partir de estudos como análise de domínio ou de co-
munidades epistêmicas, de modo a que essas informações sejam
evidenciadas e utilizadas como fonte para novos estudos, buscando
sempre a retroalimentação da ciência.

5 REFERÊNCIAS
ADLER, Melissa A. Disciplining knowledge at the Library of Congress. Know-
ledge Organization, Würzburg, v. 39, n. 5, p. 370-376, 2012.
ADLER, Melissa; TENNIS, Joseph T. Toward a taxonomy of harm in knowled-
ge organization systems. Knowledge Organization, Würzburg, v. 40, n. 4,
p. 266-272, 2013.
ARBOIT, Aline Elis; GUIMARÃES, José Augusto Chaves. The ethics of know-
ledge organization and eepresentation from a Bakhtinian perspective. Know-
ledge Organization, Würzburg, v. 42, n. 5, p. 324-331, 2015.

sumário
174
BADE, David. Ethos, Logos, Pathos or Sender, Message, Receiver?: a proble-
matological rhetoric for information technologies. Cataloging and Classifica-
tion Quarterly, Londres, v. 47, n. 07, p. 612-630.
BEAK, Jihee. Where is childrens’ voice in KO? Knowledge Organization,
Würzburg, v. 42, n. 5, p. 284-289, 2015.
BEGHTOL, C. A proposed ethical warrant for global knowledge represen-
tation and organization systems. Journal of Documentation, London,
v. 58, n. 5, p. 507-532, 2002.
BEALL, Julianne. Racially mixed people, DDC Table 5 Ethnic and National
Groups, and MARC 21 Bibliographic Format Field 083. Cataloging and Clas-
sification Quarterly, Londres, v. 47, n. 07, p. 657-670.
BELL, Hazel. Bias in indexing and loaded language. The Indexer, Sheffield,
v. 17, n. 03, 1991, p. 173-177.
BERMAN, S. Prejudices and antipathies: a tract of Library of Congress Sub-
jects Headings concerning people. Metuchen: Scarecrow Press, 1971.
BORKO, Harold. Information science: what is it? American Documentation,
Washington, v. 19, n. 1, p. 3-5, 1968.
LL, Grant. Queer theory and the creation of contextual subject access tools for
gay and lesbian communities. Knowledge Organization, Würzburg, v. 27,
n. 03, p. 122-131, 2000.
CAMPBELL, Grant et al. The terminological polyhedron in LGBTQ terminology:
self-naming as a power to empower in Knowledge Organization. Knowledge
Organization, Würzburg, v. 44, n. 08, p. 586-591, 2017.
COPE, Jonathan. Librarianship as intellectual craft: the ethics of classification
in the realms of leisure and waged labor. Knowledge Organization, Würz-
burg, v. 39, n. 5, p. 356-362, 2012.
DAHLBERG, Ingetrault. Ethics and knowledge organization: in memory of Dr.
S. R. Ranganathan in his centenary year. International Classification, Frank-
furt, v. 19, n. 1, p. 1-2, 1992.
FOX, Melodie J.; REECE, Austin. Which Ethics? Whose Morality?: an analysis
of ethical standards for information organization. Knowledge Organization,
Würzburg, n. 39, v. 5, p. 377-383, 2012.
EVANGELISTA, Isadora Victorino. A exaustividade e a especificidade como
valores éticos no processo de indexação: aspectos conceituais e deontoló-
gicos. 2016. 142 f. Dissertação (Mestre em Ciência da Informação) – Faculda-
de de Filosofia e Ciências, Universidade Estadual Paulista. Marília, 2016.

sumário
175
EVANGELISTA, Isadora Victorino; SIMÕES, Maria Graça Melo; GUIMARÃES,
José Augusto Chaves. A exaustividade e a especificidade como valores
éticos no processo de indexação: uma análise baseada na literatura disponi-
bilizada em Portugal. Páginas A&B, Porto, v. 3, n. 5, p. 58-75, 2016.
FEINBERG, Melanie. Hidden bias to responsible bias: an approach to infor-
mation systems based on Haraway’s situated knowledges. Proceedings of
the sixth International Conference on Conceptions of Library and Infor-
mation Science – “Featuring the future”, v. 12, n. 04, 2007.
FOSKETT, A. C. Better dead than read: further studies in critical classification.
Library Resources & Technical Services, Illinois, v. 28, n. 04, p. 346-359, 1984.
FOSKETT, A. C. Misogynists all: a study in critical classification. Library Re-
sources & Technical Services, Illinois, v. 15, n. 2, p. 117 - 121, 1971.
FURNER, Jonathan. Dewey deracialized: a critical race-theoretic perspective.
Knowledge Organization, Würzburg, v. 34, n. 3, 2007.
GARCÍA-GUTIÉRREZ, A. Knowledge organization from a “culture of the
border”: towards a transcultural ethics of mediation. In: LÓPEZ-HUERTAS,
M.M. (Ed.). Challenges in knowledge representation and organization for
the 21st century: integration of knowledge across boundaries. Würzburg:
ERGON-Verlag, 2002. p. 516-522.
GILLILAND, Anne J. Contemplating co-creator rights in archival description.
Knowledge Organization, Würzburg, v. 39, n. 5, p. 340-346, 2012.
GROSS, Tina. Naming and reframing: a taxonomy of attacks on knowledge
organization. Knowledge Organization, Würzburg, v. 42, n. 5, p. 263-268, 2015
GUIMARÃES, José Augusto Chaves. O profissional da informação sob o pris-
ma de sua formação. In: VALENTIM, M. L. P. (Ed.). Profissionais da informa-
ção: formação e atuação profissional. São Paulo: Polis, 2000. p. 53-70.
GUIMARÃES, José Augusto Chaves. Aspectos éticos em Organização e
Representação do Conhecimento (ORC): uma reflexão preliminar. In: GON-
ZÁLEZ DE GÓMEZ, Maria Nélida; ORRICO, Evelyn Goyannes Dill (Org.).
Políticas de memória e informação: reflexos na organização do conheci-
mento. Natal: EDUFRN, 2006.
GUIMARÃES, José Augusto Chaves et al. Ethics in the knowledge organiza-
tion environment: an overview of values and problems in the LIS literature.
In: ARSENAULT, C.; TENNIS, J. T. (Ed.). Cultural and Identity in Knowledge
Organization. Würzburg: ERGON Verlag, 2008. p. 340-346.

sumário
176
GUIMARÃES, José Augusto Chaves; MILANI, Suellen Oliveira; EVANGELISTA,
Isadora Victorino. Valores éticos na organização e representação do conheci-
mento. Encontros Bibli, Florianópolis, v. 20, n. 1, p. 19-32, 2015.
GUIMARÃES, José Augusto Chaves; NASCIMENTO, Francisco Arrais; PINHO,
Fabio Assis. The metaphorical dimension of LGBTQ information: challenges
for its subject representation. Informação & Sociedade, João Pessoa, v. 27,
n. 3, p. 49-57, 2017.
GUIMARÃES, José Augusto Chaves. Slanted knowledge organization as a
new ethical perspective. In: ANDERSEN, Jack; SKOUVIG, Laura (Org.). The
organization of knowledge: caught between global structures and local
meaning. Bingley: Emerald Publishing Limited, v. 12, p. 87-102, 2017.
HOFFMAN, Gretchen. Meeting users’ needs in cataloging: what is the right
thing to do? Cataloging and Classification Quarterly, Londres, v. 47, n. 07,
p. 631-641, 2009.
HOMAN, Philip A. Library catalog notes for “Bad Books”: ethics vs. responsi-
bilities. Knowledge Organization, Würzburg, v. 39, n. 5, p. 347-355, 2012.
HJØRLAND, B.; ALBRECHTSEN, H. Toward a new horizon in Information
Science: domain-analysis. Journal of the American Society for Information
Science, v.46, n.6, p.400-425, 1995.
HUDON, M. Multilingual thesaurus construction: integrating the views of
different cultures in one gateway to knowledge and concepts. Knowledge
Organization, Würzburg, v. 24, n. 2, p. 84-91, 1997.
JUDGE, Anthony. Anti-developmental biases in thesaurus design. Laetus in
praesens, S.l., 1981. Disponível em: http://www.laetusinpraesens.org/docs/
antidev.php. Acesso em: 6 ago. 2018.
KEILTY, Patrick. Tagging and Sexual Boundaries. Knowledge Organization,
Würzburg, v. 39, n. 5, p. 320-324, 2012.
KIPP, Margaret E. I.; BEAK, Jihee; GRAF, Ann M. Tagging of banned and challen-
ged books. Knowledge Organization, Würzburg, v. 42, n. 5, p. 276-283, 2015.
LAWRENCE, Emily. Everything is a eecommendation: netflix, altgenres and
the construction of taste. Knowledge Organization, Würzburg, v. 42, n. 5,
p. 358-364, 2015.
LEE, Wan-Chen. Culture and classification: an introduction to thinking about
ethical issues of adopting global classification standards to local environ-
ments. Knowledge Organization, Würzburg, v. 42, n. 5, p. 302-307, 2015.

sumário
177
MAI, J.-E. Classification in context: relativity, reality, and representation. Know-
ledge Organization, Würzburg, v. 31, n. 1, p. 39-48, 2004.
MARTÍNEZ-ÁVILA, Daniel; GUIMARÃES, José Augusto Chaves; PINHO, Fabio
Assis; FOX, Melodie J. The representation of ethics and knowledge organiza-
tion in the WoS and LISTA databases. Knowledge Organization, Würzburg,
v. 42, n. 5, p. 269-275, 2015.
MARTÍNEZ-ÁVILA, Daniel; KIPP, Margaret E. I.; OLSON, Hope A. DDC or
BISAC: the changing balance between corporations and public institutions.
Knowledge Organization, Würzburg, v. 39, n. 5, p. 309-319, 2012.
McCOURRY, Maurine. Domain analytic, and domain analytic-like, studies of
catalog needs: addressing the ethical dilemma of catalog codes developed
with inadequate knowledge of user needs. Knowledge Organization, Würz-
burg, v. 42, n. 5, p. 339-345, 2015.
McQUEEN, Kelli. Ethical issues of knowledge organization in designing a
metadata schema for the Leo Kottke Archives. Knowledge Organization,
Würzburg, v. 42, n. 5, p. 332-338, 2015.
McTAVISH, Jill. The ethics of querying and permeating canadian everyday life
nutritional classification technologies and processes. Knowledge Organiza-
tion, Würzburg, v. 42, n. 5, p. 308-315, 2015.
MILANI, Suellen Oliveira. Estudos éticos em representação do conhe-
cimento: uma análise da questão feminina em linguagens documentárias
brasileiras. 2010. 140 f. Dissertação (Mestre em Ciência da Informação) –
Universidade Estadual Paulista Júlio de Mesquita Filho. Marília: Universidade
Estadual Paulista Júlio de Mesquita Filho, 2010.
MILANI, Suellen Oliveira; PINHO, Fabio Assis. Knowledge Representation and
Orthophemism: a reflection aiming to a concept. Knowledge Organization,
Würzburg, v. 39, n. 5, p. 377-393, 2012.
OLSON, H. A. The power to name: marginalizations and exclusions of
subject representation in library catalogues. 1996. 432 f. Tese (Doutorado em
Library and Information Studies) – University of Wisconsin-Madison, Madison,
Wisconsin, United States, 1996.
OLSON, H. A. The power to name: locating the limits of subject representa-
tion in libraries. Dordrecht: Kluwer Academic Publishers, 2002.
ORAVEC, Jo Ann. The moral imagination in an Era of “Gaming Academia”:
implications of emerging reputational issues in scholarly activities for kno-
wledge organization practices. Knowledge Organization, Würzburg, v. 42,
n. 5, p. 316-323, 2015.

sumário
178
PINHO, Fabio Assis. Aspectos éticos em representação do conhecimento:
em busca do diálogo entre Antonio García Gutiérrez, Michèle Hudon e Clare
Beghtol. 2006. 123 f. Dissertação (Mestrado em Ciência da Informação) –
Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília.
PINHO, Fabio Assis; GUIMARÃES, José Augusto Chaves. Male homosexuality
in brazilian indexing languages: some ethical questions. Knowledge Organi-
zation, v. 39, n. 5, p. 363-369, 2012.
SEEMAN, Dean. Naming names: the ethics of identification in digital library
metadata. Knowledge Organization, v. 39, n. 5, p. 325-331, 2012.
SHOEMAKER, Elizabeth. No one can whistle a symphony: seeking a cata-
logers’ code of ethics. Knowledge Organization, Würzburg, v. 42,
n. 5, p. 353-357, 2015.
SILVA, Andrieli Pachú; GUIMARÃES, José Augusto Chaves; TOGNOLI, Natália
Bolfarini. Ethical values in archival arrangement and description: an analysis of
professional codes of ethics. Knowledge Organization, Würzburg, v. 42, n. 5,
p. 346-352, 2015.
SILVA, Andrieli Pachu da; TOGNOLI, Natalia Bolfarini; GUIMARÃES, José
Augusto Chaves. Os valores éticos na organização e representação do co-
nhecimento arquivístico. Brazilian Journal of Information Studies: research
trends, Marília, v. 11, n. 1, p. 44-53, 2017.
SOUZA, Francisco das Chagas. Ética e deontologia: textos para profissionais
atuantes em bibliotecas. Florianópolis: Editora da UFSC, 2002.
SMIRAGLIA, Richard. Bibliocentrism, cultural warrant, and the ethics of re-
source description: a case study. Cataloging and Classification Quarterly,
Londres, v. 47, n. 07, p. 671-686, 2009.
SMIRAGLIA, Richard P. Bibliocentrism revisited: RDA and FRBRoo. Knowled-
ge Organization, Würzburg, v. 42, n. 5, p. 296-301, 2015.
TENNIS, Joseph. Ethos and ideology of knowledge organization: toward
precepts for an engaged knowledge organization. Knowledge Organization,
Würzburg, v. 40, n. 1, p. 42-49, 2013.
UNSWORTH, Kristene. Ethical Concerns of Information Policy and Organiza-
tion in National Security. Cataloging and Classification Quarterly, Londres,
v. 47, n. 07, p. 642-656, 2009.
WALT, Martin Van der. Ethics in indexing classification. International Society for
Knowledge Organization - Germany, 9., 2004, Duisburg. Exposição oral […].
Proceedings… Duisburg: Universität Duisburg, 2004.

sumário
179
WEISSENBERGER, Lynnsey K. Traditional musics and ethical considerations
of knowledge and documentation processes. Knowledge Organization,
Würzburg, v. 42, n. 5, p. 290-295, 2015.
ZHANG, Jane. Archival context, digital content, and the ethics of digital
archival representation. Knowledge Organization, Würzburg, v. 39, n. 5,
p. 332-339, 2012.

sumário
180
6
Capítulo 6

Metodologia de análise de logs


na ciência da informação: revisão
de literatura e melhores práticas

Logs analysis as methodology for


studies on information science:
literature review and best practices
Luciana Monteiro-Krebs
Luciana Monteiro-Krebs
Rita do Carmo Ferreira Laipelt
Rita Do Carmo Ferreira Laipelt
Rafael Port da Rocha
Rafael Port Da Rocha

Metodologia de análise
de logs na ciência da informação:
revisão de literatura e melhores práticas

Logs analysis as methodology


for studies on information science:
literature review and best practices

DOI: 10.31560/pimentacultural/2022.95613.6
Resumo:
Em um cenário de crescente acesso à informação através de plataformas digi-
tais e sistemas de informação, pesquisas envolvendo a análise de logs tornam-
-se cada vez mais relevantes. Através dos logs, pesquisadores e profissionais
da informação podem conhecer as demandas dos usuários com quem não
mantêm contato direto, em função da prestação de serviço se dar remotamen-
te, mediada via sistema de recuperação da informação. No entanto, estudos
que utilizam a análise de logs como método no Brasil são ainda incipientes,
e descrições sistemáticas dos procedimentos metodológicos na literatura na-
cional sobre o tema inexistem. Para preencher essa lacuna, o objetivo deste
capítulo é investigar, sistematizar e descrever as etapas metodológicas e as-
pectos técnicos da análise de logs em CI, com enfoque em sistemas de recu-
peração da informação. Concretiza-se esse objetivo através da sistematização
da seção metodológica dos 10 artigos mais citados disponíveis na Web Of
Science que tenham feito uso de análise de logs, publicados no período entre
2006 e 2016. A proposta metodológica apresenta quatro etapas principais: (i)
contextualização do log; (ii) seleção; (iii) coleta e preparação dos dados; e (iv)
análise dos dados. A etapa de seleção (ii) é ainda dividida em três subetapas,
nas quais se identificam a relevância e adequabilidade das informações do log
aos objetivos de pesquisa, o recorte de dados e a disponibilização e uso dos
dados para análise. Os procedimentos são apresentados com exemplos tanto
dos textos do corpus de pesquisa quanto de estudos mais recentes baseados
na experiência dos autores do presente capítulo.

Palavras-chave: Análise de logs; metodologia da pesquisa; sistemas de


recuperação da informação; estudos de usuário.

sumário
182
Abstract:
In a scenario of increasing access to information through digital platforms and
information systems, research involving log analysis becomes increasingly re-
levant. Through system logs, researchers and librarians can learn about the de-
mands of users with whom they do not have direct contact, due to the fact that
the informational service is provided remotely, usually mediated via an information
retrieval system. However, studies that use log analysis as a method in Brazil are
still incipient, and systematic descriptions of methodological procedures in the
national literature on the subject do not exist. To fill this gap, the objective of this
chapter is to investigate, systematize and describe the methodological steps and
technical aspects of log analysis in Information Science with a focus on informa-
tion retrieval systems. This objective is achieved through the systematization of
the methodological section of the 10 most cited articles available on the Web
Of Science that have made use of log analysis, published between 2006 and
2016. The methodological proposal has four main steps: (i) contextualization of
the log; (ii) selection; (iii) data collection and preparation; and (iv) data analysis.
The selection step (ii) is further divided into three sub-steps, being the relevance
and suitability of the log information to the research objectives, the methodolo-
gical cut and the availability of data for analysis. The procedures are presented
with examples both from the texts of the research corpus and from more recent
studies based on the experience of the authors of this chapter.

Keywords: Log analysis; research methodology; information retrieval systems;


user studies.

sumário
183
1 INTRODUÇÃO

No Brasil, cerca de 152 milhões de indivíduos são usuários da


internet, o equivalente a 81% da população com 10 anos ou mais (CE-
TIC, 2021). Esse índice, crescente principalmente em centros urbanos,
possibilita às unidades de informação no país ampliarem o conheci-
mento a respeito de seus usuários, expressos através de seu com-
portamento online. As interações do usuário com o sistema aplicativo
são gravadas virtualmente em arquivos de log, registrando, para cada
requisição, a data, o horário, o local de acesso (obtido via número IP do
computador que realizou o acesso), assim como a ação determinada
pela requisição e sua situação, entre outras informações. A análise de
tais dados é importante para a melhoria dos serviços disponibilizados
e o atendimento às necessidades informacionais dos usuários em um
cenário cada vez menos presencial de acesso à informação. No que
tange a estudos de usuário na Ciência da Informação (CI), a análise
dos registros de uso em plataformas digitais (registros em logs) ofere-
ce a possibilidade de expandir tanto a quantidade de usuários incluí-
dos nas amostras quanto a granularidade da informação disponível.

No entanto, a literatura da CI a respeito do uso dos registros de


interações dos usuários em bases de dados, sites e/ou catálogos online
ainda é incipiente no Brasil. Por exemplo, uma consulta47 sobre o tema
na base de dados BRAPCI48 em junho de 2021 retornou apenas cinco
publicações. Em sua maioria, os estudos sobre análise de logs na CI
brasileira apresentam resultados de estudos empíricos, com pouco ou
nenhum aprofundamento metodológico. O trabalho de Laipelt (2015)
e Monteiro-Krebs, Rocha e Ribeiro (2017) são exemplos de pesquisas

47 A expressão de busca utilizada foi “análise de logs”, no campo Resumo.


48 BRAPCI (http://www.brapci.ufpr.br/brapci/index.php/home) é uma base que indexa 57
periódicos científicos brasileiros na área de Ciência da Informação com cobertura tem-
poral desde 1972.

sumário
184
realizadas no Brasil que analisam interações entre sistemas de recupe-
ração da informação e usuários. Laipelt (2015) analisou expressões de
busca dos usuários do Portal LexML (Senado Federal Brasileiro) para
demonstrar o potencial dos logs como fonte de coleta de dados para a
escolha de descritores para a representação da informação. Monteiro-
-Krebs, Rocha e Ribeiro (2017) analisaram o uso de um sistema de reco-
mendação para catálogos on-line de bibliotecas universitárias. Já Aires
(2003) descreveu a análise de logs e como ferramenta para incrementar
a qualidade dos resultados das máquinas de busca, porém não realizou
uma análise de logs propriamente dita, por não ter obtido acesso aos
logs das máquinas de busca comerciais. O que de fato foi realizado foi
um estudo das interações de usuários com motores de busca a partir
de relatórios de consultas redigidos pelos próprios sujeitos da pesquisa.
Efetivamente, esse trabalho não poderia ser considerado uma análise de
logs, pois o log propriamente dito não foi utilizado como fonte de dados.

Observa-se, portanto, uma carência em publicações que tragam


orientações metodológicas para pesquisas científicas focadas na análi-
se de logs, em especial com relação aos procedimentos técnicos para
a seleção, a coleta e a análise destes. O presente capítulo oferece sub-
sídios metodológicos para pesquisadores e profissionais da informação
interessados em implementar a análise de logs através de análise sis-
temática das principais publicações sobre o assunto e uma proposta
metodológica com base nas lições aprendidas dessas publicações.

Tendo em vista o potencial do uso de logs em pesquisas no cam-


po da CI, o objetivo deste capítulo é investigar, sistematizar e descrever
as etapas metodológicas e aspectos técnicos da análise de logs em CI
com enfoque em sistemas de recuperação da informação. O procedi-
mento metodológico é proposto com base em uma revisão de literatura,
utilizando como fonte pesquisas reconhecidas pela comunidade cien-
tífica que utilizaram logs. Desta forma, colhemos as melhores práticas
em estudos da CI com alto volume de citações que utilizam a análise de

sumário
185
logs como método. Ao encontrar diferentes descrições, buscamos iden-
tificar, analisar e discutir os procedimentos apresentados pelos autores
na tentativa de sistematizá-los e apresentá-los de forma convergente.
Essa contribuição visa oferecer subsídios aos profissionais e pesqui-
sadores da área fornecendo, também, exemplos práticos de aplicação
da análise de logs em benefício das unidades de informação no país,
além de identificar um panorama de como a questão dos procedimen-
tos técnicos relacionados à análise de logs é abordada nas pesquisas.

Este capítulo está organizado da seguinte forma. A seção 2 ca-


racteriza a análise de logs no contexto da recuperação da informação
em sistemas de informação, apresentando a definição de análise de
logs e introduzindo diferentes tipos de análise. A seção 3 apresenta
a metodologia, identificando as pesquisas na área da CI que utilizam
análise de logs e que apresentam os procedimentos técnicos utili-
zados com relação aos logs, tendo como fonte a plataforma Web of
Science. A seção 4 apresenta etapas que caracterizam procedimentos
metodológicos na análise de logs, delineadas a partir da análise das
pesquisas identificadas na seção 3. O capítulo é encerrado com uma
breve conclusão na seção 5.

2 ANÁLISE DE LOGS NA RECUPERAÇÃO


DA INFORMAÇÃO

Trabalhos empíricos utilizando logs começaram sendo chama-


dos de web searching studies (JANSEN; POOCH, 2000; DAVIS, 2004),
search engine transaction log studies, log analysis, entre outros. Ao lon-
go do tempo, alguns termos foram se consolidando na literatura da CI,
como é o caso da análise do log de transações (transaction log analy-
sis - TLA). “A análise do log de transações é o uso de dados coletados
em um log de transações para investigar uma questão de pesquisa

sumário
186
específica relacionada ao usuário, ao sistema ou ao conteúdo” (SPINK;
JANSEN, 2005, p. 36). As transações são todas as interações entre o
usuário e o sistema, que não precisam, necessariamente, dar-se no
ambiente web. Para estas últimas, Jansen, Taksa e Spink (2009) usam
o termo Web log analysis.
A análise do log de transações é uma ampla categorização de
métodos que abrange várias subcategorizações, incluindo análi-
se de logs da Web (ou seja, análise de logs do sistema da Web),
análise de blog e análise de logs de pesquisa (análise de logs de
mecanismos de busca) (JANSEN; TAKSA; SPINK, 2009, p. 2).

Segundo Jansen (2006, p. 408), “[...] um log de transações é um


registro eletrônico de interações que ocorreram durante um episódio
de pesquisa entre um mecanismo de pesquisa da Web e usuários pes-
quisando informações nesse mecanismo de pesquisa da Web.”. Um
log de transações, segundo Jansen (2006), registra a comunicação
entre os usuários e um sistema em um arquivo. Os logs “[...] repre-
sentam os usuários, são pegadas de informação digital” (NICHOLAS;
HUNTINGTON; WATKINSON, 2005, p. 250).

Na literatura, no entanto, não há convergência para essa clas-


sificação. Diferentes termos designam técnicas operacionalmente dis-
tintas entre si, mas, em linhas gerais, contempladas pela TLA. Assim
como Jansen, Taksa e Spink (2009) por vezes utilizam log analysis para
se referir à TLA, Nicholas, Huntington e Watkinson (2005) também utili-
zam log analysis quando se referem a deep log analysis (DLA - análise
profunda de logs), que é diferente de TLA, embora, ao analisar os mé-
todos descritos em seus artigos e artigos citados por eles, percebe-
-se que a deep log analysis é, na prática, um aprimoramento da TLA.
A DLA agrega, aos dados de pesquisa/navegação obtidos via log, in-
formações contextuais relativas aos usuários, que podem ser demo-
gráficas ou pessoais extraídas a partir de outras técnicas de coletas de
dados (questionários, entrevistas, dados de login/identificação etc.),
com isso, tem-se a caracterização como análise “profunda” de logs.

sumário
187
Um exemplo desse tipo de estudo é o realizado por Nicholas et
al. (2006a) que investigam o comportamento de busca de informações
de quase três milhões de usuários à medida que exploram o site49, o
número de visitas realizadas, bem como o tipo de itens e o conteúdo vi-
sualizado em duas bibliotecas digitais de periódicos, a EmeraldInsight
e a Blackwell Synergy. O que caracteriza esse estudo como DLA é a
combinação desses dados com a identificação de perfis de usuários
por profissão, local de trabalho, tipo de assinatura do periódico, loca-
lização geográfica, tipo de universidade, número de itens visualizados
em uma sessão etc. (NICHOLAS et al., 2006a, p. 1345). Uma excelente
revisão dos estudos de pesquisa na Web (Web searching studies) é
resumida por Jansen e Pooch (2001). Para acessar um histórico mais
antigo de TLA, recomendamos consultar Peters (1993).

Na busca de informação, o usuário pode utilizar filtros e cate-


gorias que determinem o conjunto de resultados que ele quer obter,
para além da expressão de busca. Após realizar a busca, o usuário
navega pelos resultados, selecionando as obras que decidir ler ou
acessar o registro. É a partir dos registros gerados por essas intera-
ções entre os usuários e o sistema que a análise de logs se faz pos-
sível. As expressões de busca, em que itens dos resultados o usuário
clicou, quais documentos foram visualizados e/ou baixados e todos
os demais dados podem ser usados como variáveis para pesquisas
no campo da Ciência da Informação.

Através de estudos com análise de logs, pode-se identificar


quais métodos de recuperação da informação são preferidos pelos
usuários de determinadas áreas do conhecimento. No ambiente de
informação eletrônica, estudos de usuários de periódicos on-line apon-
tam a preferência geral dos usuários para pesquisar por assunto em
bancos de dados ao invés de navegar pelos periódicos (CHEN, 2010;
49 O número de itens ou páginas visualizadas em uma sessão é chamado de “site penetra-
tion”, que traduzimos como “penetração no site” (ver seção 4.1) (NICHOLAS et al., 2006a;
NICHOLAS et al., 2007).

sumário
188
MENG-XING; CHUN-XIAO, YONG, 2010). O estudo de Vakkari e Talja
(2006) identifica essa tendência, principalmente para ciências naturais
e medicina, em relação a outras disciplinas. Além da busca e da na-
vegação, outros métodos também se mostram relevantes para a RI,
(Recuperacao da Informação) como o encadeamento de citações, que
se mostrou “[...] um método de pesquisa significativamente mais rele-
vante em economia e engenharia em comparação com humanidades
e medicina” (VAKKARI; TALJA, 2006, documento eletrônico).

Apesar de haver distinção conceitual entre busca de informa-


ção e navegação, para a análise de logs, ambas são interessantes
e podem auxiliar nos estudos que visam à melhoria dos serviços in-
formacionais oferecidos pela instituição. Na busca de informação (ou
pesquisa), podem-se analisar os termos que compõem a expressão
de busca – no intuito de melhorar o vocabulário controlado e rede de
remissivas, assim como identificar tendências temáticas de pesquisa.
Na navegação, por outro lado, pode-se analisar a jornada do usuário,
que itens ele visualizou e em quais ele clicou etc. – no intuito de me-
lhorar a estrutura do site, formatos de conteúdo, caminhos internos.

Recentemente, outros tipos de análises que incluem informa-


ções oriundas de logs começaram a ganhar popularidade entre ges-
tores de sistemas e bibliotecas, chamando a atenção de pesquisa-
dores também. Com o advento de ferramentas de análise estatística
(como AWStat, Google Analytics, entre outras), os gestores passam
a ter acesso a gráficos e dashboards com resumos de tráfego para
os sites que gerenciam. Essas ferramentas leem os logs do sistema
e mostram os resultados em formas de tabelas e até gráficos, o que
facilita a tomada de decisão no que tange a potenciais melhorias do
sistema. No entanto, tais ferramentas são diferentes da análise de logs
como concebida em nosso trabalho (DLA e TLA) por três motivos:

Primeiro, o pesquisador não possui acesso ao log em si, ape-


nas aos resultados por meio da análise estatística da ferramenta. Isso

sumário
189
limita as informações que a ferramenta apresenta, ou seja, nem to-
das as variáveis são computadas nem são passíveis de cruzamentos.
A decisão do que é ou não apresentado é feita anteriormente à con-
sulta do pesquisador, ainda na fase de design to dashboard, e não
há a possibilidade de o pesquisador escolher quais variáveis deseja
cruzar para atender seus objetivos de pesquisa. Por exemplo, se a fer-
ramenta determina que o IP dos acessos será apagado dos registros
para preservar a privacidade dos usuários, o pesquisador não poderia
se valer dessa informação (IP) para analisar a jornada de um usuário
específico. Apenas dados agregados estariam disponíveis, permitindo
somente estudos de conjuntos de usuários, o que é mais interessante
para estudos quantitativos e menos valioso para análises qualitativas.

Segundo, em geral, essas ferramentas também não documen-


tam exaustivamente de onde vêm os valores apresentados nas esta-
tísticas. Assume-se que as informações provêm dos logs, porém não
é possível encontrar nenhuma documentação que indique qual campo
do log/http é utilizado em cada análise estatística. Nas análises TLA e
DLA, esses dados são conhecidos pelos pesquisadores, até por uma
questão de transparência metodológica e replicabilidade.

Terceiro, os relatórios estatísticos também reúnem dados de ou-


tras fontes, como, por exemplo, o site visitado pelo usuário antes de
chegar na home do sistema analisado. Através de APIs, data e hora de
consulta são incorporadas à análise e, em alguns casos, até expressões
inseridas nos motores de busca são oferecidas nos relatórios. Todas es-
sas características impedem o pesquisador de isolar e cruzar variáveis,
além de estabelecer livremente os recortes de dados de acordo com
os seus objetivos de pesquisa. As ferramentas de análise estatística,
como Google Analytics e AWStat, estão limitadas ao que os relatórios
que essas empresas definem previamente e, portanto, não se encaixam
na definição de análise de logs conforme a metodologia aqui descrita.

sumário
190
3 PESQUISAS EM ANÁLISE DE LOGS
NA CIÊNCIA DA INFORMAÇÃO

Várias pesquisas mencionam que seus estudos foram feitos a


partir da análise de logs. Entretanto, essas pesquisas pouco relatam os
procedimentos utilizados com relação aos logs. Esta seção identifica e
caracteriza pesquisas que usam logs.

Realizou-se uma busca na bibliografia especializada em que a


análise de logs consta como assunto principal da publicação ou foi
mencionada junto aos métodos em pesquisas na Ciência da Infor-
mação. Optou-se pela busca na Web of Science pela abrangência
da base, pelos recursos de recuperação e filtragem dos conteúdos
e pela facilidade em gerar relatórios preliminares para rápida visua-
lização de características do corpus. A coleta foi realizada em 20 de
agosto de 2017. Foi realizada busca na plataforma Web of Science
por trabalhos sobre análise de logs ou que usam análise de logs
como metodologia, na área da Ciência da Informação50. A maior parte
dos artigos encontrados são estudos aplicados.

A triagem dos textos selecionados obedeceu a dois critérios:


impacto (número de citações) e adequação ao escopo desse artigo.
Após a busca na base, ordenamos a lista de resultados (141 artigos)
por número de citações (começando pelo mais citado). O artigo mais
citado da lista contém 297 citações e o menos citado, uma citação.

A partir desse extrato, utilizamos como segundo filtro os obje-


tivos do presente capítulo. Nosso intuito é criar um protocolo meto-
dológico para auxiliar profissionais e pesquisadores da Ciência da
50 Expressão de busca utilizada na Web of Science: Você pesquisou por: Tópico: (“log analy-
sis” OR “análise de logs” OR TLA OR “transaction log analysis”) OR Título: (“log analysis”
OR “análise de logs” OR TLA OR “transaction log analysis”) Refinado por: Categorias do
Web of Science: (INFORMATION SCIENCE LIBRARY SCIENCE) Tempo estipulado: 2006-
2016. Índices: SCI-EXPANDED, SSCI, A&HCI, CPCI-S, CPCI-SSH, ESCI. Resultados: 141
(de Principal Coleção do Web of Science).

sumário
191
Informação a realizar estudos utilizando análise de logs. Assim, faz
sentido nos guiarmos pelos materiais que trouxessem embasamen-
to teórico sobre os métodos e, por isso, artigos exclusivamente de
relatos de pesquisa foram desconsiderados. Como a maioria está
relatando estudos aplicados a partir do uso da análise de log, sele-
cionamos os que mais traziam definições de log, das variáveis que
o compõem e as etapas do processo de pesquisa. O quadro abaixo
mostra os artigos que serviram de fundamento para a sistematização
apresentada neste capítulo. Ele fornece os dados dos artigos analisa-
dos e como eles foram utilizados nessa revisão bibliográfica.

Quadro 1 – Artigos mais citados entre os que utilizam análise de logs

Utilizado
Título Autor(es) Periódico Data # citações
na seção
How are we searching Jansen, BJ; INFORMATION
the World Wide Web? Spink, A. PROCESSING &
A comparison of MANAGEMENT. v. JAN 2006 297 4.3
nine search engine 42, n. 1, p. 248-263
transaction logs
Search log analysis: Jansen, BJ. LIBRARY & INFOR-
4.1
What it is, what’s been MATION SCIENCE
2006 81 4.2
done, how to do it RESEARCH, v. 28,
4.4
n. 3, p. 407-432
Defining a session on Jansen, BJ.; JOURNAL OF THE
web search engines Spink, A.; AMERICAN SOCIETY
Blakely, C.; FOR INFORMATION 63 4.1
APR 2007
Koshman, S. SCIENCE AND
TECHNOLOGY, v. 58,
n. 6, p. 862-871
The information Nicholas, D.; INFORMATION PRO-
seeking behaviour of Huntington, P.; CESSING & MANA-
the users of digital Jamali, HR.; GEMENT, v. 42, n. 2006a 40 4.3
scholarly journals Watkinson, A. 5, p. 1345-1365

sumário
192
E-textbook use, infor- Nicholas, D.; JOURNAL OF
mation seeking beha- Rowlands, I.; INFORMATION
4.2.1
viour and its impact: Jamali, HR. SCIENCE, v. 36, APR 2010 37
4.4
Case study business n. 2, p. 263-280
and management
What deep log analysis Nicholas, D.; JOURNAL OF DOCU-
tells us about the Huntington, P.; MENTATION, v. 62,
2006b 32 4.4
impact of big deals: Jamali, HR.; n. 4, p. 482-508
case study OhioLINK Tenopir, C.
Characterising and Nicholas, D.; INFORMATION PRO-
evaluating information Huntington, P.; CESSING & MANA-
seeking behaviour Jamali, HR.; GEMENT, v. 43, n.
2007 22 4.1
in a digital envi- Dobrowol- 4, p. 1085-1102
ronment: Spotlight ski, T.
on the ‘bouncer’
Online use and Nicholas, JOURNAL OF
information seeking D.; Clark, D.; INFORMATION
behaviour: institutional Rowlands, I.; SCIENCE, v. 35, 2009 18 4.3
and subject compari- Jamali HR. n. 6, p. 660-676
sons of UK researchers
Empirical observa- Huynh, T.; INFORMATION
tions on the session Miller, J. PROCESSING &
2009 9 4.1
timeout threshold MANAGEMENT, v.
45, n. 5, p. 513-528
Library and information Warwick, C.; PROGRAM-ELEC-
resources and users Terras, M.; TRONIC LIBRARY
of digital resources Galina, I.; AND INFORMATION 2008 9 4.3
in the humanities Huntington, SYSTEMS, v. 42,
P.; Pappa, N. n. 1, p. 5-27

Fonte: elaborado pelos autores.

A partir dos artigos selecionados, realizamos a sistematiza-


ção dos conteúdos com foco nas principais contribuições poten-
ciais para a CI. Analisando os estudos, observou-se a relevância de
estágios anteriores à coleta de dados para a análise de logs, con-
forme destacado pelos trabalhos de Nicholas et al. (2005), Jansen
(2006), Nicholas et al. (2007), Jansen et al. (2007) e Huynh e Miller
(2009). Por exemplo, Nicholas et al. (2005) explicam como a análi-
se de logs se diferencia de outros métodos de pesquisa, ao refletir

sumário
193
ações dos usuários sem a interferência do pesquisador. Os demais
autores apresentam definições de diversos conceitos relevantes,
como, sessão, consulta, penetração no site e itens visualizados.
Ao sistematizar os procedimentos metodológicos, essas informações
foram incorporadas na etapa de contextualização do log (seção 4.1).

Também se observou como os autores explicam a etapa de se-


leção dos logs (seção 4.2), o que é destacado por Jansen (2006) e
Nicholas, Rowlands e Jamali (2010). Especificamente, três subetapas
da seleção foram identificadas. Primeiro, como o pesquisador pode
compreender a relevância e adequabilidade das informações do log
(seção 4.2.1). Nessa fase, a sistematização traz exemplos de linhas de
log e informações fornecidas pelo registro. Segundo, como o recorte
de dados pode ser feito dependendo dos objetivos da pesquisa (se-
ção 4.2.2). E terceiro, a disponibilização e uso dos dados (seção 4.2.3),
quando ocorre a negociação com os responsáveis pela guarda do log
para acesso a estes. Cuidados com a privacidade dos usuários são
necessários e explicados nesta seção.

Diversos trabalhos entre os mais citados apontam ainda como


a etapa de coleta e preparação de dados (seção 4.3) se dá empirica-
mente. A sistematização traz exemplos de possibilidades de análise de
expressões de busca (JANSEN; SPINK, 2006) e análises de diversas
outras variáveis, especialmente aplicáveis para DLA, conforme desta-
cado por Nicholas et al. (2006a; 2009) e Warwick et al. (2008).

Finalmente, a análise de dados (seção 4.4) é explorada. Apresen-


ta-se como os estudos de logs podem contribuir para melhoria de sis-
temas de recuperação da informação, com exemplos de aplicabilidade
baseados em Jansen (2006). Evidencia-se também a possibilidade de
cruzamento de variáveis do log com dados de diferentes fontes, como
questionário e grupo focal. Exemplos desses cruzamentos (típico de
DLA) e os resultados esperados são demonstrados com citações de Ni-
cholas, Rowlands e Jamali (2010) e Nicholas et al., (2006b). As limitações
dos estudos com logs (JANSEN, 2006) são apresentadas na conclusão.

sumário
194
4 SISTEMATIZAÇÃO DOS PROCEDIMENTOS
TÉCNICOS DE ANÁLISE DE LOGS
NA CIÊNCIA DA INFORMAÇÃO

A análise de logs não é um método simples de ser empregado,


por dois motivos principais. O primeiro é a dificuldade de acesso à ma-
téria-prima, haja vista que diversos cuidados devem ser empregados
para garantir a segurança da informação e o respeito à privacidade dos
usuários cujas interações estão registradas nos logs. A anonimização
de IP é um exemplo. O segundo motivo é o conhecimento técnico que
se demanda para manusear os logs. É necessário entender minima-
mente de programação para entender a linguagem e a estrutura dos
arquivos que se vai receber.

Porém, informações extraídas dessa fonte são valiosas por,


pelo menos, duas razões. Em primeiro lugar, a confiabilidade dos
logs. Usar logs como fonte de dados para conhecer o comportamen-
to informacional elimina qualquer eventual interferência do pesquisa-
dor sobre o usuário no momento da consulta e acesso à informação.
As informações dos logs são fiéis aos fatos, pois provém um registro
direto e imediato do que as pessoas de fato fizeram durante a intera-
ção com o sistema, “[...] não o que dizem que poderiam ou gostariam
de fazer; nem o que eles foram levados a dizer, tampouco o que eles
pensam que fizeram” (NICHOLAS et al., 2005, p. 1445). Em segundo
lugar, as pessoas têm dedicado cada vez menos tempo para partici-
par de pesquisas e preencher questionários (LAIPELT, 2015). Portanto,
através dos logs, é possível coletar grandes volumes de dados com
riqueza de detalhes de forma quase instantânea, sem as limitações
de tempo e espaço impostas pela disponibilidade dos participantes
da pesquisa para questionários ou entrevistas, por exemplo.

sumário
195
Para facilitar essa tarefa, nessa seção apresenta-se uma sis-
tematização dos procedimentos e aspectos técnicos utilizados em
análise de logs, a partir do exame dos trabalhos apresentados no
Quadro 1. Essa sistematização inicia pela compreensão das intera-
ções entre usuário e sistema aplicativo e o registro dessas interações
em arquivos de log, prosseguindo por aspectos e procedimentos que
envolvem seleção, coleta, preparação e análise.

Segundo Jansen (2006), a análise de logs envolve três etapas


principais: (i) coleta: processo de recolha dos dados de interação de
um determinado período em um log de transações; (ii) preparação: pro-
cesso de limpeza e organização dos dados de log de transações; e (iii)
análise: processo de exame dos dados com vistas a alcançar os resulta-
dos da pesquisa. Nesse estudo, adiciona-se às etapas de Jansen a con-
textualização do log, na qual os logs são primeiramente compreendidos
pelo pesquisador no contexto das interações entre usuários e Sistemas
de Recuperação da Informação (SRI), e a seleção, na qual são feitas
análises prévias do escopo e das viabilidades do uso de um log em uma
pesquisa. Essas duas questões são fundamentais para a tomada da de-
cisão sobre o uso ou não de um log e para minimizar riscos que possam
vir a ocorrer em passos subsequentes da pesquisa. Elas foram propos-
tas por este estudo à medida que se observou nos artigos analisados
preocupações em demonstrar logs e seu funcionamento, assim como
as viabilidades e as possibilidades do uso desses logs nos estudos.

Partindo dessas etapas, a seguir apresenta-se a proposta meto-


dológica baseada em uma sistematização da literatura sobre a análise
de logs, considerando, além das etapas previstas por Jansen, outras
questões que se consideram relevantes do ponto de vista de diversos
autores que são citados ao longo do texto.

sumário
196
4.1 CONTEXTUALIZAÇÃO DO LOG

A contextualização compreende a percepção, por parte do pes-


quisador que utilizará logs em suas análises, do contexto em que ocor-
rem as interações entre o sistema aplicativo, os usuários e o registro
dessas interações no log. No contexto dos sistemas aplicativos que
operam na plataforma Word Wide Web, um log representa o registro
das interações entre usuários e sistemas que rodam em Servidores
Web, que, no caso desse capítulo, são SRI. Jansen (2006, p. 419) defi-
ne interação como “[...] qualquer troca específica entre o pesquisador
e o sistema (ou seja, enviar uma consulta, clicar em um hiperlink etc.)”.

Ao realizar suas buscas e ao navegar pelos resultados dessas


buscas, um usuário de um SRI realiza várias interações, determinadas
através de requisições ao servidor. Por exemplo, ao preencher e enviar
um formulário que contém uma expressão de busca, o usuário está rea-
lizando uma requisição, que terá como resposta o resultado da consulta
expressa no formulário. Ao clicar em um item do resultado dessa consul-
ta, o usuário está realizando uma outra requisição. Essa requisição terá
como resposta a visualização das informações bibliográficas do item.

As interações ocorrem através do protocolo HTTP, que é um


protocolo de requisição-resposta entre o cliente (usuário) e o servidor
(sistema). Os logs são arquivos situados no servidor em que ficam
registradas informações referentes às requisições. Common Log For-
mat (CFL) é o formato básico para representação de arquivos de logs.
Logs representados em CFL registram: o endereço IP do computador
do usuário que realizou a requisição; a identificação do usuário; a
data e o horário da requisição; a requisição; um código que identifi-
ca o estado da requisição (como sucesso ou erro); e o tamanho em
bytes da resposta à requisição.

sumário
197
Em uma requisição, informações são passadas ao servidor. Es-
sas informações são específicas de cada sistema aplicativo e basica-
mente indicam a ação solicitada ao sistema (como a de realizar uma
consulta) e os parâmetros necessários para a execução dessa ação
(como a expressão de uma consulta).

No protocolo HTTP, as requisições não possuem estado, isto é,


para o servidor, cada requisição é independente da outra, não havendo
o conhecimento de que duas ou mais requisições participam de um
mesmo conjunto de interações e compartilham uma mesma situação
ou estado. Entretanto, para permitir a realização de interações com
estado, sessões podem ser implementadas pelos sistemas aplicati-
vos. Segundo Jansen (2006), uma sessão compreende uma série de
interações que ocorrem em um determinado período para atender a
uma ou mais necessidades de informação.

O sistema aplicativo determina quando uma sessão é iniciada


ou encerrada. Por exemplo, uma sessão pode ser iniciada por um de-
terminado sistema aplicativo quando o usuário acessa o site ou quan-
do este executa uma determinada função da aplicação. Já o término
de uma sessão, por exemplo, pode ser determinado quando o usuá-
rio executa uma determinada função ou por situações como tempo
limite ou desativação do navegador. As sessões são identificadas por
um código interno, e todas as requisições que são realizadas em uma
mesma sessão carregam o código dessa sessão, que também fica
registrado no log, junto ao registro de cada requisição. Na análise de
logs, esse código de sessão é usado para recuperar todas as requisi-
ções que ocorreram em uma mesma sessão, e o início e o fim de uma
sessão são conhecidos, respectivamente, pelas datas da requisição
mais antiga e da última requisição registrada na sessão.

A delimitação das sessões faz parte da estratégia que cada sis-


tema estabelece para realizar suas interações com o usuário. Jansen
(2006), considerando os logs analisados em sua pesquisa, caracteriza

sumário
198
a sessão como “episódio de pesquisa”, e afirma que “A duração da
sessão é o tempo total que o usuário passou interagindo com o me-
canismo de pesquisa, incluindo o tempo gasto visualizando o primeiro
e os documentos subsequentes da Web, exceto o documento final.”
(JANSEN, 2006, p. 419)51. No sistema da biblioteca digital utilizado por
Nicholas et al. (2007), a sessão é identificada por um número único
no log. Para cálculo de tempo da sessão, eles utilizam etiqueta (tag)
de início de sessão e uma tag de finalização de sessão. “Se isso não
estiver disponível, os pesquisadores escolhem um prazo máximo no
qual um usuário pode estar inativo e considere isso como o final dessa
sessão” (NICHOLAS et al., 2007). Huynh e Miller (2009) trazem diver-
sos exemplos de estudos com diferentes métricas para definir o tem-
po de sessão. Para contribuir com os estudos no campo, os autores
apresentam um modelo matemático para estimar o tempo de sessão
baseado em observações empíricas. Jansen et al. (2007) compararam
três métodos que contemplam diferentes variáveis para estabelecer
qual a melhor maneira de determinar o que é uma sessão de pesqui-
sa. Para os autores, o método que apresenta a melhor identificação
contextual, com extensão e duração da sessão, é o que utiliza as va-
riáveis endereço IP, cookie, e alterações de conteúdo das consultas.

Na análise de logs de sistemas aplicativos de recuperação de


informação, normalmente os seguintes conceitos são relevantes:

• Consulta: “Uma consulta é definida como uma sequência de


zero ou mais termos submetidos a um mecanismo de pesquisa”
(JANSEN, 2006, p. 418, tradução nossa). A consulta é registrada
no log como informação adicionada a uma requisição que de-
termina a execução de uma consulta. Cada sistema aplicativo
possui uma forma específica para representar uma requisição
que solicita a execução de consulta.

51 A duração da sessão é tipicamente curta, com pesquisadores da Web usando entre cinco
e 120 minutos (JANSEN, 2006).

sumário
199
• Penetração no site: Nicholas et al. (2006a) e Nicholas et al.
(2007) utilizam esse termo (site penetration) para nomear a
quantidade de itens ou páginas visualizadas em uma sessão.
Isso pode ser obtido a partir da identificação das requisições
registradas no log que determinam a visualização de itens.

• Itens visualizados: Esse conceito varia de sistema para siste-


ma. Para Nicholas et al. (2007, 1088, tradução nossa), conside-
ra-se um “[…] item ‘completo’ retornado pelo servidor ao cliente
em resposta a uma ação do usuário”. Segundo o autor, arquivos
de log tradicionais diferem grandemente dos registros de biblio-
teca digital. Os primeiros registram imagens e documentos de
texto separadamente. Já nos registros de biblioteca digital, um
item completo pode ser todas as páginas, gráficos etc. de um
artigo, e isso é registrado como um único item, incluindo um
resumo, um artigo ou um sumário. (NICHOLAS et al., 2007).

4.2 SELEÇÃO

A seleção compreende a definição do escopo e a identificação


das viabilidades do uso dos logs na pesquisa. Envolve verificar se o
sistema produz informações relevantes e adequadas para a realiza-
ção de uma pesquisa científica, definir o recorte temporal, negociar a
disponibilidade e o uso dos dados, incluindo questões com relação à
privacidade dos dados.

4.2.1 Relevância e adequabilidade das informações do log

As questões de pesquisa vão nortear quais dados devem


ser coletados e em que período, porém deve-se observar que cada
sistema possui características específicas criadas durante o seu

sumário
200
desenvolvimento, o que implica padrões predefinidos pelos aplicati-
vos de software (JANSEN, 2006, p. 412; LAIPELT, 2015). Outro motivo
de variação é a “[...] técnica empregada no momento da coleta dos
mesmos” (LAIPELT, 2015, p. 166). Nicholas et al. (2005, p. 1446) evi-
denciam diferentes formas de medir o uso dos documentos: o registro
pelo servidor de um único item “[...] pode incluir um resumo, um artigo
ou um índice”, ou pode-se considerar como um item completo todas
as páginas, gráficos etc. de um artigo, se isso for assim registrado
pelo servidor. Tradicionalmente, no entanto, os arquivos de log gravam
imagens e documentos de texto separadamente.

Fica claro, portanto, que a variedade de possibilidades de in-


formação a serem obtidas nos logs depende do que o servidor apre-
senta, e cabe ao pesquisador definir as métricas utilizadas para análi-
se. Assim, o pesquisador precisa adequar-se ao que oferece o log em
termos de dados para articular suas questões de pesquisa tendo em
mente o que a fonte é capaz de fornecer. Isso evidencia a importância
de uma etapa de planejamento antes da coleta dos dados nos logs.

A seleção envolve verificar se o sistema em questão con-


tém informações relevantes para a análise e se o log é adequado e
suficiente para a realização dessa análise. Isso pode ser realizado
primeiramente através da experimentação (operação) do ambiente,
pela sua exploração via interface de usuário, com a anotação das
interações relevantes ao estudo e das informações associadas a
cada interação. Com base nesse levantamento de interações, pode-
-se identificar variáveis e indicadores potenciais para o estudo.

O pesquisador pode navegar no sistema, realizar consultas e


anotar os resultados, procurando entender que tipo de retorno o sis-
tema oferece via pesquisa. Por exemplo, uma consulta a um catálogo
de biblioteca geralmente envolve um campo de busca e, às vezes,
alguns parâmetros (como os campos onde a busca será realizada).
Em outros casos, esses parâmetros aparecem somente na busca

sumário
201
avançada. Após a realização da busca, é esperada uma lista de resul-
tados (ordenados por algum critério, que também pode ser observa-
do) que apresenta algumas informações básicas de cada documen-
to, como título, autor, data etc. Este é um exemplo de interação com o
sistema, do qual se pode apreender as possibilidades que o sistema
oferece, o que pode ser solicitado e o que ele devolve da requisição.

Por exemplo, Monteiro-Krebs (2013) analisou o uso de sistemas


de recomendação, selecionando as variáveis de uso ou não da reco-
mendação feita pelo sistema, quantidade de documentos visualizados,
tipos de recomendação usados, tempo de sessão, data, IP do usuá-
rio. Observa-se que, nesse caso, as expressões de busca não foram
coletadas pois não eram relevantes para o objetivo da pesquisa. Se,
por outro lado, o objetivo da pesquisa fosse examinar as tendências
temáticas de um domínio, seria recomendado considerar a análise dos
termos de busca, estabelecendo o ponto de corte a partir da saturação
dos dados (LAIPELT; MONTEIRO-KREBS, 2021).

Foi o caso da pesquisa de Laipelt (2015), que coletou logs do


Portal LexML referentes a um período de 15 dias. A partir da aplica-
ção de um filtro, a pesquisadora selecionou os parâmetros relevan-
tes para a sua pesquisa, que foram IP, data, horário, expressão de
busca e tipo de documento (Legislação, Doutrina e Jurisprudência).
Além disso, usou para seleção de seus corpora de estudo os critérios
de frequência e funcionalidade (LAIPELT; MONTEIRO-KREBS, 2021).
Como observa-se nesse caso, se o intuito da pesquisa é estudar a
linguagem, as expressões de busca dos usuários são mais relevan-
tes do que o tempo da sessão.

Após identificar as interações relevantes ao estudo, o passo se-


guinte é verificar como essas interações são representadas no log, a partir
da análise de uma pequena amostra de registros. O log de interações de
sistemas de recuperação da informação tipicamente oferece informações
como quem fez a consulta (IP), o que foi procurado (expressão de busca

sumário
202
e filtros utilizados – se aplicável), o que obteve como resposta (lista de
resultados), qual(is) documento(s) escolheu(ram)-se para ver em detalhes
(item(ns) clicado(s)/visualizado(s)) e que ações realizou (apenas abriu o
registro, fez download do documento, realizou uma reserva etc.).

A interpretação do log envolve a identificação do que cada re-


gistro de log informa, porque cada sistema possui uma estrutura espe-
cífica de informações, que pode variar bastante. Cada registro de log é
composto por informações que representam uma interação do usuário
com o sistema, na forma de requisição. Os elementos que compõem
uma requisição são chamados de parâmetros, e cada parâmetro pode
ser utilizado como uma variável na pesquisa. Na Figura 1, apresen-
tamos a decodificação de um registro de requisição do trabalho de
Monteiro-Krebs (2013):

Figura 1 – Exemplo de registro do log decodificado

Fonte: Monteiro-Krebs (2013, p. 65) sistematizado pela autora.

A partir da decodificação representada na Figura 1, pode-se


identificar a ação do usuário: ocorre no dia 18 de dezembro de 2012,
às 02h25min25seg, o usuário (IP oculto), dentro da sessão de número
5PAAB6[...]QQ73, acessou o registro do documento 0004045368, que
foi originado de uma recomendação do tipo OtherH2 (que significa li-
gação por classificação, ou seja, o sistema está recomendando outras
obras sobre o mesmo assunto).

sumário
203
Já na Figura 2, o log analisado por Nicholas, Rowlands e Jamali
(2009) registra informações diferentes do exemplo anterior. Os dois pri-
meiros campos mostram data e hora de quando o arquivo foi enviado
pelo servidor ao computador do usuário. O próximo campo fornece a
ação (download) e descreve o tipo de página; aqui /browse/open.asp
refere-se à página inicial. O campo a seguir é o número do IP. “Mozilla
/ 5.0 + (Windows; + U; + Windows + NT + 6.0; + fr; + rv: 1.8.1.11)
+ Gecko/20071127 + Firefox/2.0.0.11” identifica o tipo de navegador
da máquina cliente. O campo http://www.sussex.ac.uk/library/resour-
ces/e-books.php é o campo de referência e fornece os detalhes do site
e da página da página anterior visualizada pelo usuário. Nesse caso,
esta era uma página de recursos de e-book ou links na Universidade
de Sussex (NICHOLAS; ROWLANDS; JAMALI, 2010).

Figura 2 – Exemplo de registro do log decodificado

Fonte: Nicholas, Rowlands e Jamali, 2010, p. 4.

Uma questão importante a ser analisada é que logs podem não


registrar informações que permitam a identificação do encadeamento
entre as interações, impossibilitando análises “relacionais”. Por exemplo,
pode ser de interesse do pesquisador investigar a quantidade de itens
resultantes de uma consulta que são realmente visitados pelo usuário.
A análise dessa relação envolve dois tipos de requisições, que estão
inter-relacionadas: a requisição da consulta e as requisições das visuali-
zações dos itens da consulta. Essa análise somente é possível se, no re-
gistro da requisição de visualização de item, houver uma informação que
permita a identificação da requisição que gerou a respectiva consulta.
Por exemplo, o registro de log da Figura 1 contém a informação que diz
que a requisição de visualização de um item foi originada de uma intera-
ção prévia de recomendação, mas não contém informação que permita

sumário
204
identificar a recomendação de origem. O pesquisador, portanto, precisa
ter em mente o que cada log pode oferecer (e o que não pode) em ter-
mos informacionais, para que não incorra em conclusões imprecisas.

4.2.2 Recorte dos Dados

Na etapa de seleção, são definidos os períodos de interações


relevantes para a análise, isto é, os recortes temporais das interações
que serão coletadas. Como os logs registram todas as interações, não
é necessário se pensar em estratificar uma amostra para fins de re-
presentatividade, ou seja, o pesquisador poderá ter acesso a todos
os registros de todos os usuários. Por outro lado, uma característica
do uso de logs é o grande volume de dados aos quais se tem aces-
so. Esse fator pode dificultar a pesquisa, já que pode sobrecarregar
o pesquisador com a quantidade de dados a ser manipulada. Assim,
é recomendável que se considere a aplicação de algum filtro de sele-
ção dos dados de acordo com os objetivos da pesquisa – escolhendo
quais interações se deseja observar.

O volume de dados disponível normalmente é muito grande,


e os dados exigem limpeza e pré-processamento antes da análise.
Por isso, é desejável que se observe a representatividade dos dados
levando em conta a otimização dos recursos disponíveis para análise
destes. Uma forma possível de recortar uma amostra representativa de
um sistema é, por exemplo, determinar um recorte estatístico a partir
do universo total de acessos ao sistema. Isso pode ser feito através do
acompanhamento de acessos mensais por usuários únicos. Através
de consulta prévia diretamente no arquivo de log, é possível recupe-
rar a quantidade de IPs diferentes que acessaram o sistema no mês.
Acompanhando-se esse indicador, pode-se calcular a média mensal
de usuários dos serviços e, assim, determinar a amostra suficiente-
mente representativa de acessos que devem compor o corpus.

sumário
205
4.2.3 Disponibilização e uso dos dados

Tendo conhecimento das possibilidades do estudo a partir da


experimentação do ambiente e interpretação do log, deve-se verificar a
viabilidade do uso deste. Nesse momento, o responsável pela guarda
do log deve ser contatado para identificar se o log registra as intera-
ções anotadas no levantamento de forma suficiente e adequada para
a análise. Muitos ambientes podem optar por não registrar todas as
interações ou guardar o registro por um período limitado.

Outra questão relevante na negociação é a presença no log de in-


formações sensíveis. Em geral, dados pessoais dos usuários – aqueles
que permitem sua identificação – são considerados sensíveis, como, por
exemplo, o IP de acesso ao sistema. Pela natureza dessas informações,
é recomendado que projetos de pesquisa que utilizem dados sensíveis
em logs passem pela avaliação de um Comitê de Ética, preferencialmen-
te indicando a anonimização dos participantes da pesquisa.

Por questão de privacidade dos usuários, é recomendável que


seja feito um tratamento no endereço de IP do computador originário
das interações. Os três primeiros algarismos do IP identificam o país
de origem do acesso. Se for relevante para a pesquisa regionalizar os
usuários, essa informação pode ser mantida, mas os demais algarismos
devem ser embaralhados (com o mesmo padrão, para que se identifi-
que quais interações são de cada usuário) ou substituídos por letras. Se
a regionalização não for relevante ou mesmo a identificação de usuários
únicos, o IP pode ser simplesmente omitido. Outra opção é fazer esse
tratamento após a etapa de análise e antes da divulgação dos resul-
tados da pesquisa, de acordo com o protocolo do projeto aprovado
previamente pelo Comitê de Ética (LAIPELT; MONTEIRO-KREBS, 2021).

Em sistemas que exigem login, é possível obter ainda mais


informações, além das presentes nos logs, como nome, endereço,
idade, gênero, profissão etc. No entanto, cada instituição estabelece

sumário
206
critérios próprios para definição do que entende como informação
sensível. Assim, é necessário consultar o responsável pela guarda do
log para entender quais dados poderão ser disponibilizados obede-
cendo a política de privacidade de dados da instituição. Outro ponto
de atenção é a adequação à Lei Geral de Proteção de Dados (LGPD)
(BRASIL, 2018), que entrou em vigor no Brasil em 2020. Ao lidar com
dados pessoais dos usuários, pesquisadores precisam atentar para
o fato de que, com o marco legal, a coleta e o uso de dados devem
ser feitos sempre com consentimento explícito dos usuários. Assim,
a LGPD (Lei 13.709, de 2018) garante maior controle dos cidadãos
sobre suas informações pessoais.

Caso existam informações sensíveis a serem retiradas do log


antes de sua disponibilização, deve-se analisar os impactos dessa
retirada ao estudo e possíveis alternativas para contornar essas limi-
tações. Se os objetivos da pesquisa demandarem que seja possível
agrupar todas as interações de um mesmo usuário (como estudos de
análise da jornada do usuário), não se pode abrir mão do uso do IP (em
casos de sistemas sem login mandatório). Nesse caso, o embaralha-
mento dos IPs de acesso ao sistema é recomendado, que pode ser fei-
to pela própria instituição antes de sua disponibilização. Dessa forma,
garante-se a privacidade dos usuários sem comprometer a pesquisa.

Em resumo, nessa fase o pesquisador determina quais os parâ-


metros ou variáveis que deseja analisar, e esse planejamento é crucial
para evitar retrabalho e garantir a viabilidade da pesquisa de forma legal
e ética (LAIPELT, MONTEIRO-KREBS, 2021). Os parâmetros precisam
dar conta do objetivo do estudo em questão, tendo em vista que cada
sistema de informação possui critérios próprios para organização dos
logs, para determinação do(s) período(s) de guarda dos arquivos e
políticas de compartilhamento (ou não) desses dados.

sumário
207
4.3 COLETA E PREPARAÇÃO DOS DADOS

Após a verificação das viabilidades do uso dos dados e a iden-


tificação dos dados a serem colhidos, a próxima etapa é a recolha dos
dados de interação de um determinado período em um log de transa-
ções, isto é, a coleta dos dados.

Na coleta, as informações são preparadas pela equipe que


gerencia o sistema aplicativo para serem entregues ao pesquisador,
de acordo com o que foi previamente especificado, com a remoção
de informações sensíveis e de informações não pertinentes à pes-
quisa, através de comando no servidor. Então o pesquisador passa
a preparar esses dados.
Depois que os dados são coletados, passa-se para o estágio
de preparação de dados do processo TLA. Para a prepara-
ção de dados, o foco é importar os dados do registro de tran-
sações para um banco de dados relacional (ou outro software
de análise), atribuindo a cada registro uma chave primária,
limpando os dados (ou seja, verificando dados incorretos em
cada campo) e calculando métricas de interação padrão que
servirá de base para uma análise mais aprofundada (JAN-
SEN, 2006, p. 414, tradução nossa).

Na etapa de preparação dos dados, o pesquisador realiza a


limpeza e organização (ou tratamento) dos dados obtidos na fase de
coleta. Procede-se, então com a normalização, isto é, a adaptação do
formato de registro de log (normalmente em formato texto) para uma
estrutura adequada para a análise (que pode ser texto, no caso de aná-
lise exclusiva de expressões de busca, e/ou tabela no caso de análises
que envolvam outras variáveis).

Geralmente, os logs são recebidos pelo pesquisador no forma-


to texto (.txt) e, para adaptá-los a um formato adequado à pesquisa,
é necessário que estes sejam exportados para uma planilha (.csv ou

sumário
208
.xls). Assim, recomenda-se usar um software que realize as funções
de acordo com o que o pesquisador deseja investigar. São exem-
plos: eliminar as URLs repetidas do log; ordenar cronologicamente as
URLs; contar o intervalo de tempo entre o primeiro e o último registro
de uma sessão (em horas, minutos ou segundos); exportar os dados
para uma tabela (formato .csv ou .xls) organizando-os em colunas
por tipo de informação; entre outras ações. É possível encomendar o
desenvolvimento de um software a um profissional da área de tecno-
logia da informação, conforme a parametrização da base de dados
que registra o log, como feito por Monteiro-Krebs (2013) e Laipelt
(2015)52. Outra opção é utilizar softwares de mercado disponíveis
para análise de logs, como o Graylog, Logstash, Loggly e Splunk.

A limpeza consiste em eliminar registros corrompidos, que são


passíveis de identificação através da ordenação sequencial dos cam-
pos, assim, registros fora do formato padrão dos dados de cada cam-
po ficarão agrupados (JANSEN, 2006). Desse modo, fica mais rápida
a eliminação dos erros em grandes volumes de dados, em que a iden-
tificação visual é inviável. “As funções padrão de banco de dados de
dados para somar e agrupar campos-chave, como horário e endereço
IP, geralmente identificam quaisquer erros adicionais” (JANSEN, 2006,
p. 415, tradução nossa). Além disso, na limpeza, podem ser eliminados
registros de agentes não humanos (robôs) se o objetivo da pesqui-
sa for analisar exclusivamente interações entre humanos e o sistema.
Infelizmente, não há como determinar com absoluta certeza quais in-
terações são realizadas por humanos ou robôs (SILVERSTEIN et al.,
1999; JANSEN, 2006). Assim, é necessário pensar em uma técnica
para estabelecer um ponto de corte no corpus. Jansen (2006), bus-
cando especificamente as interações de humanos com o sistema, de-
terminou arbitrariamente como ponto de corte a quantidade de 101 ou
mais consultas. Pode-se, alternativamente, construir um histograma,

52 Agradecemos a Vicente Grassi-Filho pelo desenvolvimento do software extrator de logs para


o formato texto, já utilizado em diferentes projetos do grupo de pesquisa Orcalab (UFRGS).

sumário
209
com base no tempo de sessão, e eliminar os “outliers” (tanto sessões
muito grandes quanto aquelas muito pequenas ou sem consulta), que
podem distorcer as métricas de análise.

Laipelt e Monteiro-Krebs (2021, p. 133) explicam que “Com a de-


codificação das interações a partir dos parâmetros é possível separar
os registros de acordo com o tipo de interação do usuário.” Assim, os
arquivos extraídos podem ser importados para tabelas de um banco
de dados como o Microsoft Access ou MySQL. A partir de então, po-
dem ser realizadas consultas ao banco de dados, através da lingua-
gem SQL. As consultas resultarão em tabelas de planilhas eletrônicas
(Por exemplo: Microsoft Excel) em que as linhas normalmente repre-
sentam requisições e as colunas representam os parâmetros/variáveis.
Essas tabelas podem, então, ser analisadas diretamente e/ou serem
transformadas em gráficos, servindo de base para a análise de dados.

4.4 ANÁLISE DOS DADOS

Na etapa de análise, as tabelas e gráficos gerados são compa-


rados e interpretados à luz dos conhecimentos teóricos concernen-
tes à pesquisa. Jansen (2006) traz diversos exemplos de queries SQL
para análise de logs. A partir dessas consultas, pode-se obter muitos
resultados estatísticos que servirão de indicadores para o gestor do
sistema, como média de consultas realizadas, média de páginas de
resultados visualizadas, frequência e coocorrência de termos, grau de
associação de pares de termos, e muitos outros.

Essas descobertas servem tanto para melhorar a arquitetu-


ra de informação do sistema quanto para planejar capacitações aos
usuários, com o intuito de contribuir para que os sistemas possam
ser planejados e avaliados a partir das necessidades reais destes.
Apresentamos a seguir, com base nos estudos recuperados para a

sumário
210
redação desse capítulo, algumas alternativas de análise das interações
dos usuários nos sistemas de recuperação da informação a partir dos
dados registrados em log.

Segundo Jansen (2006, p. 410, tradução nossa), a análise de logs


vem sendo utilizada como método “[...] para avaliar sistemas de bibliote-
cas, sistemas de recuperação de informação (IR) e, mais recentemente,
sistemas da Web.”. Para tanto, o autor aponta três possibilidades de
análise: análise no nível do termo, análise no nível da consulta e análise
no nível da sessão (JANSEN, 2006, p. 418). Gouveia (2013) afirma que,
assim como o page tagging, o método é utilizado nos estudos de métri-
cas de acesso na Web, também designados por webmetria (Webmetrics
ou Web Metrics, em inglês). A análise de logs pode ser utilizada para
diversos fins no âmbito da Ciência da Informação. O método mostra-se
útil para validar sistemas, compreender como os usuários se comportam
e o que de fato esperam dos recursos oferecidos pela instituição etc.

Através de um estudo de logs, Foust et al. (2007) descobriram


que 90% das pesquisas realizadas em um sistema de busca por livros
eletrônicos (e-books) configuraram-se como palavras-chave ou frases.
Apenas 10% utilizaram recursos avançados de pesquisa, com constru-
ções complexas, operadores booleanos, frases de busca estruturadas e
tentativas de pesquisa de títulos de livros ou autores. Os resultados desse
estudo sugerem que a maioria dos usuários não esperava recursos avan-
çados de pesquisa e compreendia com facilidade o tipo de pesquisa no
estilo “Google” no sistema de pesquisa de livros eletrônicos analisado.
Ou seja, os usuários aparentemente não queriam ter que articular recur-
sos complicados de filtragem, concatenação de operadores lógicos etc.,
mas esperam, cada vez mais, que o sistema faça isso por eles.

A seguir, elencamos algumas possibilidades de descobertas


com a análise de logs no campo da CI, a partir de parâmetros que
comumente estão presentes nos registros de sistemas de informação:

sumário
211
a. Análises dos acessos ao sistema: através do IP, pode-se iden-
tificar a região de onde o sistema é acessado, possibilitando
a geração de relatórios regionais (conforme mencionado na
seção 4.1.4); também é possível verificar os dias de maior ou
menor acesso (no mês ou na semana) através da análise das
variáveis data e horário no log; assim como verificar quantos
pesquisadores acessaram o mecanismo de pesquisa durante
determinado período. Para responder a essa questão, pode-se
fazer uma consulta SQL que provê “uma lista de usuários únicos
e o número de consultas que eles enviaram durante o período”
(JANSEN, 2006, p. 420, tradução nossa)53.

b. Duração e comprimento das sessões: a variável horário


também possibilita identificar a duração da sessão e quanto
tempo em média os usuários levam para concluir uma ação
(seja visualizar um documento, fazer uma reserva ou renova-
ção, realizar o download de um documento etc.). Isso pode
ser medido ao se subtrair o horário final (última interação) do
horário inicial (primeira interação). Assim, é possível identificar
se alguma ação específica influencia o tempo das sessões (se
a sessão será, em média, mais longa ou curta do que sem a
realização dessa ação). Monteiro-Krebs (2013) analisou a dura-
ção de sessões com e sem o uso de recomendação de obras
no catálogo de uma biblioteca universitária, concluindo que o
uso de recomendação implica acesso otimizado (visualização
de mais registros em menos tempo); adicionalmente, pode-se

53 Jansen (2006, p. 426) exemplifica essa consulta através da SQL Query 03 (qry_03_list_of_
unique_ips):
“SELECT tbl_searching_episodes.uid, Count(tbl_searching_episodes.search_url)
AS CountOfsearch_url
FROM tbl_searching_episodes
GROUP BY tbl_searching_episodes.uid
ORDER BY Count(tbl_searching_episodes.search_url) DESC”.

sumário
212
identificar o comprimento das sessões, realizando uma consul-
ta pela quantidade de pesquisas realizadas por cada usuário54.

c. Visualização, leitura ou download de documentos: esse pa-


râmetro pode medir sozinho ou cruzado com outras variáveis
a quantidade de acessos aos registros de documentos e, em
caso de obras disponíveis para acesso ao texto integral, quan-
tas leituras do texto ou mesmo downloads foram feitos pelo
usuário. Um exemplo desse tipo de estudo é o de Nicholas,
Rowlands e Jamali (2010), que empregaram três métricas a fim
de obter estimativas mais precisas de “uso” de e-books: nú-
mero de páginas visualizadas, número de sessões conduzidas
e quantidade de tempo gasto on-line. Esse tipo de estudo é
caracterizado como DLA, pois, além dos logs, utiliza questio-
nário, dados de circulação da biblioteca e grupo focal.

d. Dados demográficos e de pesquisa: em um sistema que


pede login, no qual se tem acesso aos dados demográficos do
usuário, essas informações podem ser cruzadas com todas as
demais variáveis identificadas no log. Conforme explicado na in-
trodução desse capítulo, estudos que cruzam os dados de login
do usuário com dados obtidos no log (variáveis acima listadas),
chamam-se deep log analysis (DLA) (NICHOLAS et al., 2006a;
WARWICK et al., 2008; NICHOLAS et al., 2009; NICHOLAS et al.,
2006b). Uma possibilidade de uso da DLA é cruzar estratégias
de busca (no log) com dados demográficos para identificar pa-
drões por perfil de usuário (por área de conhecimento, nível de
especialização, tipo de vínculo com a instituição etc.).

54 Jansen (2006, p. 426) exemplifica essa ação com a SQL Query 05 (qry_05_session_length):
“SELECT qry_03_list_of_unique_ips.CountOfsearch_url, Count(qry_03_list_of_unique_ips.
CountOfsearch_url) AS CountOfCountOfsearch_url
FROM qry_03_list_of_unique_ips
GROUP BY qry_03_list_of_unique_ips.CountOfsearch_url
ORDER BY Count(qry_03_list_of_unique_ips.CountOfsearch_url) DESC”.

sumário
213
e. Comportamento do usuário: através do IP, pode-se agrupar
todas as interações de um usuário com o sistema. Pelas variá-
veis data e horário, é possível ordenar cronologicamente todas
as ações de um único usuário. Quando não se tem acesso ao
IP, a sessão pode exercer esse papel, porém, tem limitações.
A primeira limitação do uso de sessão no lugar do IP é que não
é possível afirmar que uma sessão seja de um único usuário ou
um acesso de vários usuários em um mesmo computador (por
exemplo, quando o acesso é realizado a partir de locais públicos
como bibliotecas e lan houses). A segunda é que, apenas com
o dado de sessão, não se pode determinar quais sessões foram
realizadas por um mesmo usuário (podem ser várias) e, por isso,
não é possível agrupar todas as sessões de um mesmo usuário
e visualizar seu comportamento informacional na íntegra. Pode-
-se também realizar uma análise de exibição de página, também
conhecida como análise de cliques, que, de acordo com Jansen
(2006, p. 420), serve para medir o comportamento de visualiza-
ções de página dos usuários da Web. Para tanto, mensura-se a
duração da visualização do documento desde o momento em
que o usuário clica em uma URL em uma página de resultados
até o momento em que ele retorna ao mecanismo de pesqui-
sa. Se o pesquisador tiver interesse em conhecer a linguagem
do usuário, pode fazê-lo através da análise das expressões de
busca. Estudos dessa natureza visam melhorar a indexação (re-
missivas, variantes denominativas, variantes morfológicas – nu-
meral, gênero –, alterações gramaticais etc.).

f. Estratégias de busca: visa perceber padrões de navegação


(usuários mais ou menos avançados); jornada do usuário (ca-
minhos percorridos no site, ou as diferentes tentativas de recu-
peração da informação através da análise das expressões de
busca); ver se o usuário utiliza todos os recursos disponíveis
no sistema de recuperação da informação (SRI), como filtros,

sumário
214
operadores booleanos, comprimento da expressão de busca;
identificar termos simples e compostos. Jansen e Spink (2006)
fazem uma análise comparativa de nove estudos do tipo TLA
para descobrir características e mudanças nos padrões de
busca na Web (através dos logs de buscadores). A análise
realizada por Laipelt (2015, p. 160-161), por sua vez, permitiu
inferir características do perfil do usuário através de sua jorna-
da: agrupando todas as interações com o sistema, pode-se
verificar o nível de especialização do usuário a partir do seu
domínio sobre a terminologia da área do direito.

g. Uso do acervo: pode-se analisar as expressões de busca para


encontrar os títulos mais buscados. Um exemplo de estudo para
identificar obras buscadas com maior ou menor frequência é o
de Warwick et al. (2008), no qual os pesquisadores cruzaram
essa informação com um questionário de percepção sobre uso
de recursos digitais (usando método DLA). Além disso, é pos-
sível cruzar uma obra mais buscada (no log) com os períodos
em que esta estava emprestada (no catálogo), verificando assim
obras não retiradas ou reservadas por indisponibilidade (se a
busca pela obra poderia ter se efetivada em retirada, caso o item
estivesse disponível e sem fila de reserva).

h. Tendências temáticas: a partir da identificação dos assuntos


mais procurados, é possível identificar se o acervo está aten-
dendo ou não as necessidades dos usuários, podendo suprir
eventual demanda reprimida. A demanda reprimida também
poderia ser identificada através da lista de reservas no catá-
logo, porém, esse indicador somente informa a quantidade
insuficiente de itens já existentes no acervo, enquanto no log
se amplia a visão, possibilitando identificar novos itens para
aquisição que contemplem essas necessidades.

sumário
215
i. Penetração no site: a partir da quantidade de itens ou páginas
visualizadas, é possível identificar o comportamento de busca
de informações dos usuários. Identificando quantos cliques o
usuário precisa dar para acessar a informação desejada e os
caminhos percorridos por ele (páginas visitadas), é possível
avaliar criticamente a usabilidade do site, e implementar
melhorias para poupar o tempo do leitor. A penetração do
site pode ser combinada com o número de visitas, tempo de
permanência no site, tipo de itens e conteúdo visualizados para
indicar características do perfil do usuário e suas demandas.

5 CONSIDERAÇÕES FINAIS

Com a disponibilidade cada vez maior de informação através


de dispositivos diversos, os sistemas de informação têm evoluído
de forma gradual à medida que os usuários exigem maior precisão
e personalização em seus resultados de busca. Com o objetivo de
munir pesquisadores e profissionais da informação com recursos de
investigação atuais e muitas vezes disponíveis dentro da própria uni-
dade de informação, nesse capítulo discorreu-se sobre a análise de
logs como uma alternativa para identificar comportamentos de usuá-
rios e antecipar suas demandas.

As etapas metodológicas foram apresentadas e exemplificadas,


também foram expostas diversas possibilidades de uso dos parâme-
tros do log tanto separadamente quanto de forma conjunta (cruzando
as variáveis). Buscou-se, ainda, apresentar a análise de logs para ex-
plorar as potencialidades das expressões de busca para identificação
de tendências temáticas e diferenças de perfis entre os usuários.

Apesar de a obtenção de um log para análise não ser uma tarefa


das mais simples, por envolver uma série de questões técnicas e até

sumário
216
políticas comentadas nesse trabalho, acredita-se que o esforço é recom-
pensado com a riqueza de insights que se pode obter com esse recurso.
Isso foi possível demonstrar nesse capítulo, considerando as práticas
consolidadas na área da Ciência da Informação e a expertise dos au-
tores na realização de pesquisas envolvendo o uso e a análise de logs.

6 REFERÊNCIAS
AIRES, R. V. N. X.; ALUÍSIO, S. M. Como incrementar a qualidade dos resul-
tados das máquinas de busca: da análise de logs à interação em português.
Ciência da Informação, v. 32, n. 1, p. 5-16, 2003. Disponível em: http://www.
brapci.ufpr.br/brapci/v/a/689. Acesso em: 27 Jul 2017.
BRASIL. Lei nº 13.709, de 14 de agosto de 2018. Dispõe sobre a proteção
de dados pessoais e altera a Lei nº 12.965, de 23 de abril de 2014 (Marco
Civil da Internet). Brasília, DF: Presidência da República; 2018. Disponível
em: http://www.planalto.gov.br/ccivil_03/_ato2015-2018/2018/lei/L13709.htm.
Acesso em: 22 nov. 2021.
CETIC. Pesquisa sobre o uso das Tecnologias de Informação e Co-
municação nos domicílios brasileiros - TIC Domicílios 2020. S. l.:
Cetic.br, 25 nov. 2021. Disponível em:https://cetic.br/media/docs/publica-
coes/2/2011124201505/resumo_executivo_tic_domicicilios_2020_.pdf. Aces-
so em: 10 dez. 2021.
CHEN, LS. Applying swarm intelligence to a library system. Library Col-
lections, Acquisitions, and Technical Services, v. 34, n. 1, p. 1-10, 2010.
Disponível em: https://www.tandfonline.com/doi/abs/10.1080/14649055.2010.
10766254. Acesso em: 20 ago. 2018.
DAVIS, P. M. Information-seeking behavior of chemists: A transaction log analy-
sis of referral URLs. JASIST, v. 55(4), 326 –332, 2004. Disponível em: https://
onlinelibrary.wiley.com/doi/full/10.1002/asi.10384. Acesso em: 21 dez. 2018.
FOUST, J. E. et al. Improving e-book access via a library-developed full-text
search tool. Journal of the Medical Library Association, Bethesda, v. 95, n.
1, p. 40-45, 2007. Disponível em: https://www-ncbi-nlm-nih-gov.ez45.periodi-
cos.capes.gov.br/pmc/articles/PMC1773047/. Acesso em: 02 jul. 2018.
GOUVEIA, F. C.. Altmetria: métricas de produção científica para além das
citações. Liinc em Revista, Rio de Janeiro, v. 9, n. 1, p. 214-227, maio

sumário
217
2013 – Disponível em: http://revista.ibict.br/liinc/article/view/3434/3004.
Acesso em: 27 jul. 2017.
HUYNH, T.; MILLER, J. Empirical observations on the session timeout thre-
shold. Information Processing & Management, v. 45, n. 5, p. 513-528. 2009.
JANSEN, B. J. Search log analysis: what it is, what’s been done, how to do it.
Library & Information Science Research, Pennsylvania, v. 28, p. 407-432,
2006. Disponível em: http://lincs.hum.iit.edu/sites/default/files/JansenSear-
chLog.pdf. Acesso em: 03 maio 2013.
JANSEN, B. J., & POOCH, U. A review of Web searching studies and a frame-
work for future research. Journal of the American Society for Information
Science and Technology (JASIST), v. 52, p. 235–246, 2001.
JANSEN, B. J.; TAKSA, I.; SPINK, A. Research and Methodological Founda-
tions of Transaction Log Analysis. In: JANSEN, Bernard J.; SPINK, Amanda;
TAKSA, Isak. Handbook of web log analysis. Hershey, PA: Information
Science Reference, 2009. p. 1-16.
JANSEN, B.J.; SPINK, A. How are we searching the World Wide Web?
A comparison of nine search engine transaction logs. Information Proces-
sing & Management, v. 42, n. 1, p. 248-263, jan. 2006.
JANSEN, BJ.; SPINK, A.; Blakely, C.; Koshman, S. Defining a session on web
search engines. Journal of the American Society for Information Science
and Technology (JASIST), v. 58, n. 6, p. 862-871, Apr. 2007.
LAIPELT, R. C. F. A análise de logs como estratégia para a realização da
garantia do usuário. Em Questão, Porto Alegre, v. 21, n. 3, p. 150-170, set/
dez. 2015. Disponível em: http://www.redalyc.org/html/4656/465645968009/.
Acesso 16 jul. 2017.
LAIPELT, R. C. F.; MONTEIRO-KREBS, L. Termos sob a superfície: elementos
teóricos, metodológicos e terminológicos para a Representação do Conheci-
mento. Rio de Janeiro: Editora Interciência, 2021.
MENG-XING, H.; CHUN-XIAO, X.; YONG, Z.. Supply chain manage-
ment model for digital libraries. The Electronic Library, v. 28, n. 1,
p. 29-37, 2010. Disponível em: https://www.emeraldinsight.com/doi/
abs/10.1108/02640471011023351. Acesso em: 20 ago. 2018.
MONTEIRO-KREBS, L. Sistema de recomendação para bibliotecas
universitárias. 2013. 95f. Trabalho de Conclusão de Curso (Graduação) –
Faculdade de Biblioteconomia e Comunicação, Universidade Federal do Rio
Grande do Sul, Porto Alegre, 2013. Disponível em: http://www.lume.ufrgs.br/
handle/10183/78367. Acesso em: 26 jul. 2017.

sumário
218
MONTEIRO-KREBS, L.; ROCHA, R. P. da; RIBEIRO, C. Quem leu este
também leu...: sistema de recomendação na biblioteca universitária. Pers-
pectivas em Ciência da Informação, v. 22, n. 1, p. 151-169, mar. 2017. DOI:
10.1590/1981-5344/2496. Disponível em: http://portaldeperiodicos.eci.ufmg.
br/index.php/pci/article/view/2496. Acesso em: 17 abr. 2019.
NICHOLAS, D. et al. Characterising and evaluating information seeking beha-
viour in a digital environment: Spotlight on the ‘bouncer’. Information Proces-
sing & Management, v. 43, n. 4, p. 1085-1102, 2007. Disponível em: https://
doi.org/10.1002/asi.20564. Acesso em: 22 dez. 2021.
NICHOLAS, D. et al. The information seeking behaviour of the users of digital
scholarly journals. Information Processing & Management, v. 42, n. 5,
p. 1345-1365, September 2006a. Disponível em: https://doi.org/10.1016/j.
ipm.2006.02.001. Acesso em: 22 dez. 2021.
Nicholas, D. et al.. Online use and information seeking behaviour: institutional
and subject comparisons of UK researchers. Journal of Information Science,
v. 35, n. 6, p. 660-676, 2009.
NICHOLAS, D.; HUNTINGTON, P.; WATKINSON; A. Scholarly journal usage:
the results of deep log analysis. Journal of Documentation, London, v. 61,
n. 2, p. 248-280, 2005. Disponível em: http://www.emeraldinsight.com/doi/pd-
fplus/10.1108/00220410510585214. Acesso em: 26 jul. 2017.
NICHOLAS, D.; HUTTINGTON, P; WATKINSON, A. Revisiting ‘obsolescence’
and journal article ‘decay’ through usage data: an analysis of digital jour-
nal use by year of publication. Information Processing & Management, v.
41, n. 6, p. 1441-1461, dez. 2005. Disponível em: https://doi.org/10.1016/j.
ipm.2005.03.014. Acesso em: 20 ago. 2018.
NICHOLAS, D.; ROWLANDS, I.; JAMALI, H.R.. E-textbook use, information
seeking behaviour and its impact: Case study business and management.
Journal Of Information Science, v. 36, n. 2, p. 263-280, abr. 2010.
NICHOLAS, D.; ROWLANDS, I.; JAMALI, H.R.. E-textbook use, information
seeking behaviour and its impact: Case study business and management.
Journal of Information Science, v. 36, n. 2, p. 263-280, abr. 2010.
NICHOLAS, David et al. What deep log analysis tells us about the impact of
big deals: case study OhioLINK. Journal of Documentation, v. 62, n. 4, p.
482-508, 2006b. Disponível em: https://doi.org/10.1108/00220410610673864.
Acesso em: 22 dez. 2021.
PETERS, T.A.. The history and development of transaction log analysis.
Library Hi Tech, v. 11, n. 2, p. 41-58, 1993.

sumário
219
SILVERSTEIN, C. et al.. Analysis of a very largeWeb search engine query log.
SIGIR Forum, v. 33, n. 1, p. 6-12, 1999.
SPINK, A., JANSEN, B. J.. Web search: public searching of the web.
New York: Kluwer, 2005. 198 p.
VAKKARI, P.; TALJA, S.. Searching for electronic journal articles to support
academic tasks. A case study of the use of the Finnish National Electronic
Library (FinELib). Information Research, v. 12, n. 1, 2006. Disponível em:
https://www.emeraldinsight.com/doi/abs/10.1108/02640471011023351.
Acesso em 20 ago. 2018.
WARWICK, C. et al.. Library and information resources and users of digital
resources in the humanities. Program-electronic Library And Information
Systems, v. 42, n. 1, p. 5-27, 2008.

sumário
220
7
Capítulo 7

A classificação automática de
documentos de arquivo é uma
solução para os problemas que
os usuários encontram com a
classificação funcional? Algumas
reflexões e caminhos a percorrer

Renato Tarciso Barbosa de Sousa

Is automatic classification of records


A classificação
a solution to the problems automática
users
de documentos
encounter with functional de arquivo
classification?
é uma solução
Some thoughts para osforward
and ways problemas
que os usuários encontram
Renatocom
Tarcisoa Barbosa
classificação
de Sousa funcional?
Algumas reflexões e caminhos a percorrer

Is automatic classification of records


a solution to the problems users
encounter with functional classification?
Some thoughts and ways forward

DOI: 10.31560/pimentacultural/2022.95613.7
Resumo:
A classificação funcional de documentos de arquivo está pacificada na litera-
tura da área, apesar de sua aplicação prática ter se tornado comum a partir da
década de 1990. Estudos de caso, que começaram a surgir a partir dos anos
2000, têm revelado sistemas híbridos que misturam função, estrutura, assunto,
tipo e espécie documental. O objetivo deste capítulo é identificar as possibi-
lidades de inserir, nos sistemas informatizados de gestão de documentos, a
classificação automática de documentos de arquivo. Quanto à natureza da
pesquisa, ela é do tipo aplicada e qualitativa, em relação à abordagem do pro-
blema, e exploratória e descritiva, no tocante aos seus objetivos, pois o tema
classificação automática ainda está em fase preliminar de desenvolvimento e
porque torna claro um problema. A técnica de coleta de dados é a pesquisa
bibliográfica relacionada à classificação de documentos de arquivo, à aborda-
gem funcional, às questões de usabilidade do instrumento de classificação e
a classificação automática de documentos. As primeiras experiências de uso
da classificação automática apontam para o uso da deep leaning com base
na inteligência artificial. Essas possibilidades precisam da junção dos conhe-
cimentos em tecnologia da informação e em arquivologia.

Palavras-Chave: Classificação de documentos de arquivo;classificação


funcional;classificação automática.

sumário
222
Abstract:
The functional classification of records is pacified in the literature of the area, al-
though its practical application has become common since the 1990s. Case stu-
dies, which began to emerge from the 2000s, have revealed hybrid systems that
mix function, structure, subject, type and document species. The objective is to
identify the possibilities of inserting automatic classification of archive documents
into computerized document management systems. As for the nature of the re-
search it is of the applied and qualitative type in relation to the approach to the
problem and exploratory and descriptive in relation to its objectives, because the
automatic classification theme is still in a preliminary phase of development and
because it makes a problem clear. The data collection technique is literature re-
search related to the classification of archival documents, the functional approach,
the usability issues of the classification instrument, and the automatic classification
of documents. The first experiences of using automatic classification point to the
use of deep leaning based on artificial intelligence. These possibilities need the
pooling of knowledge in information technology and archival science.

Keywords: Classification of archival documents; functional classification;


automatic classification.

sumário
223
1 INTRODUÇÃO

Milton Santos, um dos principais geógrafos brasileiros, em sua


obra mais conhecida chamada Por uma geografia nova (1978), faz a
seguinte afirmação:
O apego às velhas ideias parece uma enfermidade incurável. (...)
Caímos naquele defeito de considerar velhas formas de pensar
como inevitáveis. Ao invés de perseguir um saber novo, preferi-
mos deliciar-nos com a reprodução do saber velho. (...) O novo
é, de certa forma, o desconhecido e só pode ser conceitualizado
com imaginação, e não com certezas (SANTOS, 1978, p. 110).

Em 2015, Reed deu um título interessante ao artigo publicado na


revista Acervo: Fazer o mesmo não vai funcionar, em que ela discute a
passagem, na Austrália, dos sistemas de recordkeeping manuais para
os digitais. O mundo digital tem demonstrado que fazer mais do mesmo
não servirá para avançarmos. Tanto a citação quanto o título revelam a
necessidade de reinvenção, de inovação, de monitoramento contínuo e
de um repensar constante da nossa teoria e da nossa prática.

Os planos de classificação baseados na função ou planos de


classificação funcionais começam a aparecer no cenário arquivístico
desde meados da década de 1990. Lembramos, inclusive, que sua for-
mulação teórica se deu há cerca de oitenta anos, com Campbell, em
1941, e Schellenberg, em 1956. A força propulsora do uso, em maior es-
cala, desse tipo de classificação, que antes era dominada por instrumen-
tos baseados em assuntos, foi a divulgação da ISO 15.489-1, em 2001.
A norma defendeu, como melhor prática para a classificação de docu-
mentos, um esquema baseado na análise dos processos de negócio, fun-
ções e atividades realizadas pela organização (IFOULD; JOSEPH, 2016).

Entretanto, a partir de 2004, estudos apontando as dificulda-


des de uso desse tipo de abordagem para a classificação de docu-
mentos de arquivo começam a aparecer (CANABRIA, 2004). Depois

sumário
224
disso, vários autores, em inúmeras partes do mundo (Canadá, Ingla-
terra, Finlândia, Malásia, entre outros), publicaram trabalhos sobre a
usabilidade do plano de classificação funcional.

Em um primeiro momento, a falta de compreensão do instru-


mento acontecia no ambiente de documentos em papel. Situação
que não se alterou nos sistemas de gestão de documentos híbridos
(documento em papel e documento digital) ou mesmo em situações
de predominância completa dos documentos digitais. A passagem do
mundo do papel para o digital não repercutiu em uma melhora do nos-
so instrumental, mas, nesse novo ambiente, abriu-se a possibilidade
concreta de desafiarmos essa questão. A diferença é que podemos uti-
lizar tecnologias para mitigar, em certa medida, os problemas de uso.

A utilização de sistemas informatizados tem provocado uma


descentralização importante das atividades de gestão de documen-
tos. Aquilo que era feito nos setores de protocolo (registro, tramitação,
classificação) e nos setores de arquivo (classificação, descrição, ava-
liação, transferência, recolhimento e controle) passaram a acontecer
no momento da criação ou da captura do documento. Nesse sentido,
o usuário passa a jogar um papel fundamental no funcionamento do
sistema. Infelizmente, não temos tido programas de formação contínua
que os capacitem a operar com essas novas tarefas.

É importante, então, que as estratégias e instrumentos utilizados


sejam inteligíveis ou automatizados. Da mesma forma que, para operar
um automóvel, não é necessário ser um engenheiro mecânico, não se
pode exigir do usuário que ele seja arquivista. Qualquer pessoa pode
dirigir um automóvel sem saber quais são as leis e teorias que fazem
o carro se mover. Acreditamos que isso não é uma discussão, apenas,
de questões tecnológicas, mas da necessidade de inteligência arqui-
vística embarcada nesses sistemas.

Por que estamos preocupados com a questão da classifica-


ção? Por dois motivos. A classificação de documentos de arquivo não

sumário
225
é uma função autônoma, ela está ligada umbilicalmente à avaliação
e à descrição. Essas funções arquivísticas sem a classificação ficam
soltas no ar, isto é, experimentam tal nível de subjetividade que as
esvazia de sentido. Outro motivo está no fato da classificação (agru-
pamento) preservar o vínculo arquivístico, sem o qual o documento
não é nada além da informação que está contida nele. Os documen-
tos são agrupados a partir de um amalgama chamado função-ati-
vidade-transação, o difundido modelo FAT, de Schellenberg (2005).
É esse agrupamento e esse vínculo obtidos da atividade geradora
dos documentos que é possibilitado pela classificação.

A pergunta que motiva e dá título a esse trabalho é a seguinte: a


classificação automática de documentos de arquivo é uma solução para
os problemas que os usuários encontram com a classificação funcional?
O objetivo é identificar as possibilidades de inserir, nos sistemas infor-
matizados de gestão de documentos, a classificação automática de do-
cumentos de arquivo. Precisamos verificar o que a literatura arquivística
tem falado sobre esse tipo de classificação, que desonera o usuário do
trabalho de classificar diretamente os documentos que acumula.

Quanto à natureza da pesquisa, ela é do tipo aplicada por pre-


tender produzir conhecimento que pode alterar determinada realidade.
Ela é qualitativa, em relação à abordagem do problema, e exploratória
e descritiva, no tocante aos seus objetivos, pois o tema classificação
automática ainda está em fase preliminar de desenvolvimento e porque
torna claro um problema. A técnica de coleta de dados é a pesquisa
bibliográfica relacionada à classificação de documentos de arquivo, à
abordagem funcional, às questões de usabilidade do instrumento de
classificação e a classificação automática de documentos.

A fundamentação teórica do trabalho foi elaborada a partir da


revisão da literatura sobre os temas acima indicados. Esta deu-se nos
idiomas português, inglês, francês e espanhol, sem nenhuma delimita-
ção de tempo, origem ou abordagem.

sumário
226
Esse trabalho está estruturado em cinco seções, incluindo a in-
trodução. A segunda delineia a matriz teórica com o intuito de embasar
e fundamentar o estudo. A terceira seção aborda os problemas, apon-
tados na literatura, sobre o uso da classificação funcional e, a quarta,
identifica as possibilidades de utilização da classificação automática.
A quinta seção traz as nossas considerações finais.

2 FUNDAMENTAÇÃO TEÓRICA

A classificação constitui uma categoria de estudo de diversas


áreas: filosofia, biologia, história, biblioteconomia, arquivologia, entre
outras. Não pretendemos identificar a multiplicidade de conceitos já pro-
duzidos a partir de cada uma das contribuições fornecidas por aquelas
disciplinas do conhecimento humano, mesmo porque seria uma tarefa
difícil por conta dos limites de tempo e espaço. Privilegiaremos apenas
as categorias teóricas com as quais pretendemos dialogar e as que po-
derão auxiliar-nos na compreensão sobre o objeto de estudo.

Parte-se do pressuposto, nesse trabalho, que a classificação


de documentos de arquivo não pode limitar sua finalidade somente ao
acesso aos documentos. A classificação de documentos de arquivo,
diferentemente do que ocorre, por exemplo, na biblioteca, precisa fun-
damentar outras operações do quefazer arquivístico. Encontramos três
objetivos a serem atingidos com a classificação: manter o contexto de
produção dos documentos, fundamentar a avaliação e a descrição e,
também, permitir o processo de busca e a recuperação da informação.

Para alguns autores, principalmente Duranti (1997), a prática de


classificar documentos se origina da necessidade de explicitar o “vín-
culo arquivístico” (archival bond), que existe entre todos os documentos
que participam da mesma atividade desde o momento de sua criação.

sumário
227
E, portanto, a recuperação de documentos de arquivo é somente um
benefício colateral da classificação, sendo o objetivo principal colocar
os documentos individuais nos agrupamentos aos quais pertencem,
baseando-se na missão e nas funções do criador.

Heredia Herrera considera haver uma relação indissolúvel entre


a classificação e a descrição. Para ela, “a descrição é a representação
da classificação. De tal maneira, que é difícil, ao menos de forma corre-
ta, descrever sem classificar” (HEREDIA HERRERA, 2011, p. 66, tradu-
ção nossa). É possível observar, na norma ISAD(G), a importância da
classificação para a descrição. Todo trabalho descritivo é baseado nos
níveis de classificação de um arquivo. As regras da descrição multinível
dependem diretamente do instrumento de classificação de documen-
tos de arquivo (CONSELHO INTERNACIONAL DE ARQUIVOS, 2000).
No que tange à avaliação, Sabourin (2001), em relato sobre a aplicação
da macroavaliação no governo canadense, demonstra a necessidade
da classificação funcional para a realização da macroavaliação ou ava-
liação funcional. Precisou-se de um novo modelo de classificação ba-
seado na função para organizar documentos por função, subfunção,
atividade, transação e processo de negócios e não por assunto, por
estruturas hierárquicas de objetos ou por produtos finais.

Gagnon-Arguin e Bannouri (1998) entendem que a classificação


de documentos de arquivo tem objetivos operacionais e objetivos es-
tratégicos. Em relação aos operacionais, eles identificam a organiza-
ção dos documentos, a recuperação e a interpretação da informação.
Quanto aos estratégicos, teríamos, então, a classificação como um
instrumento de gestão da informação, de respeito à legislação sobre o
acesso aos documentos e base da constituição do fundo.

Heón (2003, p. 220-221) defende que o objetivo da classifica-


ção é garantir que todos os documentos estejam relacionados ao seu
fundo original. Assim, dentro dele, ordenados da forma que lhes foi
dada por seu criador.

sumário
228
A norma australiana de classificação de documentos (COUN-
CIL OF STANDARDS AUSTRALIA, 2011, p. 4) afirma que a classifica-
ção não é apenas para descrever o conteúdo do documento ou per-
mitir a pesquisa e a recuperação. Mais do que isso, ela é usada para
oferecer suporte a todo um conjunto de processos de recordkeeping,
incluindo a identificação dos documentos que precisam ser captura-
dos e criados para apoiar os negócios e fornecer uma estrutura para
determinar e implementar decisões de retenção, segurança e aces-
so. A classificação é utilizada, também, para garantir que os vínculos
entre as funções, que estão sendo executadas, e os documentos
resultantes sejam consistentes e mantidos. Portanto, o objetivo não
é descrever o assunto ou o conteúdo do documento, mas colocar o
documento no contexto da função que o criou.

Pearce-Moses (2005) define classificação como “A organiza-


ção de materiais dentro de categorias de acordo com um esquema
que identifica, distingue e relaciona essas categorias”. O Multilingual
archival terminology, do Conselho Internacional de Arquivos, apre-
senta seis definições para classificação, destaco duas delas: 1 – A
organização sistemática de documentos em grupos ou categorias de
acordo com métodos, procedimentos ou convenções representadas
em um plano ou esquema (Glossário de termos arquivísticos e de re-
cordkeeping, do Departamento de Trabalhos Públicos, do Estado de
Queensland, Austrália); 2 – Identificação e arranjo sistemáticos das
atividades de negócios em categorias logicamente estruturadas, de
acordo com convenções, métodos e procedimentos, representados
no sistema de classificação para auxiliar os negócios, acesso contí-
nuo e apropriadas avaliação e eliminação (Terminologia utilizada na
Universidade de British Columbia, no Canadá).

O National Archives of Australia (2003) estabeleceu o termo


classificação da seguinte forma: a identificação e organização siste-
mática de atividades de negócios e/ou de documentos em catego-
rias, de acordo com convenções logicamente estruturadas, métodos

sumário
229
e regras processuais representados em um sistema de classificação.
Para Guercio (2002, p. 437, tradução nossa), a “classificação significa
o reconhecimento, a identificação e a organização funcional de docu-
mentos, de acordo com critérios lógicos e consistentes em unidades
de classificação funcionais distintas”.

No mundo francófono, o Dicionário de terminologia arquivís-


tica (2002), da Direction des Archives de France, compreende a
classificação como uma operação de ordenação intelectual e física
dos documentos de arquivo no interior de dossiês e esses dentro
dos fundos, resultado da aplicação do princípio de respeito aos
fundos. Roberge (2011, p. 469) defende a classificação como ação
de identificar um documento por meio de um esquema de classifi-
cação. No Glossário do Portal de Arquivística Francófona (PIAF)55,
de 2015, classificação significa a “operação intelectual e material
para analisar e a ordenar os documentos de arquivo conforme os
princípios arquivísticos e seus resultados” (p. 23, tradução nossa).

No mundo hispânico, Heredia Herrera (2013) entende a clas-


sificação como uma função arquivística em que se estabelecem as
categorias documentais baseadas nas funções e na estrutura orgânica
de uma instituição e se manifesta no quadro de classificação do fundo.
Ela é determinada pelo princípio da proveniência. Cruz Mundet, em
uma abordagem muito mais ampla, definiu-a como a
Ação e efeito de agrupar hierarquicamente os documentos de
um fundo mediante agrupamentos ou classes, desde os mais
amplos aos mais específicos, de acordo com os princípios da
proveniência e ordem original; para o qual se identificam os ti-
pos documentais, evidenciam-se as relações que existem entre
eles e se organizam em uma estrutura lógica, chamada quadro
de classificação, que reflete hierarquicamente essas relações
(CRUZ MUNDET, 2011, p. 111, tradução nossa).

55 Disponível em: https://www.piaf-archives.org/sites/default/files/bulk_media/glossaire/glos-


saire_papier.pdf. Acesso em: 3 jul. 2021.

sumário
230
A ABNT NBR 15.489-2018 percebe a classificação como a
“identificação sistemática e/ou configuração de atividades de negó-
cio e/ou documentos de arquivo em categorias de acordo com con-
venções, métodos e regras estruturadas logicamente” (ABNT, 2018,
p. 2). A norma australiana sobre classificação de documentos (HB
5031-2011 – Handbook Records Classification) sustenta, no âmbito do
recordkeeping56, que ela tem objetivos ambiciosos de gerenciar do-
cumentos e de garantir que eles possam ser encontrados, usados e
compreendidos ao longo do tempo.

E, por último, as definições encontradas no Brasil. O Dicionário


Brasileiro de Terminologia Arquivística, da Associação dos Arquivistas
Brasileiros (1990), estabelece que se trata de um “processo que consiste
em colocar ou distribuir documentos ou informações, de acordo com
planos previamente adotados” (p. 28). O Dicionário Brasileiro de Termino-
logia Arquivística, do Arquivo Nacional (2005), apresenta, talvez, uma das
mais pobres definições em relação às apresentadas aqui. Ele entende a
classificação como “organização dos documentos de um arquivo ou co-
leção, de acordo com um plano de classificação, código de classificação
ou quadro de arranjo” (p. 49). O Dicionário de Terminologia Arquivística
(CAMARGO; BELLOTTO, 2010), que se aproxima das definições interna-
cionais, entende a classificação como a “sequência de operações, que,
de acordo com as diferentes estruturas, funções e atividades da entidade
produtora, visam a distribuir os documentos de um arquivo” (p. 30).

Nesse trabalho, a concepção que se utiliza de classificação é


a atividade intelectual de agrupar, a partir de pesquisa, os documen-
tos de arquivo de acordo com um princípio de classificação, definin-
do as operações necessárias à subordinação e à coordenação dos

56 Na definição do Glossary of archival and records terminology, de Pearce-Moses (2005),


recordkeeping significa a “criação, uso, manutenção e disposição sistemática de docu-
mentos para atender às necessidades e responsabilidades administrativas, programáticas,
legais e financeiras” (p. 331, tradução nossa). Com muito cuidado, podemos afirmar que
se trata de sinônimo de records management.

sumário
231
níveis de classificação. Não se faz distinção, nessa definição, entre
os suportes documentais.

Os trabalhos de Schellenberg aprofundaram a questão da clas-


sificação. E os que defendem a classificação funcional são, de algu-
ma forma, credores do arquivista americano, pois foi com o seu livro
Arquivos modernos: princípios e técnicas, lançado em 1956, que esse
modelo foi disseminado pelo mundo. Essa verticalização empreendida
pelo arquivista americano fica clara nas observações sobre classifica-
ção de documentos públicos e nos pontos estabelecidos para elabo-
ração de um sistema de classificação.

Encontramos a definição de classificação funcional em algu-


mas publicações da área. O Glossary of archival and records termi-
nology, de Richard Pearce-Moses, editado pela Sociedade de Arqui-
vistas Americanos (2005), entende como um sistema para organizar
materiais de acordo com a atividade ou função. O Glossary of terms
(2009),do International Records Management Trust, definiu o termo
como um sistema para organizar materiais com base na função, ati-
vidade ou tarefa executada por uma organização para cumprir seu
mandato, em vez de se basear por departamento, nome ou assunto.
O Dicionário Brasileiro de Terminologia Arquivística (2005, p. 132) não
apresenta nenhuma definição para classificação funcional, mas fica
claro quando afirma, no verbete plano de classificação, que este é
“elaborado a partir do estudo das estruturas e funções de uma insti-
tuição (...)”, deixando nítida a opção por aquela abordagem.

A classificação funcional está pacificada na literatura da área,


inclusive caminhamos para uma naturalização da classificação basea-
da na função. Vários autores fizeram a defesa desse modelo de clas-
sificação de documentos de arquivo, dentre eles: Duranti et. al. (2002),
National Archives of Australia (2003), Shepherd e Yeo (2003), Roberge
(2011), Caravaca (2017). As normas ISO 26.122 (2008) e a ISO 15.489
(2016) também seguiram a linha desses autores. Esta última norma,

sumário
232
inclusive, recomenda, claramente, que o desenvolvimento do plano de
classificação de documentos de arquivo seja baseado em uma análise
de funções, atividades e processos de trabalho.

A formulação teórica da classificação funcional é antiga, mas


a implementação prática é relativamente recente (ALBERTS; SCHEL-
LINCK; EBY; MARLEAU, 2010, PACKALÉN; HENTTONEN, 2016). Ape-
sar da ideia não ser nova, a classificação baseada nas funções somen-
te começou a ser aplicada em meados da década de 1980. Orr (2005)
cita, por exemplo, nesse renascimento do interesse pela classificação
funcional, o trabalho de Haas, Samuels e Simmons, que, em 1985,
estruturou a classificação das atividades e processos que geravam
documentos na ciência moderna e tecnologia.

3 OS PROBLEMAS NO USO
DA CLASSIFICAÇÃO FUNCIONAL

Apesar da pacificação existente sobre a abordagem funcional na


classificação de documentos, temos poucos exemplos que tenham sido
implementados com sucesso (ORR, 2005). A questão da usabilidade de
planos de classificação funcionais é particularmente significativa para
usuários leigos. Afinal, “a teoria não ajuda se as pessoas não a puderem
aplicar” (HURLEY; SYMONDSON, 2002, p. 25 apud ORR, 2005, p. 70).

Orr (2005) fez uma pesquisa a respeito do que havia sido escrito
na literatura da área sobre o tema, as visões dos especialistas e a ex-
periência dos gestores de documentos da Austrália, Canadá e Reino
Unido. Os resultados demonstraram que as desvantagens de aplicar
o método funcional estavam assentados no sentimento dos usuários
de que o instrumento não era intuitivo, que eles achavam confuso e
que sentiam uma redução na produtividade com o tempo gasto para a
compreensão desse tipo de classificação.

sumário
233
A aplicação da análise funcional para a construção de planos de
classificação pode ter como resultado um sistema abstrato e autorre-
ferencial, uma classificação que representaria as funções da organiza-
ção, mas que seria totalmente incapaz de capturar os modos de traba-
lho em uma unidade organizacional real. Como consequência disso,
os usuários teriam dificuldades de aplicar a classificação (FOSCARINI,
2010). Os sistemas funcionais tendem a criar silos de informação em
uma organização, tornando mais difícil a produção de visões horizon-
tais da informação. Quando os processos de trabalho são horizontais e
cruzam múltiplas funções, a informação criada não pode ser agrupada
(ALBERTS; SCHELLINCK; EBY; MARLEAU, 2010).

Ifould e Joseph (2016, p. 18) apresentaram, no quadro abaixo,


uma síntese da literatura arquivística da percepção dos usuários sobre
as dificuldades encontradas para registrar, pesquisar e encontrar infor-
mação orgânica com planos de classificação funcionais.

Quadro 1 – Percepções dos usuários sobre a classificação funcional

Percepções Fontes
Os usuários consideram que os esquemas de classifica- GUNNLAUGSDOTTIR, Johanna. Functional classification scheme for records: a
ção funcional não são intuitivos e nem fáceis de utilizar. way to chart documented knowledge in organizations. Records Manage-
ment Journal, v. 22, n. 2, p. 116–129, 2012.
JOSEPH, Pauline. EDRMS search behaviour: implications for records ma-
nagement principles and practices, 2010. Tese – University of Western Australia,
Perth, 2010.
Os usuários consideram os esquemas de classificação GUNNLAUGSDOTTIR, Johanna. Functional classification scheme for records: a
funcional complicados ou demasiadamente complicados. way to chart documented knowledge in organizations. Records Manage-
ment Journal, v. 22, n. 2, p. 116–129, 2012.
JOSEPH, Pauline. EDRMS search behaviour: implications for records ma-
nagement principles and practices, 2010. Tese – University of Western Australia,
Perth, 2010.
Os usuários nem sempre sabem onde arquivar o docu- GUNNLAUGSDOTTIR, Johanna. Functional classification scheme for records: a
mento em um esquema de classificação funcional. way to chart documented knowledge in organizations. Records Manage-
ment Journal, v. 22, n. 2, p. 116–129, 2012.
JOSEPH, Pauline. EDRMS search behaviour: implications for records ma-
nagement principles and practices, 2010. Tese – University of Western Australia,
Perth, 2010.

sumário
234
Os usuários acham os esquemas de classificação fun- GUNNLAUGSDOTTIR, Johanna. Functional classification scheme for records: a
cional confusos por ser possível classificar os documen- way to chart documented knowledge in organizations. Records Manage-
tos em muitas categorias. ment Journal, v. 22, n. 2, p. 116–129, 2012.
ORR, Stuart Anthony. Functions-based classification of records: is it
functional? 2005. Dissertação (Master of Science in Records Management) –
Divisão de Informação e Estudos de Comunicação, Northumbria University, New-
castle, 2005.
SMYTH, Z. A. Implementing EDRM: has it provided the benefits expected?
Records Management Journal, v. 15, n.3, p. 141-149, 2005.
Os usuários acham que o pior método é o funcional. GUNNLAUGSDOTTIR, Johanna. Functional classification scheme for records: a
way to chart documented knowledge in organizations. Records Manage-
ment Journal, v. 22, n. 2, p. 116–129, 2012.
Os usuários consideram desnecessário o plano de clas- GUNNLAUGSDOTTIR, Johanna. Functional classification scheme for records: a
sificação funcional e o uso é demorado. way to chart documented knowledge in organizations. Records Manage-
ment Journal, v. 22, n. 2, p. 116–129, 2012.
Os planos de classificação funcional não são intuitivos JONES, Pauline. The role of virtual folders in developing an electronic document
ou nem amigável para o usuário. Ele fica desconfortável and records management system: Meeting user and records management needs,
com a abordagem funcional. Records Management Journal, v.18, n.1, p. 53-60, 2008.
Os usuários não compreendem como o plano de clas- JOSEPH, Pauline. EDRMS search behaviour: implications for records ma-
sificação funciona e como usar. Não gostam de usar a nagement principles and practices, 2010. Tese – University of Western Australia,
classificação funcional, porque é difícil de aplicar e é Perth, 2010.
pouco clara. ORR, Stuart Anthony. Functions-based classification of records: is it
functional? 2005. Dissertação (Master of Science in Records Management)
– Divisão de Informação e Estudos de Comunicação, Northumbria University,
Newcastle, 2005.
PACKALÉN, Saara, HENTTONEN, Pekka, Recordkeeping professional understan-
ding of and justification for functional classification: Finnish public sector organi-
zational context, Archival Science, v. 16, p. 403-419, 2016.
Os usuários consideram a função um conceito estranho CALABRIA, Tina. Evaluating Caloundra City Council’s EDMS classification. 2004.
e difícil decompreender e não intuitivo. Disponível em: https://www.steptwo.com.au/files/kmc_caloundracouncil.pdf.
Acesso em: 7 mai. 2020.
FOSCARINI, Fiorella. Understanding functions: An organizational culture perspec-
tive. Records Management Journal, v. 22, p. 20–36, 2012.
ORR, Stuart Anthony. Functions-based classification of records: is it functional?
2005. Dissertação (Master of Science in Records Management) – Divisão de In-
formação e Estudos de Comunicação, Northumbria University, Newcastle, 2005.
Os usuários consideram que os planos de classificação FOSCARINI, Fiorella. Understanding functions: An organizational culture perspec-
funcional são inflexíveis em relação com as antigas uni- tive. Records Management Journal, v. 22, p. 20–36, 2012.
dades compartilhadas com estrutura pessoal, tornando MORELLI, Jeff. Hybrid filing schemes: the use of metadata signposts in functional
os planos impopulares. file plans, Records Management Journal, v. 17, n. 1, p. 17-31, 2007.

sumário
235
Para os usuários, a classificação não é intuitiva, é des- BAK, Greg. Continuous classification: capturing dynamics relationships among
necessariamente complexa e mais demorada do que por information resources. Archival Science, v. 12, p. 287-318, 2012.
outros meios.
Pelo fato da classificação funcional permitir que um do- ALBERTS, Inge, SCHELLINCK, Jen, EBY, Craig, MARLEAU, Yves. Bridging Func-
cumento seja organizado num único local (fixidez), os tions and Processes for Records Management. Canadian Journal of Infor-
usuários também têm capacidade de pesquisa limitada. mation and Library Science, Toronto, v. 34, n. 4, p. 365-390, dez. 2010.

Fonte: adaptado de IFOULD; JOSEPH, 2016.

Analisando as percepções apresentadas pelos vários autores,


fica evidente a dificuldade que os usuários têm de utilizar o plano de
classificação funcional. Ele parece não representar efetivamente o que
os funcionários fazem em seu trabalho cotidiano. O nível de abstração
é muito alto, impedindo o vínculo direto entre o documento e a ativida-
de que o gerou. Se os sistemas não geram confiança, os documentos
permanecerão com indivíduos ou grupos de trabalho (OLIVER; FOS-
CARINI, 2013), criando ilhas informacionais sem nenhuma conexão e
sem ter todo o seu potencial explorado de maneira consistente.

Esta dificuldade é entendida por Bak (2012) pelo fato dos teóri-
cos da gestão de documentos promoverem a classificação funcional
sem definições autorizadas de funções. Para Duranti e Franks (2015),
um dos fatores que contribuem para tornar a análise das funções difícil
tem a ver com a relatividade das noções de missão (geralmente associa-
do à função) e processo ou meio (comumente relacionado à atividade).
As autoras sugerem que os estudos em sociologia, administração e psi-
cologia social podem ajudar no entendimento do conceito de função.

A abordagem funcional atende a dois dos três objetivos da clas-


sificação de documentos de arquivo: a manutenção do vínculo arqui-
vístico e a fundamentação de outras funções arquivísticas (avaliação e
descrição, principalmente). A recuperação dos documentos, como um
dos objetivos, não é completamente preenchida, mesmo no ambiente
tradicional de documentos em papel. O agrupamento favorecia, princi-
palmente, a busca contextual dos documentos, mas não auxiliava em

sumário
236
buscas pelo conteúdo. Caravaca (2017) entende que o plano de classi-
ficação é o primeiro instrumento de acesso aos documentos do arquivo.
Nos sistemas informatizados de gestão de documentos, essa tarefa não
está diretamente vinculada à classificação, mas à articulação e relacio-
namento dos metadados. Esse novo ambiente e a implementação dos
metadados permitiram, inclusive, a quebra da barreira da fixidez dos
agrupamentos dados pela classificação aos documentos em papel.

Entretanto, as tentativas anteriores de fundamentar os planos de


classificação em assuntos, estrutura organizacional, tipos documen-
tais, espécies documentais ou a mistura de todos esses elementos não
obtiveram sucesso. O contexto de criação e uso dos documentos não
pode ser mantido a partir desse tipo de classificação. O vínculo arqui-
vístico não era estabelecido, tornando os documentos objetos isolados
em seu próprio conteúdo.

Os gestores de documentos, de acordo com Warland e Mokhtar


(2013), parecem estar presos entre uma teoria da classificação e o lugar
difícil da prática de classificação do usuário final. Eles afirmam que não
mais de 5% de todos os documentos digitais criados ou recebidos pelas
organizações estão em conjuntos classificados em sistema de gestão
de documentos. Os restantes são armazenados, não classificados ins-
titucionalmente, em unidades de rede ou de computadores “pessoais”,
nos sistemas de negócio e nos servidores de e-mails (SOUSA, 2020).

De qualquer forma, mesmo com as vantagens do plano de


classificação funcional em relação à manutenção do vínculo arqui-
vístico, à fundamentação de outras funções arquivísticas e à estabili-
dade e continuidade, não resolvemos ainda a importante questão da
usabilidade desses instrumentos, como demonstram os estudos de
caso sobre a aplicação deles (CALABRIA, 2004; ORR, 2005; FOSCA-
RINI, 2009; ALBERTS; SCHELLINCK; EBY; MARLEAU, 2010; IFOULD;
JOSEPH, 2016). Os arquivistas precisam descobrir o que seus usuá-
rios pensam e dizem sobre os serviços prestados pelos sistemas

sumário
237
de gestão de documentos. É fundamental iniciar um diálogo com os
usuários em vez de se concentrar somente nos sistemas e nas tec-
nologias envolvidas (OLIVER; FOSCARINI, 2013).

Desenhar sistemas e processos de trabalho que facilitem aos


produtores a criação e armazenamento de bons documentos é vital,
mas desafiante na prática. Isso requer habilidades de engenharia de
sistemas de alto nível junto a uma sólida compreensão dos requisitos
de gestão de documentos, processos de trabalho e comportamento
humano (CUNNINGHAM, 2021).

Acreditamos que o vínculo arquivístico e a fundamentação de


outras funções arquivísticas encontram, na abordagem funcional, a
estabilidade necessária para serem implementados. Por outro lado,
o plano de classificação de documentos de arquivo não pode deixar
de satisfazer as necessidades e expectativas dos usuários. É sem-
pre importante lembrar que o instrumento é operado diretamente pelo
usuário no momento em que ele cria ou recebe o documento fruto
de suas atividades na organização. Observamos que, nos sistemas
informatizados, a descentralização de responsabilidades pela gestão
de documentos se aprofundou, exigindo do usuário uma participação
maior e vital para o funcionamento do sistema como um todo.

Os caminhos possíveis para fugir dessa encruzilhada (vincula-


ção do documento à atividade que o gerou e a usabilidade do instru-
mento) são, primeiro (sem ordem de valor), de não adotar a análise
funcional como o ponto de chegada para a definição de um plano de
classificação funcional, mas como ponto de partida. A análise fun-
cional é importante para definir os níveis mais altos da estrutura do
plano, mas, nos níveis mais baixos, outros elementos seriam mais
interessantes, tais como: série documental, tópico, critério geográ-
fico, necessidades dos usuários, entre outros. O segundo, é ter um
melhor alinhamento entre a teoria da administração e a de gestão de
documentos, como aconselham Alberts et al. (2010). E, por último, a

sumário
238
classificação automática, que já começou a ser tratada pela literatura
da área. É sobre isso que vamos tratar na próxima seção.

4 A CLASSIFICAÇÃO AUTOMÁTICA
DE DOCUMENTOS DE ARQUIVO

Classificar é uma atividade humana. Os seres humanos (quase)


instintivamente organizam as coisas e os fenômenos em categorias.
Portanto, nós a classificamos. Sobrepomos ou vinculamos com algum
tipo de forma e estrutura e, aos fazermos isso, os dotamos (coisas e fe-
nômenos) de um significado e contexto, que nos ajudam a dar-lhes sen-
tido, a tornar a sua gestão mais eficiente (WARLAND; MOKHTAR, 2013).

O conceito de classificação é apropriado sem que se tenha cons-


ciência sobre ele. A classificação trafega pelos vários momentos da vida
dos seres humanos. A maioria das pessoas não é consciente do fato
que classificamos em uma grande extensão em nossas vidas diárias.
Sem classificação o progresso humano seria impossível (SOUSA, 2005).

Para Langridge (1977, p. 11), o fato da inconsciência é um in-


dício da natureza fundamental do processo de classificação. E mais,
“sem classificação não poderia haver nenhum pensamento humano,
ação e organização que conhecemos. A classificação transforma im-
pressões sensoriais isoladas e incoerentes em objetos reconhecíveis
e padrões recorríveis”. Buscando a Psicologia, Langridge cita o inglês
Patrick Meredith para quem “grande parte da arte de aprender consis-
te em regularizar hábitos pessoais de classificação”. Astério Campos
(apud PIEDADE, 1983, p. 16) considera que “a classificação, entendida
como processo mental de agrupamento de elementos portadores de
características comuns e capazes de ser reconhecidos como entidade
ou conceito, constitui uma das fases fundamentais do pensar humano”.

sumário
239
Desde os sistemas de gestão de documentos em papel, a classi-
ficação é um elemento fundamental e esse papel permaneceu ou mes-
mo ficou mais evidenciado no ambiente digital. Entretanto, substituir os
agrupamentos criados pelo ato classificatório por metadados relacio-
nados ao conteúdo dos documentos é uma falsa solução, pois esvazia
todo o esforço para a manutenção do vínculo arquivístico e a fundamen-
tação das outras funções arquivísticas (avaliação e descrição).

A falta de compreensão de que eram necessárias novas atitu-


des e soluções com a expansão do ambiente digital gerou, em um
primeiro momento, a ideia de que seria importante apenas reproduzir
as pastas, as gavetas e as caixas existentes no mundo físico em
diretórios e subdiretórios na raiz dos computadores. Não se atentou
para as grandes possibilidades que a Tecnologia da Informação po-
deria oferecer ao mundo arquivístico. Apresentamos essa discussão
somente para contextualizar, pois as dificuldades dos usuários no
uso e na aplicação do plano de classificação funcional continuavam,
tinham apenas migrado para outro ambiente.

Agrupamos os documentos para lhes dar sentido e contexto.


Como visto na seção anterior, os métodos, que não passam, em al-
guns momentos, de recomendações vagas, parecem falhar nessa ta-
refa. Cunningham (2021) reconheceu isso na Austrália, para ele nada
funcionou como se esperava, inclusive com a inevitável relação entre
análise funcional e classificação.

A falibilidade desses métodos está levando as organizações a


abandonarem a classificação pela utilização de metadados, que resol-
vem em parte o problema. Entretanto, esse tipo de alternativa fornece
não mais do que uma forma de agrupamento temporário, não preserva,
na maioria das vezes, o contexto de produção e uso dos documentos.

A partir da década de 2010, algumas experiências começam a


ser feitas na busca de alternativas a essa encruzilhada existente entre a

sumário
240
classificação funcional e a sua usabilidade. Como vimos anteriormen-
te, a classificação funcional é uma ideia que leva em consideração a
relação entre três entidades: o agente acumulador (pessoa física ou
jurídica), a função/atividade e o documento. Isso está bastante claro
para os arquivistas, como aponta a literatura, mas está embaçado para
os usuários, que acham isso pouco intuitivo e difícil de compreender.

Encontramos, na literatura, alguns poucos exemplos sobre o


uso de classificação automática de documentos de arquivo. Na língua
inglesa, encontramos três termos: auto-categorization, auto-classifica-
tion ou automatic classification. Conceito que, ainda, não ganhou uma
definição nos glossários e dicionários da área.

Guercio (2017) chama a atenção para o fato de que a atividade


de reflexão teórica, tão expressiva entre 1995 e 2005, sobre os docu-
mentos digitais, foi deixada de lado nos últimos anos. Isso permitiu,
ao mercado (fornecedores de software), propor soluções operacionais
que, de fato, têm sido limitadas a replicar passivamente o existente e
não embarcando nessas ferramentas inteligência arquivística, na for-
ma de requisitos para o funcionamento desses instrumentos. Não ini-
ciando, assim, processos de inovação.

Encontramos um estudo realizado na Universidade de Richmond,


que examinou se a análise assistida por tecnologia no e-discovery po-
deria ser mais eficaz e mais eficiente do que a análise manual exaustiva.
Uma análise manual alcançou 65% de precisão e 65% de revocação,
que é o nível que os seres humanos concordam uns com os outros.
Em comparação, uma análise baseada no algoritmo informático, de do-
cumentos do arquivo de correio eletrônico de uma empresa, e tendo
sido analisado 1,9% dos documentos por seres humanos, para ajudar o
sistema a aprender, alcançou taxas médias de revocação e precisão de
76,7% e 84,7%, respectivamente. Assim, se os gestores de documen-
tos pudessem ajudar um sistema a aprender a classificar documentos
digitais, as taxas de sucesso para a classificação desses documentos

sumário
241
poderiam ser tão elevadas como indicado nos resultados da pesquisa
da Universidade de Richmond (WARLAND; MOKHTAR, 2013).

O blog dos Arquivos do Estado de Nova Gales do Sul57, na Aus-


trália, veiculou uma experiência interessante sobre o uso da classifica-
ção automática (auto-classification) para organizar documentos que não
tinham recebido tratamento. Na verdade, eram 400 mil documentos
digitais contidos em 31 mil pastas, algumas com até 14 níveis de pro-
fundidade, de uma agência governamental. Devido a questões admi-
nistrativas, os documentos precisavam ser migrados e classificados em
questão de meses. O que tornava a classificação manual impossível.

Optou-se, então, pela classificação automática a partir de um


módulo do software TRIM. A solução envolvia três componentes.
O primeiro foi o reconhecimento óptico de caracteres, um OCR, que
transformou arquivos de imagem em texto legível. O arquivo foi, em
seguida, indexado por um servidor de indexação de conteúdos. E, por
último, encaminhado para o módulo de classificação automática.

A precisão do sistema de classificação automática dependia da


definição de um conjunto de termos para vinculá-los a cada categoria
(classes do instrumento de classificação). Segundo os relatos, esta foi
a parte mais difícil, que consumiu mais recursos do projeto como um
todo e foi um fator crítico para o sucesso.

Ribeiro e Assis (2018) discutem, de forma interessante, o deep


learning e suas potencialidades para a classificação de documentos de
arquivo. Eles entendem que, com o grande volume de documentos di-
gitais acumulados diretamente em várias plataformas, muitas vezes de
forma não estruturada e organizada, a tarefa de classificá-los poderia
ser facilitada com o auxílio de algoritmos de deep learning, que fazem
parte da chamada “inteligência artificial leve”. Acreditam, inclusive, que

57 Using auto-classification to classify unmanaged records. Disponível em: https://futureproof.


records.nsw.gov.au. Acesso em: 20 nov. 2021.

sumário
242
é possível criar sistemas que analisem uma quantidade massiva de da-
dos e, a partir dessas informações, classificar documentos.

Como sugestão, Ribeiro e Assis propõem que:


[...] para alcançar uma eficácia e eficiência na utilização de tais
técnicas, é necessário que haja estudos prospectivos da área
de Arquivologia em torno da Inteligência Artificial, possibilitando
assim o entendimento de como tais algoritmos funcionam e os
aplicando em seu cotidiano, juntamente com profissionais de
Tecnologia da Informação (TI). (RIBEIRO; ASSIS, 2018).

Oladejo e Hadzidedic (2020), na mesma linha dos autores bra-


sileiros, entenderam que as técnicas de classificação automática de
documentos utilizam algoritmos, que aprendem com as classificações
humanas. Dessa forma, podem realizar a tarefa humana de classifica-
ção a partir de uma formação adequada. Citaram, inclusive, um projeto
intitulado SEEK! que criou uma solução de aprendizagem automática
com um algoritmo de recomendação baseado em regras para decidir
automaticamente a pasta de destino e os metadados de um documen-
to, com base no seu conteúdo.

Para Payne e Baron (2017), as novas ferramentas de categoriza-


ção automatizada (auto-categorization) são necessárias para ultrapas-
sar as limitações das tradicionais categorizações e manter a força do
vínculo arquivístico. Eles entendem que essa abordagem traz vanta-
gens significativas, que incluem a capacidade de:

• indexar automaticamente um único documento ou um grupo de


documentos;

• permitir a atualização automatizada da massa de relações entre


documentos;

• desenvolver linguagem natural consistente que pode melhorar o


acesso dos usuários aos dados e repositórios;

sumário
243
• lidar com múltiplas linguagens de maneira eficaz;

• acessar uma plataforma independentemente por diversos usuá-


rios e para inúmeros fins.

Os autores acima citam como métodos de categorização au-


tomática a classificação baseada em regras, a correlação difusa, o
vetor espacial, a similaridade, o baseado em árvore e a rede neural.
Os métodos de categorização automática são concebidos para redu-
zir significativamente os custos que as organizações têm em relação
aos seus orçamentos para gestão de documentos. Isso diminui a
despesa global de armazenamento e arquivamento (PAYNE; BARON,
2017). Algumas fronteiras foram abertas, mas está claro que precisa-
mos de mais pesquisa e aplicação para tornar os métodos de classi-
ficação automática eficientes.

5 CONSIDERAÇÕES FINAIS

Vivemos, atualmente, uma situação híbrida, da mesma forma


que temos grandes massas documentais acumuladas em supor-
te papel estamos formando outras no ambiente digital. O fato é que
assistimos meio inertes a criação de volumes cada vez maiores de
documentos digitais com pouco tratamento arquivístico. Os sistemas
de gestão de documentos não conseguiram capturar todos aqueles
registros. Muitos desses documentos passam longe do controle arqui-
vístico, dando origem a repositórios de documentos de arquivo sem
nenhum requisito de gestão de documentos.

Isso pode ser observado no caso dos sistemas de negócio, nos


servidores de e-mails, nos computadores “pessoais” e nos diretórios
de rede. Nesses espaços, a organização, a preservação e a recupe-
ração estão sob a jurisdição das decisões arbitrárias, da linguagem

sumário
244
natural, da falta de conhecimento sobre o que é um documento de
arquivo, entre outros elementos.

O tratamento desses conjuntos documentais não tem condi-


ções de ser feito manualmente. Precisamos lançar mão da tecnologia
da informação para processar esses enormes volumes de documentos
digitais e que crescem em progressão geométrica, como é o caso dos
e-mails. Soluções têm sido encontradas, mas que tem uma fundamen-
tação mais prática do que teórica. O exemplo maior disso é o projeto
do Arquivo Nacional Americano intitulado Capstone.

O objetivo deste trabalho foi o de identificar as possibilidades de


inserir, nos sistemas informatizados de gestão de documentos, a clas-
sificação automática de documentos de arquivo. Para isso verificamos
o que a literatura arquivística tem escrito sobre esse tipo de classifica-
ção, que desonera o usuário do trabalho de classificar diretamente os
documentos que acumula.

Apesar de não estar no escopo desse trabalho, não só os


usuários têm dificuldade na compreensão e aplicação da classifica-
ção funcional mas também os arquivistas, de acordo com Packalén e
Henttonen (2016). Esse problema ganha especial importância quando
percebemos que a classificação, além de matricial, está intimamente
vinculada à avaliação e à descrição. Uma classificação errada pode
resultar em uma aplicação da tabela de temporalidade equivocada e a
uma descrição pouco consistente.

As primeiras experiências de uso da classificação automática


apontam para o uso da deep leaning com base na inteligência artificial.
Entretanto, essas possibilidades precisam da junção dos conhecimen-
tos em tecnologia da informação e em arquivologia. O canto de sereia
de tratar o documento como uma entidade isolada, que tem valor ape-
nas pelo conteúdo que veicula, é muito sedutor.

sumário
245
Outra possibilidade é adiantar o trabalho do arquivista para o
momento da criação do documento. Partindo da ideia de que o docu-
mento é resultado das atividades, que são cotidianamente repetidas,
portanto, podemos criar padrões de documentos, isto é, tipos docu-
mentais já classificados.

Muito trabalho precisa ser feito para que os métodos de classi-


ficação automática dos documentos de arquivo alcancem um grande
desempenho, tornando desnecessária a intervenção manual, que no
caso dos grandes volumes já acumulados seria impossível ou deman-
daria grandes recursos financeiros e materiais. Estão aí alguns dos ca-
minhos que podemos seguir, mas somente a pesquisa pode construir
soluções com requisitos de gestão de documentos.

6 REFERÊNCIAS
ALBERTS, Inge, SCHELLINCK, Jen, EBY, Craig, MARLEAU, Yves. Bridging
Functions and Processes for Records Management. Canadian Journal of
Information and Library Science, Toronto, v. 34, n. 4, p. 365-390, dez. 2010.
ARQUIVO NACIONAL (Brasil). Dicionário brasileiro de terminologia arqui-
vística. Rio de Janeiro: Arquivo Nacional, 2005.
ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. ABNT NBR ISO 15489-
1: 2018. Informação e documentação – Gestão de documentos de arquivo.
Parte 1: Conceitos e princípios. Rio de Janeiro: ABNT, 2018
ASSOCIAÇÃO DOS ARQUIVISTAS BRASILEIROS. Dicionário brasileiro de
terminologia arquivística. São Paulo: CENADEM, 1990.
ASSOCIACIÓN ESPAÑOLA DE NORMALIZACIÓN Y CERTIFICACIÓN (AE-
NOR). UNE-ISO/TR 26.122. Información y documentación. Análisis de los
processos de trabajo para la gestión de documentos. Madri: AENOR, 2008.
BAK, Greg. Continuous classification: capturing dynamics relationships
among information resources. Archival Science, v. 12, p. 287-318, 2012.
BAK, Greg. La classificación de documentos electrónicos: documentando
relaciones entre documentos. Tábula, n. 13, p. 59-77, 2010.

sumário
246
CALABRIA, Tina. Evaluating Caloundra City Council’s EDMS classification.
2004. Disponível em: https://www.steptwo.com.au/files/kmc_caloundracoun-
cil.pdf. Acesso em: 7 maio 2020.
CAMARGO, Ana Maria, BELLOTTO, Heloisa Liberalli. Dicionário de termino-
logia arquivística. São Paulo: Centro de Memória da Educação, 2010.
CAMPBELL, Eduard G. Functional classification of archival material. The
Library Quaterly: information, community, policy,v. 11, n. 4, p. 431-441, 1941.
CARAVACA, Maria Mata. Policies and requirements for archival sedimen-
tation in a hybrid records management environment: a critical analysis of
international writings, 2017. Tese (Doutorado em Library and Documentation
Sciences) – Sapienza Universitá di Roma, Roma, 2017.
CONSELHO INTERNACIONAL DE ARQUIVOS (CIA). ISAD(G) Norma geral in-
ternacional de descrição arquivística. Rio de Janeiro: Arquivo Nacional, 2000.
CONSELHO INTERNACIONAL DE ARQUIVOS (CIA). Multilingual archival ter-
minology. Disponível em: http://www.ciscra.org/mat/. Acesso: em: 24 abr. 2020.
COUNCIL OF STANDARDS AUSTRALIA. Handbook Records Classification.
HB 5031-2011, Sydney, 2011.
CRUZ MUNDET, José Ramón. Diccionario de archivística: con equivalências
em inglês, francês, alemán, portugués, catalán, euskera y gallego.Madrid:
Alianza Editorial, 2011.
CUNNINGHAM, Adrian. Cómo de lleno está el vaso? Cambios y desafios
para los professionales de los documentos frente a la transformación digital
en la era de los datos. Tábula, n. 24, 2021, p. 21-43.
DIRECTION DES ARCHIVES DE FRANCE. Dictionnaire de terminologie
archivistique. Paris, 2002.
DURANTI, Luciana et al. Preservation of the integrity of electronic records.
Dordrecht: Kluver, 2002.
DURANTI, Luciana, FRANKS, Patrica C. (ed.). Encyclopedia of Archival
Science. Lanham: Rowman & Littlefield, 2015.
DURANTI, Luciana. The archival bond. Archives and Museum Informatics,
v. 11, p. 213-218, 1997.
FOSCARINI, Fiorella. Function-based records classification systems. An
exploratory study of records management practices in central banks,2009.
Tese (Doutorado em Library, Archival and Information Studies) – University of
British Columbia. Vancouver: British Columbia, 2009.

sumário
247
FOSCARINI, Fiorella. La classificación de documentos basada em funciones:
comparación de la teoria y la práctica. Tábula, n. 13, p. 41-57, 2010.
FOSCARINI, Fiorella. Understanding functions: An organizational culture pers-
pective. Records Management Journal, v. 22, p. 20–36, 2012.
GAGNON-ARGUIN, Louise, BANNOURI, Rabii. La classification des docu-
ments institutionnels dans les ministères du Gouvernement du Québec
et le défi informatique. Montreal: Conseil du Trésor, 1998.
GUERCIO, Maria. La classificazione nell’organizzazione dei sistemi documen-
tari digitali: criticità e nuove prospettive. JLIS.it, v. 8, n. 2, mai., 2017.
GUERCIO, Maria. Records classification and content management: old functions
and new requirements in the legislations and standards for electronic record-
-keeping systems. In: Proceedings of the DLM-Forum 2002. Access and pre-
servation of electronic information: best practices and solutions. Barcelona, 2002.
GUNNLAUGSDOTTIR, Johanna. Functional classification scheme for records:
a way to chart documented knowledge in organizations. Records Manage-
ment Journal, v. 22, n. 2, p. 116–129, 2012.
HEÓN, Gilles. La classification. In: COUTURE, Carol et al. Les functions archi-
vistiques. Montreal: Presses de L´Université du Québec, 2003. p. 220-254.
HEREDIA HERRERA, Antonia. Lenguaje y vocabulario archivísticos: algo
más que un diccionario. Sevilla: Junta de Andalucía, 2011.
HEREDIA HERRERA, Antonia. Manual de archivistica básica: gestión y
sistemas. Cidade do México: Univesidad Autónoma de Puebla, 2013.
IFOULD, Peta, JOSEPH, Pauline. User difficulties working with a business classifi-
cation scheme: a case study”, Records Management Journal, v. 26, n. 1, 2016.
INTERNATIONAL RECORDS MANAGEMENT TRUST (IRMT). Glossary of
terms. Londres: IRMT, 2009.
JOSEPH, Pauline. EDRMS search behaviour: implications for records mana-
gement principles and practices, 2010. Tese – University of Western Australia,
Perth, 2010.
LANGRIDGE, Derek. Classificação. Abordagem para estudantes de Bibliote-
conomia. Rio de Janeiro: Interciência, 2006.
MORELLI, Jeff. Hybrid filing schemes: the use of metadata signposts in func-
tional file plans. Records Management Journal, v. 17, n. 1, p. 17-31, 2007.

sumário
248
NATIONAL ARCHIVES OF AUSTRALIA. Overview of Classification Tools
for Records Management. Camberra: National Archives of Australia, 2003.
Disponível em: https://www.naa.gov.au/sites/default/files/2019-10/classifca-
tion-tools.pdf. Acesso em: 1 maio 2020.
OLADEJO, Babatunde, HADZIDEDIC, Suncica. Electronic records manage-
ment: a state of the art review. Records Management Journal, v. 31, n. 1,
p. 74-88, 2021.
OLIVER, Gillian, FOSCARINI, Fiorella. Effective records management: working
collaboratively within organizations. Comma, Liverpool, n. 1, 2013. Disponível
em: https://doi.org/10.3828/comma.2013.1.14. Acesso em: 15 maio 2020.
ORR, Stuart Anthony. Functions-based classification of records: is it
functional?, 2005. Dissertação (Master of Science in Records Management)
– Divisão de Informação e Estudos de Comunicação, Northumbria University.
Newcastle: Northumbria University, 2005.
PACKALÉN, Saara, HENTTONEN, Pekka, Recordkeeping professional
understanding of and justification for functional classification: Finnish public
sector organizational context, Archival Science,v. 16, p. 403-419, 2016.
PAYNE, Nathaniel, BARON, Jason R. Auto-categorization methods for digital
archives. In: IEEE International Conference on Big Data, 2017, Boston. Anais
[…]. Boston: IEEE International Conference on Big Data, 2017.
PEARCE-MOSES, Richard (org.). A glossary of archival and Records termi-
nology. Chicago: The Society of American Archivists, 2005.
PIEDADE, Maria Antonietta Requião. Introdução à Teoria da Classificação.
Rio de Janeiro: Interciência, 1983.
REED, Barbara. Just doing the same won’t work lets make the digital record-
keeping compelling! Acervo, Rio de Janeiro, v. 28, n. 2, jul./dez., 2015, p. 93-109.
RIBEIRO, Patrick Dourado, ASSIS, João Marcus Figueiredo. Deep learning e
suas potencialidades para a classificação arquivística. In: Congresso Interna-
cional em Humanidades Digitais, 1, 2018, Rio de Janeiro. Anais [...]. Rio de
Janeiro: Universidade Federal do Rio de Janeiro, 2018.
ROBERGE, Michel. Le schéma de classification hiérarchique dês docu-
ments administratifs. Conception, développement, déploiementet mainte-
nance. Québec: Editions Michel Roberge, 2011.
SABOURIN, Paul. Constructing a functions-based records classification
system: Business Activity Structure Classification System. Archivaria, Ottawa,
v.51, p. 137-154, 2001.

sumário
249
SCHELLENBERG, Theodore Rooservelt. Arquivos modernos. Princípios e
técnicas. Rio de Janeiro: FGV, 2005.
SHEPHERD, Elizabeth, YEO, Geoffrey. Managing records. A handbook of
principles and practice. Londres: Facet, 2003.
SMYTH, Z. A. Implementing EDRM: has it provided the benefits expected?
Records Management Journal, v. 15, n.3, p. 141-149, 2005.
SOUSA, Renato Tarciso Barbosa de. A classificação no ambiente digital ainda
é a base da gestão de documentos e de arquivos? Alguns apontamentos
para o debate. In: SIMPÓSIO INTERNACIONAL DE ARQUIVOS, 1, São Paulo,
2020. Anais [...] São Paulo: Even 3, 2020.
SOUSA, Renato Tarciso Barbosa de. Classificação em arquivística: trajetória
e apropriação de um conceito. 2005. Tese (Doutorado em História Social) –
Universidade de São Paulo, São Paulo, 2005.
WARLAND, Andrew, MOKHTAR, Umi Asma. Can technology classify records
better than a human? IRMS Bulletin, n. 171, p. 16-19, 2013.

sumário
250
Parte 2

Parte
Abordagem aplicada

Abordagem aplicada
na organização
2
na organização
do conhecimento

do conhecimento
8
Capítulo 8

Reduções sintagmáticas e indexação:


uma análise a partir de logs de
pesquisa dos usuários de um sistema
de recuperação da informação

Syntagmatic reductions and indexing:


an analysis from user search logs
of an information retrieval system
Isabel Cristina Pereira dos Santos

Isabel Cristina Pereira dos Santos

Reduções sintagmáticas e indexação:


uma análise a partir de logs de pesquisa
dos usuários de um sistema
de recuperação da informação

Syntagmatic reductions and indexing:


an analysis from user search logs
of an information retrieval system

DOI: 10.31560/pimentacultural/2022.95613.8
Resumo:
Este capítulo se propõe a analisar o tratamento das reduções sintagmáticas no
processo de indexação e a orientar metodologicamente como extrair e identifi-
car essas reduções, tendo como fonte de terminologia os logs de pesquisa de
usuários de um sistema de recuperação de informação (SRI) da área de Eco-
nomia, estabelecendo-se, assim, uma forma de se trabalhar com logs no con-
texto da Organização do Conhecimento. Apresenta-se um instrumento para a
identificação de lexias candidatas a variantes denominativas extraídas dos logs
de pesquisa, baseado na teoria de Judit Freixa. Aplicam-se, como metodolo-
gias, a linguística de corpus, a garantia literária, mais especificamente, a garan-
tia terminológica, a garantia do usuário e a garantia acadêmica. Analisam-se,
detalhadamente, duas lexias da subárea de Microeconomia — cobb douglas e
poupança —, por se entender que, entre os casos analisados na pesquisa, são
os que mais podem enriquecer a discussão sobre reduções sintagmáticas.
Conclui-se que a análise de logs e a metodologia de garantias são grandes
aliadas para a indexação de reduções sintagmáticas, uma vez que podem tra-
zer à luz relações semânticas entre termos e esclarecer conceitos que, quando
reduzidos, podem perder sua especificidade e adquirir outro sentido.

Palavras-Chave: Reduções sintagmáticas; logs; indexação; variação


denominativa; garantia terminológica; garantia do usuário.

sumário
253
Abstract:
This chapter aims to analyze the treatment of syntagmatic reductions in the in-
dexing process and to methodologically guide how to extract and identify these
reductions, having as a source of terminology the search logs of users of an infor-
mation retrieval system (IRS) in the area of Economy, thus establishing, a way of
working with logs in the context of the Knowledge Organization. An instrument for
the identification of lexias candidates for denominative variants extracted from the
search logs of users of an IRS, based on the theory of Judit Freixa, is presented.
The applied methodologies are the corpus linguistics, literary warrant, more speci-
fically, terminological warrant, user warrant and academic warrant. Two lexias from
the Microeconomics subarea — cobb douglas and poupança — are analyzed
in detail, as it is understood that, among the cases analyzed in the research, they
are the cases that can most improve the discussion on syntagmatic reductions.
It is concluded that log analysis and the methodology of warrants are great allies
for the indexing of syntagmatic reductions, as they can bring to light semantic
relationships between terms and clarify concepts, which can lose their specificity
and acquire another sense when reduced.

Keywords: Syntagmatic reductions; logs; indexing; denominational variation;


terminological warrant; user warrant.

sumário
254
1 INTRODUÇÃO

Este capítulo se propõe a analisar o tratamento das reduções


sintagmáticas no processo de indexação. Ele é um recorte da disserta-
ção de mestrado desta autora intitulada “Reconhecimento de termos e
de variantes denominativas a partir dos logs de pesquisa dos usuários
da Revista Análise Econômica: uma análise da variação no âmbito da
Microeconomia” (2021). Além de abordar o uso de reduções de sintag-
mas, esse capítulo também se propõe a orientar, por meio de sua me-
todologia, como extrair e identificar essas reduções, tendo como fonte
de terminologia os logs de pesquisa de usuários de um sistema de
recuperação de informação, estabelecendo-se, assim, uma forma de
se trabalhar com logs no contexto da Organização do Conhecimento.

Os logs são os arquivos que contêm o histórico de pesquisa


dos usuários. Na dissertação supracitada, entre outros estudos, como
os de Laipelt (2015a; 2015b), eles têm se mostrado uma importante
fonte para a extração de terminologia e de variação denominativa,
servindo inclusive como garantia do usuário no processo de legitima-
ção dos termos. Os logs proporcionam, ao analista, uma terminologia
in vivo, uma terminologia “pulsante”, uma vez que carregam consigo
as expressões de busca dos usuários, também chamadas de lexias,
que nada mais são do que a representação da linguagem natural,
caracterizada por supressões de letras, acentos, preposições, siglas
e partes do sintagma, além de apresentarem possibilidades de varia-
ções denominativas dos termos pesquisados.

No processo de indexação, as reduções sintagmáticas são um


grande desafio ao indexador, uma vez que se admite não apenas um tra-
balho prescritivo, destinado a representar unidades unívocas, mas tam-
bém um trabalho descritivo das unidades propostas pelo usuário, con-
siderando o emprego de termos variantes como formas remissivas para
a recuperação da informação. Nesse caso, as variantes denominativas

sumário
255
e/ou suas reduções precisam ser analisadas com bastante atenção, pois
podem vir a ser realmente uma representação dos termos normalizados
(uma redução do sintagma) ou um outro termo (um outro conceito).
E, quando da extração de terminologia dos logs de pesquisa, essa re-
lação entre sintagma e termo reduzido é bastante frequente na análise.

Para o reconhecimento das reduções sintagmáticas extraídas


dos logs, esta pesquisa se baseou na tese de doutorado de Freixa
(2002), que propõe uma análise exaustiva da variação terminológica.
Fundamentada em bases teóricas da Teoria Comunicativa da Termino-
logia (TCT), a autora propõe uma classificação formal detalhada para
a variação denominativa existente nos discursos especializados, mais
precisamente, da área ambiental, dividindo essa classificação em cin-
co blocos, de acordo com o tipo de alteração linguística produzida.
Nesse capítulo, serão destacados o segundo e o terceiro bloco, que
tratam das variações morfossintáticas e das reduções sintagmáticas.

2 AS REDUÇÕES SINTAGMÁTICAS

Conforme os princípios metodológicos fundamentais da TCT, a


categoria gramatical básica dos termos é a nominal, podendo apresen-
tar unidades adjetivas e verbais de caráter terminológico relacionadas a
esses termos nominais. Existem também locuções de valor terminológi-
co compostas de preposições e sintagmas nominais. Em uma perspec-
tiva denominativa, a maioria dos termos é substantivo (CABRÉ, 2001).

Em linguagens documentárias, como dicionários, glossários, te-


sauros, lista de palavras-chave, o termo preferido geralmente é um termo
monoléxico, ou seja, um substantivo (ex.: poupança), ou um termo poli-
léxico, ou seja, um sintagma nominal (ex.: caderneta de poupança). Nas
áreas de especialidade, os sintagmas nominais são mais numerosos, e
há predominância de substantivos também, porém, da mesma forma,
adjetivos podem adquirir status de termo (KRIEGER; FINATTO, 2017).

sumário
256
O uso da variação por redução nos logs de pesquisa se dife-
rencia do uso da variação por redução no discurso. A variação no dis-
curso, segundo Freixa (2013), dá-se principalmente por questões de
estilo de escrita do autor, que tem por objetivo evitar repetição dos ter-
mos, usando outras denominações; economizar termos, fazendo uso
de siglas, abreviaturas, acrônimos (variantes gráficas) e reduções por
anáfora (variantes lexicais), conforme o exemplo:
A teoria da escolha social (social choice) estuda como as pre-
ferências individuais se agregam para formar uma preferência
coletiva. Essa teoria remonta à publicação do paradoxo da vo-
tação, por Condorcet (1785) (RAE1704, 2020).58

Nesse exemplo, “essa teoria” retoma a “teoria da escolha social”


anteriormente mencionada no discurso. Trata-se de um mecanismo de
coesão, no qual “teoria” mantém o sentido original do sintagma, cons-
tituindo-se assim uma redução anafórica. Essa afirmação somente é
possível porque o sintagma e sua redução coexistem em um mesmo
contexto textual. Para mapear essas reduções presentes nos textos, é
necessária uma leitura atenta de todo o texto, a fim de localizar as aná-
foras do termo preferido, ou seja, se ele foi repetido de forma reduzida
no mesmo contexto ou em outro contexto no mesmo texto.

No entanto, para as variantes que ocorrem nos logs, não há um


contexto textual, mas sim um contexto informacional, composto por ses-
sões, históricos e expressões de busca ou lexias (Quadro 2 e 4), as quais
são a representação gráfica de uma construção mental do usuário, sem
revisões ou correções. Em suas estratégias de busca, o usuário cria as-
sociações semânticas e morfológicas nas suas tentativas de recuperar a
informação e, dessas associações, podem surgir variantes denominati-
vas que são reconhecidas pelo indexador apenas dentro de uma sessão
de logs, sem um contexto textual especializado. A validação no contexto

58 RAE1704: VARGAS, J.; HERSCOVICI, A. A tragédia dos commons revisitada: uma análise
crítica. Revista Análise Econômica, Porto Alegre, v. 35, n. 67, p. 105-128, mar. 2017.
Disponível em: https://seer.ufrgs.br/AnaliseEconomica/article/view/54987/40801 Acesso
em: 05 out. 2019.

sumário
257
de uso é realizada pelo indexador durante o processo de garantia lite-
rária, que abrange a garantia terminológica (contexto textual), a garantia
do usuário (contexto informacional) e a garantia acadêmica (consulta a
especialistas), etapas subsequentes ao reconhecimento terminológico.

Em termos de recuperação da informação, ao utilizar termos re-


duzidos, o usuário gera um “ruído” na recuperação, trazendo à tona um
número elevado de documentos aleatórios (CHAUMIER, 1988, p. 63),
uma vez que torna o termo de busca muito genérico. Em termos de inde-
xação, o indexador preza sempre pelo termo mais específico, no caso, o
sintagma, e, quando esse sintagma se reduz, a redução faz com que ele
perca informações semânticas, perdendo assim o seu sentido original.

Por esse motivo, no processo de identificação de variantes de-


nominativas presentes nos logs, é preciso direcionar uma maior aten-
ção aos casos de reduções, principalmente aos casos de redução
de extensão, como, por exemplo, em finanças pessoais / finanças,
em que um termo poliléxico (finanças pessoais) se converte a um
termo monoléxico (finanças), perdendo o seu carácter específico e
tornando-se mais genérico. Nesse caso, claramente ocorre perda de
sentido do termo poliléxico, uma vez que, sem um contexto textual
no qual se possa identificar o caráter anafórico do termo reduzido
(finanças), não é possível afirmar que esse termo seja uma variante
do termo poliléxico (finanças pessoais).

Para identificar os tipos de variação que poderiam existir en-


tre os pares de lexias extraídos dos logs, utilizou-se, como referencial
teórico, a Classificação Formal de Variantes Denominativas de Freixa
(2002). O Quadro 1 foi elaborado a partir do quadro de Freixa (2014) e
abrange apenas os blocos II e III da classificação. Por meio do quadro
de Freixa (2014), foi possível elaborar um instrumento para identificar
lexias candidatas a variantes extraídas dos logs de pesquisa e funda-
mentar as possíveis variações existentes, tais como variações morfos-
sintáticas entre termos monoléxicos/poliléxicos, reduções de extensão
e de base e outros tipos de reduções.

sumário
258
Faz-se importante destacar que as lexias apresentadas no Qua-
dro 1 são “candidatas a variantes” e foram extraídas da pesquisa de
Santos (2021), exceto para o exemplo producto ecológico / ecoprodu-
to, que pertence ao corpus de Freixa (2002)59. Ao contrário de Freixa
(2002), que extraiu e validou suas variantes em um contexto textual
antes de disponibilizá-las em um quadro, Santos (2021) apenas se
baseou no quadro de Freixa (2014) para organizar as lexias extraídas
dos logs, sem validá-las como variantes, pois, como mencionado, no
caso dos logs, não há um contexto textual, mas sim um contexto infor-
macional, devendo as lexias serem validadas na etapa de garantia, que
ocorre posteriormente às suas inserções no quadro.

Quadro 1 – Instrumento para a identificação de lexias candidatas a variantes


denominativas extraídas dos logs de pesquisa dos usuários de um sistema
de recuperação da informação – Variações morfossintáticas e reduções

II VARIAÇÕES MORFOSSINTÁTICAS
2. Estrutura diferente
f) Monoléxico / poliléxico producto ecológico / ecoproduto
III REDUÇÕES
1. Reduções finanças pessoais / finanças
da extensão bolsa de valores / bolsa
demanda marshalliana / demanda
oaxaca blinder / oaxaca
2. Reduções função de produção cobb-douglas / cobb-douglas
da base função de produção de cobb-douglas / cobb-douglas
função produção de cobb-douglas / cobb-douglas
função de produção do tipo cobb-douglas / cobb-douglas
caderneta de poupança / poupança
conta de poupança / poupança
3. Outras reduções teoria econômica evolucionista / teoria evolucionista
Fonte: Adaptado de Freixa (2014, p. 316-317).

59 No Quadro 1, nas categorias para as quais não foram encontrados exemplos de variação
em Economia, tais como “Estrutura diferente: monoléxico / poliléxico”, mantiveram-se os
exemplos propostos por Freixa (2014), em sua classificação original, por se entender que
candidatas a variantes para essas categorias podem ser encontradas em outro corpus de
estudo (SANTOS, 2021).

sumário
259
Para classificar os casos de redução, Freixa (2002) adotou três
critérios: primeiro, conforme a parte da unidade em que ocorre a redu-
ção, se na extensão ou na base do sintagma; segundo, conforme o nú-
mero de elementos reduzidos; e terceiro, conforme a estrutura do sin-
tagma. As reduções de extensão são as mais comuns. De acordo com
a autora, as reduções são principalmente anafóricas, ou seja, aquelas
que, quando aplicadas em um contexto textual, retomam um sintagma
usado anteriormente no mesmo discurso, como, por exemplo, bolsa de
valores / bolsa e função de produção cobb-douglas / cobb-douglas, em
que bolsa e cobb-douglas são os elementos anafóricos que retomam
e remetem às formas completas do termo (sintagmas) que já foram
mencionadas antes no contexto.

No Quadro 1, o bloco II trata das variações morfossintáticas, ou


seja, das relações formais entre os constituintes do termo, que podem
acarretar mudanças na estrutura do termo. No tipo “Estrutura diferente”,
ocorre a alternância entre a estrutura substantivo e adjetivo (producto
ecológico) e uma unidade monoléxica (ecoproduto), em que o adjeti-
vo (ecológico) da unidade sintagmática é representado por um prefixo
(eco) no monoléxico (ecoproducto) (FREIXA, 2002).

Laipelt (2015b), que classificou variantes denominativas da área


do Direito do Trabalho e do Direito Previdenciário, chama a atenção
para a necessidade de se fazer uma análise atenta, pois aspectos mui-
to específicos da variação podem deixar dúvidas quanto às possibli-
dades de classificação de variantes em algumas categorias. Sobre as
variações morfossintáticas com estruturas diferentes, as quais apre-
sentam reduções, a autora explica o seguinte:
[...] ao compararmos duas variantes entre si, é preciso observar
com atenção as alterações produzidas, visto que a presença
ou ausência de um único aspecto é fator determinante para
correta classificação. Por exemplo, qual a diferença entre uma
alteração de estrutura morfossintática que ocasiona a mudança
de uma unidade monoléxica para uma unidade poliléxica, e as

sumário
260
reduções de extensão, visto que na categoria reduções tam-
bém encontramos unidades poliléxicas que, devido à redução,
se tornam monoléxicas? A diferença está no resultado da alte-
ração obtida. No caso das alterações morfossintáticas, um dos
termos da unidade poliléxica, geralmente, o adjetivo, de acordo
com Freixa (2002), se transforma em prefixo da forma monolé-
xica, sem que o termo perca sua especificidade, como se pode
verificar no exemplo a seguir: produto ecológico / ecoproduto.
No caso de várias alterações complexas, é o radical do subs-
tantivo que se torna prefixo da unidade monoléxica resultante,
como pode-se verificar nesse exemplo: Agricultura ecológica /
Agroecologia (LAIPELT, 2015b, p. 50, grifo do autor).

O bloco III trata das variações denominativas oriundas das redu-


ções dos sintagmas. Freixa (2002) explica que a redução pode ser en-
tendida como a supressão de um ou mais constituintes de um sintagma,
e que essa supressão contribui para a economia linguística, assim como
ocorre com os acrônimos, mecanismo utilizado para encurtar um termo.

A aplicação do Quadro 1 pretende auxiliar no processo de re-


conhecimento dos termos, pois possibilita, ao indexador, organizar as
lexias por categorias, realizar uma pré-análise e conjecturar possibili-
dades de variações que podem existir entre elas até uma confirmação
final, que se dará por meio da aplicação das garantias. Tendo em vista
a etapa de garantias, ao se analisar os pares de lexias dispostos no
instrumento de identificação, deve-se fazer a seguinte pergunta: Cada
lexia do par de lexias apresenta uma definição própria?

Se a resposta for “sim”, pode-se comparar as duas definições e


verificar se o conceito é o mesmo; caso o conceito não seja o mesmo,
considera-se que se trata de dois termos independentes, não sendo,
portanto, variantes. Se a resposta for “não”, quer dizer que as defini-
ções são iguais, sendo os termos, portanto, variantes. Aqui, pode-se
considerar as reduções como variantes também.

sumário
261
3 METODOLOGIA DA PESQUISA

Esta é uma pesquisa baseada em corpus e de natureza aplica-


da, pois visa ao emprego concreto em trabalhos no âmbito da Orga-
nização do Conhecimento. Para análise da terminologia e justificação
das reduções, aplicaram-se, como metodologias, a linguística de cor-
pus, a garantia literária, mais especificamente, a garantia terminoló-
gica, a garantia do usuário e a garantia acadêmica (BARITÉ, 2020,
2009, 2007; BARITÉ ROQUETA, 2011; BARITÉ, M. et al. 2010; NATIO-
NAL INFORMATION STANDARDS ORGANIZATION, 2005; BEGHTOL,
1986). Nesse contexto, para que esta pesquisa possa ser replicada
por pesquisadores que pretendam empreender trabalho semelhante,
descrevem-se a seguir as etapas metodológicas60.

Etapa 1 – Organização do corpus de estudo

Realizou-se a extração das lexias dos logs de pesquisa dos


usuários da Revista Análise Econômica, no período de 31 de maio de
2019 a 26 de novembro de 2020, totalizando 1.162 logs, para, a partir
delas, selecionar candidatas a variantes denominativas. A extração foi
realizada por meio de um extrator de logs61, o qual disponibiliza os logs
em uma planilha em Excel, com extensão .csv, separados em colunas,
que designam, respectivamente: o IP do usuário que fez a pesquisa no
site da revista; o ano, o mês, o dia, a hora, o minuto, e o segundo em
que o usuário fez a pesquisa; o país do acesso; e o termo pesquisado
(sempre entre aspas).

Etapa 2 – Organização do corpus de referência

Realizou-se o download dos artigos publicados no site da Revis-


ta Análise Econômica no período 2015-2019. Cada artigo recebeu um

60 Para mais detalhes dessa metodologia, ver Santos (2021).


61 Elaborado pelo profissional da área de Informática Vicente Grassi Filho.

sumário
262
código correspondente à edição a qual pertence, a fim de identificar
a referência do artigo durante a análise da colocação do termo em
determinado contexto. Para a compilação do corpus de referência e
extração dos termos, foi utilizado o software Sketch Engine (2021).

Etapa 3 – Reconhecimento terminológico:


3.1) Análise das lexias de Economia extraídas dos logs de pesquisa
a partir do instrumento para a identificação de lexias candidatas
a variantes denominativas (Quadro 1), separando-se as lexias
candidatas a variantes nos seguintes grupos: Grupo A – Lexias
candidatas a variantes encontradas na mesma sessão de bus-
ca; e Grupo B – Lexias candidatas a variantes encontradas em
diferentes sessões de busca;

3.2) Análise das lexias de Economia extraídas dos logs de pesquisa


(corpus de estudo) e suas ocorrências no corpus textual espe-
cializado (corpus de referência), e aplicação do Quadro 1, se-
parando-se as lexias candidatas a variantes no seguinte grupo:
Grupo C – Lexias candidatas a variantes encontradas compa-
rando-se o corpus de estudo com o corpus de referência;

3.3) Classificação das candidatas a variantes dos Grupos A, B e C


conforme o Sistema de Classificação JEL (Journal of Economic
Literature), método padrão de classificação da literatura aca-
dêmica de Economia (AMERICAN ECONOMIC ASSOCIATION,
2020). A JEL foi usada como instrumento de apoio para o reco-
nhecimento terminológico das candidatas a variantes, auxilian-
do na organização da classificação dos termos da Economia e
no recorte de um subdomínio para fins de análise, uma vez que
se obteve um número elevado lexias;

3.4) Reconhecimento do subdomínio com maior ocorrência de can-


didatas a variantes e seleção das candidatas pertencentes a
ele, fazendo-se, assim, o recorte para análise.

Etapa 4 – Garantia literária

Validação das candidatas a variantes nos dicionários e nos li-


vros-texto de Microeconomia, subdomínio recortado.

sumário
263
Dicionários:

a. SANDRONI, P. (Org.). Dicionário de Economia do século XXI. 8.


ed. Rio de Janeiro; São Paulo: Record, 2016.

b. HOUAISS, A. (Org.). Dicionário Houaiss da língua portuguesa.


Rio de Janeiro: Objetiva, 2009.

Livros-texto sobre a área recortada:

a. GOOLSBEE, A.; LEVITT, S.; SYVERSON, C. Microeconomia. 2. ed.


Trad. Teresa Cristina Padilha de Souza. São Paulo: Atlas, 2018.

b. PINDYCK, R. S.; RUBINFELD, D. L. Microeconomia. 8. ed. Trad.


Daniel Vieira. São Paulo: Pearson Education do Brasil, 2013.

c. VARIAN, H. R. Microeconomia: uma abordagem moderna. 9. ed.


Trad. Regina Célia Simille de Macedo. Rio de Janeiro: Elsevier, 2015.

Etapa 5 – Preenchimento das fichas terminológicas

A ficha foi adaptada conforme as necessidades dessa pesquisa.


Para a sua elaboração, levaram-se em consideração as informações
que um indexador precisa saber sobre um determinado termo.

Etapa 6 – Consulta a especialistas para validar as candidatas


a variantes selecionadas

Seguindo as recomendações da Terminologia e da Organização


do Conhecimento, essa pesquisa contou com a colaboração de dois
docentes da área de Economia – o professor Ivan Colangelo Salomão,
da Universidade Federal do Paraná (UFPR), e o professor Sabino da Sil-
va Pôrto Junior, da Universidade Federal do Rio Grande do Sul (UFRGS)
–, os quais gentilmente aceitaram participar do reconhecimento termi-
nológico como consultores especialistas. Aplicada a metodologia pro-
posta, foram escolhidas duas lexias para serem analisadas detalhada-

sumário
264
mente − cobb douglas, pertencente ao Grupo B de lexias, e poupança,
pertencente ao Grupo C de lexias −, por se entender que são os casos
que mais podem enriquecer a discussão sobre reduções sintagmáticas.

4 ANÁLISE DAS REDUÇÕES


ENCONTRADAS EM LEXIAS CANDIDATAS
A VARIANTES DOS GRUPOS B E C

Nesta seção, analisam-se, mais detalhadamente, duas lexias


candidatas a variantes pertencentes a Categoria D – Microeconomia
– da Classificação JEL: cobb douglas e poupança. A intenção dessa
análise é verificar se ambas as lexias são reduções de sintagmas ou se
são conceitos independentes.

4.1 LEXIA COBB DOUGLAS62

Esta análise pretende investigar se a lexia cobb douglas é uma


redução sintagmática ou um conceito independente. Para tanto, o pri-
meiro passo é olhar para o corpus de estudo e verificar os históricos
de busca dos usuários. Conforme o Quadro 2, essa lexia aparece em
outubro de 2020, no histórico de busca de um usuário, que será cha-
mado de “Usuário 2”.

62 O termo eponímico cobb-douglas é formado pela junção dos sobrenomes do economista


Paul Douglas e do matemático Charles Cobb. Douglas (1892-1976) foi professor da Univer-
sidade de Chicago e senador dos Estados Unidos (EUA); Cobb (1875-1949) foi professor
da Faculdade de Amherst, em Massachusetts, EUA (VARIAN, 2015).

sumário
265
Quadro 2 – Contexto informacional da lexia cobb douglas (Grupo B)

Usuário 2
Lexia IP* Ano Mês Dia Hora Min. Seg. Local
“economia da produção” 177.129.xx.yyy 2020 10 21 16 18 30 Viçosa – MG
“cobb douglas” 177.129.xx.yyy 2020 10 21 16 19 29 Viçosa – MG
“elasticidade de produção” 177.129.xx.yyy 2020 10 21 16 19 47 Viçosa – MG
“CES” 177.129.xx.yyy 2020 10 21 16 24 7 Viçosa – MG
Fonte: Elaborado pela autora, 2021.
Nota: * Por questão de privacidade e anonimato do usuário, optou-
se por substituir os últimos números do endereço IP por letras.

Ao se observar o Quadro 2, o segundo passo é buscar por cobb


douglas no Dicionário de Economia do século XXI (2016), a fim de co-
nhecer a sua definição:
COBB-DOUGLAS (Função de Produção). Uma função com
a fórmula Q = A.La.Kb, em que Q é a produção, A, a e b
são constantes e L e K são, respectivamente, o trabalho e o
capital. [...]. Veja também Função Homogênea. (SANDRONI,
2016, p. 276, grifo do autor).

FUNÇÃO DE PRODUÇÃO COBB-DOUGLAS. Veja Cobb-


-Douglas (Função de Produção). (SANDRONI, 2016, p. 662,
grifo do autor).

Pelas definições do dicionário, é possível verificar que as lexias


cobb douglas / função de produção se relacionam semanticamente.
Ao se olhar para os logs novamente, verifica-se que outro usuário, que
será chamado de Usuário 1, já havia pesquisado por função de produ-
ção em junho de 2019, conforme o Quadro 3.

sumário
266
Quadro 3 – Contexto informacional da lexia função de produção (Grupo B)

Usuário 1
Lexia IP* Ano Mês Dia Hora Min. Seg. Local
“micro” 200.235.xxx.yy 2019 6 26 13 51 26 Viçosa – MG
“função de
200.235.xxx.yy 2019 6 26 13 53 59 Viçosa – MG
produção”
“microeconomia” 200.235.xxx.yy 2019 6 26 14 10 12 Viçosa – MG

Fonte: Elaborado pela autora, 2021.


Nota: * Por questão de privacidade e anonimato do usuário, optou-
se por substituir os últimos números do endereço IP por letras.

Ou seja, as lexias cobb douglas / função de produção foram pes-


quisadas por dois usuários diferentes, sendo, por isso, classificadas no
Grupo B. Nesse exemplo, uma vez que se trata de termos especializados
bastante restritos ao domínio da Economia, e não há um parentesco for-
mal entre as lexias que torne visível uma relação entre elas, nem a analista
possui um conhecimento prévio e extratextual capaz de chegar a uma
constatação, a busca por definições se tornou uma prática imprescindí-
vel para que se pudesse criar possíveis relações entre as lexias. Porém,
somente será possível legitimar essa relação como uma relação entre
variantes nas etapas “Garantia Literária” e “Consulta a especialistas”.

Pelas entradas do dicionário, observa-se que a lexia cobb dou-


glas tem como variantes cobb-douglas (função de produção) e função
de produção cobb-douglas. Em ambas, o termo eponímico cobb-dou-
glas apresenta hífen, diferente da expressão reduzida cobb douglas
proposta pelo usuário. No primeiro caso, que aparenta ser o termo pre-
ferido, pois apresenta a definição, a estrutura do termo cobb-douglas
(função de produção) causa estranhamento ao consulente, uma vez que
a expressão função de produção aparece entre parênteses, dando a im-
pressão de que ela não seria parte integral do termo, mas uma variante.
Na verdade, a expressão função de produção não deveria aparecer entre
parênteses na estrutura do termo, uma vez que, como será visto a seguir,
ela constitui outro termo, com sentido próprio.

sumário
267
Já, no segundo caso, desfaz-se essa ambiguidade: em função
de produção cobb-douglas, o termo descritivo antecede ao eponímico,
formando um sintagma com um sentido completo, que leva o con-
sulente a constatar que cobb douglas seria um “tipo de” função de
produção, não uma variação por redução de base, como leva falsa-
mente a crer a primeira entrada. Essa entrada, contrariando a esco-
lha do dicionarista, poderia ocupar satisfatoriamente o lugar de termo
preferido. Como se verá mais adiante nas colocações, os usuários e
especialistas não costumam usar parênteses na formação de termos,
sendo cobb-douglas (função de produção) uma construção bastante
precária, pois este não seria o termo mais usual nos contextos de uso.

No entanto, é preciso verificar também se, para a lexia função


de produção, existe uma definição própria. Caso exista, cobb douglas
/ função de produção não serão variantes. Veja-se:
FUNÇÃO DE PRODUÇÃO. É a relação entre a produção de um
bem e os insumos ou fatores de produção necessários para pro-
duzi-lo. Uma função de produção pode ser apresentada na forma
genérica Q = f(L, K, t), em que Q é o produto, L é a força de
trabalho, K é o capital e t é o progresso técnico. Outros fatores de
produção, como as matérias-primas, podem fazer parte também
da função de produção. [...]. Veja também Cobb-Douglas (Fun-
ção de Produção). (SANDRONI, 2016, p. 661, grifo do autor).

Como se pode perceber, o dicionário apresenta também entra-


da para função de produção. Apesar de as definições não deixarem
clara para um leigo a diferença entre os termos, conclui-se que, por
terem entradas diferentes, cobb douglas/função de produção repre-
sentam conceitos diferentes.

No entanto, para sanar dúvidas quanto à definição, foi preci-


so ir mais além. Nesse caso, os livros-texto de Microeconomia se
mostraram grandes aliados. Segundo a literatura microeconômica,
a princípio, a função Cobb-Douglas foi aplicada para se estudar o
comportamento da produção, sendo um dos tipos mais comuns de

sumário
268
função de produção utilizados pelos economistas (GOOLSBEE; LE-
VITT; SYVERSON, 2018; VARIAN, 2015, grifo nosso). Todavia, os livros
revelaram uma nova possibilidade para a lexia cobb douglas propos-
ta pelo usuário: o termo reduzido cobb-douglas não se refere apenas
à função de produção, mas se refere também a outros termos, que o
incorporam em sua estrutura, conforme o Quadro 4.

Quadro 4 – Colocações do termo reduzido


cobb-douglas nos livros-texto de Microeconomia

Referência Terminologia
Goolsbee, Levitt função Cobb-Douglas
e Syverson (2018) função utilidade convencional de Cobb-Douglas
função utilidade de Cobb-Douglas
função produção de Cobb-Douglas
fórmula funcional de Cobb-Douglas
equação padrão de Cobb-Douglas
funções de Cobb-Douglas
Varian (2015) preferências Cobb-Douglas
função de utilidade Cobb-Douglas
função de utilidade de Cobb-Douglas
curvas de indiferença Cobb-Douglas
função Cobb-Douglas
forma Cobb-Douglas
forma funcional Cobb-Douglas
consumidor Cobb-Douglas
Varian (2015) funções de demanda Cobb-Douglas
demanda Cobb-Douglas
função de produção de Cobb-Douglas
isoquantas de Cobb-Douglas
função oferta da empresa Cobb-Douglas
tecnologia de Cobb-Douglas
Pindyck e Rubinfeld (2013) função utilidade de Cobb-Douglas
função de utilidade Cobb-Douglas
função de produção de Cobb-Douglas
funções de produção de Cobb-Douglas

Fonte: Elaborado pela autora, 2021.

Com os resultados apresentados no Quadro 4, não se pode


afirmar que todo cobb-douglas está relacionado à função de produção,

sumário
269
pois ele pode se referir também à função utilidade de Cobb-Douglas,
à forma funcional Cobb-Douglas, a preferências Cobb-Douglas, a iso-
quantas de Cobb-Douglas, à tecnologia de Cobb-Douglas etc. Daí de-
preende-se que a lexia cobb douglas, proposta pelo usuário, seja uma
redução de vários outros termos. Esses resultados fizeram com que se
repensasse a proposta do usuário registrada nos logs de pesquisa, ou
seja, o que realmente o usuário gostaria de recuperar quando utilizou
a redução cobb douglas em sua estratégia de busca?

Para responder essa questão, é preciso compreender a di-


ferença entre os termos função produção de Cobb-Douglas e fun-
ção utilidade de Cobb-Douglas. Pela literatura microeconômica,
entende-se, grosso modo, que função produção de Cobb-Douglas
e função utilidade de Cobb-Douglas são representações que se
diferenciam por seus objetivos e pelas variações da forma funcional
Cobb-Douglas, a qual sofre adaptações de suas variáveis conforme
os objetivos de análise econômica.

Entre as infinidades de possibilidades relacionadas no Quadro


4, cabe ao indexador retornar ao histórico de busca do usuário, a fim
de verificar se ele utilizou outros termos em sua estratégia que po-
dem delimitar o conceito pretendido quando da pesquisa do termo
reduzido. Nesse contexto, no Quadro 2, verificou-se que as lexias rela-
cionadas a cobb douglas pelo usuário foram economia da produção,
elasticidade de produção e CES (sigla em inglês para elasticidade de
substituição constante), ou seja, todas pertencentes à teoria da produ-
ção, o que conecta imediatamente a lexia cobb douglas ao termo fun-
ção de produção cobb-douglas e descarta a sua conexão com função
de utilidade Cobb-Douglas, termo pertencente à teoria do consumidor.

Em síntese, pensando-se em termos de indexação, se, por


um lado, a lexia cobb douglas, proposta pelo usuário, não pode ser
considerada redução de base dos sintagmas dispostos no Quadro
4, porque o usuário, ao reduzir o sintagma pretendido, deu a ele um

sumário
270
sentido indefinido, devido às inúmeras possibilidades discursivas
(Quadro 4), por outro lado, o contexto informacional da lexia delimitou
a sua análise neste estudo à sua relação com a função de produção,
podendo ele, nesse contexto, ser considerado uma redução de fun-
ção de produção cobb-douglas.

4.2 LEXIA POUPANÇA

As lexias que constituem o Grupo C são as que, na comparação


do corpus de estudo com o corpus de referência, surgiram como can-
didatas a variantes. No Quadro 5, apresenta-se o histórico de busca
do usuário.

Quadro 5 – Contexto informacional da lexia poupança (Grupo C)

Lexia IP* Ano Mês Dia Hora Min. Seg. Local


“investimento” 200.137.xx.yy 2019 7 16 17 47 21 Vitória – ES
“poupança” 200.137.xx.yy 2019 7 16 17 50 14 Vitória – ES

Fonte: Elaborado pela autora, 2021.


Nota: * Por questão de privacidade e anonimato do usuário, optou-
se por substituir os últimos números do endereço IP por letras.

De acordo com os logs, o usuário utilizou a expressão poupança


em sua estratégia de busca. Por não haver candidatas a variantes na
mesma sessão de busca, nem em sessões de busca diferentes, apli-
cou-se a regra do Grupo C de lexias, em que se buscaram colocações
de poupança no corpus formado pelos artigos da revista, de onde foi
possível estabelecer os pares de lexias poupança / caderneta de poupan-
ça e poupança / conta de poupança. A intenção aqui é saber se a lexia
poupança, proposta pelo usuário, é uma redução de base de caderneta
de poupança e conta de poupança ou se representa outro conceito.

sumário
271
O primeiro passo é verificar a garantia literária; se há definições
para esses termos no dicionário especializado, no dicionário do léxico
geral e nos livros-texto de Microeconomia. Veja-se:
POUPANÇA. Em economia, parte da renda nacional ou individual
que não é utilizada em despesas, sendo guardada e aplicada
depois de deduzidos os impostos. [...]. Veja também Consumo;
Investimento. (SANDRONI, 2016, p. 1271, grifo do autor).
1
poupança s.f. 1 ato ou efeito de poupar 2 despesa moderada;
economia. 3 infrm. característica do que não gosta de gastar e
prefere amealhar; sovinice 4 ECON fração da renda nacional ou
individual que não é aplicada em serviços e bens de consumo.
ETIM poupar + ança. PAR. popança (s.f) 2poupança s.f. ECON
red. de caderneta de poupança. SIN/VAR ver sinonímia de pe-
cúlio (HOUAISS, 2009, p. 1534, grifo do autor).

CADERNETA DE POUPANÇA. Contas sobre cujos depósitos


são creditados mensalmente (lei de agosto de 1983) juros e
correção monetária, uma vez observada a condição de que sa-
ques e depósitos sejam feitos em épocas predeterminadas. [...].
Veja também BNH; Desilusão Monetária; Plano Collor; Plano
Real; Plano Verão (SANDRONI, 2016, p. 191, grifo do autor).

caderneta de poupança ECON tipo de depósito bancário em


que a quantia não movimentada por determinado período de
tempo rende juros e recebe correção monetária. ETIM caderno
+ eta \ê\ (HOUAISS, 2009, p. 357, grifo do autor).

Sumariamente, observa-se que poupança, na área de Econo-


mia, apresenta duas definições:

a. “[...] parte da renda nacional ou individual que não é utilizada


em despesas, sendo guardada e aplicada depois de deduzidos
os impostos” (SANDRONI, 2016, p. 1271); “fração da renda
nacional ou individual que não é aplicada em serviços e bens
de consumo” (HOUAISS, 2009, p. 1534); e

b. redução do termo caderneta de poupança (HOUAISS, 2009,


p. 1534).

sumário
272
A definição “b” para poupança, oriunda do Dicionário Houaiss,
dicionário do léxico geral, apresenta dois problemas: primeiro, não há
um texto que a defina e, para “decifrá-la”, o consulente precisa verificar
a definição de caderneta de poupança, a fim de confirmar se realmente
poupança pode ser considerada uma redução desse termo; segundo,
tendo poupança a sua própria definição no Houaiss, para a Terminolo-
gia, ela seria outro termo, outro conceito, não podendo assim ser con-
siderada uma redução de caderneta de poupança, ainda mais estando
etiquetada na mesma área de conhecimento, que é a Economia.

A redução proposta pelo Dicionário Houaiss é plenamente acei-


tável em contextos informais, em que o intercâmbio entre poupança
e caderneta de poupança assume o mesmo sentido; no entanto, em
contextos especializados, esses termos assumem sentidos específicos,
objetivando cada um a sua univocidade, respeitando o contexto comu-
nicativo da Economia, área de conhecimento em que ele está inserido.

Pindyck e Rubinfeld (2013) definem caderneta de poupan-


ça como um ativo isento de risco, que paga juros (geralmente men-
sais) que são reinvestidos na própria conta. Dos três livros-texto de
Microeconomia consultados, esses autores foram os únicos que
usaram o termo em seu texto:
Às vezes, é necessário decidir o grau de risco que estamos
dispostos a assumir. Por exemplo, o que você deveria fazer com
suas economias? Será que deveria investir seu dinheiro em algo
seguro, como uma caderneta de poupança, ou em algo mais
arriscado, porém com maior potencial de rendimentos, como
o mercado de ações? (PINDYCK; RUBINFELD, 2013, p. 151).

Também nos artigos da Revista Análise Econômica foram encon-


tradas três ocorrências para o termo caderneta de poupança:
[...] o financiamento imobiliário depende essencialmente de re-
cursos direcionados da caderneta de poupança e do FGTS,
cujos montantes, em grande parte, são provenientes de bancos

sumário
273
públicos (a Caixa Econômica Federal detém aproximadamente
70% desse mercado); [...] (RAE1616, 1983, grifo nosso)63.

Nas obras consultadas, não se encontrou definição para o termo


conta de poupança, porém se encontraram ocorrências para ele. Dos
três livros-texto consultados, Goolsbee, Levitt e Syverson (2018) foram
os únicos que usaram esse termo em seu texto:
Suponha que, quando você tinha um ano de idade, sua avó
tenha lhe dado uma pequena moeda de prata de um dólar. Seus
pais colocaram essa moeda de prata de um dólar em uma con-
ta de poupança com taxa de juros garantida de 9%, e logo de-
pois esqueceram isso (GOOLSBEE; LEVITT; SYVERSON, 2018,
p. 1393, grifo nosso).

Também no universo de artigos da Revista Análise Econômica


foram encontradas duas ocorrências para conta de poupança:
Uma evolução semelhante ocorreu com o número de clientes
com conta de poupança, que registrou alta de 41,1% na mes-
ma base de comparação, alcançando 82,1 milhões no final de
2007 (58,2 milhões em 2002) (RAE1506, 1983, grifo nosso)64.

Após essa reflexão, para se entender os conceitos dos termos


caderneta de poupança e conta de poupança, pelos contextos apre-
sentados, entende-se que elas são variantes entre si. Sofrem, apenas,
alteração de base caderneta / conta, não alterando o sentido original
do sintagma caso sejam intercambiadas no mesmo contexto de uso.

Retornando a análise do conceito poupança, o segundo passo


agora é verificar a garantia do usuário. Nesse caso, os logs de pesqui-
sa podem auxiliar o indexador a conhecer qual o sentido de poupança

63 RAE1616: ARAUJO, A.; FERRARI FILHO, F.; BUENO, E. Existe uma bolha imobiliária no
Brasil? Uma análise teórica e empírica. Revista Análise Econômica, Porto Alegre, v. 34,
n. 66, p. 149-172, set. 2016. Disponível em: https://seer.ufrgs.br/AnaliseEconomica/article/
view/54872/38539. Acesso em: 20 out. 2019.
64 RAE1506: CAGNIN, R. F.; FREITAS, M. C. P. Tributação das transações financeiras: a ex-
periência brasileira com o IOF e a CPMF. Revista Análise Econômica, Porto Alegre, v. 33,
n. 63, p. 139-169, mar. 2015. Disponível em: https://seer.ufrgs.br/AnaliseEconomica/article/
view/35893/33366. Acesso em: 20 out. 2019

sumário
274
que o usuário está buscando. De acordo com os logs, o usuário utilizou
a expressão poupança em sua estratégia de busca, imediatamente
após a expressão investimento (Quadro 5). Segundo Goolsbee, Levitt
e Syverson (2018), pela definição econômica,
[investimento] implica a aquisição de algum tipo de capital, na
esperança de um retorno futuro. Todavia, [...], poupança e in-
vestimento [...] são, de fato, interligados. Essa ligação resulta do
funcionamento dos mercados de capitais. Essencialmente, os
poupadores proporcionam fundos que os investidores utilizam
para comprar capital. Os investidores compensam os poupado-
res pagando de volta uma parcela dos retornos do investimento.
(GOOLSBEE; LEVITT; SYVERSON, 2018, p. 1393).

Relacionando-se essas duas lexias, tudo leva a crer que o usuá-


rio estaria pensando poupança como um “tipo de” investimento. Nesse
caso, acredita-se que o usuário, assim como o Dicionário Houaiss, não
faz distinção entre a lexia poupança e os sintagmas caderneta de pou-
pança / conta de poupança. O que é compreensível, pois a tendência
do usuário de um sistema de informação é reduzir o termo de busca. No
entanto, observou-se que, nos três livros-texto de Microeconomia con-
sultados, nenhum dos autores utiliza o termo poupança com o sentido
de caderneta de poupança, mas sim com o sentido de parte de uma
renda que não é utilizada. Isso também ocorre com os artigos da revista:
Mais especificamente, a contribuição de Keynes pode ser enten-
dida a partir do debate sobre a relação poupança/investimento e
a problemática do financiamento (RAE1508, 1983, grifo nosso).65

Portanto, o timing dos impostos tem impactos sobre as decisões


de consumo e poupança das famílias. (RAE1520, grifo nosso)66.

65 RAE1508: MISSIO, F. J.; JAYME JR., F. G.; OLIVEIRA, A. M. H. C. Desenvolvimento fi-


nanceiro e crescimento econômico: teoria e evidência empírica para as unidades fede-
rativas do Brasil (1995-2004). Revista Análise Econômica, Porto Alegre, v. 33, n. 63,
p. 191-227, mar. 2015. Disponível em: https://seer.ufrgs.br/AnaliseEconomica/article/
view/39374/33368. Acesso em: 20 out. 2019.
66 RAE1520: MARQUES JÚNIOR, L. S. Equivalência ricardiana e os efeitos da política fiscal
na economia brasileira. Revista Análise Econômica, Porto Alegre, v. 33, n. 64, p. 215-241,
set. 2015. Disponível em: https://seer.ufrgs.br/AnaliseEconomica/article/view/41890/34912.
Acesso em: 20 out. 2019.

sumário
275
À medida que o investimento é realizado, a atividade industrial
é estimulada e geram-se rendas que serão divididas entre
consumo e poupança. (RAE1701, grifo nosso)67.

O terceiro passo da análise corresponde à garantia acadêmica


ou consulta a especialistas. Nas palavras do professor Ivan Colan-
gelo Salomão, especialista consultado, “Caderneta ou conta de pou-
pança não são exatamente a mesma coisa que poupança. As duas
primeiras podem ser lidas como um tipo de investimento, ao passo
que o termo poupança, desacompanhado, significa todo e qualquer
tipo de não gasto, ou seja, todos os recursos que não são empenha-
dos em despesas ou consumos.”

A opinião do especialista vem a corroborar as informações le-


vantadas nos corpora de estudo e de referência. Em suma, nos contex-
tos de uso da área de Economia, poupança não pode ser considerada
uma redução dos termos caderneta de poupança e conta de poupan-
ça, uma vez que representa um conceito diferente desses dois termos,
tendo sua própria definição.

5 CONSIDERAÇÕES FINAIS

A indexação de reduções sintagmáticas em listas de remissi-


vas deve ser um processo extremamente cuidadoso, uma vez que
nem toda redução pode ser considerada uma variante denominativa
do termo preferido. Este, na maioria das vezes, quando reduzido,
adquire outro conceito, como no caso da lexia poupança.

Partindo-se dos logs de pesquisa, conforme o usuário cria estra-


tégias de busca, ele tende a reduzir os termos. A primeira impressão é

67 RAE1701: AIDAR, G. L.; TERRA, F. H. B. A Teoria da Firma pós-keynesiana: uma revisão dos
elementos relevantes. Revista Análise Econômica, Porto Alegre, v. 35, n. 67, p. 21-45, mar.
2017. Disponível em: https://seer.ufrgs.br/AnaliseEconomica/article/view/55545/40798.
Acesso em: 03 out. 2019.

sumário
276
a de que entre duas lexias como poupança / caderneta de poupança
ocorre variação por redução de base, pois se trata de um termo mono-
léxico e de um sintagma, em que há grande possibilidade de ocorrer
uma variação desse tipo. Entretanto, a análise terminológica mostrou
que o termo poupança adquire conceitos diferentes nos contextos es-
pecializado e não especializado, não se confirmando como uma re-
dução sintagmática de caderneta de poupança / conta de poupança
no domínio da Economia. Nesse caso, a consulta ao especialista foi
decisiva para a confirmação dos conceitos.

A lexia cobb douglas apresentou uma análise bastante comple-


xa, uma vez que no decorrer do estudo, surgiu uma gama de possibi-
lidades de sintagmas para a redução proposta pelo usuário. Frente a
tantas possibilidades, somente o contexto informacional dos logs foi
capaz de suprir as ambiguidades trazidas por essa redução, uma vez
que ele está implícito na consulta. É o contexto informacional, ou seja,
as relações semânticas entre as lexias em uma mesma sessão de bus-
ca, que pode vir a determinar o assunto pretendido na recuperação.

No caso, o conjunto de lexias cobb douglas, economia da pro-


dução, elasticidade de produção e CES (sigla em inglês para elasti-
cidade de substituição constante) constitui um grupo de termos em-
pregados em teoria da produção, os quais determinaram a relação
entre cobb douglas e função de produção, em detrimento à relação
cobb douglas e função de utilidade e cobb douglas. Na aplicação da
metodologia, ficou evidente que os logs podem servir como garantia
do usuário em justificativas para o emprego de determinado termo
em detrimento de outro, mas isso requer uma análise diferenciada
para cada termo devido às suas especificidades.

Em síntese, se existe um corpus que dê sentido ao termo pelo


seu contexto de uso, consegue-se verificar se um termo é uma redu-
ção por ele ser um elemento anafórico, ou seja, um elemento de reto-
mada do termo completo ou sintagma. No entanto, se a finalidade for

sumário
277
a inclusão do termo em um catálogo de bibliotecas, recomenda-se
tomar muito cuidado com as reduções, justamente porque nos logs,
como já mencionado, não existe um contexto de uso; as reduções
podem ser variantes ou não, e o uso de termos simples ou reduzidos
pode gerar ruídos para o usuário durante a recuperação da informa-
ção, uma vez que amplia a sua estratégia de busca, recuperando
documentos fora do assunto realmente desejado.

6 REFERÊNCIAS
AMERICAN ECONOMIC ASSOCIATION. JEL Classification System/EconLit
Subject Descriptors. Fev. 01, 2020. Disponível em: https://www.aeaweb.org/
econlit/jelCodes.php?view=jel. Acesso em: 07 jan. 2021.
BARITÉ, M. Garantía literaria y normas para construcción de vocabularios
controlados: aspectos epistemológicos y metodológicos. Scire, v. 15, n. 2,
p. 13-24, jul.-dic. 2009.
BARITÉ, M. La garantía literaria: vigencia y proyección teórico-metodológica.
In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO,
8., 2007, Salvador. Anais... Salvador: Ancib, 2007.
BARITÉ, M. et al. Garantia literária: elementos para uma revisão crítica após um
século. TransInformação, Campinas, v. 22, n. 2, p. 123-138, maio/ago. 2010.
BARITÉ ROQUETA, M. Garantía académica. In: BARITÉ ROQUETA, M. La
garantía literaria como herramienta de revisión de sistemas de organi-
zación del conocimiento: modelo y aplicación. 2011. 382 f. Tesis (Doc-
torado en Información Científica) – Departamento de Biblioteconomía e
Documentación, Facultad de Documentación y Comunicación, Universidad
de Granada, Granada, 2011.
BEGHTOL, C. Semantic validity: concepts of warrant in bibliographic classifi-
cation systems. Library Resources & Technical Services, v. 30, n. 2,
p. 109-125, Apr. – Jun. 1986. Disponível em: https://utexas.instructure.com/
courses/1160641/files/38750130/download?verifier=F7wJRuw5ku8BSNKMe-
fyvIbtPERFBVykHRiVWkDVv&wrap=1. Acesso em: 01 out. 2020.
CABRÉ, M. T. Sumario de principios que configuran la nueva propuesta teórica.
In: CABRÉ, M. T.; FELIU, J. (Ed.). La terminología científico-técnica:

sumário
278
reconocimiento, análisis y extracción de información formal y semántica. Barce-
lona: IULA, UPF: 2001. p. 19-25.
CHAUMIER, J. Indexação: conceito, etapas e instrumentos. Revista Bra-
sileira de Biblioteconomia e Documentação, São Paulo, v. 21, n. 1/2,
p. 63-79, jan./jun. 1988.
FREIXA, J. La variación denominativa en terminología: tipos y causas. In: IS-
QUERDO, A. N.; CORNO, G. O. M. (Org.). As ciências do léxico: lexicologia,
lexicografia, terminologia. Campo Grande: UFMS, 2014. p. 311-329.
FREIXA, J. La variació terminològica: análisi de la variació denominativa
en textos de diferent grau d’especialització de l’àrea de medi ambient. Tese
(Doutorado) – Universidade de Barcelona, Barcelona, 2002.
FREIXA, J. Otra vez sobre las causas de la variación denominativa. Debate
Terminológico, n. 9, p. 38-46, feb. 2013.
GOOLSBEE, A.; LEVITT, S.; SYVERSON, C. Microeconomia. 2. ed. Trad. Tere-
sa Cristina Padilha de Souza. São Paulo: Atlas, 2018.
HOUAISS, A. (Org.). Dicionário Houaiss da língua portuguesa. Rio de
Janeiro: Objetiva, 2009.
KINGHOST. Localizar IP (GeoiP). Disponível em: https://king.host/wiki/geoip.
Acesso em: 12 jan. 2021.
KRIEGER, M. G.; FINATTO, M. J. B. Introdução à terminologia: teoria & práti-
ca. 2. ed. São Paulo: Contexto, 2017.
LAIPELT, R. C. F. A análise de logs como estratégia para a realização da
garantia do usuário. Em Questão, Porto Alegre, v. 21, n. 3, p. 150-170,
set./dez. 2015a. Disponível em: https://seer.ufrgs.br/EmQuestao/article/
view/59806/36047. Acesso em: 27 maio 2020.
LAIPELT, R. C. F. Metodologia para seleção de termos equivalentes e
descritores de tesauros: um estudo no âmbito do Direito do Trabalho e do
Direito Previdenciário. 2015b. 213 f. Tese (Doutorado em Linguística Aplica-
da) – Programa de Pós-Graduação em Linguística Aplicada, Universidade do
Vale do Rio dos Sinos, São Leopoldo, 2015b.
NATIONAL INFORMATION STANDARDS ORGANIZATION. Guidelines for the
construction, format and management of monolingual controlled vocabu-
laries: an American National Standards developed by the National Information
Standards Organization. Bethesda: NISO Press, 2005.
PINDYCK, R. S.; RUBINFELD, D. L. Microeconomia. 8. ed. Trad. Daniel Vieira.
São Paulo: Pearson Education do Brasil, 2013.

sumário
279
REVISTA ANÁLISE ECONÔMICA. Porto Alegre: FCE/UFRGS, 1983. Quadri-
mestral. Disponível em: https://www.ufrgs.br/rae. Acesso em: 19 jul. 2020.
SANDRONI, P. (Org.). Dicionário de Economia do século XXI. 8. ed. Rio de
Janeiro; São Paulo: Record, 2016.
SANTOS, I. C. P. Reconhecimento de termos e de variantes denomina-
tivas a partir dos logs de pesquisa dos usuários da Revista Análise
Econômica: uma análise da variação no âmbito da Microeconomia. 2021.
260 f. Dissertação (Mestrado em Ciência da Informação) – Programa de
Pós-Graduação em Ciência da Informação, Universidade Federal do Rio
Grande do Sul, Porto Alegre, 2021.
SKETCH ENGINE: Language corpus management and query system. Dispo-
nível em: https://www.sketchengine.eu. Acesso em: 23 jan. 2021.
VARIAN, H. R. Microeconomia: uma abordagem moderna. 9. ed. Trad. Regi-
na Célia Simille de Macedo. Rio de Janeiro: Elsevier, 2015.

sumário
280
9
Capítulo 9

As taxonomias no contexto
da arquivologia

Taxonomies in the context of archives

Carine Melo Cogo Bastos

Thiago Henrique Bragato Barros

Carine Melo Cogo Bastos

Thiago Henrique Bragato Barros

As taxonomias
no contexto da arquivologia
Taxonomies
in the context of archives
DOI: 10.31560/pimentacultural/2022.95613.9
Resumo:
A organização do conhecimento encontra-se no bojo da atividade de repre-
sentação e acesso aos documentos arquivísticos. As discussões, neste ca-
pítulo, apresentam a relação da Arquivologia com a Organização do Conhe-
cimento. Este trabalho é sobre a organização do conhecimento, relacionando
conceitos de autores da área e de áreas próximas à Arquivologia. Discorre
igualmente, sobre sistemas de organização do conhecimento na disciplina
Organização do Conhecimento. As abordagens aqui apresentadas buscam
contextualizar as taxonomias na Arquivologia. Por fim, apresenta conceitos
sobre a representação do conhecimento e os sistemas de organização, apro-
fundando a taxonomia como um instrumento de gestão na organização do
conhecimento no contexto da Arquivologia, com os aportes teóricos da Ar-
quivologia e Organização do Conhecimento dos seguintes autores: Araújo
(2014), Barité (2001), Borko (1968), Barros (2016), Barros e Sousa (2019),
Brascher e Café (2008), Campos e Gomes (2007), Dahlberg (1978, 2006),
Guimarães (2005, 2008, 2012), Hjørland (2002, 2008), Navarro (1995), Smit
(2012), Sousa e Araújo (2007, 2017) e Vitoriano (2017).

Palavras-Chave: Arquivologia; organização do conhecimento; taxonomias.

sumário
282
Abstract:
The organization of knowledge is at the heart of the activity of representation
and access to archival documents. The discussions in this chapter present the
relationship of Archivology to the Knowledge Organization. This work is about the
organization of knowledge, relating concepts from authors in the area and from
areas close to archivology. It also discusses knowledge organization systems in
the Knowledge Organization discipline. The approaches presented here seek
to contextualize taxonomies in archivology. Finally, it presents concepts about
knowledge representation and organization systems, deepening taxonomy as a
management tool in the organization of knowledge in the context of archivology.
With theoretical contributions from Archival and Knowledge Organization by the
following authors: Araújo (2014), Barité (2001), Borko (1968), Barros (2016), Bar-
ros e Sousa (2019), Brascher e Café (2008), Campos e Gomes (2007), Dahlberg
(1978, 2006), Guimarães (2005, 2008, 2012), Hjørland (2002, 2008), Navarro
(1995), Smit (2012), Sousa e Araújo (2007, 2017) e Vitoriano (2017).

Keywords: Archival science; knowledge organization; taxonomies.

sumário
283
1 INTRODUÇÃO

Um arquivo institucionalizado passível de organização será


preservado para um determinado grupo ou instituição a fim de que
se garanta a proteção de direitos individuais e da memória coletiva.
Será por meio da organização do conhecimento e do domínio do
contexto de produção documental que o arquivista, dentro do quadro
funcional de um arquivo, conseguirá estruturar conhecimento, mode-
lar sistemas de organização e disponibilizar o acesso ao acervo ar-
quivístico. Os documentos de arquivo permitem que os apagamentos
de um determinado grupo venham a ficar em evidência, fazendo com
que as informações e a memória social possam emergir através da
organização do conhecimento.

Como decorrência tanto do impacto das reflexões da Arquivologia


integrada quanto das tecnologias da informação e dos tipos especiais
de arquivo, algumas mudanças ocorreram: o arquivo passou a ser cada
vez mais caracterizado como um sistema de informação, e o objeto de
estudo da Arquivologia passou a ser a informação arquivística (ARAÚJO,
2014). Outra forma de entender informação é pensá-la “[...] como fenô-
meno social coletivo, estruturas de conhecimento e instituições de me-
mória das comunidades” (ALMEIDA et al., 2007, p. 23). Desta maneira,
[...] estudos recentes vêm mostrando a necessidade de estudar
os arquivos como construções sociais, e para tanto, “a arquivolo-
gia deveria deixar de ser vista como uma ciência que ‘documenta
a verdade dos fatos’” para ser uma ciência voltada para a dis-
cussão dos documentos como resultado e reflexo de uma multi-
plicidade de tensões sociais que se produzem em tempo e lugar
determinados, isto é, que vê os documentos como construtos
produzidos segundo determinadas regras do discurso, determi-
nadas “condições de documentar”. Nessa mesma perspectiva,
cada vez mais vêm sendo desenvolvidos estudos vinculando
as questões arquivísticas às questões de construção de identi-
dade por meio da memória no plano conceitual ou em estudos
relativos a identidades étnicas de determinados grupos sociais

sumário
284
e mesmo vinculando memória e arquivos a partir do uso de do-
cumentos arquivísticos em obras de arte (ARAÚJO, 2014, p. 87).

Organização do Conhecimento, para Bräscher (2008), é como o


processo de modelagem do conhecimento que visa à construção de
representações do conhecimento. Dessa maneira, “[...] a organização
do conhecimento enquanto campo disciplinar, representa uma espe-
cialização para a Ciência da Informação” (BARROS; SOUSA, 2019,
p. 79). Ainda, de acordo com os mesmos autores, a Organização do
Conhecimento não só pode como tem relação com a Arquivologia e
com os arquivos, principalmente quando se pensa nas possibilidades
de abordagens referentes aos sistemas de organização, já que os sis-
temas de gestão, classificação, acesso e controle arquivísticos são
justamente isto: sistemas conceituais baseados em características das
instituições produtoras de documentos (BARROS; SOUSA, 2019).

Cabe à Arquivologia produzir instrumentos de recuperação da


informação relacionados aos acervos arquivísticos custodiados pelas
instituições de arquivo, tanto públicas quanto privadas. Com o advento
das tecnologias de informação, a ênfase nos documentos de arquivo
mudou, recaindo aos sistemas informatizados o gerenciamento de do-
cumentos arquivísticos e se aproximando cada vez mais a Organiza-
ção do Conhecimento da Arquivologia.

Além disso, o usuário tem um importante papel nesse proces-


so de estruturação, organização e recuperação do conhecimento, visto
que é entendido como um dos personagens principais na busca da in-
formação, manifestando seus interesses nas pesquisas e incitando os
arquivistas a estarem cada vez mais conectados com as necessidades
e maneiras de representar o conhecimento, a fim de dar acesso aos
seus usuários, auxiliados pelas abordagens e teorias da Organização
do Conhecimento. Na Arquivologia, as necessidades de acesso à infor-
mação estão vinculadas diretamente às dificuldades dos profissionais,
no decorrer dos anos, de estruturar esquemas de classificação de docu-
mentos e fazer uma recuperação eficaz da informação.

sumário
285
Ao diferenciar informação de conhecimento, dizemos que in-
formação é algo pontual, tem um prazo de vida curto e serve para
o hoje, mas não nos garante nenhuma utilidade daqui a um tempo.
Já o conhecimento tem um propósito e significado diferente de in-
formação; sua utilização é atemporal, agrega valor e se transforma
em benefício real, possuindo o poder de até mesmo mudar a forma
de pensar das pessoas. Dessa maneira, conhecimento “[...] é um
saber acumulado da humanidade, mas também é para satisfazer as
necessidades sociais permanentes que requerem e geram novos co-
nhecimentos” (BARITÉ, 2001, p. 42, tradução nossa).

A Organização do Conhecimento, na Ciência da Informação,


procura adequar as diversas práticas e atividades sociais vinculadas
ao acesso ao conhecimento. Hjørland (2008) define organização do
conhecimento como algo
[...] sobre descrever, representar, arquivar e organizar documen-
tos e representações de documentos, bem como assuntos e con-
ceitos tanto por humanos quanto por programas de computador.
Para esses fins, são desenvolvidos regras e padrões, incluindo
sistemas de classificação, listas de títulos de assuntos, tesauros
e outras formas de metadados (HJØRLAND, 2008, p. 86).

Já Dahlberg (2006) conceitua organização do conhecimento como


[...] a ciência que estrutura e organiza sistematicamente unida-
des do conhecimento (conceitos) segundo seus elementos de
conhecimento inerentes (características) e a aplicação de con-
ceitos e classes de conceitos ordenados dessa forma para atri-
buição de conteúdos de referentes (objetos/assuntos) de todos
os tipos (DAHLBERG, 2006, p. 12, tradução nossa).

Esteban Navarro e Garcia Marco (1995), por sua vez, dizem que
a Organização do Conhecimento se apresenta como uma plataforma de
integração das ciências documentais, aproximando-se da Arquivologia,
quando esta busca estudar esquemas de classificação para represen-
tação do conhecimento. Os instrumentos elaborados nos arquivos, os

sumário
286
catálogos, guias e inventários, possuem o mesmo objetivo que a própria
organização do conhecimento, no caso, facilitar o acesso, a recupera-
ção da informação e a gestão do conhecimento para os usuários.

2 TAXONOMIAS NA ARQUIVOLOGIA

O conhecimento é registrado sempre em documentos, indepen-


dentemente do seu formato ou suporte; é um conjunto organizado de
informações disponíveis, admitindo os mais diversos usos, de maneira
indiscriminada (BARITÉ, 2001). Os documentos de arquivo são preser-
vados, em um primeiro momento, por razões administrativas devido
ao seu valor legal ou probatório, bem como por seu valor histórico.
Dessa forma, os arquivistas, ao elaborar instrumentos de busca e es-
truturar sistemas de representação das informações dos documentos
e suas temáticas, atuam como intermediários e organizadores do co-
nhecimento. O armazenamento e a organização da informação estão
diretamente relacionados ao objetivo de provar fatos, contar algo ou
difundir o conhecimento para gerar novos conhecimentos. Assim, “[...]
este conhecimento, se registrado, adquire um novo estatuto de infor-
mação que poderá ser socializado e potencialmente incorporado por
algum indivíduo para gerar novo conhecimento” (SMIT, 2012, p. 95).

Guimarães (2008) diz que, no âmbito da Ciência da Informação,


a organização e a representação do conhecimento apresentam natu-
reza mediadora, configurando-se em um conjunto de processos que
estabelecem a intermediação entre um conhecimento que, uma vez pro-
duzido, foi materializado e socializado, de tal forma que possa servir de
base para a geração de um novo conhecimento. Por sua vez, esse novo
conhecimento, uma vez materializado e socializado, pode igualmente
ser objeto de nova organização e representação, caracterizando aquilo
que se pode denominar como fluxo helicoidal da informação.

sumário
287
As classificações em arquivo não são uniformes, dado que estão
automática e diretamente relacionadas à organização produtora des-
ses documentos. Dessa maneira, os arquivistas utilizam legislações,
estatutos e organogramas do órgão que os auxiliam nessa atividade.

De acordo com Barros e Souza (2019), a base para a construção


de sistemas de organização do conhecimento consiste nas estruturas
organizacionais, visto que estas oferecerem subsídios para a modela-
gem dos sistemas de organização do conhecimento. Igualmente, con-
tribuem para a construção de melhores esquemas de classificação no
desenvolvimento do fazer arquivístico, produzindo melhores resultados
na representação, disseminação e acesso as informações por seus
usuários finais. Os arquivistas, nesse contexto, atuam diretamente com
a atividade de representação em função da interpretação que esse
profissional faz do acervo arquivístico de uma instituição.

Faz-se necessário também entender conceito, o qual é funda-


mental para a construção, organização e representação do conheci-
mento. O conceito é uma “[...] unidade de conhecimento que surge pela
síntese dos predicados necessários relacionados com determinado ob-
jeto e que, por meio de sinais linguísticos, podem ser comunicados”
(DAHLBERG, 1978, p. 12, tradução nossa). Dahlberg também define o
termo como “[...] a forma verbal de um conceito, o componente que con-
venientemente, sintetiza e representa um conceito com o propósito de
designá-lo e comunicá-lo” (DAHLBERG, 1978, p. 76, tradução nossa).

Na Arquivologia, é a partir dos documentos de arquivo que se po-


dem elaborar representações sobre o que são abordados nestes, como
uma forma de garantir a recuperação da informação, pois é necessá-
rio tornar mais eficiente o armazenamento e o acesso às informações.
A classificação de documentos baseada no princípio de proveniência
e auxiliada pelo contexto de produção documental seria a base para
elaboração de esquemas de representação do conhecimento. Assim,

sumário
288
[...] a representação do conhecimento é feita por meio de di-
ferentes tipos de Sistemas de Organização do Conhecimento
(SOC), que são sistemas conceituais que representam deter-
minado domínio por meio da sistematização dos conceitos
e das relações semânticas que se estabelecem entre eles
(BRÄSCHER; CAFÉ, 2008, p. 8).

Nesse sentido, tais sistemas são instrumentos ou ferramentas


que auxiliarão os usuários a encontrarem a informação de manei-
ra mais rápida, eficaz e segura, pois foram elaborados levando em
consideração o contexto de geração da informação registrada em
documento de arquivo.

A grande maioria das instituições busca soluções que resolvam


seus problemas de desorganização de arquivos. Com o enorme volu-
me documental acumulado e a falta de acessibilidade aos documen-
tos arquivísticos, recebem propostas de sistemas informatizados que
prometem soluções milagrosas em curto espaço de tempo, o que, em
grande parte, negligencia a estrutura que produziu, utilizou e acumulou
o acervo. Este é um dos problemas que os Sistemas de Organização
do Conhecimento (SOCs) podem auxiliar a sanar.

De acordo com Hodge (2000, apud BRÄSCHER e CAFÉ, 2008,


p.8) onde este ressalta que os SOCs são “[...] o coração de toda
biblioteca, museu e arquivo”, uma vez que são “mecanismos de or-
ganização da informação”. Na descrição de conteúdo, os SOCs cum-
prem a função de padronizar a representação da informação, no que
concerne à identificação do assunto do documento. Relacionado à
recuperação da informação, Vickery define os sistemas de organiza-
ção do conhecimento como “[...] instrumentos complementares que
ajudam o usuário a encontrar seu caminho no texto” Vickery (2008,
apud BRÄSCHER e CAFÉ, 2008, p. 8).

Na Biologia, a taxonomia é um sistema de classificação desen-


volvido por Lineu (naturalista sueco no século XVII) para agrupar e ca-
tegorizar as espécies de seres vivos, em que se propôs uma hierarquia

sumário
289
de semelhanças entre eles, dividindo-os em cinco grupos: reino, clas-
se, ordem, gênero e espécie. Aquino et al. (2009) acrescentam que as
taxonomias surgiram no campo da Biologia e, por lá, são utilizadas há
muito tempo, tendo se tornado alvo de estudos na Ciência da Infor-
mação, em que o seu aparecimento e uso estão relacionados com as
formas automatizadas de criação da informação.

A taxonomia pode ser definida como “[...] um vocabulário con-


trolado de uma determinada área do conhecimento e, acima de tudo,
um instrumento ou elemento de estrutura que permite alocar, recupe-
rar e comunicar informações dentro de um sistema sob uma premis-
sa lógica” (TERRA et al., 2005, p. 1). Assim, na Ciência da Informa-
ção, a taxonomia é um sistema de organização do conhecimento que
classifica e facilita o acesso às informações, no qual se organizam as
informações por categorias, normatizando as relações hierárquicas
existentes entre elas. Nesse contexto, a taxonomia é uma solução
que pode ser escolhida para atender à demanda de maneira sucinta
ao classificar as informações contidas nos documentos de arquivo,
auxiliando a representar e estabelecer os conceitos por meio de um
sistema de organização do conhecimento.

A classificação hierárquica é muito utilizada em esquemas de


classificação na Arquivologia. As taxonomias auxiliam os usuários a
compreenderem como o conhecimento pode ser categorizado e,
quando representam conceitos, oferecer um mapa que serve como
guia nos processos de conhecimento. Sendo assim,
A taxonomia deverá ser usada como instrumento complementar
à atividade de classificação de documentos, devendo ser pauta-
da pelos seguintes passos: 1. Classificar o documento conforme
o plano de classificação de documentos de arquivo; 2. Identifi-
car no primeiro ou segundo nível de termos da taxonomia a área
utilizada na classificação dos documentos; 3. Utilizar os termos
dos diversos níveis da taxonomia como descritores (termos de
indexação) em complemento à classificação dos documentos; e

sumário
290
4. Verificar a coerência da classificação combinada com a indexa-
ção nas dimensões funcionais e temáticas, respectivamente com
os documentos (SOUSA; ARAÚJO JÚNIOR, 2017, p. 53).

A taxonomia é um dos sistemas de organização do conhecimen-


to mais simples, menos estruturado e pode ser aplicado em qualquer
universo e contexto organizacional, além de ser uma ferramenta de
gestão que auxilia a realizar a organização em si, com um olhar voltado
ao usuário e a quem realmente utiliza e precisa da informação. Tam-
bém pode-se dizer que as taxonomias possuem um caráter dinâmico
e apresentam necessidades de atualização, manutenção frequente e
constante validação de conceitos que já foram preestabelecidos junta-
mente aos usuários, os quais são fundamentais, dado que auxiliam na
classificação das informações e na modelagem dos sistemas de orga-
nização do conhecimento em conjunto aos arquivistas. Dessa maneira,
[...] as taxonomias são estruturas classificatórias para organizar
as informações de uma determinada instituição num dado con-
texto. Nesse sentido, são diferentes, tendo em vista que refletem
o tipo de organização e informação da instituição que represen-
tam (AQUINO et al., 2009, p. 206).

Sendo assim, ao construir taxonomias, os arquivistas utilizarão


princípios classificatórios para elaboração desses instrumentos, em
que é necessário estabelecer a categorização das classes, “[...] a ca-
tegorização é um processo que requer pensar o domínio de forma
dedutiva, ou seja, determinar as classes de maior abrangência dentro
da temática escolhida” (CAMPOS; GOMES, 2007, p. 5).

3 CONSIDERAÇÕES FINAIS

Estudos que explorem as taxonomias contribuirão para traçar me-


lhores instrumentos de busca na Arquivologia, assim como auxiliar na
representação do conhecimento e na construção de melhores planos

sumário
291
de classificação de documentos, com vistas à promoção da qualidade
da pesquisa por informações. Não é uma atividade fácil, mas é neces-
sário construir instrumentos que representem, cada vez melhor, a prática
arquivística e as taxonomias desenvolvidas para domínios específicos.
As taxonomias podem servir como guia e permitir agregação de novos
conceitos, pois, estas têm como uma de suas caraterísticas “[...] ser
um instrumento de organização intelectual, atuando como um mapa
conceitual dos tópicos explorados em um sistema de recuperação da
informação” (CAMPOS; GOMES, 2007, p. 4).

Nesse sentido, “[...] as taxonomias representam os propó-


sitos de organização intelectual de um dado contexto” (CAMPOS;
GOMES, 2007, p. 2). Assim, é possível fazer a relação destas com a
análise de domínio, pois é através da contextualização do domínio
realizado na análise que se pode chegar à organização intelectual
representada nas taxonomias.

No âmbito da Ciência da Informação, “[...] as taxonomias po-


dem ser comparadas a estruturas classificatórias, como as Tabelas de
Classificação, que têm como objetivo reunir documentos de forma lógi-
ca e classificada” (CAMPOS; GOMES, 2007, p. 2). Nesse sentido, têm
ampla relação com a Arquivologia, pois também servem como instru-
mentos de organização e recuperação de informação. Outra questão
em que as taxonomias podem auxiliar os arquivistas refere-se a como
“ensinar” os usuários através das estruturas de conceito e hierarquia,
facilitando a aplicação de práticas de gestão documental e entendi-
mento por parte de pesquisadores e usuários.

Dessa maneira, é importante acrescentar que, para a Organiza-


ção do Conhecimento, é necessário, cada vez mais, promover novas
formas para representar e organizar conhecimento de grupos específi-
cos que se encontram em desvantagem em estruturas classificatórias,
principalmente em acervos arquivísticos. Por fim, a relação Arquivolo-
gia com a Organização do Conhecimento trará melhores respostas às

sumário
292
demandas institucionais e permitirá que os arquivistas possam auxiliar,
ainda mais, na representação do conhecimento das mais diversas co-
munidades, grupos ou instituições.

4 REFERÊNCIAS
ALMEIDA, Daniela Pereira dos Reis et al. Paradigmas Contemporâneos da
Ciência da Informação: a recuperação da informação como ponto focal.
Revista Eletrônica Informação e Cognição, Marília, v. 6, n. 1, p.16-27,
2007. Disponível em: https://brapci.inf.br/_repositorio/2010/03/pdf_fc-
4f01292e_0008415.pdf. Acesso em: 22 set. 2020.
AQUINO, Idalécio. J.; CARLAN, Eliana.; BRÄSCHER, Marisa. B. Princípios
classificatórios para a construção de taxonomias. Ponto de Acesso, Salva-
dor, v. 3, n. 3, p. 196-215, dez. 2009. Disponível em: https://periodicos.ufba.
br/index.php/revistaici/article/view/3626/2744. Acesso em: 29 mar. 2021.
ARAÚJO, Carlos. Alberto. Ávila. Arquivologia, Biblioteconomia, Museologia e
Ciência da Informação: o diálogo possível. Brasília: Briquet de Lemos, 2014.
BARITÉ, Mario. Organización del conocimiento: un nuevo marco teórico-con-
ceptual en Bibliotecología y Documentación. In: CARRARA, Kester (org.). Edu-
cação, universidade e pesquisa. Marília: Unesp: FAPESP, 2001. p. 35-60.
BARROS, Thiago. Henrique. Bragato; SOUSA, Renato. Tarcisio. Barbosa de.
Organização do conhecimento e Arquivologia: abordagens metodológicas.
Informação & informação, Londrina, v. 24, n. 2, p. 76-92, maio/ago. 2019.
Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/
view/38290. Acesso em: 18 set. 2020.
BORKO, Harold. Information Science: What is it? American Documentation,
Washington, D.C., v.19, n.1, p. 3-5, Jan. 1968. Disponível em: https://onlineli-
brary.wiley.com/doi/abs/10.1002/asi.5090190103. Acesso em: 20 jan. 2020.
BRÄSCHER, Marisa. B. B.; CAFÉ, Lígia. M. A. Organização da Informação ou
Organização do Conhecimento? In: Encontro Nacional de Pesquisa em Ciên-
cia da Informação, 9., 2008, São Paulo. Anais [...]. São Paulo: ANCIB, 2008.
CAMPOS, Maria. Luiza. Almeida.; GOMES, Hagar. Espanha. Taxonomia e clas-
sificação: A categorização como princípio. In: Encontro Nacional de Pesquisa
em Ciência da Informação, VIII, 2007, Salvador. Anais. Bahia. Brasil, 2007.

sumário
293
DAHLBERG, Ingetraut. Teoria do conceito. Ciência da Informação, Brasília,
v. 7, n. 2, p. 101-107, 1978. Disponível em: http://revista.ibict.br/ciinf/article/
view/115/115. Acesso em: 18 fev. 2020.
DAHLBERG, Ingetraut. Knowledge organization: a new science? Knowledge
Organization, Baden, v. 33, n. 1, p. 11-19, 2006. Disponível em: https://www.
ergonverlag.de/isko_ko/downloads/ko3320061c.pdf. Acesso em: 20 jan. 2020.
ESTEBAN NAVARRO, Miguel Angel; GARCÍA MARCO, Francisco Javier. Las
primeras jornadas sobre organización del conocimiento: organización del
conocimiento e información científica. Scire: representación y organización
del conocimiento, Zaragoza, v. 1, n. 1, p. 149-157, ene./jun. 1995. Disponível
em: http://www.ibersid.eu/ojs/index.php/scire/article/download/1038/1020/0.
Acesso em: 20 jan. 2020
GUIMARÃES, José. Augusto. Chaves. A dimensão teórica do tratamento
temático da informação e suas interlocuções com o universo científico da
International Society for Knowledge Organization (ISKO). Revista Ibero-Ame-
ricana de Ciência da Informação, Brasília, v. 1, n. 1, 2008. Disponível em:
https://doi.org/10.26512/rici.v1.n1.2008.940. Acesso em: 20 jan. 2020.
HJØRLAND, Birger. Core classification theory: a reply to Szostak. Journal of
Documentation, United Kingdom, v. 64, n. 3, p. 333-342, 2008. Disponível
em: https://doi.org/10.1108/00220410810867560. Acesso em: 30 set. 2020.
HJØRLAND, Birger. Domain analysis in information science: Eleven approa-
ches – traditional as well as innovative. Journal of Documentation, United
Kingdom, v. 58, n. 4, p. 422–462, ago. 2002. Disponível em: https://doi.
org/10.1108/00220410210431136. Acesso em: 21 out. 2020.
HJØRLAND, Birger. What is Knowledge Organization (KO)? Knowledge
Organization, Baden, v. 35, n. 2/3, p. 86-101, 2008. Disponível em: https://
repository.arizona.edu/handle/10150/106183. Acesso em: 20 jan. 2020.
SMIT, Johanna. Wilhelmina. Smit. A informação na Ciência da Informação. In-
CID: Revista de Ciência da Informação e Documentação, Ribeirão Preto, v. 3, n.
2, p. 84-101, 2012. DOI: 10.11606/issn.2178-2075.v3i2p84-101. Disponível em:
https://www.revistas.usp.br/incid/article/view/48655. Acesso em: 18 maio. 2021.
SOUSA, Renato. Tarcísio. Barbosa de.; ARAÚJO JÚNIOR, Rogério. Henri-
que de. A indexação e criação de taxonomias para documentos de arquivo:
proposta para a expansão do acesso e integração das fontes de informação.
Brazilian Journal of Information Science: Research Trends, Marilia, v. 11, n.
4, p. 47-56, 2017. Disponível em: http://revistas.marilia.unesp.br/index.php/
bjis/article/view/7508/4788. Acesso em: 03 jan. 2020.

sumário
294
TERRA, José Cláudio C. et al. Taxonomia: elemento fundamental para a ges-
tão do conhecimento. Slide Share, S.l., 21 ago. 2005. Disponível em: https://
pt.slideshare.net/jcterra/taxonomia-elemento-fundamental-para-a-gestao-do-
-conhecimento. Acesso em: 04 set. 2021.
VITORIANO, Marcia Cristina de Carvalho Pazin. Uma aproximação entre Arqui-
vologia e Ciência da Informação: o uso dos conceitos de informação orgânica
e informação arquivística. Brazilian Journal of Information Science: Research
Trends, Marilia, v. 11, n. 4, p. 57-66, 2017. Disponível em: http://www2.marilia.
unesp.br/revistas/index.php/bjis/issue/view/447. Acesso em: 12 fev. 2020.

sumário
295
10
Capítulo 10

Reflexão sobre folksonomia


e engajamento político

Reflection on folksonomy and


political engagement

Talita Morgana Arruda Tavares

Fabio Assis Pinho

Talita Morgana Arruda Tavares

Fabio Assis Pinho

Reflexão sobre folksonomia


e engajamento político
Reflection on folksonomy
and political engagement
DOI: 10.31560/pimentacultural/2022.95613.10
Resumo:
Este capítulo sobre folksonomia e engajamento político materializa uma pes-
quisa cujo objetivo é o de analisar o engajamento dos usuários do Twitter em
temas de viés político com o uso de duas hashtags – #CPIdaCovid e #29M
– sob a ótica da folksonomia. A pesquisa se justifica pelo fato de que o uso
dessas marcações pontua acontecimentos históricos a partir da visão pessoal
dos usuários da mídia e é um extrato social que utiliza a linguagem natural
para marcar acontecimentos. Trata-se de uma pesquisa qualitativa, explorató-
ria e de observação não participante, utilizando a Análise de Conteúdo (AC),
com as categorias temáticas notícia, opinião, repercussão, meme ou imagem
viral e outros, e as categorias a favor, neutra e contra. O estudo conclui que a
folksonomia pode ser compreendida e considerada como instrumento para o
engajamento político de usuários no meio digital, em especial no Twitter, pois
é possível observar que a folksonomia pode ser considerada uma ferramen-
ta eficaz de engajamento, já que é em torno das publicações, utilizando de
marcações em forma de indexação livre das informações, que os usuários se
encontram, debatem e formam opinião ou se aproximam em torno de lutas e
manifestações com as quais convergem ou divergem.

Palavras-Chave: Folksonomia; política; Twitter; engajamento.

sumário
297
Abstract:
This chapter on folksonomy and political engagement materializes research who-
se objective was to analyze the engagement of Twitter users in themes of political
bias using two hashtags – #CPIdaCovid and #29M – from the perspective of
folksonomy. The research is justified by the fact that the use of these markings
punctuates historical events from the personal view of media users and is a social
extract that uses natural language to mark events. It was a qualitative, explora-
tory, and non-participant observation research, using Content Analysis (CA), with
the thematic categories news, opinion, repercussion, meme or viral image and
others and the categories in favor, neutral, and against. The study concluded that
folksonomy can be understood and considered as an instrument for the political
engagement of users in the digital environment, especially on Twitter, as it was
observed that folksonomy can be considered an effective engagement tool, as it
revolves around publications using tags in the form of free indexing of information
that users meet, debate and form opinions or comes together around struggles
and manifestations with which they converge or diverge.

Keywords: Folksonomy; policy; Twitter; engagement.

sumário
298
1 INTRODUÇÃO

Estar conectado às redes sociais, hoje, é algo tão natural e di-


fundido que não há mais dúvidas em relação à importância de se pes-
quisar os impactos do digital nas áreas de conhecimento. Na Ciência
da Informação (CI) – que investiga a informação e seus usos – é ainda
mais inegável a relevância de pesquisas que abarquem esse campo,
pois, sendo ela uma área compreendida pela interdisciplinaridade, que
antes tratava sobre o livro e a biblioteca, expandiu sua atuação para
teorias de classificação e indexação, além da recuperação de dados e
estudos descritivos (LE COADIC, 1994, p. 23).

Com a inserção do digital na vida cotidiana e a difusão do uso das


mídias sociais, houve grandes transformações, também, na comunicação
interpessoal, que passou a ser mediada por aparatos eletrônicos. De acor-
do com Castells (2005, p. 24), o aparato tecnológico nas comunicações
[...] criou um novo sistema de redes de comunicação global
e horizontal que, pela primeira vez na história, permite que as
pessoas se comuniquem umas com as outras sem utilizar os
canais criados pelas instituições da sociedade para a comuni-
cação socializante (CASTELLS, 2005, p. 24).

Essa forma de comunicação viabiliza, então, que as pessoas


debatam e se organizem em torno das mais diversas pautas, sem in-
termediários, aumentando o engajamento em temas antes restritos
ao off-line ou a públicos específicos. Com as manifestações políticas,
o cenário não é diferente. É nas redes sociais, locais marcados pela
efervescência de debates, que há o encontro de discursos similares e
opostos, em que, quem tem acesso à internet, expõe suas opiniões.

É nessa perspectiva, com a proposição de compreender a


participação dos usuários das redes em pautas políticas, que analisamos
o uso de duas hashtags no Twitter sob a ótica da folksonomia, a qual é
compreendida segundo Assis e Moura (2013, p. 87), como “modalidade

sumário
299
de organização da informação em ambientes digitais”. Dessa forma, a
pergunta de pesquisa que norteou nossa análise foi: como se dá o en-
gajamento dos usuários do Twitter em temas de viés político?

Para responder a essa pergunta, o objetivo geral dessa pesqui-


sa é o de analisar o engajamento dos usuários do Twitter em temas
de viés político com o uso de duas hashtags – #CPIdaCovid e #29M
– sob a ótica da folksonomia. A justificativa que aqui se postula é pelo
fato de que o uso dessas marcações serve como importante objeto
de estudo, já que pontua acontecimentos históricos, a partir da visão
pessoal de cada usuário da rede, e é um extrato social que utiliza a
linguagem natural para marcar acontecimentos.

A reflexão que trazemos nesse capítulo tem abordagem qualita-


tiva, ancorada na Análise de Conteúdo (AC) de assuntos políticos ma-
terializados por hashtags no Twitter. Para isso, #CPIdaCovid e #29M
foram as tags determinadas. A #CPIdaCovid se refere aos trabalhos
do Senado Federal em compreender as responsabilidades do governo
federal na condução da pandemia e a #29M faz referência aos protes-
tos que aconteceram em 29 de maio de 2021 pelo Brasil contra o pre-
sidente da República Federativa do Brasil, pela continuidade do auxílio
emergencial durante a pandemia do coronavírus, pela ampliação da
vacinação entre outras pautas.

Consequentemente, foi definido o período em que as hashtags


seriam analisadas. Para a #CPIdaCovid, foi escolhido o dia 13 de maio
de 2021, quando o CEO da Pfizer, Sr. Carlos Murillo, prestou depoimen-
to no Senado Federal e, de acordo com matéria de Gois (2021, p. 1)
,no portal O Globo, foi “o dia com mais manifestações, a exceção de
ontem (19 de maio), foi 13 de maio, data do testemunho do represen-
tante da Pfizer, a farmacêutica”. De acordo com a consultoria de dados
Bites68, foram realizados 46.275 usos da hashtag.
68 A Bites (https://bites.com.br/) é uma consultoria que captura dados abertos e retorna para
o cliente em forma de relatório. A pesquisa dessa hashtag foi enviada de forma gratuita
para a realização dessa reflexão.

sumário
300
Foi a partir desse cenário que delimitamos o corpus de aná-
lise. Foram utilizados tweets que obtiveram pelo menos um retweet,
descartando aqueles que eram respostas a publicações de outros
usuários, visando alcançar aqueles que obtiveram uma interação
mais relevante na rede social. Essa busca foi realizada na própria
plataforma do Twitter, no campo “busca avançada” e “mais recentes”
e retornou 1.479 publicações.

Para a hashtag do ato nas ruas, a #29M, foi analisado o dia 29


de maio de 2021, dia da manifestação. Da mesma forma que a #CPI-
daCovid, foi utilizada a busca avançada da plataforma considerando,
também, publicações com pelo menos um retweet, gerando 1.476 re-
sultados. É necessário pontuar que as publicações aqui utilizadas foram
possíveis de serem recuperadas pois os perfis dos usuários estão de
modo público no Twitter, permitindo ser encontrados nas buscas e ret-
weetados por outros usuários da rede (com identidades preservadas).

Para a análise de conteúdo, as categorias definidas para ambas


as hashtags foram as seguintes: notícia, opinião, repercussão, meme
ou imagem viral e outros (sem enquadramento nas categorias anterio-
res). Além disso, outras três categorias foram utilizadas na pesquisa:
publicações marcadas como “A favor”, “Neutra” e “Contra”. No caso da
#CPIdaCovid, as marcadas como “A favor” se referem as mensagens
em apoio à CPI e em oposição ao governo federal, “Neutra” são aquelas
que não falam diretamente sobre a CPI ou apenas repercutem algo sem
juízo de valor especificamente sobre a hashtag ou a CPI e “Contra” são
os tweets contrários a realização da CPI e a favor do governo federal.

No caso da #29M, “A favor” são as mensagens em apoio às


manifestações e contra o governo federal, “Neutra” são as que não
falam diretamente sobre as manifestações ou a publicação não possui
juízo de valor sobre elas e “Contra” são as publicações que utilizaram
a tag, mas são contrárias ao movimento.

sumário
301
2 ENGAJAMENTO POLÍTICO,
FOLKSONOMIA E MÍDIAS SOCIAIS

Maar (1982, p. 399) diz que a política anda lado a lado com a
história, “com o dinamismo de uma realidade em constante transfor-
mação que continuamente se revela insuficiente e insatisfatória e que
não é fruto do acaso, mas resulta da atividade dos próprios homens
vivendo em sociedade” (MAAR, 1982, p. 36). Dessa maneira, seria ne-
cessária a “organização e mobilização em torno de interesses sociais,
que desta forma passam a se desenvolver com objetivos políticos [...]
para transformar em direito as reivindicações” (MAAR, 1982, p. 456).

Compreende-se, então, que o agir cidadão conversa com a ne-


cessidade do engajamento político por parte da população. Rosenfield
(2017, p. 7) reflete sobre essa questão pontuando que “o conceito de
‘política’ se refere efetivamente ao que é coletivo, ao que é comum a
todos”. Para o autor, “o indivíduo é antes de tudo cidadão, ou seja, mem-
bro de uma cidade”, sendo assim, “a comunidade política que é legada
às próximas gerações provém da responsabilidade que cada um assu-
me, hoje, em relação aos assuntos coletivos” (ROSENFIELD, 2017, p. 6).

Em locais que possuem a Democracia como regime político –


sendo, em resumo, o exercício do poder político por parte do povo,
com a participação do povo na tomada de decisões –, a perspectiva
de o indivíduo buscar agir em comunidade se torna mais concreta e
necessária. A democracia, para Rosenfield (2017, p. 25),
[...] inaugura um novo sentido do político, ao determinar-se por
um espaço público de discussão, de luta, de negociação e de
diálogo. A reunião de todos aqueles que constituem a socieda-
de numa forma de organização política aberta ao seu aperfei-
çoamento dá aos cidadãos um novo sentido da comunidade,
não excluindo ninguém, por princípio, dos assuntos públicos
(ROSENFIELD, 2017, p. 25).

sumário
302
Nesse contexto, nossa reflexão traz o engajamento político sob
a ótica da folksonomia como modalidade de organização do conhe-
cimento nos ambientes digitais. Ela representa o uso da linguagem
natural promovida pelos próprios usuários das redes de forma inde-
pendente ou colaborativa. O termo é uma junção de povo (do inglês
folk) e taxonomia (uma forma de classificação) e foi cunhado por Wal
(2007, não paginado, tradução nossa):
Folksonomia é o resultado da marcação livre e pessoal de infor-
mações e objetos (qualquer coisa com um URL) para a própria
recuperação. A marcação é feita em um ambiente social (geral-
mente compartilhado e aberto a outras pessoas). A folksonomia
é criada a partir do ato de marcação pela pessoa que consome
as informações (WAL, 2007, não paginado, tradução nossa).

Nesse processo, o próprio usuário de determinada rede “rotu-


la, nomeia, designa suas palavras, dados e arquivos de forma livre,
não existindo nenhuma metodologia e/ou etapas a serem realizadas
para a organização e a recuperação das informações de seu interesse”
(MOREIRA; ROMÃO, 2010, p. 4). Como observa O’Reilly (2005, p. 3,
tradução nossa), a folksonomia seria uma categorização colaborativa
“usando palavras-chave livremente escolhidas, geralmente chamadas
de tags. A marcação permite o tipo de associações múltiplas e so-
brepostas que o próprio cérebro usa, em vez de categorias rígidas”
(O’REILLY, 2005, p. 3, tradução nossa).

Para Assis e Moura (2013, p. 87), a folksonomia é “uma inovação


que explora o potencial das redes sociais na organização e no com-
partilhamento dos recursos informacionais”, dessa forma, esse tipo de
organização da informação agregaria as “manifestações da linguagem
contextualizada e, por vezes, caótica de sujeitos em colaboração”. Para
sintetizar o conceito de folksonomia, o presente capítulo se utiliza da
compreensão produzida por Corrêa e Santos (2018, p. 29), como sendo:
[...] o resultado do processo de etiquetagem livre (atribuição de
etiquetas, palavras-chave) realizada pelos usuários mediante o

sumário
303
emprego de termos provenientes de linguagem natural – dis-
pensando o uso de vocabulários controlados – em ambientes
digitais colaborativos visando indexar recursos informacionais
compartilhados de qualquer formato (textos, imagens, áudio,
vídeo etc.) para fins de sua representação e recuperação (COR-
RÊA; SANTOS, 2018, p. 29).

A partir disso, entende-se, então, que cada usuário, a partir da


visão de mundo que possui, organiza – ou categoriza, classifica – a in-
formação de modo natural, próprio e subjetivo, de forma democrática.
O que acontece a partir disso é a possibilidade de conexão de diversos
indivíduos que começam a interagir a partir de qualquer local do globo
em torno de um determinado tema ou hashtag.

Ao termo hashtag, somente é permitido seu surgimento após


o aparecimento da Web 2.0, que seria considerada a segunda ge-
ração da internet. Tim O’Reilly (2005, p. 3) definiu a Web 2.0 como
sendo a “web enquanto plataforma”. De acordo com Dias, Castro e
Silva (2015, p. 6), esse espaço se configura como um “ambiente que
diz respeito ao aspecto evolutivo e gradativo da fase preliminar na
perspectiva da participação coletiva, na produção de informação, em
redes de relacionamento”. As tecnologias que estão presentes nessa
fase da Web são intuitivas e interativas e conferem maior independên-
cia aos usuários, interesse pela navegação e descoberta de conteú-
dos, favorecendo o surgimento de novas formas de produção e uso
de informação (DIAS; CASTRO; SILVA, 2015). É a partir do estabele-
cimento da Web 2.0 que é possível o surgimento das redes sociais
como são conhecidas hoje e, consequentemente, das hashtags. Para
criar uma, é necessário colocar o símbolo “#” antes da palavra ou
expressão que se queira destacar, formando uma tag (ou etiqueta).

A rede social aqui utilizada para a reflexão neste capítulo foi o


Twitter, Inc., que pode acessada por meio do endereço: http://www.
twitter.com. A mídia, que surgiu no ano de 2006, é considerada um
serviço de microblogging, no qual os usuários escrevem pequenos

sumário
304
textos que podem conter até 280 caracteres. O site sugere ao usuário
começar a escrever a partir da pergunta “O que está acontecendo?”.
Cada pessoa pode criar um perfil na rede, seguir outros perfis de
usuários e ser seguido por eles. Pode-se publicar de maneira privada
ou pública e, caso queira direcionar a mensagem a uma conta em
específico, deve-se acrescentar o símbolo “@” antes do nome do
usuário destinatário da publicação.

Nessa ambiência, o engajamento político por parte dos cida-


dãos, o qual é permitido nas democracias, nas sociedades contempo-
râneas, tem se expressado não só nas ruas, por meio dos protestos,
mas também nos meios digitais, na internet. As inovações tecnológi-
cas abrem novas possibilidades para o diálogo entre os atores sociais
para que eles se integrem na prática democrática e se tornam uma
nova via para promover o ativismo social.

Ribeiro, Borba e Hansen (2016, p. 503-504) refletem que, em


uma perspectiva otimista, a internet cria uma nova estrutura de comu-
nicação e, com isso, surgem oportunidades diferentes de participação
política além da convencional que ocorre no off-line, tendo o poder de
dirimir barreiras da participação popular, ampliando o debate político.
“Nesse sentindo, a internet é vista como parte do espaço público e,
desse modo, a ágora poderia ser reproduzida virtualmente, trazendo
a possibilidade de participação ao cidadão comum, inserindo-o nos
processos de deliberação.”

Importante ressaltar, então, os números de acesso à internet no


Brasil e no mundo para se ter uma noção do alcance das tecnologias
no atual panorama social. De acordo com pesquisa realizada em janei-
ro de 2021 pela agência We are Social e pela Hootsuite, divulgada pela
Istoé Dinheiro (NÚMERO..., 2021), existem cerca 4,66 bilhões de pes-
soas conectadas em todo o mundo, o que significa mais da metade da
população mundial. No Brasil, esse número, em 2020, de acordo com
a pesquisa TIC Domicílios 2019, é de 134 milhões de usuários, ou seja,

sumário
305
três em cada quatro brasileiros acessam a internet no país, segundo
divulgado pela Agência Brasil (BRASIL..., 2020).

Essa realidade digital, tão presente no nosso cotidiano, foi definida


por Castells (2005, p. 24) como sendo uma “sociedade em rede”, que é:
[...] uma estrutura social baseada em redes operadas por tec-
nologias de comunicação e informação fundamentadas na mi-
croelectrónica e em redes digitais de computadores que geram,
processam e distribuem informação a partir de conhecimento
acumulado nos nós dessas redes (CASTELLS, 2005, p. 24).

O autor resgata que movimentos sociais começaram a se orga-


nizar na internet já na década de 1980 e basicamente os mesmos com-
ponentes faziam parte desses grupos: movimentos locais em busca de
oportunidades de auto-organização, o movimento hacker e governos
municipais com o intuito de fortalecer a participação do cidadão. Como
os governos não conseguiam controlar os fluxos de comunicação ali
existentes, a internet conseguiu fugir do controle estatal.

Dessa forma, Castells (2005, p. 24) observa que a nova configu-


ração social começa a tornar a comunicação de massa horizontalizada
e autocomandada, ou seja, possui uma interação que não necessita
dos meios dos sistemas de mídia tradicionais para acontecer, porque
ela parte da iniciativa de indivíduos ou grupos independentes. Para a
política, as características dessa sociedade em rede são relevantes,
[...] uma vez que a política é largamente dependente do espaço
público da comunicação em sociedade, o processo político é
transformado em função das condições da cultura da virtuali-
dade real. As opiniões políticas e o comportamento político são
formados no espaço da comunicação (CASTELLS, 2005, p. 24).

O autor compreende que, por a internet estar se tornando im-


portante meio de comunicação e de sistematização, com certeza os
movimentos sociais e políticos já a utilizam como um “instrumento

sumário
306
privilegiado para atuar, informar, recrutar, organizar, dominar e contra-
dominar” (CASTELLS, 2003). Ele reforça, porém, que esses espaços
não são determinantes na formação da opinião pública, já que os
indivíduos possuem autonomia na busca por fontes de informação –
bem como para se tornarem as próprias fontes. Para Recuero (2009,
p. 16), que estuda a interação mediada pelo computador, o advento
dessa comunicação “está mudando profundamente as formas de or-
ganização, identidade, conversação e mobilização social”.

Essa mobilização, que perpassa pelas pautas políticas, surge,


comumente, em um ambiente em que demandas da sociedade não
estão sendo supridas. Para Castells (2013, p. 127),
[...] a conjuminância de degradação das condições materiais
de vida e crise de legitimidade dos governantes encarregados
de conduzir os assuntos públicos leva as pessoas a tomar as
coisas em suas próprias mãos, envolvendo-se na ação coletiva
fora dos canais institucionais prescritos para defender suas de-
mandas e, no final, mudar os governantes e até as regras que
moldam suas vidas (CASTELLS, 2013, p. 127).

É possível afirmar que a realidade social se alterou quando


atingiu o âmbito digital e com o surgimento e estabelecimento das
redes sociais, locais de fluxo intenso de publicação e troca de informa-
ção, nas quais “as comunidades de interesse organizam-se com rique-
za muito maior de informações específicas” (MAGRANI, 2014, p. 84).
Magrani (2014, p. 87) diz ainda que os movimentos que acontecem no
on-line permitem “catalisar agendas através de engajamento, diálogo,
circulação e protesto” e que:
[...] indivíduos antes marginais no diálogo político possuem,
com as novas mídias, meios para se mobilizar, debater opiniões
entre si e com instituições governamentais e mídia tradicional e
inclusive influenciar estes atores através de diferentes platafor-
mas (MAGRANI, 2014, p. 87).

sumário
307
Os indivíduos passam, então, a encontrar, nas mídias sociais, na
Internet, o local para expressar ideias e opiniões, reunir, debater e com-
preender discursos dos mais diversos. Para Recuero (2009, p. 24), as
redes sociais se desenham como propagadoras de discursos, ao mes-
mo tempo, individuais e coletivos e afirma que o que chama de “Comu-
nicação Mediada pelo Computador” redefiniu formas de organização e
mobilização social. Essas redes, como um espaço de livre expressão,
não possuem barreiras governamentais ou partidárias, o que dá visibili-
dade e engaja pessoas nos mais diversos acontecimentos.

Também se faz necessário pontuar, ainda mais se tratando do


debate político nas redes, a visão pessimista do uso da internet e das
redes sociais nesse âmbito. Magrani (2014, p. 106-162) cita alguns
pontos que dão vazão a esse pensamento: a exclusão digital, a so-
brecarga de informação, o filtro-bolha, a polarização e fragmentação,
falta de cultura de engajamento político on-line e sistema político não
dialógico, tecnização do debate e a tecnologia para o controle. A ex-
clusão se refere a falta de acesso universal à internet, retirando alguns
cidadãos do debate amplo. A sobrecarga, ou information overload, diz
respeito à quantidade excessiva de informações disponíveis, que atra-
palham o indivíduo na compreensão e tomada de decisões.

Já o filtro-bolha (Filter Bubble) faz referência aos algoritmos que


se formam a partir dos dados de navegação, limitando a liberdade de
navegação dos usuários e os deixando à margem de alguns discursos
e opiniões. Este conversa com outro ponto negativo, a “polarização
e fragmentação”, que é quando as pessoas buscam e compartilham
conteúdo de valores e opiniões e ideologias semelhantes. Com relação
a falta de cultura de engajamento político on-line e sistema político não
dialógico, Magrani (2014, p. 138) observa que há ações individuais
descentralizadas e as discussões nas redes não atingem: “alto nível
racional-dialógico relevantes para a política ou para o incremento da

sumário
308
democracia”. Outro ponto negativo apontado pelo autor é a ênfase à
parte técnica do debate faz com que o usuário da internet se interesse
menos em se engajar em discussões, o que diminuiria o valor do que
está sendo discutido e restringindo a discussão dos temas a um menor
número de pessoas, em teoria mais qualificados.

Por fim, Magrani (2014, p. 152) cita a tecnologia para o con-


trole, em que pontua a preocupação com a regulação da internet
por parte dos governos para garantir os direitos dos cidadãos no
ambiente on-line, como privacidade, liberdade de expressão e di-
reitos consumeristas. “Há hoje algum consenso de que a regulação
(em alguma medida) da internet é importante para que haja maior
segurança de garantias aos direitos constitucionais dos cidadãos-u-
suários” (MAGRANI, 2014, p. 152).

3 HASHTAGS NO ENGAJAMENTO POLÍTICO

As duas hashtags para a realização desta reflexão – #CPIda-


Covid e #29M – tratam de formas diferentes de engajamento político.
A primeira é sobre um acontecimento que será discutido e tratado por
meses, no caso da CPI, que tinha duração prevista inicialmente de 90
dias, sendo renovada, posteriormente, por mais 90 dias; e a outra é
sobre um momento específico em que o evento é realizado, em que o
chamamento para a realização dele foi feito basicamente on-line.

Vejamos o uso das marcações aqui escolhidas com o momento


político vivenciado no Brasil, a fim de compreender o surgimento das
tags, como pode ser visualizado a seguir no quadro 1.

sumário
309
Quadro 1 – Hashtags, contexto em que são utilizadas e o período de análise

Hashtag Contexto Período de coleta

Essa hashtag foi utilizada quando os usuários do


Twitter queriam fazer referência aos acontecimentos
da Comissão Parlamentar de Inquérito (CPI) do Se-
13 de maio
#CPIdaCovid nado Federal brasileiro que trata da pandemia da Co-
de 2021.
vid-19 no país. A CPI da Pandemia foi instalada em 27
de abril e visa investigar ações e omissões do governo
federal no combate à pandemia.
A #29M surgiu para os usuários repercutirem os
protestos que aconteceram em 29 de maio de 2021
pelo país contra o governo de Jair Bolsonaro. Em
meio à pandemia da Covid-19, as reinvindicações 29 de maio
#29M
se concentraram em torno do impeachment do de 2021.
presidente, a continuidade do auxílio emergencial, a
ampliação da vacinação, contra os cortes de verba na
educação, entre outras pautas.
Fonte: Os autores, 2021.

A partir da busca avançada da própria plataforma, então, foram


recuperados 1.479 tweets utilizando a #CPIdaCovid e 1.476 publica-
ções da #29M. Com base na Análise de Conteúdo e na definição das
categorias mencionadas anteriormente, estas ficaram classificados
conforme demonstra o quadro 2 a seguir.

Quadro 2 – Distribuição e classificação de


publicações em cada categoria de análise.

Categoria #CPIdaCovid #29M


Notícia 55 42
Opinião 879 874
Repercussão 386 436
Meme 59 22
Outros 100 102
Total 1.479 1.476
Fonte: Os autores, 2021.

sumário
310
Também, de acordo com a categorização realizada a partir da
Análise de Conteúdo, a pesquisa definiu as publicações como “A fa-
vor”, “Neutra” e “Contra”. Para essa definição, foram considerados
diversos fatores, entre eles, o uso de outras hashtags por parte dos
usuários. O quadro 3, a seguir, mostra a quantidade de publicações
nessas categorias.

Quadro 3 – Quantidade de publicações a favor, “neutras” e contra os eventos

Hashtag A favor “Neutra” Contra


#CPIdaCovid 746 706 27
#29M 1265 210 1
Fonte: Os autores, 2021.

Dessa forma, a partir de agora, demonstra-se, com números e


exemplos, como se comportaram essas publicações ao cruzar as in-
formações. Com relação a #CPIdaCovid, obteve-se 55 notícias, todas
marcadas como “neutras”. Um exemplo pode ser conferido na figura 1.

Figura 1 – #CPIdaCovid: Exemplo das categorias notícia e “neutra”

Fonte: Twitter, Inc. (2021).

sumário
311
As publicações marcadas como opinião e a favor foram a gran-
de maioria, com 659 publicações. Elas apresentam algum juízo de va-
lor favorável à CPI, como demonstrado na figura 2.

Figura 2 – #CPIdaCovid: Exemplo das categorias opinião e a favor

Fonte: Twitter, Inc. (2021).

Apesar de, na denominação, as categorias opinião e “neutra”


possam parecer contraditórias, 196 publicações foram marcadas des-
sa forma, porque elas apresentam alguma opinião, mas elas não se
encaixam como “A favor” ou “Contra” a CPI, poderiam ser feitas por
quem apoia ou não os trabalhos da comissão ou o governo federal.
Outros 24 tweets de opinião foram marcados como contrários à CPI.

Já com relação a #29M, foram identificadas 21 publicações


com notícias marcadas como “a favor”. Elas são, basicamente, de
portais independentes de notícias. Também foram encontradas 20 no-
tícias marcadas como neutras, conforme exemplo na figura 6 a seguir.
Apenas uma notícia foi marcada como contrária por apresentar, já no
título, uma crítica a realização do evento.

As publicações marcadas como de opinião e a favor foram a


maioria dos dados coletados: 852. Como “neutra” foram encontradas
22 publicações. Como categorias de repercussão e a favor, foram 301
publicações, e repercussão e neutra foram 135, como demonstrado
nas figuras 3 e 4 a seguir.

sumário
312
Figura 3 – #29M: Exemplo das categorias repercussão e a favor

Fonte: Twitter, Inc. (2021).

Figura 4 – #29M: Exemplo das categorias repercussão e “neutra”

Fonte: Twitter, Inc. (2021).

sumário
313
Nas categorias meme/imagem viral e a favor”, foram encontra-
dos 22 tweets, conforme exemplo na figura 5.

Figura 5 – #29M: Exemplo das categorias meme/imagem viral e a favor

Fonte: Twitter, Inc. (2021).

E, finalmente, como “outros”, aparecem 74 a favor e 28


neutras, como visto nas figuras 6 e 7, a seguir:

Figura 6 – #29M: Exemplo das categorias outros e a favor

Fonte: Twitter, Inc. (2021).

sumário
314
Figura 7 – #29M: Exemplo das categorias outros e “neutro”

Fonte: Twitter, Inc. (2021).

O debate que acontece nas redes sociais em torno de ambas


as hashtags e dos temas que as compreendem tem repercutido não
só nas redes sociais, mas na mídia tradicional. O alcance da CPI da
Pandemia foi (e é) tão grande no Twitter que foi comparado com o do
programa de TV Big Brother Brasil pela Folha de São Paulo. Com o tí-
tulo “CPI da Covid atrai público que ficou órfão do BBB e decola na era
da ‘política pop’”, Moraes e Menon (2021) escrevem que: “não faltam
aproximações dramatúrgicas entre o que se tem visto no Senado no
último mês e as grandes atrações do entretenimento brasileiro”.

Entrevistado pelas jornalistas, o cientista de dados Pedro Bar-


ciela afirmou que eventos como o impeachment de Dilma Rousseff e
as eleições de 2008 tiveram um maior número de interações, porém
“no universo do parlamento, ela (a CPI) pode ser, sim, um dos eventos
que mais criaram engajamento” (MORAES; MENON, 2021). Também
sobre a CPI, o Correio Brasiliense divulgou que “ao longo do primeiro e
agitado mês de depoimentos, a CPI da Covid resultou em 11,8 milhões
de publicações no Twitter” (incluindo ou não o uso de hashtags).

sumário
315
Já as manifestações sobre o 29 de maio de 2021 repercutiram
no jornal O Globo. A reportagem de João Saconi informou que foram
1,8 milhões de menções do dia 1º de maio até o dia 29 no Twitter com
hashtags a favor e contra a manifestações. “Online, o ato foi mencio-
nado 767 mil vezes por meio da hashtag #29MForaBolsonaro e 29
mil vezes com a #ForaGenocida, de acordo com a contagem da Ar-
quimedes até as 19h” (SACONI, 2021). Ele também escreve que, em
contraponto, a base do governo investiu na hashtag #EuApoioBolso-
naro2022, “que teve 165 mil menções neste sábado, em referência à
busca pela reeleição do político”.

4 CONSIDERAÇÕES FINAIS

Os números expressivos do uso das hashtags e de publica-


ções em torno dos temas políticos aqui expostos refletem a importân-
cia que as redes sociais, em especial o Twitter, conseguiram alcançar
ao redor dessas questões. Seja da simples manifestação de pen-
samento, da repercussão de um fato ou da convocação para mani-
festações de rua, é possível compreender que o uso que se faz das
mídias sociais vem impactando até na mais básica compreensão do
ser cidadão, de atuar enquanto cidadão.

A partir do exposto, foi possível, então, observar que, sim, a folk-


sonomia pode ser considerada uma ferramenta eficaz de engajamen-
to, já que é em torno das publicações, utilizando essas marcações em
forma de indexação livre das informações, que os usuários se encon-
tram, debatem e formam opinião ou se aproximam em torno de lutas
e manifestações com as quais convergem ou divergem. Por meio da
folksonomia, então, pode-se observar e analisar diversos fenômenos
que ocorrem no “mundo real” ou off-line, mas que se moldam, fortale-
cem-se e ganham relevância no digital, além de se estabelecer como

sumário
316
método atual e necessário, para estudos acerca dos debates políticos.
Dessa forma, foi possível atingir o objetivo geral do trabalho de analisar
o engajamento dos usuários do Twitter em temas de viés político, a
partir do uso de hashtags, sob a ótica da folksonomia.

É imperioso que, dado o advento do uso das redes sociais,


as discussões levantadas nessas mídias não sejam inferiorizadas ou
alcancem um lugar que fique à margem dos debates políticos. Pelo
que foi visto, a partir dos exemplos de eventos, com destaque no meio
digital, e pelos exemplos aqui expostos, o mundo já está em transfor-
mação e essas mudanças perpassam pelos indivíduos que se organi-
zam e expõem suas opiniões nessas redes.

Importante também destacar que essa reflexão por si só não se


propõe a esgotar todas as interpretações das hashtags com viés políti-
co ou até mesmo das aqui demonstradas, já que, pelo grande volume
de dados, houve a necessidade de se realizar um recorte das publica-
ções para viabilizar a análise, o que significa dizer que mais pesquisas
podem se derivar a partir do exposto, dada a importância de se tratar
de temas sociais no âmbito da Ciência da Informação, nesse caso,
a partir da folksonomia sob a ótica da Organização e Representação
do Conhecimento. Esta reflexão demonstra, ainda, que instrumentos
utilizados na Organização e Representação do Conhecimento podem
ser atuais e relevantes se colocados em cenários e posições diversas,
acompanhando as mudanças tecnológicas, políticas e sociais.

5 REFERÊNCIAS
ASSIS, Juliana de; MOURA, Maria Aparecida. Folksonomia: a linguagem
das tags. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciên-
cia da Informação, Florianópolis, v. 18, n. 36, p. 85-106, 2013. Disponível
em: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2013v-
18n36p85/24523. Acesso em: 25 set. 2021.

sumário
317
BRASIL tem 134 milhões de usuários de internet, aponta pesquisa. Agência
Brasil, Brasília, 26 maio 2020. Disponível em: https://agenciabrasil.ebc.com.
br/geral/noticia/2020-05/brasil-tem-134-milhoes-de-usuarios-de-internet-apon-
ta-pesquisa. Acesso em: 26 set. 2021.
CASTELLS, Manuel. A galáxia da internet. Zahar: Rio de Janeiro, 2003.
CASTELLS, Manuel. A sociedade em rede: do conhecimento à política. In:
CASTELLS, Manuel; CARDOSO, Gustavo (Org.). A sociedade em rede: do
conhecimento à acção política. Belém: Imprensa Nacional, 2005.
CASTELLS, Manuel. Redes de indignação e esperança. Rio de Janeiro:
Zahar, 2013.
DIAS, Luana Gomes; CASTRO, Hallison Phelipe Lopes de; SILVA, Márcio Be-
zerra da. Categorização de serviços da web 2.0: uma proposta de apoio aos
bibliotecários. Revista Folha de Rosto, Juazeiro do Norte, v. 1, n. 2, p. 5-16,
2015. Disponível em: https://periodicos.ufca.edu.br/ojs/index.php/folhaderos-
to/article/view/38/51. Acesso em: 24 set. 2021.
GOIS, Ancelmo. CPI da Covid já gerou 9 milhões de comentários no Twitter;
33% são de apoio ao governo. O Globo, Rio de Janeiro, 20 maio 2021. Dis-
ponível em: https://blogs.oglobo.globo.com/ancelmo/post/ cpi-da-covid-ja-
-gerou-9-milhoes-de-comentarios no-twitter-33-sao-de-apoio-ao-governo
.html. Acesso em: 24 set. 2021.
LE COADIC, Yves-François. A ciência da informação. Brasília: Briquet de
Lemos/Livros, 1994.
MAAR, Wolfgang Leo. O que é política. São Paulo: Brasiliense, 1982.
MAGRANI, Eduardo. Democracia conectada: a internet como ferramenta de
engajamento político-democrático. Curitiba: Juruá Editora, 2014. Disponível
em: https://bibliotecadigital.fgv.br/dspace/bitstream/handle/10438/14106/De-
mocracia%20conectada.pdf. Acesso em: 30 set. 2021.
MORAES, Carolina; MENON, Isabella. CPI da Covid atrai público que ficou
órfão do BBB e decola na era da ‘política pop’. Folha de S. Paulo, São
Paulo, 27 maio 2021. Disponível em: https://www1.folha.uol.com.br/ilustra-
da/2021/05/cpi-da-covid-deslancha-na-era-da-politica-pop-e-atrai-publico-in-
teressado-em-bbb.shtml. Acesso em: 24 set. 2021.
MOREIRA, Vivian Lemes; ROMÃO, Lucília Maria Sousa. Discurso e(m) folk-
sonomia: o Brasil vestido com algumas tags. E-Compós, Brasília, v. 13, n. 1,
2010. Disponível em: https://1library.org/document/q76koxvy-discurso-e-fol-
kosonomia-brasil-vestido-com-algumas-tags.html. Acesso em: 25 set. 2021.

sumário
318
NÚMERO de usuários de Internet no mundo chega aos 4,66 bilhões. Istoé
Dinheiro, São Paulo, 03 fev. 2021. Disponível em: https://www.istoedinheiro.
com.br/numero-de-usuarios-de-internet-no-mundo-chega-aos-466-bilhoes/.
Acesso em: 26 set. 2021.
O’REILLY, Tim. What is web 2.0: design patterns and business models for
the next generation of software. 30 set. 2005. 5 p. Disponível em: https://
www.oreilly.com/pub/a/web2/archive/what-is-web-20.html?page=1.
Acesso em: 24 set. 2021.
RECUERO, Raquel. Redes sociais na internet. Porto Alegre: Sulina, 2009.
RIBEIRO, Ednaldo Aparecido; BORBA, Julian; HANSEN, Jaqueline Resmini.
Participação on-line e off-line no Brasil: relações e condicionantes. Revista do
Serviço Público, Brasília, v. 67, n. 4, p. 497-523, 2016. Disponível em: https://
revista.enap.gov.br/index.php/RSP/article/view/1262. Acesso em: 25 set. 2021.
ROSENFIELD, Denis Lerrer. O que é democracia. São Paulo:
Editora Brasiliense, 2017.
SACONI, João. Nas redes sociais, manifestações de maio somaram 1,8
milhão de menções. O Globo, Rio de Janeiro, 29 maio 2021. Disponível
em: https://blogs.oglobo.globo.com/sonar-a-escuta-das-redes/post/nas-re-
des-sociais-manifestacoes-de-maio-somaram-18-milhao-de-mencoes.html.
Acesso em: 24 set. 2021.
CORRÊA, Renato Fernandes; SANTOS, Raimunda Fernanda dos. Análise
das definições de folksonomia: em busca de uma síntese. Perspectivas em
Ciência da Informação, Belo Horizonte, v. 23, n. 2, p. 1-32, 2018. Disponível
em: https://www.scielo.br/j/pci/a/wq76G649MfqdWHWtQkwwgGB/?format=p-
df&lang=pt. Acesso em: 24 set. 2021.
TWITTER, INC. About. 2021. Disponível em: https://about.twitter.com/en.
Acesso em: 13 maio 2021.
WAL, Thomas Vander. Folksonomy. 2007. Disponível em: http://www.vander-
wal.net/folksonomy.html. Acesso em: 24 set. 2021.

sumário
319
11
Capítulo 11

Organização e recuperação
da informação: desafios na
Arquivologia e na Biblioteconomia

Organization and information


retrieval: challenges in Archival
Science and Librarianship
Andréa Fontoura da Silva

Bruna
Andréa Carballo
Fontoura da Dominguez
Silva de Almeida

Joana
Bruna Carballo Dominguez dePeregrina
Almeida Hernandes

Joana Peregrina Hernandes

Organização e recuperação
da informação:
desafios na Arquivologia
e na Biblioteconomia

Organization and information retrieval:


challenges in Archival Science
and Librarianship

DOI: 10.31560/pimentacultural/2022.95613.11
Resumo:
Busca-se discutir a Organização do Conhecimento e recuperação da infor-
mação com foco no acesso de usuários em arquivos e bibliotecas. Aborda
os conceitos de Organização do Conhecimento (OC) e estudo de usuários.
Relaciona as atividades de arquivos e bibliotecas como primordiais para o
acesso à informação e satisfação de seus usuários através de instrumentos
que organizam e recuperam a informação.

Palavras-Chave: Organização do conhecimento. Recuperação da informação.


Estudos de usuário.

sumário
321
Abstract:
Discuss the Organization of Knowledge and information retrieval with a focus
on user access to archives and libraries. It covers the concepts of Knowledge
Organization (CO) and user study. Lists the activities of archives and libraries as
essential for accessing information and satisfying their users through instruments
that organize and retrieve information.

Keywords: Knowledge organization. Information retrieval. User studies.

sumário
322
1 INTRODUÇÃO

A reflexão sobre a qual dissertaremos versa sobre o estudo da


busca de informações pelos usuários em arquivos e bibliotecas com
a ótica da Organização do Conhecimento (OC). O foco apresentado
aqui visa inserir, no debate, o tema da recuperação da informação e
sua relação com o usuário no contexto da OC, nas duas áreas: Arqui-
vologia e Biblioteconomia.

Durante o período de 1972 a 2021, apenas 34 trabalhos foram rea-


lizados tratando, no título, Arquivologia e Biblioteconomia, nas pesquisas
realizadas na Base de Dados Referenciais de Artigos de Periódicos em
Ciência da Informação (Brapci). Vê-se que, em 49 anos, não chega a
um trabalho científico por ano sobre a temática das duas áreas juntas.
Nesse sentido, percebemos a importância e o alerta de que precisamos
trabalhar mais em conjunto para minimizar as dificuldades, trocar expe-
riências e refletir mais sobre a ótica da Organização do Conhecimento.

Salientamos a importância dos usuários nos processos de de-


cisão ao procurar estratégias e formas de acessar, através da Orga-
nização do Conhecimento, informações pertinentes ao contexto dos
arquivos e bibliotecas. Desta forma, práticas arquivísticas e biblioteco-
nômicas são apropriadas ao estudo e desenvolvimento de estratégias
para melhorar a recuperação da informação nestas instituições.

A reflexão aqui proposta tem como papel fundamental a aborda-


gem de temas como difusão em arquivos e disseminação da informação
nas bibliotecas, na qual pretende-se aproximar os estudos de recupe-
ração da informação e estudos de usuários. Visando contribuir para os
estudos da Organização do Conhecimento e seus efeitos sobre o aces-
so de usuários a informações em arquivos e bibliotecas, este trabalho
apresenta, além da Introdução, uma seção destinada à Metodologia,
bem como a Recuperação da Informação em arquivos e bibliotecas:

sumário
323
desafios, Organização do Conhecimento, na Arquivologia e na Bibliote-
conomia, Acesso, usuários e a OC, considerações finais e referências.

2 METODOLOGIA

A pesquisa aqui apresentada motivou-se a partir de estudos no


Grupo de Pesquisa em Organização e Representação do Conhecimen-
to – Abordagens Linguísticas em Arquivos e Bibliotecas – OrcaLab, da
Universidade Federal do Rio Grande do Sul (UFRGS). Através de pes-
quisas em artigos relacionados à Organização do Conhecimento, tive-
mos a possibilidade de refletir sobre a importância de estudos na área.

A metodologia empregada esteve centrada na pesquisa bibliográ-


fica, subsidiada por livros e artigos disponíveis de forma on-line em sua
maioria. As fontes de informação utilizadas na pesquisa foram: Scientific
Electronic Library Online - SciELO Brasil, Google Acadêmico, LUME Re-
positório Digital – Universidade Federal do Rio Grande do Sul (UFRGS).

A terminologia nas buscas se deteve em: Organização do Co-


nhecimento, Recuperação da Informação, Usuário, Difusão Arqui-
vística, Disseminação da Informação, Sistemas de Recuperação da
Informação, Arquivologia e Biblioteconomia. A partir dos resultados
obtidos, foram selecionados os textos que mais se adequaram à pro-
posta da pesquisa.

3 A RECUPERAÇÃO DA INFORMAÇÃO
EM ARQUIVOS E BIBLIOTECAS: DESAFIOS

Para que a recuperação da informação pesquisada pelo usuá-


rio faça sentido, é necessário que algumas medidas sejam adota-
das dentro dos arquivos e bibliotecas. O conceito de recuperação da

sumário
324
informação aqui estudado é o de Belkin; Croft (1987)69 apud Laipelt e
Monteiro-Krebs (2021, p. 13):
A recuperação da informação efetiva-se em uma solicitação do
usuário ao SRI, que, então, compara o que se solicitou com a
representação dos documentos armazenados, por meio de um
conjunto de procedimentos.

Entende-se SRI como Sistemas de Recuperação da Infor-


mação, que são “[...] aqueles que, entre outras funções, visam dar
acesso às informações contidas em documentos neles registrados.”
(ARAUJO, 2020, p. 1).

Na Biblioteconomia, quando precisamos orientar a indexação


com vistas a atender os usuários do centro de informação (LANCAS-
TER, 2004), precisamos também saber como o SRI captará as ex-
pressões de busca dos usuários. Podemos perceber que, além das
bibliotecas, publicações periódicas e base de dados são orientadas a
refletir sobre a terminologia usada e seus usuários. Ao estudarmos a
recuperação da informação, vemos que o “todo” é muito mais do que
apenas inserir uma palavra e recuperar o que se quer.
O “processo de recuperação da informação” envolve a repre-
sentação dos documentos, a formulação da consulta, a com-
putação da resposta e a comunicação da resposta. A repre-
sentação de documentos – por meio de termos indexadores,
descritores ou palavras-chave – pode ser feita por especialistas
ou extraída automaticamente do texto integral do documento
(LAIPELT; MONTEIRO-KREBS, 2021, p. 13).

Na Arquivologia, a tipologia documental se faz necessária nos


registros das descrições dos documentos, pois reflete as atividades
desenvolvidas de uma instituição. Nesse sentido, termos como cer-
tidão de nascimento, ata de reunião, plantas arquitetônicas, entre
outros, são necessários ao elaborar um Sistema de Organização do

69 BELKIN, J. N.; CROFT, W. B. Retrieval techniques. Annual Review of Information Science


and Technology (Arist), Silver Spring, v. 22, p. 109-145, 1987.

sumário
325
Conhecimento (SOC) para arquivos. Vemos, em Smit (2017, p. 20), que
este nosso questionamento é considerado quando ela nos diz:
Embora não muito discutida, a indexação de conteúdo revela-se
em certos casos determinante para evitar que o usuário deva
pesquisar uma informação contida num respeitável volume de
documentos, representantes da mesma tipologia documental,
mas contendo informações variáveis.

Os SOCs precisam aparecer mais nos estudos da área para


que o usuário tenha mais autonomia em arquivos Menne-Haritz (2001)
apud. Smit (2017, p. 22) nos elucida neste sentido:
[...] a recuperação da informação e dos documentos, ou seja, o
acesso a eles pelos usuários, somente adquire sua plena signifi-
cação quando inclui uma preocupação didática e tradutora: não
se trata de interpretar os documentos para o usuário, mas forne-
cer ao mesmo todas as informações que preservem o potencial
informacional “original”, ou seja, o contexto original de produção
do documento, abrindo caminho para que o usuário os interprete.

Percebe-se, então, que os arquivos precisam considerar mais


as buscas dos usuários e suas necessidades, trazendo sua represen-
tatividade aos arquivos, para que, enfim, o arquivo tenha o seu pa-
pel social e de difusão da informação com verdadeira propriedade.
Na busca de informações em bibliotecas, os estudos recentes mos-
tram que a autonomia de pesquisa dos usuários pode ser alcança-
da com a mediação midiática, através de tecnologias da informação
como smartphones, internet e redes sociais.
Portanto, é considerado o meio utilizado para dar visibilidade
à Instituição, no sentido de apresentar sua função e conduzir
a sociedade à ampliação de sua cultura. Desta forma, visa o
acesso às informações mediante a elaboração de estratégias
que criem uma aproximação dos indivíduos com informações
referentes à sua história ou a conhecimentos específicos
(ROCKEMBACH; DIAS, p. 337, 2018).

sumário
326
Cada vez mais necessitamos de estudos em Ciência da Informa-
ção e Tecnologia, visto que a interdisciplinaridade da área é evidenciada.
Nela, podemos relacionar a Ciência da Informação com tantas outras
teorias e práticas, tais como a Informática, a Biblioteconomia, a Arqui-
vologia, a Museologia, a Documentação, a Ciência da Computação,
a Comunicação, entre outras. Neste contexto, percebe-se como uma
Ciência Contemporânea multifacetada permitindo integração com ou-
tras práticas, voltadas à interdisciplinaridade dos estudos. Nesse senti-
do, entende-se que se faz cada vez mais necessário adotar recursos que
permitam um diálogo adequado às linguagens utilizadas pelos usuários.
Partimos do pressuposto que as organizações apresentam,
cada vez mais, novas práticas informacionais, que requerem
estratégias de recuperação da informação mais eficientes e
eficazes. Portanto, é difícil ancorar a recuperação da informa-
ção contida nos documentos de arquivo apenas no instrumento
de classificação. Precisamos incorporar nesse esforço novos
instrumentos que possibilitem a recuperação da informação
de modo compatível com as demandas informacionais atuais
(SOUSA; ARAÚJO JÚNIOR, 2013, p. 133).

É preciso refletir sobre os recursos empregados para a recu-


peração da informação, pois a funcionalidade dos instrumentos deve
ser um pré-requisito. Um instrumento que não é compreendido pelo
usuário acaba dificultando a recuperação da informação, resultando
no total oposto do que é esperado.

Segundo Costa70 (2011 apud VAZ; ARAÚJO, 2015, p. 11), um


fator a ser discutido
[...] é a falta de habilidade do usuário em utilizar os instrumen-
tos de recuperação da informação nos arquivos: guias, catá-
logos, inventários e índices. Esses instrumentos de pesquisa
são obras complexas, especializadas e de difícil elaboração, a
ponto de não serem inteligíveis aos usuários de arquivo. É por
isso que o arquivista deve se sentir responsabilizado por essa

70 COSTA, Marli Guedes da. Acesso aos arquivos públicos: aspectos jurídicos e práticos.
Cenário Arquivístico, Brasília, DF, v. 4, n. 1, p. 22-31, jan./ jun., 2011.

sumário
327
incompreensão das ferramentas que elabora. Cabe ao profis-
sional de arquivo o treinamento do seu usuário para possibilitar
que ele tenha acesso pleno à todas as informações disponíveis.

Na Arquivologia, os instrumentos tradicionais de pesquisa preci-


sam de uma revisão teórica, pois, como apontam os autores, acabam
dificultando a pesquisa e a recuperação da informação. Os instrumen-
tos de busca e recuperação da informação precisam ter uma lingua-
gem que converse com os usuários, bem como o uso deve ser intuitivo,
poupando tempo de esforço a fim de tornar a pesquisa mais atrativa
aos pesquisadores. Nesse sentido, estudos na área de recuperação
da informação, sistemas de informação, disseminação da informação
em bibliotecas e difusão em arquivos são temas em constante debate
e percepção por parte da Ciência da Informação (CI).

4 ORGANIZAÇÃO DO CONHECIMENTO (OC)

Inicia-se esta seção com a Organização do Conhecimento,


campo interdisciplinar teórico e metodológico relacionado à Ciência da
Informação. Conforme definido por Hjørland (2016), a OC busca fazer
representações de documentos, assuntos e conceitos, através de des-
crição e organização, por exemplo. Essa organização pode ser feita de
forma manual ou por programas de computador. Assim, vislumbra-se
aproximar a Organização do Conhecimento à Arquivologia e à Biblio-
teconomia para facilitar a construção de instrumentos de pesquisa e
representação visando ao acesso à informação.

Ao construir metodologias para isso, a Organização e Represen-


tação do Conhecimento tem como propósito desenvolver ferramentas
capazes de propiciar ao usuário a capacidade de acessar às infor-
mações arquivísticas de forma empírica e independente da ajuda do
arquivista. Assim, a coleta de dados abre caminhos para a reinserção
de algumas tendências na Ciência da Informação, como, por exemplo,

sumário
328
as linguagens, estruturas e classificações (BARROS; SOUSA, 2019).
Inclusive estes são aspectos importantes para a estruturação de meto-
dologias mais aplicáveis às necessidades de recuperação da informa-
ção e ao ímpeto investigativo do usuário. Essas necessidades e formas
de interação entre usuário e informação são recentes. Estima-se que
são tendências que surgiram nos últimos vinte anos e estão relacio-
nadas à forma como ocorre a gestão administrativa que, consequen-
temente, tem impacto sobre como as pessoas constroem o conheci-
mento e buscam informações (BARROS; SOUSA, 2019).

Como uma tendência que se revela diante da Ciência da Infor-


mação e busca facilitar o acesso à informação de maneira dinâmica
e centrada nas necessidades do usuário, os estudos relacionados à
Organização do Conhecimento implicam a verificação de novos con-
ceitos e, também, uma revisão dos processos que se apresentam de-
satualizados diante de um contexto totalmente tecnológico, digital e
físico. De fato, a pesquisa de informação está carente de recursos sem
a inserção de novos conceitos para que não precise estigmatizar o
processo do acesso do usuário à informação.

As já mencionadas tendências de interação entre usuários e in-


formação fomentam o desenvolvimento de todas as áreas que subsi-
diam essa relação. Arquivos e bibliotecas buscam, na Organização do
Conhecimento, os subsídios e ferramentas para suprir as necessidades
de usuários e tornar o acesso à informação dinâmico e independente.

4.1 ORGANIZAÇÃO DO CONHECIMENTO


NA ARQUIVOLOGIA

Sob a perspectiva da organização e acesso, observam-se pon-


tos em comum entre a Arquivologia e a Organização do Conhecimen-
to. Suas relações são recentes e se estreitam a partir dos sistemas ba-
seados em características do contexto de produção dos documentos,

sumário
329
que refletem na gestão, classificação, controle e acesso (BARROS;
SOUSA, 2019; BARROS; TOGNOLI, 2015).

Dessa forma, a Organização do Conhecimento pode contribuir


intimamente com as atividades desenvolvidas por arquivistas, princi-
palmente no que tange à gestão documental. A base do tratamento
arquivístico, dispensado a documentos e a informações, está pautada
em seus contextos particulares de produção e utilização. Com isso, as
metodologias e estudos do campo da Organização do Conhecimento
podem contribuir para os arquivos, desde que respeitando tais contex-
tos e particularidades.

Percebe-se que a Organização do Conhecimento trouxe con-


ceitos que permitiram refletir melhor sobre a aplicação de metodolo-
gias advindas de outras áreas nas ferramentas arquivísticas, como,
por exemplo, a linguística, a taxonomia, os tesauros, entre outros. Com
esse efeito, os documentos foram inseridos em uma nova metodologia
de classificação que permitiu que ferramentas de pesquisa e banco
de dados tivessem estruturas dinâmicas e de fácil uso. Embarcamos
em uma proposta de estudo que permite estender o campo de pes-
quisa da Arquivologia em relação aos estudos técnicos, pois vemos
que alguns temas ainda não estão sendo explorados o suficiente em
relação aos avanços dos arquivos, suas tecnologias, interação com os
usuários, recuperação da informação e interdisciplinaridade da área.

Os documentos de arquivo registram ações que são represen-


tadas na organização destes, a partir da classificação, utilizada para
evidenciar o vínculo arquivístico. Na Arquivologia, esse vínculo revela
informações contextuais a respeito da produção desses documentos,
tornando-se essencial para a recuperação das informações. Sendo
assim, a classificação é uma das funções matriciais da Arquivologia,
compondo parte fundamental do processo de gestão documental nos
arquivos. Nesse processo de organização e representação, ressalta-se

sumário
330
a relação orgânica dos documentos, tão cara à Arquivologia (ROUS-
SEAU; COUTURE, 1998; SOUSA, 2009; SCHMIDT; SMIT, 2015).

No contexto atual, os documentos de arquivo são produzidos de


forma híbrida propondo um novo cenário, no qual documentos físicos e
digitais compartilham o espaço e, nesse sentido, os processos de repre-
sentação e organização do conhecimento no contexto dos arquivos são
estudados na Arquivologia de forma compartimentada e dissociada de
uma visão sistêmica (BARROS, 2019, p. 77). Com isso, propõe-se uma
relação mais estreita aos métodos da Organização do conhecimento.

Complementa-se a isso, o fato de que a classificação é o ponto


de partida para os processos de organização dos arquivos (BARROS;
TOGNOLI, 2015). Logo, é a partir dessa função que são pautados os de-
mais procedimentos técnicos envolvidos na gestão documental. Ainda,
As atividades de descrição e classificação são, para os arqui-
vos, o que são as atividades de classificação, catalogação e
indexação para as bibliotecas, ou seja, a organização do conhe-
cimento arquivístico em si (BARROS; TOGNOLI, 2015, p. 95).

Isso reforça as relações entre Organização do Conhecimento


e Arquivologia, principalmente porque menciona etapas fundamentais
do tratamento dispensado aos arquivos e que fazem parte da gestão
documental. Além disso, ressalta processos-chave para a Organiza-
ção do Conhecimento, que são a organização e representação de do-
cumentos, e traça um paralelo entre atividades desempenhadas em
arquivos e bibliotecas.

4.2 ORGANIZAÇÃO DO CONHECIMENTO


NA BIBLIOTECONOMIA

Há algum tempo, a Organização do Conhecimento, dentro da


literatura especializada, vem trazendo diversas relações com a Biblio-
teconomia, quando busca, por meio de Sistemas de Organização do

sumário
331
Conhecimento – SOCs, refletir sobre os usos de instrumentos que
qualificam a atividade do bibliotecário. Temos, na Biblioteconomia,
vocabulários controlados, lista de assuntos, tesauros, estes sendo
Sistemas de Organização do Conhecimento que pretendem auxiliar
os usuários em suas buscas em adequação também aos Sistemas de
Recuperação da Informação, aliado na disseminação da informação.
Podemos refletir que, assim, os Sistemas de Organização do Co-
nhecimento abrangem todos os tipos de esquemas de organização
no que tange à informação, tais como: esquemas de classificação e
cabeçalhos de assuntos, arquivos de autoridades, estando estes em
arquivos, bibliotecas e museus (HODGE, 2001).

Nesse sentido, os Sistemas de Organização do Conhecimento


precisam ser avaliados, estudados, percebidos com grande importân-
cia no papel de acesso à informação, visto estarem ligados também à
disseminação da informação e aos usuários que os utilizam. Assim, a
Organização do Conhecimento pelas linguagens documentárias são
instrumentos privilegiados que podem apresentar dupla função: repre-
sentar o conhecimento e promover interação entre o usuário e o con-
teúdo, promovendo, assim, o uso cada vez mais efetivo de bibliotecas.
Contribuições como esta podem ser utilizadas pela Arquivologia para
refletir sobre usuários e acesso, tema de estudos na Biblioteconomia.

Percebe-se que glossários, vocabulários controlados e tesauros


auxiliam na revocação dos Sistemas de Recuperação da Informação
(GABRIEL JÚNIOR; LAIPELT, 2019). Estudos desses SRIs, na Biblio-
teconomia, vêm avançando com, inclusive, novas formas de estudar
as expressões de busca feitas nesses sistemas por usuários, através
da metodologia de análise de logs, por exemplo, estuda por Laipelt
(2015). Para minimizar problemas de comunicação entre bibliotecários
e usuários, a autora escolheu
[...] como objeto de estudo as lexias de buscas contidas nos
“logs” de pesquisa dos usuários do Portal LexMl do Senado

sumário
332
Federal Brasileiro, visto que, toda pesquisa realizada no Por-
tal fica registrada em um arquivo log armazenado no servidor
Web da instituição e, através de sua análise, é possível verificar
a linguagem utilizada pelos usuários para a recuperação de
informação (LAIPELT, 2015, p. 16).

Assim, os estudos de Biblioteconomia e Organização do Conhe-


cimento trazem grande discussão sobre como podemos utilizar os es-
tudos há tempos realizados nessa área e refletir sobre como podemos,
dentro da interdisciplinaridade, adentrar na organização da produção
intelectual humana e também nos documentos oriundos de institui-
ções, como na Arquivologia. Desse modo, Brascher e Carlan (2010)
afirmam ser essenciais, em um Sistema de Organização do Conheci-
mento, os conceitos, que são as unidades básicas do conhecimento.

4.3 ACESSO, USUÁRIOS E ORGANIZAÇÃO


DO CONHECIMENTO

Pesquisas sobre estudo de usuários e acesso à informação


na Arquivologia são recentes, devido a maior exigência dos usuários.
Em outras áreas, como, por exemplo, na Biblioteconomia, são temas
que possuem mais know-how sobre práticas, métodos e regras para
o acesso a documentos e como podem ser desenvolvidas novas fer-
ramentas que permitam que a informação possa ser recuperada de
forma adequada. Um dos conceitos estudados foi o de Cavalcante,
Galo, Vendramini (2017, p. 388-389):
[...] os estudos de usuários surgiram com o objetivo de ma-
pear características de determinada população para que as-
sim fosse possível planejar as informações mais adequadas a
serem oferecidas, desenvolvendo estudos dirigidos no intuito
de perceber se as necessidades de determinados grupos de
usuários estavam sendo satisfeitas adequadamente, buscan-
do oferecer um feedback aos sistemas.

sumário
333
Em bibliotecas especializadas, nas quais os usuários são mais
exigentes e possuem, de regra, um maior conhecimento do assunto, o
uso de vocabulários controlados traz um tratamento mais diferenciado
a estes. A Linguagem Documentária, construída e utilizada para ca-
racterizar o conteúdo dos documentos (MAIMONE, 2006), permite que
toda informação gerada possa ter seu próprio código e, dessa forma,
parametrizando formas de busca mais acessíveis aos usuários.

Vejamos que, na Arquivologia, Santos (2009) traz uma concep-


ção atual sobre as funções arquivísticas71, reorganizando-as seguindo
as tendências de um profissional dinâmico e centrado na informação
como objeto de estudo e trabalho. Outros pesquisadores veem que
os processos de organização arquivística geram produtos (BARROS,
2020), ou seja, que o resultado da organização do conhecimento per-
mite a construção de ferramentas capazes de refletir a organização
documental da instituição.

É importante observar que o tratamento das informações nos


arquivos é um todo indissociável. Todos os produtos gerados na apli-
cação das funções são ferramentas que permitem dar continuidade
à gestão. No caso da difusão e acesso, que são as últimas etapas
do processo, ainda assim, não vemos um fim em si mesmos, já que
é através deles que a informação ganha dinamização e visibilidade
perante seu usuário. Nesse sentido, entende-se difusão como práticas
exercidas no arquivo, perpassando todas as outras funções, ou seja,
divulgando e propagando as ideias do arquivo (SANTOS, 2009).

Seguindo essa linha, Rockembach (2015) acredita que a difusão


precisa ser realizada com uma abordagem interdisciplinar, abarcando
algumas temáticas específicas, como a acessibilidade e transparên-
cia, estudo de usuários, comportamento informacional, mediação da

71 Os autores canadenses Rousseau e Couture apresentaram, em 1998, no livro Os funda-


mentos da disciplina arquivística, as funções: criação, avaliação, aquisição, conservação,
classificação, descrição e difusão dos arquivos.

sumário
334
informação e literacia informacional. Percebemos aqui a necessidade
constante de estudos de usuários, nas duas áreas, para melhorar o
atendimento e vislumbrar novos serviços.

Ressalta-se que o grande trunfo da difusão é a aproximação


que esta realiza entre o acervo e o usuário, residindo nisso o princi-
pal motivo para se difundir acervos com informações arquivísticas.
Sendo assim, Barros (2020, p. 80) define, em seu texto, que “os pro-
cessos de difusão e acesso lidam com o que existe de mais sensível
na missão dos arquivos no cumprimento de servir à sociedade e dar
acesso aos conjuntos documentais.”

Com base nas recentes pesquisas e encabeçando uma pro-


posta de inclusão dos usuários, tem-se como pressuposto entender
as necessidades destes, baseando-se nessa realidade e propiciando
acessibilidade às instituições de arquivo. O estreitamento de rela-
ções entre o arquivo e seu usuário dá credibilidade à instituição na
comunidade e visibilidade quanto ao seu potencial informacional e
de pesquisa. Tudo isso colabora para a criação de uma identidade
do arquivo com a sociedade ao seu redor, transformando-o em uma
parte do cotidiano dessas pessoas.

A difusão propõe, ao arquivista, o papel de priorizar e instigar


a comunidade a perceber o envolvimento e a influência sociocultural
do arquivo na sociedade, tanto no seu aspecto administrativo quan-
to no aspecto histórico. Somente com projetos de difusão, é possível
essa integração, além de propor uma nova relação do arquivista com
a comunidade, que antes era de ser o guardião da informação para o
facilitador ao acesso à informação.

Nas bibliotecas, o sentido de disseminação ou, mais precisa-


mente, a disseminação da informação recai sobre a utilidade da infor-
mação e de como podemos transferi-la. A disseminação assume varia-
das formas que geram inúmeros produtos e serviços, dependendo do
enfoque e da prioridade conferida (LARA; CONTI, 2003).

sumário
335
As formas de pesquisa abrangidas na parte inicial das telas de
catálogos on-line de bibliotecas são importantes de se comunicar ao
usuário, para que ele se sinta confiante em suas pesquisas. Muitos
se distanciam dos catálogos e de sua própria pesquisa porque não
conhecem e nem sabem como procurar no sistema. O treinamento de
diferentes usos de tecnologias, assim como o uso dos catálogos de
bibliotecas, por exemplo, é de extrema importância.

Devemos entender que o digital precisa de uma relação diálogo-


-perceptiva de ferramentas intuitivas, mas também de textos que sejam
simples e fáceis de entender. Mais do que disseminar a informação ao
usuário, é necessário refletir como faremos esta disseminação, quais
meios atenderão suas expectativas e, também, torná-lo capaz de aces-
sar independentemente de qualquer profissional, caso assim o queira.

5 CONSIDERAÇÕES FINAIS

A proposta que aqui deixamos é a de incentivar arquivistas e


bibliotecários a aprofundarem estudos interdisciplinares, para terem
mais proximidade com os usuários e adentrar mais na área de desen-
volvimento de ferramentas para a recuperação da informação. Capa-
citar profissionais no desempenho de suas atividades e propor novos
paradigmas para a arquivística na busca de evoluir o estudo teórico e
profissional. Partindo desse ponto, verificar quais ferramentas podem
ser aplicadas para melhorias do que está sendo discutido.

Muitas bibliotecas, desde o advento das Tecnologias de Infor-


mação e Comunicação (TICs), buscam utilizar catálogos eletrônicos
para melhorar recuperar seus acervos. Estes não são apenas locais
de descrição de documentos ali existentes, transportam a utilização de
instrumentos da organização do conhecimento, como os vocabulários
controlados e os tesauros para localizar diversos assuntos.

sumário
336
Deve-se refletir, no âmbito da Organização do Conhecimento,
que, no campo de estudo da Biblioteconomia, o uso de forma mais
reflexiva desses instrumentos pode trazer ao usuário uma maior ca-
pacidade de encontrar aquilo que necessita, de uma forma menos
complicada. Vemos sistemas de classificação, listas de cabeçalhos
de assunto, taxonomias, tesauros, ontologias, entre outros que exi-
gem normas e metodologias adequadas de construção e atualização
para finalidades e aplicações específicas, mas que precisam sim,
refletir as necessidades desses usuários. Assim, também influencia
na visibilidade de acervos, pois estes precisam pensar sobre as ne-
cessidades dos usuários para que se indique a biblioteca, utilize-se
da biblioteca e ela possa ter significado como tal.

Dessa forma, também percebemos que a Arquivologia busca


visibilidade em seus arquivos a partir da função de difusão/acesso.
Ou seja, após a aplicação de outras seis funções, dentre elas a clas-
sificação e avaliação, é que se tem a possibilidade de difundir acer-
vos e instituições arquivísticas.

Nos arquivos, a Organização do Conhecimento se faz presente


em alguns instrumentos, como nos planos de classificação e instru-
mentos de pesquisa, que são justamente os produtos da aplicação
das funções arquivísticas. Logo, percebe-se que a Organização do
Conhecimento aplicada à Arquivologia perpassa essas funções e resi-
de na última delas, o conector entre arquivos e usuários, promovendo,
dessa maneira, o acesso às informações.

A partir disto, entende-se que é compromisso dos arquivos


estipular uma métrica para utilização dos documentos, ou seja, uma
gestão documental capaz de proporcionar ao usuário formas padro-
nizadas de recuperação à informação e não o contrário. Vemos que
o usuário tem tomado o controle em atribuir a significância aos do-
cumentos, causando um mar de possibilidades de organicidade aos
documentos e, com isso, prejudicando a recuperação da informação.

sumário
337
O relacionamento disciplinar das áreas da Arquivologia e Biblio-
teconomia é concernente à utilização de instrumentos de organização
do conhecimento para difundir e disseminar essas instituições. Para
a Biblioteconomia, os catálogos mostram uma relação interessante
nesse sentido. Vida escrita (pessoal ou institucional – como nos arqui-
vos), pesquisada, impressa e disponibilizada por diferentes aspectos
de um material informacional, considerando instrumentos que trazem
ao usuário maior credibilidade ao serviço, é o que bibliotecas e arqui-
vos estão buscando, como mostra esse trabalho, de forma conjunta e
reflexiva, para o desenvolvimento da Organização do Conhecimento.

6 REFERÊNCIAS
ARAUJO, Vania Maria Rodrigues Hermes de. Sistemas de recuperação da infor-
mação: a metodologia da tese. Pesquisa Brasileira em Ciência da Informa-
ção e Biblioteconomia, João Pessoa, v. 15, n. 4, p. 1-15, 2020. Disponível em:
https://brapci.inf.br/index.php/res/download/151941. Acesso em 22 nov. 2021.
DOI: 10.22478/ufpb.1981-0695.2020v15n4.56535 Acesso em: 22 nov. 2021.
BARROS, Thiago Henrique Bragato. Sem gestão não há difusão e acesso:
aspectos histórico-conceituais da arquivística canadense e brasileira. Acervo,
Rio de Janeiro, v. 33, n. 3, p. 68-85, set-dez. 2020.
BARROS, Thiago Henrique Bragato; SOUSA, Renato Tarciso Barbosa de.
Organização do conhecimento e Arquivologia: abordagens metodológicas.
Informação & Informação, Londrina, v. 24, n. 2, p. 76-92, maio/ago. 2019.
BARROS, Thiago Henrique Bragato; TOGNOLI, Natalia Bolfarini. Os proces-
sos de representação do conhecimento arquivístico: elementos históricos e
conceituais da classificação e descrição. In: GUIMARÃES, J. A. C.; DODEBEI,
V. Organização do conhecimento e diversidade cultural. Marília: Fundepe,
2015, v. 3, p. 94-99.
BRASCHER, Marisa.; CARLAN, Eliana. Sistemas de organização do conheci-
mento: antigas e novas linguagens. In: ROBREDO, J.; BRASCHER, M. (Org.).
Passeios pelos bosques da informação: estudos sobre representação e orga-
nização da informação e do conhecimento. Brasília: IBICT, 2010. p. 147-176. Dis-
ponível em: http://www.ibict.br/publicacoes/eroic.pdf. Acesso em: 10 jun. 2013.

sumário
338
CAVALCANTE, Luciane F. B.; GALO, Regina; A. C.; VENDRAMINI, Virgínia. Es-
tudos de usuário da Arquivologia: reflexões. VII SECIN, UEL, 2017. Disponí-
vel em: http://www.uel.br/eventos/cinf/index.php/secin2017/secin2107/paper/
viewFile/461/285. Acesso em: 21 nov. 2021.
GABRIEL JUNIOR, Rene F.; LAIPELT, Rita do Carmo. F. Descrição das
relações semânticas para aplicação em KOS: uso do Tesauro Semânti-
co Aplicado (THESA). P2P & Inovação, Rio de Janeiro, v. 6 n. 1, p.117-
135, Set.2019/Fev. 2020. Disponível em: http://revista.ibict.br/p2p/article/
view/4946. Acesso em: 7 out. 2021.
HJØRLAND, Birger. Knowledge organization. Knowledge Organization, To-
ronto, v. 43, n. 6, p. 475-484, 2016. Disponível em: http://www.isko.org/cyclo/
knowledge_organization. Acesso em: 12 de jun. de 2021.
HODGE, Gail. Systems of knowledge organization for digital libraries:
beyond traditional authority files. Washington, D.C.: 2001. The Digital Library
Federation Council on Library and Information. Disponível em: www.clir.org/
pubs/abstract/pub91abst. Acesso em: jun. 2021.
LAIPELT, Rita do Carmo Ferreira. Metodologia para seleção de termos
equivalentes e descritores de tesauros: um estudo no âmbito do Direito
do Trabalho e do Direito Previdenciário. São Leopoldo, 2015. Tese (Doutora-
do) – Programa de Pós-graduação em Linguística, Universidade do Vale do
Rio dos Sinos – UNISINOS. São Leopoldo: Universidade do Vale do Rio dos
Sinos, 2015. Disponível em: http://www.repositorio.jesuita.org.br/bitstream/
handle/UNISINOS/4853/RITA+DO+CARMO+FERREIRA+LAIPELT_.pdf?se-
quence=1. Acesso em: 22 nov. 2021.
LAIPELT, Rita do Carmo Ferreira; MONTIERO-KREBS, Luciana. Termos sob a
superfície: elementos teóricos, metodológicos e terminológicos para a repre-
sentação do conhecimento. Rio de Janeiro: Interciência, 2021. 159 p.
LANCASTER, Frederick W. Indexação e resumos: teoria e prática. 2. ed. rev.
atual. Brasília, DF: Briquet de Lemos, 2004. 452 p.
LARA, Marilda Lopes Ginez de; CONTI, Vivaldo Luiz. Disseminação da infor-
mação e usuários. São Paulo em Perspectiva, São Paulo, 2003, v. 17, n. 3-4.
p. 26-34. Disponível em: https://doi.org/10.1590/S0102-88392003000300004.
Acesso em: 20 nov. 2021.
MAIMONE, Giovana D. Glossário de indexação e resumos. 2006.
ROCKEMBACH, Moisés. Difusão em arquivos: uma função arquivística, infor-
macional e comunicacional. Informação Arquivística, Rio de Janeiro, v. 4,
n. 1, p. 98-118, jan-jun. 2015.

sumário
339
ROCKEMBACH, Moisés; DIAS, Eliane Carniel. Difusão em arquivos na Cine-
mateca Capitólio: Um Estudo de Caso. Informação & Informação, Londrina,
v. 23, n. 1, p. 335 – 350, jan./abr. 2018. Disponível em: http://www.uel.br/
revistas/informacao/. Acesso em: 20 nov. 2021.
ROUSSEAU, Jean-Yves; COUTURE, Carol. Os fundamentos da disciplina
arquivística. Lisboa: Dom Quixote, 1998.
SANTOS, Vanderlei B. A prática arquivística em tempos de gestão do conhe-
cimento. In: SANTOS, V. B. dos; INNARELLI, H. C.; SOUSA, R. T. B. (Org.).
Arquivística: temas contemporâneos: classificação, preservação digital,
gestão do conhecimento. 3. ed. Distrito Federal: SENAC, 2009.
SCHMIDT, Clarissa; SMIT, Johanna. Organização e representação da in-
formação em arquivos: uma análise a partir da função classificação. In: XII
Congreso ISKO España y II Congreso ISKO, Organización del conocimiento
para sistemas de información abiertos, 19-20 nov. 2015, Murcia. Anais […].
Murcia: Universidad de Murcia, 2015.
SMIT, Johanna. W. Recuperação, acesso e uso dos documentos arquivísti-
cos. Ciência da Informação, Brasília, v. 42, n. 1, 2013. DOI: 10.18225/ci.inf..
v42i1.1391 Disponível em: https://brapci.inf.br/index.php/res/download/56102.
Acesso em: 19 nov. 2021.
SOUSA, Tarciso B. S. A classificação como função matricial do que-fazer
arquivístico. In: SANTOS, V. B. dos; INNARELLI, H. C.; SOUSA, R. T. B. (Org.).
Arquivística: temas contemporâneos: classificação, preservação digital,
gestão do conhecimento. 3. ed. Distrito Federal: SENAC, 2009.
SOUSA, Tarciso B. S.; ARAÚJO JÚNIOR, Rogério Henrique. A classificação
e a taxonomia como instrumentos efetivos para a recuperação da informa-
ção arquivística. Ciência da Informação, Brasília, v. 42, n. 1, 2013. DOI:
10.18225/ci.inf..v42i1.1400 Acesso em: 19 nov. 2021.
VAZ, G. A.; ARAÚJO, Carlos A. V. A importância dos estudos de usuários na
formação do arquivista. Informação Arquivística, Rio de Janeiro, v. 4, n. 2,
2015. Disponível em: http://hdl.handle.net/20.500.11959/brapci/41831.
Acesso em: 18 nov. 2021.

sumário
340
12
Capítulo 12

Desdobramentos da transcrição
colaborativa nas abordagens
teórico-metodológicas da
organização do conhecimento

Developments of collaborative
transcription in knowledge organization
theoretical-methodological approaches
Camila Monteiro de Barros

Edgar Bisset Alvarez


Camila Monteiro de Barros

Edgar Bisset Alvarez

Desdobramentos da transcrição
colaborativa nas abordagens
teórico-metodológicas
da organização do conhecimento
Developments of collaborative transcription
in knowledge organization
theoretical-methodological approaches
DOI: 10.31560/pimentacultural/2022.95613.12
Resumo:
Este capítulo tem como objetivo discutir os desdobramentos teórico-metodo-
lógicos dos projetos de transcrição e descrição colaborativa de documentos
para a área da Organização do Conhecimento (OC). Alguns exemplos desse
tipo de projeto são o Anti-Slavery Manuscripts e Scribes of the Cairo Geniza,
ambos hospedados na plataforma Zooniverse. Esses projetos contam com
a participação de voluntários na tarefa de classificação e transcrição de do-
cumentos. No primeiro caso, trata-se principalmente de correspondências de
cunho abolicionista no contexto norte-americano do século XIX. No segundo,
fragmentos de documentos judaicos do período entre os séculos X e XIII d.C.,
escritos em hebreu e árabe formal e informal, estão à disposição dos usuários
para que os transcrevam. As transcrições são realizadas com uma participa-
ção cultural diversificada e até diversa daquela do contexto do documento.
A possibilidade de representação colaborativa da cultura global por meio do
uso de plataformas tecnológicas nos aproxima das abordagens das Huma-
nidades Digitais, que prevê o emprego de tecnologia no questionamento de
temas humanísticos. Das temáticas que compõem domínios às temáticas
abordadas em documentos, daquilo que será transcrito e reconstruído colabo-
rativamente, serão derivadas interpretações de interesse da OC, sendo que as
escolhas linguísticas e significativas realizadas pelos colaboradores influencia-
rão nessas interpretações. Dessa perspectiva, observamos alguns desdobra-
mentos teórico-metodológicos para a OC: gênese da noção de “OC colabora-
tiva”; ampliação do espaço para linguagens não especializadas, fomentando
as discussões sobre pluralidade de saberes; perspectiva das humanidades
digitais como ferramental tecnológico para a efetiva objetivação da pluralidade
de saberes; para além da instrumentalização dos fazeres relacionados à OC,
a área pode se apropriar dos impactos teóricos e vinculações sociais; conso-
lidação das humanidades digitais como dispositivo potencializador do estudo
das questões culturais humanas que são tão relevantes para a OC.

Palavras-Chave: Organização do conhecimento; representação do


conhecimento; transcrição colaborativa; humanidades digitais.

sumário
342
Abstract:
This chapter aims to discuss the theoretical-methodological developments of
documental collaborative transcription projects for the area of ​​Knowledge Or-
ganization (KO). Some examples of this type of project are Anti-Slavery Manus-
cripts and Scribes of the Cairo Geniza, both hosted on the Zooniverse platform.
These projects have the participation of volunteers in the task of classifying and
transcribing documents. In the first case, the project deals with North American
anti-slavery documents, mainly correspondences, from the 19th century. In the
second, fragments of Jewish documents from the period between the 10th and
13th centuries AD, written in formal and informal Hebrew and formal and informal
Arabic, are available for users to transcribe. The transcriptions are carried out
with a diversified cultural participation and are even different from that of the do-
cument’s context. The possibility of collaborative representation of global culture
through the use of technological platforms brings us closer to the approaches of
Digital Humanities, which foresees the use of technology in questioning huma-
nistic themes. From the themes that make up domains to the themes addressed
in documents, from what will be transcribed and reconstructed collaboratively,
interpretations of interest to KO will be derived, and the linguistic and significant
choices made by the collaborators will influence these interpretations. From
this perspective, we observe some theoretical-methodological developments
for KO: genesis of the notion of “collaborative KO”; expansion of the space for
non-specialized languages, fostering discussions on plurality of knowledge;
perspective of the digital humanities as a technological tool for the effective ob-
jectification of the plurality of knowledge; in addition to the instrumentalization
of actions related to the KO, the area can appropriate theoretical impacts and
social bonds; consolidation of the digital humanities as a potentiating device for
the study of human cultural issues that are so relevant to KO.

Keywords: Knowledge organization; knowledge representation; crowdsourcing


transcription; digital humanities.

sumário
343
1 INTRODUÇÃO

Entre a Organização do Conhecimento (OC), os aspectos cul-


turais do conhecimento e o âmbito digital, deparamo-nos com as pos-
sibilidades ferramentais das Humanidades Digitais, que perpassa por
todos esses aspectos e, nessa discussão, será cotejada com as dis-
cussões específicas da OC, permitindo trazer elementos de grande
importância para o desenvolvimento, evolução e processamento do
conhecimento nas ciências humanas, sociais e culturais, fortemente
mediados por recursos digitais.

De acordo com alguns levantamentos, as abordagens que já


vêm sendo desenvolvidas na relação entre OC e as possibilidades
das humanidades digitais parecem dar maior foco ao desenvolvimen-
to de sistemas de organização do conhecimento e acesso à grande
quantidade de dados e documentos (ALBUQUERQUE; QUINTANA,
2021) e às questões de natureza aplicada, com menor atenção à teo-
rização (ANDRADE, DAL’EVEDOVE, 2021). Nesse contexto, propo-
mos uma reflexão sobre os desdobramentos teórico-metodológicos
para a OC dos projetos de transcrição e descrição colaborativa de
documentos que se pautam no uso de tecnologias e se aproximam,
inclusive, da ideia de ciência cidadã.

As transcrições e descrições colaborativas dessa natureza são


realizadas em linguagem natural e seu conteúdo tem relação não só
com o conteúdo do próprio documento, mas também com as expe-
riências das pessoas engajadas nos projetos. Portanto, a transcrição
é realizada com uma participação cultural diversificada e até diversa
daquela em que o documento está contextualizado. Nesse contex-
to, a organização social e a organização intelectual do conhecimento
(HJØRLAND, 2008) se entrelaçam inadvertidamente.

Esse quadro abre espaço para diferentes interpretações a respei-


to, por exemplo, de textos religiosos, políticos e imagens arquitetônicas.

sumário
344
Julgamos que essa discussão é de fundamental importância para a OC,
pois tem relação direta com a manutenção das heranças culturais, com
questões de pluralidade linguística e de saberes, e, consequentemente,
na análise de assunto, representação de domínio, construção de siste-
mas de organização do conhecimento.

Tendo como foco a Organização do Conhecimento na concep-


ção de Hjørland (2008), em que essa área engloba perspectivas teóri-
cas, passa pelo desenvolvimento e análise de instrumentos e abarca
também o âmbito do próprio documento, sabemos que as questões
de transcrição têm ligações com outras áreas. A Paleografia e a Di-
plomática, por exemplo, concatenadas à Arquivologia e aos estudos
históricos têm como foco o estudo das diferentes formas de escrita,
verificação da veracidade de documentos, sua legitimidade jurídica,
entre outros aspectos. (BREWANGER; LEAL, 2020). Também estão re-
lacionados com a temática que propõe a área da Linguística, com os
estudos de tradução, a área de História e os estudos voltados à própria
estrutura tecnológica de plataformas de colaboração.

Sem adentrar na especialidade dessas áreas, mas sim da OC,


nosso foco é a flutuação da noção de domínio, assunto, suas várias
possibilidades de contextualização e reconhecimento, oportunizadas
pela ampla participação de pessoas, aproximando a discussão do
fundamento cultural de variação de significados. Assim, questiona-
mos: Como a OC é impactada por esse quadro? Como a área pode
pensar a questão do domínio, das suas teorias fundantes, da repre-
sentação, beneficiando-se das ferramentas tecnológicas na perspec-
tiva das humanidades digitais?

Para tanto, trazemos alguns exemplos de projetos de transcri-


ção colaborativa de documentos, contextualizamos os princípios das
humanidades digitais e discorremos sobre as configurações da OC
nas suas interseções com o debate da representatividade cultural, da
variação das linguagens e dos significados. Para além da tecnologia

sumário
345
como finalidade e mantendo-nos alertas com relação “à crença exces-
siva no potencial e neutralidade dos algoritmos para identificar informa-
ções e fazê-las circular” (MOURA, 2018, p. 119), centramos os temas
justamente na participação das pessoas no contato com documentos,
sem definições algorítmicas prévias ou automatizadas. Pautamos a
reflexão em um formato ensaístico, mas que aponta, nas suas con-
clusões, desdobramentos que impactam diretamente a OC e que são
passíveis de vinculação teórica e social para a composição da área.

2 CONTEXTO DOS PROJETOS


DE TRANSCRIÇÃO E DESCRIÇÃO
COLABORATIVA

Silva e Borges (2018) demonstraram que, associados às ciên-


cias documentais, os projetos de transcrição de documentos antigos
são tradicionalmente relacionados a instituições de memória. As au-
toras ponderam que, mais recentemente, os projetos dessa mesma
natureza têm sido estruturados diretamente relacionados com projetos
de Humanidades Digitais, englobando maior diversidade de temas,
documentos e pessoas envolvidas, aproximando-se, em alguns casos,
dos princípios da ciência cidadã.

Alguns exemplos desse tipo de iniciativa são o Scribes of the


Cairo Geniza e Anti-Slavery Manuscripts. Ambos os projetos estão
hospedados na plataforma Zooniverse72, considerada a maior no que
se refere a projetos colaborativos de ciência cidadã e humanidades
digitais, em diversas áreas. Criada em 2007, com o projeto Galaxy
Zoo para identificação morfológica de galáxias (SIMPSON; PAGE;
ROURE, 2014), atualmente, a plataforma abriga mais de 50 projetos
ativos com cerca de 1,6 milhão de usuários inscritos (HERODOTOU

72 Diaponível em: https://www.zooniverse.org/. Acesso em: 19 jul. 2022.

sumário
346
et al., 2020). Mais informações sobre a história e a estrutura da pla-
taforma podem ser encontradas em Simpson, Page e Roure (2014)
e informações sobre o considerável engajamento de voluntários e os
tipos de tarefas por eles desempenhadas podem ser acessadas em
Herodotou et al. (2020) e no site da própria plataforma.

No projeto Scribes of the Cairo Geniza73, ainda em andamento


no momento de escrita deste texto, fragmentos de documentos judai-
cos, na sua maior parte com origem entre os séculos X e XIII d.C., estão
à disposição dos usuários para que os classifiquem e transcrevam.
Na classificação, que é a primeira parte do projeto, solicita-se aos vo-
luntários que identifiquem a língua do documento, podendo ser hebreu
formal ou informal e/ou árabe formal ou informal. As estruturas formais
das línguas correspondem ao nível “fácil” da segunda etapa do pro-
jeto, a transcrição, enquanto a escrita informal, corresponde ao nível
“desafiante”. Os documentos são originalmente provenientes da geni-
zá (sala de armazenagem documentos que, pelo seu caráter religioso,
devem ser queimados após a morte do dono, mas que curiosamente
não o foram) da Sinagoga de Ben Ezra, em Fustat (Cairo antiga), no
Egito. Diferente do que se esperava encontrar em uma genizá, foram
mapeados documentos religiosos e documentos do dia a dia, como
contratos e petições. No século XIX, quando da descoberta da genizá
do Cairo, os documentos ficaram dispersos em coleções particulares
de pesquisadores e colecionadores. Pouco a pouco, ao longo dos
anos, foram incorporados aos acervos de várias bibliotecas universi-
tárias e especializadas. Atualmente, os documentos que fazem parte
do projeto Scribes of the Cairo Geniza (figura 1) são disponibilizados
por instituições parceiras que têm a guarda desses acervos, como a
biblioteca da Universidade da Pensilvânia (EUA), biblioteca do Seminá-
rio Teológico Judaico (EUA), biblioteca da Universidade de Cambridge
(Inglaterra), entre outras (SCRIBES OF THE CAIRO GENIZA, 2021).

73 Disponível em: https://www.scribesofthecairogeniza.org/. Acesso em: 19 jul. 2022.

sumário
347
Figura 1 – Exemplos de Fragmentos de documentos disponíveis
para transcrição no projeto Scribes of the Cairo Geniza

Fonte: Scribes of the Cairo Geniza (2021).

O projeto inclui designação de tags para os documentos e fóruns


de discussão a respeito das escolhas de tradução, correspondência
semântica das palavras adotadas atualmente com aquelas do período
de produção do documento, prováveis usos dos documentos e outras
questões. O projeto dos escritos do Cairo lida não só com a transcrição
mas também com a tradução. As discussões são realizadas em inglês,
assim como a identificação de palavras e frases. Dada a complexidade
das tarefas, grande parte dos documentos encontra-se na fase de re-
conhecimento de caracteres do hebreu e do árabe para, a partir disso,
poder-se trabalhar na transcrição e tradução de fato como, por exem-
plo, nos comentários a seguir extraídos da plataforma do projeto: “This
looks like liturgical composition with each line ending in the #letter_
beyt”; “The cursive Hebrew is hard to decipher. Has the purpose of this
been identified??”, “Can someone confirm the character at the end of
the fifth line from the bottom (image 2)?”. Com a participação da equipe

sumário
348
que gerencia o projeto (na sua maior parte composta por bibliotecá-
rias e bibliotecários) e dos voluntários, o projeto também desenvolve
conjuntos de referências alfabéticas e de frases-chave para auxiliar no
reconhecimento dos caracteres dos documentos. Essas espécies de
dicionários são um produto secundário, ou seja, não são o objetivo do
projeto, mas geram bases de conhecimento que podem permanecer
após o término do projeto (SCRIBES OF THE CAIRO GENIZA, 2021).

O projeto Anti-Slavery Manuscripts74, finalizado em agosto de


2020, é composto por documentos abolicionistas norte-americanos,
principalmente correspondências (figura 2), do período entre 1830 e
1870, que compõem a Coleção Abolicionista da Biblioteca Pública de
Boston (EUA). O objetivo do projeto é realizar a transcrição integral
dos documentos para, posteriormente, convertê-los em documentos
legíveis por máquina e possibilitar a busca em texto completo.

Figura 2 – Exemplos de documentos disponíveis para


transcrição no projeto Anti-Slavery Manuscripts

Fonte: Anti-Slavery Manuscripts (2021).

74 Disponível em: https://www.antislaverymanuscripts.org/. Acesso em: 19 jul. 2022.

sumário
349
Hospedado na estrutura do Zooniverse, o projeto Anti-Slavery Ma-
nuscripts também disponibiliza tutoriais, possibilidade de designação de
tags e fóruns de discussão. No caso desse projeto, trata-se somente da
transcrição, o que não deixa de abrir espaços para variações linguísti-
cas. Algumas discussões podem ser vistas em comentários como: “So-
metimes the paper they wrote on was very thin and there is bleed through
from the verso. Tough to distinguish sometimes. Is that the case here?”;
“We took a closer look at this and have concluded that March 21 is likely
the correct date”; “I would agree with Holly and transcribe as ‘is’!”.

Entre projetos das áreas de biologia, artes, física, natureza, espa-


ço, o Zooniverse oferece uma estrutura para a participação colaborativa
de pessoas nas mais diversas formas: identificação de ocorrência de
espécies de animais e plantas, análise de mapas, análise de imagens
microscópicas, transcrição de imagens arquitetônicas, catalogação de
objetos museais etc. Alguns projetos visam utilizar a análise humana
como input para aprendizagem de máquina com base em padrões.

No presente texto, escolhemos os dois projetos descritos an-


teriormente para que figurem como ilustração da discussão que se-
gue nas próximas seções. O principal motivo da escolha é o foco
na participação humana pela sua própria natureza de subjetividade.
As escolhas, as discussões, dúvidas e sugestões sobre conteúdo,
uso e contexto dos documentos são partes efetivamente integrantes
do desenvolvimento desses projetos. Parece, então, que essas inicia-
tivas, apesar de apenas ilustrativas da discussão, colocam em evi-
dência que práticas no âmbito das humanidades digitais impactam
no que se refere a pensar o conhecimento coletivamente.

sumário
350
3 POSSIBILIDADES NAS
HUMANIDADES DIGITAIS

O surgimento e evolução da cultura digital têm facilitado a abertu-


ra, acesso e democratização do conhecimento e sua produção, no con-
texto digital. Segundo Risam (2018), “[...] a produção de conhecimento
digital está envolvida em uma política de conhecimento da era da infor-
mação que não apenas reproduziu, mas também ampliou os valores
culturais dominantes”. A evolução e o avanço acelerado das tecnologias
excederam muito as expectativas para o futuro da humanidade, o que
abre um desafiante campo de estudos, as “Humanidades Digitais”.

A cultura do digital modificou de maneira significativa as for-


mas como entendemos e interagimos com a realidade. Esse fenô-
meno, sustentado pelos avanços e desenvolvimento cada vez mais
acelerado das TICs, tem modificado as formas de comunicação, as
formas de relacionamento social e até a forma de construção e geren-
ciamento de conhecimento, tendo a web como seu principal aliado
nessa desconstrução do tradicional. Nesse sentido, Llanes-Padrón e
Jorente (2017, p. 104, tradução nossa) afirmam que
As formas hipertextuais de apresentação da informação inter-
ferem na estética das interações e abrem novos conhecimen-
tos em um redesenho (representação) da cultura. Com isso, as
representações modificadas por essa estética – vinculadas à
mídia web – e utilizadas como meio de difusão de informações e
conhecimentos de muitos para muitos – criam novos mapas de
contatos na rede de percepções e na cognição dos indivíduos.

O desenvolvimento e aperfeiçoamento de tecnologias voltadas


para a organização, representação, visualização, acesso e apropriação
da informação lançaram novas formas de pesquisa nas ditas ciências
humanas e sociais, cobrando novas abordagens teórico-metodológi-
cas, que acabaram produzindo um modelo interpretável e interativo de

sumário
351
uso, posse e apropriação do conhecimento. Segundo Pimenta (2020,
p. 7-8) “[...] os recursos digitais tornaram-se ferramenta desejável – e
caminho quase que compulsório para algumas pesquisas – na produ-
ção, na comunicação e na divulgação do conhecimento não somente
para as ciências humanas, mas em todo cenário científico planetário”.

Dessa forma, estudos sobre humanidades digitais, considera-


dos por Albuquerque e Hernández-Quintana (2021, p. 729, tradução
nossa) como “[...] um conjunto de práticas ou uma comunidade de
práticas de pesquisa onde a ligação é o uso de tecnologias digitais.”,
apresentam trabalhos que juntam o conhecimento das áreas das ciên-
cias humanas, sociais, artísticas e linguísticas, sendo abordadas me-
diante o uso de técnicas, métodos e práticas advindas das ciências
computacionais. Segundo Ortega (2013, p.18, tradução nossa),
[...] as Humanidades Digitais podem definir-se como o espaço
de convergência entre ciências da computação, mídia digital e
disciplinas humanísticas na busca de novos modelos interpre-
tativos e novos paradigmas de conhecimento de acordo com as
transformações operadas no seio da sociedade digital.

Por sua vez, autores como Pimenta (2020) declaram que as


humanidades digitais podem ser consideradas um campo transdisci-
plinar, em que podem ser encontradas ações vinculadas às ciências
humanas e sociais, com recursos e práticas oriundos das ciências
computacionais, na busca por respostas aos novos cenários que vêm
se apresentando produto da evolução da humanidade e na forma em
como o digital tem influenciado a produção do conhecimento. Paletta
(2018, p. 2) argumenta que “uma característica distintiva das Huma-
nidades Digitais é o cultivo de uma relação bidirecional entre as hu-
manidades e o digital: o campo emprega tecnologia na pesquisa e
no questionamento de temas humanísticos”. As humanidades digitais,
seguindo a linha de pensamento dos autores acima relacionados, po-
dem ser consideradas um fenômeno interdisciplinar capaz de interligar
e dar abrigo aos novos conhecimentos gerados na busca por soluções

sumário
352
aos problemas das ciências humanas e sociais, produto da inserção
das tecnologias digitais.

Esse tipo de abordagem tem permitido um avanço nas formas


de gerar, disseminar e compartilhar os conhecimentos gerados por
pesquisadores, profissionais e especialistas das diferentes áreas de
conhecimento. Esse cenário se constitui um desafio para os profissio-
nais da informação, visto que, considerando a proximidade existente
entre as humanidades digitais e a Ciência da Informação, entende-se
que “[...] ambas podem ser consideradas ciências interessadas na
informação, como, disciplinas interessadas no estudo do paradigma
da pesquisa científica dos dados” (RÍO RIANDE, 2018, p. 2, tradução
nossa). A forma como se organiza o conhecimento, com o objetivo de
recuperá-lo, disseminá-lo e o torná-lo acessível para a satisfação das
necessidades informacionais da sociedade, precisa de novos olhares,
novos objetivos e novos enfoques epistemológicos, teóricos e práticos.

Nas palavras de Hjørland (2008), o processo de organização


da informação e os sistemas de organização do conhecimento po-
dem ser considerados um domínio de pesquisa, ensino e prática, for-
temente vinculado à Ciência da Informação. Entretanto, sob o olhar
das humanidades digitais, seria necessário entender as pesquisas de
fronteira que permitam a abordagem interdisciplinar, híbrida e, princi-
palmente, de trabalho em equipe, envolvidas no desenvolvimento de
projetos como os descritos na seção anterior, voltados para garantir a
organização, disseminação e acesso ao conhecimento resultado das
atividades do ser humano.

Segundo Golub, Kamal e Vekselius (2021, p. 26, tradução nos-


sa), “[...] o caminho para o avanço das humanidades digitais é um en-
volvimento mais profundo com a disciplina da organização do conhe-
cimento”. Nesse sentido, as autoras ainda ilustram que, considerando
a organização da informação e do conhecimento um dos principais

sumário
353
campos de estudo, tornou-se universal a necessidade cada vez maior
de organizar sistematicamente as informações na era digital.

Esse cenário de profunda transformação nas práticas sociocul-


turais, provocadas pelos avanços tecnológicos a nível global, provo-
ca que projetos como Anti-Slavery Manuscripts e Scribes of the Cairo
Geniza precisem de uma maior atenção em questões vinculadas à
organização do conhecimento, para evitar problemas de sustentabi-
lidade e escalabilidade. Por isso, profissionais, pesquisadores e es-
pecialistas que se dedicam às Humanidades Digitais, acostumados a
encarar problemas como estes, conseguem trabalhar e desempenhar
em plataformas híbridas, juntando o tradicional com as tecnologias, o
especializado com cidadãos comuns.

4 ORGANIZAÇÃO DO CONHECIMENTO
E LINGUAGENS

O exercício de objetificação do conhecimento traz consigo a


possibilidade da manutenção de sua existência temporal e certa per-
manência espacial. No século XX, sedimenta-se o entendimento de
que os estudos da linguagem, combinados à noção de estruturação
do pensamento – ou arquitetura das ideias, como preferia Paul Otlet
– poderiam revelar lógicas de percepção de mundo. Tal abordagem
da filosofia da linguagem, embora não seja única, continua fortemente
concatenada aos estudos da área de Organização do Conhecimento.

Entretanto, os significados, as referencialidades, as nominações


expressivas das emoções, a semiótica e a fenomenologia do discur-
so, as “armadilhas da linguagem”, como registrou Marcondes (2017),
desconhecem a ânsia da existência e permanência. No movimento in-
cessante da língua e das ideias por meio dela expressas, a condição

sumário
354
humana de interpretação tem papel, senão responsabilidade, na cons-
tituição do conhecimento. Para Smiraglia (2014), as palavras fazem
sentido àquele que as emprega e, uma vez socializado, os registros
do conhecimento passam a compor cânones que, para o autor, são
corpora de obras (works, na acepção de Smiraglia) que compõem sig-
nificados culturalmente referenciados.

Nessa discussão, temos como foco os registros do conhe-


cimento, individualmente compreendidos como documentos, mas
que igualmente demonstram “uma impermanência a ser saboreada
pelos seus receptores, volátil segundo a percepção decorrente dos
fins divergentes para os quais podem ser consultados” (SMIRA-
GLIA, 2001, p. 196, tradução nossa). Hjørland (2008) afirma que os
documentos são contextuais e seus significados estão ligados ao
uso para os quais serão empregados.

A partir da diferença entre linguagem (conformação abstrata)


e língua (fenômeno empírico) (MARCONDES, 2017), cabe retomar
Foucault (2020) a respeito da ordem imposta pela estrutura da língua
ao ato cultural do discurso. A língua se conforme como regra de es-
trutura do discurso, mas é preciso atentar-se à sua apropriação social
para a emergência da perspectiva do acontecimento que permeia o
discurso (FOUCAULT, 2020).

A transcrição colaborativa de documentos encontra-se nesse


contexto complexo em que se tem à disposição a estrutura da língua
dos documentos antigos (que pode ser mais ou menos conhecida)
e as possibilidades de interpretação do discurso ali expresso, cujas
especificidades precisam ser desvendadas. Defendemos que o tecido
de significados (BARTHES, 1987) desses documentos precisa ser re-
construído no bojo dialógico entre passado, presente, cultura, estudo,
especificidade, universalidade e engajamento plural.

sumário
355
De fato, não é possível submeter o arcabouço cultural unica-
mente à sua expressão linguística, no entanto, é necessário admitir
que há uma conexão filosófica entre o conhecimento e a linguagem
que o representa, sendo que sua compreensão pode ser inferida a
partir de um âmbito cultural (SMIRAGLIA, 2014). Essa mesma situação
se coloca com relação aos produtos das transcrições. Estes são tam-
bém (novos) documentos, cuja estrutura da língua é empregada para
expressar alguma interpretação.

Trazendo a reflexão para o âmbito mais particular da OC, Szos-


tak (2014) questiona o significado de “universal”, pensando se seriam
várias perspectivas particulares em consenso, se um sistema universal
seria “um lugar para tudo”75 e, em particular, se as realidades digitais
contemporâneas requerem universalidade. A universalidade, então,
descolada da noção de consenso, vem acompanhada da noção de
pluralidade. A participação colaborativa de pessoas no desvelamento
dos discursos de documentos e fragmentos, como nos projetos des-
critos anteriormente, é uma forma de pluralidade que traz desdobra-
mentos importantes para a OC.

Ao sugerirem traduções e termos, as pessoas trazem suas pró-


prias referências para o âmbito do documento e, da colaboração, sur-
gem reconstruções dos significados dos saberes que chegaram até
nós. A partir disso, derivam também reconstruções históricas que confe-
rem certas delimitações às temáticas e aos domínios de conhecimento
ali envolvidos. Sabe-se, na OC, que tanto as estruturas objetivas da so-
ciedade quanto as estruturas subjetivas das relações e do pensamento
humano competem para que se compreenda e se represente um domí-
nio. Sobre a representação, temos o universo dos acontecimentos que
somente o documento, no seu percurso, conhece e temos aquilo que
se torna visível e acessível à análise da perspectiva da OC. Trata-se de
um conhecimento “passado” reconstituído por outros autores/leitores,

75 “a place for everything”

sumário
356
com base nos parâmetros atuais da língua e do entendimento. Guedes,
Moura e Dias (2011) demonstram que o uso da língua é a condição para
o estabelecimento do diálogo (sincrônico ou diacrônico), já que é uma
forma de linguagem pactuada entre os interlocutores.

Trazer à discussão da OC essa variação no entendimento do do-


mínio é se apropriar do que, de fato, as Humanidades Digitais ofere-
cem, ou seja, a vinculação social, humana e teórica da interação cultural.
É importante registrar que reconhecemos as injustiças sociais que ha-
bitam a humanidade e que a representatividade cultural, nos mais di-
versos setores, ainda está longe de ser alcançada de fato. Distante de
qualquer apelo “democrático” em relação à tecnologia e mais distante
ainda de admitir a possibilidade de uma representação plural de forma
acrítica, lançamos essa reflexão com vistas a trazer mais complexidade
à abordagem teórica da OC que, muitas vezes, compreende a noção
de “conceito” como um tipo de fenômeno homogêneo, sendo que os
conceitos têm distintas naturezas (BARROS, CAFÉ, LAPLANTE, 2016).

As teorias socioculturais da OC, identificadas também como


teorias críticas da OC, vêm fundamentando – ainda que sob outros as-
pectos – o foco que trazemos na presente discussão. No que se refere
às metodologias das teorias críticas, Martínez-Ávila, Semidão e Ferreira
(2016, p. 119, tradução nossa) afirmam que “na sua forma mais rica,
combinam elementos/valores éticos, de busca por justiça social, prag-
máticos, a partir da posição e ponto de vista de alguns grupos sociais
que não são considerados por sistemas universais”. Garcia Gutierrez
(2018, p. 56, tradução nossa) clama que “na era da transcultura digital,
a verdade se reduzirá, de fato, à interação de valores, a uma verdade
como processo, como trânsito, como precariedade, como impostura,
como pós-verdade”. No âmbito da Epistemologia Social, os aspectos
culturais aparecem principalmente a partir da ideia de organização so-
cial do conhecimento (VERONEZ JÚNIOR et al., 2021).

sumário
357
Das temáticas que compõem domínios às temáticas abordadas
em documentos, daquilo que será transcrito, traduzido e reconstruído
serão derivadas interpretações de interesse da OC, sendo que as esco-
lhas linguísticas e significativas realizadas pelos colaboradores influen-
ciarão nessas interpretações e na “compreensão dos meandros discur-
sivos próprios ao domínio no qual incide” (MOURA, 2018, p. 122).

No que tange à noção de representação do conhecimento, al-


gumas questões permanecem contemporâneas: As temáticas são de-
finidas pela linguagem do documento? O assunto está na gênese do
documento, no contexto atual, na visão crítica daquele que analisa ou
na revisão contextualizada de seu conteúdo? Está o assunto implicado
na concepção (se não no direito) de escolha daquele que lê? Ron-
deau (2014) demonstra que a Ciência da Informação adota posições
conflitantes sobre essas questões, mas que, no entanto, nunca estão
completamente dissociadas daquele que lê o documento.

É no bojo das humanidades digitais que se pode exercitar um


entendimento fenomenológico das ferramentas tecnológicas que per-
mitem a interseção dessa miríade de possibilidades. Esses projetos
colaborativos permitem que pessoas com diferentes perspectivas
exponham suas interpretações. Se antes a linguagem especializada
dava suporte à compreensão cultural de documentos, agora soma-
-se a isso a valorização de pontos de vista de não especialistas. Para
Moura (2018, p. 128), “ao admitirmos outros contextos e fontes para
corroborar os termos que constituirão as linguagens de indexação, por
exemplo, torna-se possível retirar das sombras do rareamento inúme-
ras temáticas e agendas sociais.”

No fluxo entre os registros trazidos nos documentos e os novos


documentos produzidos como fruto de transcrição e tradução, há, de
fato, interferências culturais que trazem modificações substanciais pela
ótica da terminologia (mais obviamente na tradução) e pela ótica das
relações dos elementos contextuais que caracterizam aquele universo

sumário
358
de conhecimento. Por exemplo: ao estarem disponíveis para acesso, os
documentos transcritos e, portanto, legíveis, tornam-se fontes para re-
conhecimento de domínios de conhecimento, levantamento terminoló-
gico, desenvolvimento de SOCs etc. Nesse contexto, de que domínio se
ocupa a OC, de fato? Do documento histórico ora representado ou da
expressão atualizada daquela representação? A “agenda social” que
dali se desprende corresponde a que universo simbólico e linguístico?
O que a OC organizará ou representará nesse caso? Se, por um lado,
a tecnologia não representa, por si só, o desenvolvimento da área de
OC (como muitas pesquisas fazem parecer especialmente no que se
refere ao desenvolvimento de SOCs e tarefas automatizadas de análise
de informação), por outro lado, a área de OC se desenvolve também no
bojo das reconfigurações sociais, em que novos questionamentos de
temas humanísticos se revelam no emprego da tecnologia.

Pode-se tecer uma aproximação com a teoria da desclassificação


de Garcia Gutiérrez que prevê a desconstrução das referências hegemô-
nicas fundamentais de visão de mundo. Para o autor, “desclassificação
é um sistema aberto que instala pluralismo lógico no núcleo do enten-
dimento e processos de enunciação, através de ferramentas metacog-
nitivas”. (GARCIA GUTIÉRREZ, 2011, p. 5, tradução nossa). A partir do
momento em que as referências culturais acabam se tornando preceitos
que guiam a estruturação hierárquica de conhecimentos (LARA; MEN-
DES, 2017), a participação colaborativa pode tecer gatilhos de desclas-
sificação dado que as bases culturais seriam, a princípio, mais diversifi-
cadas que o fechamento do âmbito especializado em estudos disso ou
daquilo. Além disso, por meio dos fóruns de discussão das plataformas,
que são públicos, tem-se uma “fagulha” da necessária contrariedade na
construção do conhecimento (GARCIA GUTIÉRREZ, 2011).

Da transcrição, depende grande parte da descrição dos docu-


mentos, causando impactos relevantes para a OC na perspectiva teó-
rica e metodológica. É o caso na seleção e definição de termos e ex-
pressões representativas tanto da cultura trazida no documento quanto

sumário
359
das culturas da atualidade, colocando como elemento de extrema im-
portância a possibilidade de representação coletiva da cultura global.

5 DESDOBRAMENTOS

A partir da reflexão – ainda inicial – exposta no texto, podem-


-se depreender desdobramentos à OC que, com vistas à provocação,
apresentamos a seguir com um pouco mais de objetividade. O primei-
ro impacto diz respeito à construção colaborativa do próprio domínio
de conhecimento e não somente da sua representação. Na sua esfera
ideal e simbólica, as práticas sociais de um contexto passado, quando
ressignificadas em outro contexto, podem gerar uma referência total-
mente nova do que se entende daquela cultura. A partir de linguagens
e interpretações não especializadas, os novos documentos figuram
como os novos registros daquele conhecimento, fazendo-nos perce-
ber a emergência da OC colaborativa.

No caminho da pluralidade, tem-se um desdobramento teórico


que chama a OC a se apropriar do impacto das práticas de transcrição
no seu âmbito de estudo. Nesse sentido, é interessante incluir o tema
da colaboração especialmente nos estudos críticos da OC.

A partir daí, já podemos vislumbrar as humanidades digitais


como potencialidade metodológica para algumas teorias críticas da
OC. Essa perspectiva localiza a estrutura tecnológica no status de
ferramenta para as humanidades na medida em que, a princípio, au-
mentam as chances de visibilidade de diferentes pontos de vista. No
entanto, para além da questão instrumental, as humanidades digitais
fazem também emergir questões sociais importantes para a OC.

Finalmente, sem intenção de esgotar o tema, percebe-se que


existem inúmeras oportunidades na produção e compartilhamento do

sumário
360
conhecimento, a partir da adoção das técnicas, práticas e métodos
propostos nas humanidades digitais, em que a organização do conhe-
cimento ocupa um papel de suma importância, como mostrado nos
projetos acima mencionados, delineando, de forma transparente, uma
parceria entre ambas disciplinas que amplia a transdisciplinaridade e
colaboração, que é defendida no presente trabalho.

6 REFERÊNCIAS
ALBUQUERQUE, Ana Cristina de; QUINTANA, Ania Rosa Hernadez. Sistemas
de organização do conhecimento e humanidades digitais: possíveis interlocu-
ções a partir da abordagem da análise do domínio. In: SILVA, Carlos Guarda-
do da; REVEZ, Jorge; CORUJO, Luís (Eds.). Organização do Conhecimento
no Horizonte 2030: Desenvolvimento Sustentável e Saúde. CONGRESSO
ISKO ESPANHA-PORTUGAL, 5, 2021, Lisboa. Anais [...] Lisboa: Centro de
Estudos Clássicos, Colibri, 2021. Disponível em: https://repositorio.ul.pt/hand-
le/10451/50067. Acesso em: 19 jul. 2022.
ANDRADE, Laura Mariane de; DAL’EVEDOVE, Paula Regina. Aproximações
entre organização do conhecimento e humanidades digitais. In: SILVA, Carlos
Guardado da; REVEZ, Jorge; CORUJO, Luís (Eds.). Organização do Conheci-
mento no Horizonte 2030: Desenvolvimento Sustentável e Saúde. CONGRES-
SO ISKO ESPANHA-PORTUGAL, 5, 2021, Lisboa. Anais [...]. Lisboa: Centro
de Estudos Clássicos, Colibri, 2021. Disponível em: https://repositorio.ul.pt/
handle/10451/50067. Acesso em: 19 jul. 2022
ANTI-SLAVERY MANUSCRIPTS. 2021. Disponível em: https://www.antisla-
verymanuscripts.org/ Acesso em: 19 jul. 2022.
BARROS, Camila Monteiro; CAFÉ, Lígia Maria Arruda; LAPLANTE, Audrey.
Emotional Concepts in Music Knowledge Organization. In: CONGRESSO
ISKO-BRASIL, 14, 2016, Rio de Janeiro. Anais [...]. São Paulo, Baden-Baden
(Alemanha): Verlag, 2016, p. 164, 2016. Disponível em: https://www.nomos-e-
library.de/10.5771/9783956504389/knowledge-organization-for-a-sustainable-
-world-challenges-and-perspectives-for-cultural-scientific-and-technological-
-sharing-in-a-connected-society?page=1 . Acesso em: 19 jul. 2022.
BARTHES, Roland. O prazer do texto. São Paulo: Perspectiva, 1987.

sumário
361
BERWANGER, Ana Regina; LEAL, João Eurípedes Franklin. Noções de pa-
leografia e de diplomática. Santa Maria: Fundação de Apoio a Tecnologia e
Ciência, Editora UFSM, 2020.
FOUCAULT, Michel. A arqueologia do saber. 8. ed. Rio de Janeiro: Forense, 2020.
GARCÍA GUTIÉRREZ, Antonio L. En pedazos: el sentido de la desclasifica-
ción. Madrid: ACCI, 2018.
GARCÍA GUTIÉRREZ, Antonio. Desclassification in knowledge organization: a
post-epistemological essay. TransInformação, Campinas, v. 23, n. 1, p. 5-14,
2011. Disponível em: https://www.scielo.br/j/tinf/a/89vfV6PdSJjGkRMrr56Gqv-
J/?format=pdf&lang=en. Acesso em: 19 jul. 2022.
GOLUB, Koraljka; KAMAL, Ahmad M.; VEKSELIUS, Johan. Knowledge
organisation for digital humanities. In: Golub, K., & Liu, Y.-H. Information
and Knowledge Organisation in Digital Humanities: Global Perspectives.
Routledge, 2021. Disponível em: https://doi.org/10.4324/9781003131816.
Acesso em: 19 jul. 2022.
GUEDES, Roger de Miranda; MOURA, Maria Aparecida; DIAS, Eduardo
José Wense. Indexação social e pensamento dialógico: reflexões teóricas.
Informação e Informação, Londrina, v. 16 n. 3, p. 40 – 59, jul./ ago. 2011.
Disponível em: https://www.uel.br/revistas/uel/index.php/informacao/article/
view/10477/10642. Acesso em: 19 jul. 2022.
HERODOTOU, Christothea; ARISTEIDOU, Maria; MILLER, Grant; BALLARD,
Heidi; ROBINSON, Lucy. What Do We Know about Young Volunteers? An
Exploratory Study of Participation in Zooniverse. Citizen Science: Theory and
Practice, v. 5, n. 1, p. 2, 2020. Disponível em: http://doi.org/10.5334/cstp.248.
Acesso em: 19 jul. 2022.
HJØRLAND, Birger. What is knowledge organization (KO)? Knowledge Organi-
zation, Baden-Baden (Alemanha), v. 35, n. 2-3, p. 86-101, 2008. Disponível em:
https://www.nomos-elibrary.de/10.5771/0943-7444-2008-2-3-86/what-is-knowled-
ge-organization-ko-volume-35-2008-issue-2-3?page=1. Acesso em: 19 jul. 2022.
LARA, Marilda Lopes Ginez de; MENDES, Luciana Corts. Referências socio-
culturais nos Sistemas de Organização do Conhecimento. Iris – Informação,
Memória e Tecnologia, Recife, v. 3, n. especial, p. 26-44, 2014/2017. Dispo-
nível em: https://periodicos.ufpe.br/revistas/IRIS/article/view/236185/28898.
Acesso em: 19 jul. 2022.
LLANES PADRÓN, Dunia; JORENTE, Maria José Vicentini. Complejidad, Repre-
sentación y acceso a la Información archivística en los nuevos contextos para-
digmáticos. In: JORENTE, Maria José Vicentini; PADRÓN, Dunia Ilanes (Orgs).

sumário
362
Una Mirada a la ciencia de la información desde los nuevos contextos
paradigmáticos de la posmodernidad. São Paulo: Cultura Académica, 2017.
MARCONDES, Danilo. As armadilhas da linguagem. Rio de Janeiro: Zahar, 2017.
MARTÍNEZ-ÁVILA, Daniel; SEMIDÃO, Rafael; FERREIRA, Marcio. Methodologi-
cal aspects of critical theories in knowledge organization. Knowledge Organi-
zation, Baden-Baden (Alemanha), v. 43, n. 2, p. 118-125, 2016. Disponível em:
https://repositorio.unesp.br/handle/11449/161468 Acesso em: 19 jul. 2022.
MOURA, Maria Aparecida. Organização social do conhecimento e performativi-
dade de gênero: dispositivos, regimes de saber e relações de poder. Liinc em
Revista, Rio de Janeiro, v. 14, n. 2, p. 118-135, nov. 2018. Disponível em: https://
periodicos.ufpb.br/index.php/pbcib/article/view/46587 . Acesso em: 19 jul. 2022.
ORTEGA, Nuria Rodríguez. Humanidades Digitales, Digital Art History y cul-
tura artística: relaciones y desconexiones. Artnodes, Málaga, n. 13, p. 16-25,
2013. Disponível em: https://www.raco.cat/index.php/Artnodes/article/down-
load/285089/372946. Acesso em: 01 out. 2021.
PALETTA, Francisco Carlos. Ciência da Informação e Humanidades Digitais
– uma reflexão. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA
INFORMAÇÃO (ENANCIB), 19., 2018, Londrina. Anais… Londrina: ANCIB,
2012. Disponível em: https://brapci.inf.br/index.php/res/download/124826.
Acesso em: 01 out. 2021.
PIMENTA, R. M. Por que Humanidades Digitais na Ciência da Informação?
Perspectivas pregressas e futuras de uma prática transdisciplinar comum.
Informação & Sociedade: Estudos, [S. l.], v. 30, n. 2, 2020. DOI: 10.22478/
ufpb.1809-4783.2020v30n2.52122. Disponível em: https://periodicos.ufpb.br/
ojs2/index.php/ies/article/view/52122. Acesso em: 01 out. 2021.
RÍO RIANDE, Gimena del. Humanidades Digitales CAICYT: Las Humanidades
Digitales en la agenda de investigación de las Ciencias de la Información.
8ª JoBiCyT del congreso de ABGRA. 24-26 abr 2018. Disponível em:
doi:10.5281/zenodo.3233995. Acesso em: 15 set. 2021.
RISAM, Roopika. New Digital Worlds: Postcolonial Digital Humanities in
Theory, Praxis, and Pedagogy. Illinois: North-western University Press, 2018.
RONDEAU, Sophie. The life and times of aboutness: a review of the library and in-
formation science literature. Evidence Based Library and Information Practice,
Alberta, v. 9, n.1, p. 14-35, 2014. Disponível em: https://journals.library.ualberta.ca/
eblip/index.php/EBLIP/article/view/19091/16224. Acesso em: 01 out. 2021.

sumário
363
SCRIBES OF THE CAIRO GENIZA. 2021. Disponível em: https://www.scribe-
softhecairogeniza.org/. Acesso em: 05 out. 2021.
SILVA, Ana Margarida Dias da; BORGES, Leonor Calvão. A transcrição e a
leitura de manuscritos entre o crowdsourcing e a participação cidadã. In:
CONGRESSO BAD, 13, Lisboa, 2018. Anais [...]. Lisboa: Associação portu-
guesa de bibliotecários, arquivistas, profissionais da informação e documen-
tação, 2018. Disponível em: https://eg.uc.pt/bitstream/10316/81196/3/A%20
transcri%c3%a7%c3%a3o%20e%20a%20leitura%20de%20manuscritos.pdf.
Acesso em: 18 set. 2021.
SIMPSON, Robert; PAGE, Kevin R.; ROURE, David. Zooniverse: observing the
world’s largest citizen science platform. In: INTERNATIONAL WORLD WIDE
WEB CONFERENCE, 14, Seul, 2014. Anais […]. Seul: International World
Wide Web Committee. https://dl.acm.org/doi/pdf/10.1145/2567948.2579215
SMIRAGLIA, Richard P. The elements of knowledge organization.
Londres: Springer, 2014.
SMIRAGLIA, Richard P. Works as signs, symbols, and canons: the epistemolo-
gy of the work. Knowledge Organization, Baden-Baden (Alemanha), v. 28,
n. 4, p. 192-202, 2001. Disponível em: doi.org/10.5771/0943-7444-2001-4-
192. Acesso em: 01 out. 2021.
SZOSTAK, Rick. How universal is universality? Knowledge Organization, Ba-
den-Baden (Alemanha), v. 41, n. 6, p. 468-470, 2014. Disponível em: https://
www.nomos-elibrary.de/10.5771/0943-7444-2014-6-468/how-universal-is-uni-
versality-volume-41-2014-issue-6?page=1. Acesso em: 30 set. 2021.
VERONEZ JÚNIOR, Wilson Roberto; ALMEIDA, Carlos Cândido de; MARTÍ-
NEZ-ÁVILA, Daniel; RODRIGUEZ, Sonia Maria Troitiño. Epistemologia social
e organização do conhecimento: contribuições as abordagens culturais. In:
SILVA, Carlos Guardado da; REVEZ, Jorge; CORUJO, Luís (Eds.). Organi-
zação do Conhecimento no Horizonte 2030: Desenvolvimento Sustentável e
Saúde. CONGRESSO ISKO ESPANHA-PORTUGAL, 5, 2021, Lisboa. Anais
[...]. Lisboa: Centro de Estudos Clássicos, Colibri, 2021. https://repositorio.
ul.pt/handle/10451/50067
ZOONIVERSE. S.l., 2021. Página inicial. Disponível em: https://www.zooniver-
se.org/. Acesso em: 19 jul. 2022.

sumário
364
13
Capítulo 13

O software Thesa como SOC


no contexto arquivístico: uma
proposta de modelo teórico

Thesa software as SOC in the


archival context: a proposal
for a theoretical model
Adriana Carla Ribeiro dos Santos

Raí Rocha Costa


Adriana Carla Ribeiro dos Santos
Marcos Oliveira da Costa
Raí Rocha Costa

O software Thesa como SOC


Marcos Oliveira da Costa

no contexto arquivístico:
uma proposta
de modelo teórico

Thesa software as SOC


in the archival context
a proposal for
a theoretical mode

DOI: 10.31560/pimentacultural/2022.95613.13
Resumo:
Esta pesquisa tem como objetivo desenvolver uma proposta teórica para a
adaptação do software Thesa (Tesauro Semântico Aplicado), aplicando-o para
o contexto dos arquivos, com base no estudo das relações semânticas dos
sistemas de organização do conhecimento (SOC). Entende-se como impor-
tante o desenvolvimento deste estudo, pois a problemática do acesso e utili-
zação da informação é um dos fenômenos investigados pela Ciência da Infor-
mação (CI). A utilização da Organização do Conhecimento (OC) por meio de
SOCs como o Thesa é necessária para as instituições de forma geral, e prin-
cipalmente em arquivos, tendo em vista que o controle semântico auxilia em
uma melhor recuperação da informação no âmbito destes. O estudo define-se
como pesquisa exploratória, quanto a abordagem do problema, configura-se
como qualitativa e, para discutir os marcos teóricos da área e aplicá-los a rea-
lidade que será estudada, o instrumento de coleta de dados foi o bibliográfico.
Por fim, baseando-se nos dados que foram demonstrados, identificou-se as
funcionalidades do Thesa e apontou-se o este como um possível SOC eficaz
no processo de organização do conhecimento arquivístico.

Palavras-Chave: Organização do conhecimento; sistema de organização do


conhecimento; Thesa; arquivos.

sumário
366
Abstract:
This research aims to develop a theoretical proposal for the adaptation of Thesa
(Applied Semantic Thesaurus) software, applying it to the context of archives,
based on the study of the semantic relationships of knowledge organization sys-
tems (SOC), it is understood the development of this study is important, as the
issue of access and use of information is one of the phenomena investigated by
Information Science (CI). The use of the Knowledge Organization (CO) through
SOCS such as Thesa is necessary for institutions in general, and especially in
archives, considering that semantic control helps in a better information retrieval
in their scope. The study is defined as exploratory research, as the approach
to the problem is configured as qualitative and to discuss the theoretical fra-
meworks of the area and apply them to the reality that will be studied, the data
collection instrument was the bibliographic. Finally, based on the data that were
demonstrated, the functionalities of Thesa were identified and it was pointed out
as a possible SOC effective in the process of organizing archival knowledge.

Keywords: Knowledge organization; knowledge organization system; Thesa;


archives.

sumário
367
1 INTRODUÇÃO

Os estudos sobre Organização do Conhecimento (OC) expan-


dem-se cada vez que surgem novas discussões sobre a sistematiza-
ção e organização da informação para promover a ação do conheci-
mento. Nesse processo, acabamos encontrando com a Organização
e Recuperação da Informação Arquivística (ORIA), um campo ainda
pouco explorado e estudado que surge com as iniciativas de siste-
matização e organização da informação em arquivo. Na arquivologia,
o objeto de estudos são as informações orgânicas registradas, em
que seu conteúdo informacional apresenta o processo comunicativo
humano, para, assim, promover o processo comunicativo da informa-
ção arquivística, pensando na padronização da linguagem por meio da
adoção do instrumento terminológico, o tesauro.

Este artigo aborda temas referentes a OC no domínio da arqui-


vologia, propondo uma nova perspectiva para o acesso da informa-
ção arquivística. Objetiva-se desenvolver uma proposta teórica para a
adaptação do software Thesa (Tesauro Semântico Aplicado), aplican-
do-o para o contexto dos arquivos, com base no estudo das relações
semânticas dos sistemas de organização do conhecimento (SOCs).

A justificativa dessa pesquisa está relacionada à importância do


desenvolvimento prático das ações de organização e sistematização
da informação nos arquivos, considerando suas normatizações, pois
a problemática se dá pelo acesso e utilização da informação que é
considerado um dos fenômenos de investigação da Ciência da Infor-
mação (CI). Portanto, para entendermos melhor a influência da OC na
arquivologia, faremos uma contextualização da construção do concei-
to e de sua definição durante os últimos anos, ligado ao SOC – que
são estruturas organizadas que objetivam a construção de padrões
abstratos da realidade, representando os conceitos de um domínio.

sumário
368
Há poucas referências relacionado ao tema de tesauro para o
uso em arquivos na Ciência da Informação. O Thesa foi criado como
um instrumento para a elaboração de tesauros, a fim de reduzir o tra-
balho operacional e priorizar o trabalho cognitivo e conceitual refe-
rente a modelagem do domínio (GABRIEL JUNIOR; LAIPELT, 2017).
Esse software é indispensável para as instituições de forma geral, e,
principalmente, em arquivos, tendo em vista que o controle semântico
auxilia em uma melhor recuperação da informação no âmbito destes.

1.1 METODOLOGIA

No que diz respeito aos aportes metodológicos, essa pesquisa


define-se como de natureza exploratória. De acordo Gil (2002, p. 41),
isso se dá pois esta tem por objetivo “proporcionar maior familiaridade
com o problema, com vistas a torná-lo mais explícito ou a constituir hi-
póteses. Pode-se dizer que estas pesquisas têm como objetivo princi-
pal o aprimoramento de ideias ou a descoberta de intuições”. Levando
em consideração que essa pesquisa tem como problemática central
criar uma proposta teórica (hipótese) para o software Thesa, visando
a sua aplicação em arquivos, entende-se que se enquadra como um
estudo exploratório, uma vez que analisa um objeto que já existe e
pretende criar hipóteses com o objetivo de aprimorar ideias e desco-
bertas, ou seja, é condizente com a definição acima exposta.

 Quanto a abordagem do problema, define-se como qualitativa,


na medida em que analisa os dados de forma comparativa e sistemá-
tica, mas sem a necessidade de se quantificar os resultados por meio
de cálculos e métricas (MINAYO, 2002, p. 22). Esse tipo de abordagem
é importante para pesquisa, pois, para Prodanov e Freitas (2013), o
pesquisador mantém contato direto com a sua “fonte de estudo”, po-
dendo analisá-la e criar hipóteses a partir disso. No caso da pesquisa
em questão, essa abordagem é pertinente, levando em consideração

sumário
369
que os pesquisadores mantiveram contato com o objeto de estudo
(Thesa) e suas funcionalidades básicas, para que se pudesse criar
sugestões sobre a adaptação deste para o universo do arquivo.

No que concerne ao método de coleta de dados, este se deu


por meio de pesquisa bibliográfica. De acordo com Marconi e Laka-
tos (2003), por mais simplório que possa parecer, esse método requer
detalhamento no que concerne a suas fases de elaboração, que vai
desde a coleta dos dados, a seu fichamento análise, comparação com
a realidade que se está investigando e, por fim, a produção textual.

2 ORGANIZAÇÃO DO CONHECIMENTO
E DA INFORMAÇÃO

Para que a informação documental seja entendida, ela precisa


ser apreendida, registrada e armazenadas em sistema de informação,
para, assim, cumprir seu objetivo de recuperação e uso. A organiza-
ção acontece quando reunimos o que conhecemos em uma estrutura
sistematicamente organizada, de forma que possa se representar a
informação. Entende-se o conceito de Organização do Conhecimento
(OC), segundo Dahlberg, como:
A ciência que estrutura e organiza sistematicamente unidades
do conhecimento (conceitos) segundo seus elementos de co-
nhecimento (características) inerentes e a aplicação esses con-
ceitos e classes de conceitos ordenados a objetos/assuntos
(DAHLBERG, 2006, p. 12).

A OC conseguiu se inserir na área da ciência mediante estudos


realizados por pesquisadores como Dahlberg e pelos membros da
International Society of Knowledge Organization (ISKO), e, a partir de
1973, decidem reconhecer a OC como área de estudo. Desenhando
cada vez mais a OC, Barité (2001, p. 42-53) apresenta dez princípios

sumário
370
básicos que justificam o status científico e intelectual da Organização
do Conhecimento (OC):

1. o conhecimento é um produto social, uma necessidade social e


um dínamo social;

2. o conhecimento se realiza a partir da informação e ao socializar


se transforma em informação;

3. a estrutura e a comunicação do conhecimento formam um sis-


tema aberto;

4. o conhecimento deve ser organizado para seu melhor aprovei-


tamento individual e social;

5. existem muitas formas possíveis de organizar o conhecimento;

6. toda organização do conhecimento é artificial;

7. o conhecimento registra sempre em documentos, como conjunto


organizado de dados disponíveis, e admite usos indiscriminados;

8. o conhecimento se expressa em conceitos e se organiza me-


diante sistemas de conceitos;

9. os sistemas de conceitos se organizam para fins específicos,


funcionais ou de documentação;

10. as leis que regem a organização de sistemas de conceitos


são uniformes e previsíveis, e se aplicam por igual a qualquer
área disciplinar.

Dessarte, a OC por muitos anos estava presente apenas nas


discussões da biblioteconomia que a viam como uma prática opera-
cional interna das bibliotecas para a classificação bibliográfica, ativi-
dade essa que possui processos em que há criação de instrumentos
para representar conteúdos temático de documentos e por resultado
aumentando a eficácia da recuperação (SILVA, 2021).

sumário
371
Hjørland (2008) comenta sobre atividades que a OC inclui como
descrição de documentos e indexação em bibliotecas, bancos de dados
bibliográficos, arquivos e desenvolvimento de algoritmos de computador
realizados por bibliotecários, arquivistas, especialistas em informação,
especialistas em assuntos e leigos. Institucionalizando essas atividades
em sua organização, Smit (2012), discorre que “para poder cumprir sua
missão, ao selecionar, organizar e disponibilizar a informação, as institui-
ções atribuem um selo de qualidade àquela informação” e, assim, gera
ciclos infinitos de informação. De acordo com Guimarães (2008), um co-
nhecimento que é produzido, registrado, organizado, socializado e apro-
priado, gerará um novo conhecimento que também passará pelo mesmo
movimento, constituindo um fluxo helicoidal de informações infinito.

A aproximação da OC com a Arquivística veio acontecer algum


tempo depois. A arquivística, ainda no século XX, estava se redes-
cobrindo e seus conceitos aprimorando-se. Ao entrar no século XXI,
novos desafios são propostos pelas novas tecnologias de informação
e novas formas de produção documental se estabelecem. O arquivista
da “era da informação” deve estar atento a essas novas construções
que circundam e implementam as atividades arquivísticas, pois novas
teorias chegam para repensar e aprimorar as funções bases da arqui-
vística. Como Terry Cook (1997) comenta:
Na introdução de sua análise sobre a história do pensamento
arquivístico ao longo de um século, retoma que a mudança de
postura do arquivista com relação à intervenção nos proces-
sos de produção e de recuperação do documento demonstra-
ram sua capacidade de compreender a natureza do documen-
to de arquivo, interpretando sua função, estrutura, processo
administrativo e contexto documental, indo além do conteúdo
histórico, alterando, assim, o valor de imparcialidade atribuí-
do ao arquivista e aos documentos de arquivo, por exemplo.
(COOK, 1997, p.19-20, tradução nossa).

Quando o objeto de estudo da arquivologia passou a ser a infor-


mação arquivística e de modo sistematizado, o propósito era organizar
o conhecimento específico produzido e registrado pela sociedade e que

sumário
372
tivesse como como resultado a sua recuperação e o acesso. Diferente
da biblioteconomia, na arquivologia, a organização dos documentos
se estabelece através do contexto, e não do conteúdo, respeitando
sua proveniência e ordem original, que são princípios fundamentais
da arquivística. Assim, as atividades e funções desempenhadas pelo
arquivista se dão quando há o reconhecimento do fundo do arquivo
para operacionalização (ROUSSEAU; COUTURE, 1998, p. 79).

Para poder apresentar ao usuário a informação produzida pelo


fundo, é necessário um conjunto de atividades arquivísticas. Destaca-
mos aqui a classificação e a descrição arquivística, consideradas funções
primordiais para a organização e representação do conhecimento arqui-
vístico. As duas funções são parte de processo intelectual que também
é materializado por meio dos instrumentos de pesquisa resultados dos
processos de representação do conhecimento arquivístico e entendidos
como uma ponte entre o usuário e o documento (TOGNOLI, 2012, p. 89).

Analisando a aplicação dos sistemas e processos de OC sob


o ângulo da arquivística, vemos que a preocupação se dá em cima
do contexto de produção. Evidenciando o contexto de produção do-
cumental, “podemos compreendê-lo enquanto a própria essência da
Arquivologia o que a torna singular dentro da OC”, como explica Silva
(2021, p. 35). Os estudos de vocabulários controlados e a elaboração
de tesauros funcionais, para a Organização do Conhecimento Arquivís-
tico, são introduzidos pelas autoras Alencar e Cervantes:
Verifica-se que o documento de caráter arquivístico encontra
sua razão de existência nas diferentes finalidades funcionais do
órgão produtor. Assim, nota-se que um vocabulário controlado
representando, portanto, as funções, irá ser coerente com o fa-
zer arquivístico, uma vez que, pelo princípio da proveniência, o
caráter norteador para organizar e representar, está no sentido
que originou a ação (ALENCAR; CERVANTES, 2017, p. 02).

Segundo as autoras, a produção desses instrumentos possibi-


lita entender a função que deu origem ao documento, uma estratégia

sumário
373
do acesso à informação. O vocabulário controlado é o instrumento
criado para normalizar os termos e vocábulos que representam as
informações, com a finalidade agilizar a busca e o acesso, o controle
deste tem o objetivo de recuperar e organizar as informações, apri-
morando, assim, o acesso. Para Smit e Kobashi (2003), o vocabulário
controlado é criado para padronizar e facilitar a entrada e a saída de
dados de um sistema de informações, promovendo maior precisão e
eficácia na comunicação entre os usuários e os sistemas de informa-
ções. Então, a apresentação dos termos padronizados representam
uma nova perspectiva para a área arquivística.

3 SISTEMA DE ORGANIZAÇÃO
DO CONHECIMENTO

Os Sistemas de Organização do Conhecimento (SOCs) são ins-


trumentos de representação do conhecimento que foram estabeleci-
dos pelo Networked Knowledge Organization Systems Working Group,
em uma Conferência da ACM Digital Libraries em 1998, Pittsburgh na
Pennsylvania. O termo (SOC) é do original inglês “Knowledge Organi-
zation System” (KOS). A sigla KOS é aplicada com frequência na litera-
tura, em português, usa-se a sigla SOC. Hjørland (2008) refere-se aos
SOCs como ferramentas que colaboram na interpretação da Organiza-
da do Conhecimento, conhecidas como ferramentas semânticas.

Segundo Hodge (2000), os SOCs são todos os tipos de instrumen-


tos cujo objetivo é organizar a informação e promover a ação do conhe-
cimento, os quais incluem os sistemas de classificação que organizam
materiais, os cabeçalhos de assunto para fornecer o acesso mais detalha-
do, os catálogos que controlam versões variantes de informação, como
nomes geográficos ou nomes de pessoas e outros esquemas, as redes
semânticas, tesauros, taxonomias e ontologias. Como mostra a figura 1:

sumário
374
Figura 1 – SOC

Fonte: Souza et al., (2012).

Assim, organizar a informação é a função de um SOC, por


isso, são denominados como o “coração” dos Sistemas de Recu-
peração da Informação (SRI) de museus, bibliotecas e arquivos,
tanto em ambiente físico quanto na web, segundo Hodge (2000).
Já a classificação de Zeng (2008), apresentada na figura 2, demos-
tra dois grupos separados, ou seja, Listas de Termos e Modelos
do tipo Metadados, que são diferentes das propostas por Hodge e
Souza et al. (2012), que formam um único grupo.

sumário
375
Figura 2 – Os SOCs

Fonte: Zeng, 2008.

Ressalta-se, portanto, que os SOCs são estruturas organizadas


que objetivam a construção de padrão abstratos da realidade, repre-
sentando os conceitos de um domínio. Geralmente as ferramentas se-
mânticas são usadas para o tratamento da informação, possibilitando a
recuperação da informação, em ambiente informatizado ou tradicional.

Na Web Semântica, as ferramentas para desenvolvimento de


SOCs estão se popularizando, principalmente os tradicionais, devido
à necessidade de compartilhamento de padrões orientados por onto-
logias. Atualmente, os sistemas de busca são os principais meios de
localização de informação na web. Porém, há uma certa inconfiabili-
dade nesses resultados de busca, o que significa que nem sempre
encontramos aquilo que realmente desejamos.

sumário
376
3.1 TESAURO APLICADO AO ARQUIVO

A Lei 12.527, de 18 de novembro de 2011, comumente conheci-


da como Lei de Acesso à Informação (LAI), foi promulgada diretamen-
te para regulamentar o acesso à informação no Brasil (BRASIL, 2011).
Para garantir o acesso informação, cabe ressaltar, é fundamental que
os documentos estejam organizados e representados de forma que
possam ser utilizados. No entanto, para que os documentos possam
estar acessíveis aos usuários/pesquisadores, faz-se necessário o uso
de instrumentos que contribuam, consecutivamente, na relação entre
os usuários/pesquisadores e as instituições mantenedoras de arquivos.

Ademais, o processo acelerado dos recursos físicos tem gera-


do uma crescente produção do conhecimento arquivístico, no que diz
respeito ao contexto das Tecnologias de Informação e Comunicação
(TIC). Muito embora, o campo digital seja um ambiente complexo, a
necessidade de representar tal conhecimento com instrumentos termi-
nológicos é imprescindível para o acesso informacional.

Para tanto, os principais instrumentos de organização nos arqui-


vos são o Plano de Classificação e a Tabela de Temporalidade. A partir
dessas funções, o tesauro funcional, o mais apropriado para arquivos,
é desenvolvido levando em conta as atividades que são desempenha-
das pelos arquivos. Assim:
Um tesauro funcional controla o vocabulário que designa a ra-
zão de ser do documento (sua função) e não o que ele contém
(assunto). A sua construção partirá do plano de classificação e
o reordenará. Nunca é demais salientar que um tesauro funcio-
nal não substitui tal plano (SMIT; KOBASHI, 2003, p. 45).

O tesauro é um instrumento de recuperação da informação que


oferece subsídios para o relacionamento entre os termos (hierarquia,
associação e equivalência), uma forma mais detalhada da informação

sumário
377
orgânico-funcional. As relações associativas são aquelas dependentes
dos conceitos, porém, não estabelecem uma super ordenação. Essas
relações são divididas em dois grupos: relação sequencial, que é a
relação extrínseca entre conceitos, que faz referência a objetos que
têm relação de unidade espaço-temporal, como, por exemplo, “cau-
sa-efeito”, “produtor x produto”, “etapas de um processo”; e a relação
pragmática, caracterizada como a relação entre conceitos que podem
ser estabelecidos por conexões temáticas. Segundo Cintra et al. (2002,
p. 54), as relações que não se submetem a uma hierarquia são aquelas
que apresentam uma proximidade espacial ou temporal entre termos,
que não possuem relacionamento hierárquico e nem de equivalência.
Para o controle do vocabulário, as relações de equivalência são usa-
das em uma linguagem documentária, isso porque operam no nível
de sinonímia e da polissemia, assim determinam as remissivas para
conduzir o usuário para os termos preferidos pelo sistema.

Lembrando que, na linguagem natural, vários termos, palavras


ou expressões podem designar uma única ideia ou conceito, porém,
na Linguagem Documentária, apenas uma denominação é selecionada
para designar como descritor. Assim, os outros termos são considerados
como não descritores, tornando-se uma remissiva (GOMES, 1990, p. 47).

Quando se usa a sinonímia na construção de tesauros, verifi-


camos que sinônimos são dois termos que tem a possibilidade fun-
cional de serem trocados um pelo outro. Cintra et al. (2002, p. 77)
destacam que pode “compreender tanto a sinonímia absoluta como a
quase-sinonímia” e falam, ainda, que a sinonímia nas linguagens do-
cumentárias “é de caráter eminentemente preferencial e visa remeter
o usuário de um termo não preferencial, para um termo selecionado
[...]” (CINTRA et al., 2002, p. 77).

Na Arquivologia, o tesauro funcional pode contribuir de várias


formas, respeitando os princípios da área. É produzido na perspecti-
va de funcionamento de índice de termos do plano de classificação;

sumário
378
como índice para encontrar séries documentais a serem eliminadas;
provê pontos de acesso ao usuário, permitindo o uso de sinônimos
ou outros termos não adotados para a terminologia, mas adotado
pelo arquivo; pode ser usado como ferramenta para ajudar o funcio-
nário a encontrar documentos necessários para as tarefas do dia a
dia (SMIT; KOBASHI, 2003, p. 45).

Considerando tais fatores, Smit e Kobashi (2003) destacam que


os tesauros funcionais ofereceram subsídios à Arquivologia no que se
refere ao tratamento da informação, ou seja, existe uma diferença entre
uma informação arquivística e a biblioteconômica, a primeira é avalia-
da por sua função e, a segunda, por seu assunto. Cabe ressaltar que
um quadro de classificação em Arquivo se refere a representação da
estrutura orgânico/funcional do fundo ao qual se aplica, porém, é com-
pletamente diferente, da sua origem, dos sistemas de classificação de
bibliotecas, cujas rubricas representam assuntos. Portanto, a estrutura
de um quadro de classificação em Arquivos possibilita o acesso por
proveniência, não especificamente recuperação.

Com isso, o tesauro tradicional não seria indicado para orga-


nizar arquivos, mas, é possível encontramos tesauros para arquivos,
especificamente os históricos, que privilegiam o conteúdo temático.
Podemos citar: o espanhol Tesauro del Patrimonio Histórico Andaluz,
o inglês United Kingdom Archival Thesaurus (UKAT), e os franceses
Thesaurus W: vocabulaire normalisé pour la description des archives
administratives locales contemporaines e o Archives de Cannes.

Os tesauros citados desenvolvem basicamente três listas: assun-


tos, instituições e localidades geográficas (GIMÉNEZ-CHORNET; ES-
CRIG-GIMÉNEZ, 2011). Porém, tais tesauros, não consideraram a orien-
tação da norma internacional para gestão de arquivos (ISO 15.489), ao
hierarquizarem assuntos e não funções (GIBBONS; SHENTON, 2003). 

sumário
379
A importância de um tesauro aplicado a arquivos está relacionada
ao fato de poder ser modelado a documentos e registros eletrônicos,
tanto quanto aos documentos físicos. Estes são ligados à construção de
estruturas de diretórios nomeadas com as palavras-chave do tesauro,
permitindo que os documentos sejam definidos por metas aos objetivos
da instituição, contribuindo na eficiência e na rapidez da recuperação da
informação (NATIONAL ARCHIVES OF AUSTRALIA, 2003).

3.2 THESA – TESAURO SEMÂNTICO APLICADO

O Thesa é um software gratuito, que funciona em ambiente Web,


e foi desenvolvido como um instrumento para os estudantes de gra-
duação de biblioteconomia na disciplina de Linguagens Documentárias
para a elaboração de tesauros, a fim de reduzir o trabalho operacional
e priorizar o trabalho cognitivo e conceitual referente a modelagem do
domínio (GABRIEL JUNIOR; LAIPELT, 2017). Na versão 0.20.05.18 do
Thesa, é possível criar um número ilimitado de tesauros, ou seja, tem
uma concepção de múltiplos tesauros, e os usuários desses tesauros
podem configurá-lo para uso público ou privado (GABRIEL JUNIOR; LAI-
PELT, 2017). Além do mais, tem como base as normas internacionais de
construção de tesauros da ISO e NISO vigentes, assim como, as diretri-
zes e os requisitos semânticos dos SOCs e da Web Semântica.

A escolha desse software se fez pela sua estrutura, que é ba-


seada na concepção das relações entre os conceitos, ou seja, nele,
o conceito pode ser representado por um termo, uma imagem, um
som, um link ou qualquer outra forma que possa ser explicitada, como
descreve seus produtores. Os organizadores destacam que o Thesa é
um open source (código aberto), podendo ser modificado ou aperfei-
çoado, desde que mantendo os créditos, e, ainda, aceita contribuições
de melhoramentos pela comunidade.

sumário
380
4 O THESA APLICADO
NO CONTEXTO DOS ARQUIVOS

Visto que os tesauros podem ser instrumentos eficazes no pro-


cesso de organização do conhecimento arquivístico de uma institui-
ção, nesse subcapítulo, explana-se sobre a possível utilização deste
por meio do software Thesa. No entanto, sugerem-se pequenas adap-
tações para que esse software trabalhe plenamente com alguns con-
ceitos e tipologias documentais requiridas pela documentação arqui-
vística. Essas “sugestões” fazem-se necessárias, uma vez que o Thesa
não foi pensado, inicialmente, para o ambiente do arquivo, mas, por ter
certa flexibilidade, sua adaptação se torna possível para outras áreas
do conhecimento (GABRIEL JUNIOR; LAIPELT, 2017).

Dessa forma, reforça-se que, para que se elaborassem as su-


gestões em questão, utilizou-se a própria estrutura do Thesa e pensou-
-se, no âmbito desta, as modificações necessárias para que esse soft-
ware comporte, de maneira mais eficaz, a organização de um tesauro
voltado para arquivos. Ainda sobre isso, outro ponto a ser ressaltado
é que, para intuito didático e meramente ilustrativo, foi utilizado uma
série documental do arquivo central da Universidade Federal do Pará
(UFPA)76, relativa aos contratos, acordos e convênios, visando a uma
melhor compreensão da proposta e sugestões feitas nesse trabalho.

A série documental foi escolhida para essa proposta teórica,


para além do atributo didático, por se entender que, para um software
de relações semânticas como o Thesa, ao menos inicialmente, traba-
lhar a proposta baseando-se em uma série documental traria maior fa-
cilidade de compreensão do objetivo dessa pesquisa e se enquadraria
mais nos campos e funcionalidades já existentes no software. Neste

76 Ressalta-se que nenhum dado sigiloso ou delicado foi utilizado na demonstração. Por se
tratar de documentação permanente, muitas das nomenclaturas utilizadas são comuns aos
mais diversos arquivos, sendo usadas aqui como forma de ilustrar didaticamente a proposta.

sumário
381
sentido, um dos pontos iniciais que foi refletido sobre o software, para
uma possível mudança, diz respeito principalmente ao ato da criação
do Tesauro no Thesa. Após uma análise inicial, percebeu-se que, para
melhor atender o âmbito do arquivo, alguns elementos voltados aos
conceitos arquivísticos devem estar presentes no software. Dessa for-
ma, segue-se uma figura para melhor ilustrar tal necessidade:

Figura 3 – Elementos conceituais arquivísticos

Fonte: Elaborado pelos autores (2021).

Nota-se que, para melhor organização do conhecimento arqui-


vístico, é necessário que alguns elementos conceituais da área este-
jam presentes no processo inicial de criação do tesauro no Thesa. São
eles: o produtor da série documental em que se embasará a criação
do Tesauro; a descrição desta instituição produtora; informações como
objetivos, propósitos e finalidade e breve histórico; a seleção do gênero
documental do tesauro que se está organizando, delimitando-se, como
proposta ilustrativa, aos gêneros textuais, audiovisuais/filmográficos,

sumário
382
iconográficos, eletrônicos/informáticos, cartográficos, micrográficos77;
por fim, a descrição de espécie e tipologia documental.

Um aspecto a ser ressaltado é com relação à escolha do gêne-


ro. Os tipos de gêneros documentais apontados por este estudo são
meramente ilustrativos, em um esforço de englobar todos os possíveis
gêneros trabalhados em um arquivo. Cabe ao usuário selecionar o que
melhor se enquadra com a documentação com a qual ele está traba-
lhando na criação do seu tesauro.

Dessarte, após análise, no que concerne ainda ao processo de cria-


ção de um tesauro voltado para arquivo no âmbito do Thesa, no que diz res-
peito às funcionalidades práticas e posições dos campos sugeridos para
o software, identificou-se três mecanismos importantes a serem inseridos
neste, baseado no esquema conceitual apontado anteriormente, o quais
seriam: finalidade, gênero, espécie/tipologia. Para melhor compreensão da
disposição desses dados no software, segue uma imagem ilustrativa:

Figura 4 – Modelo teórico de metadados para o THESA

Fonte: Elaborado pelos autores, 2021.

77 Ressalta-se que, atualmente, seja provável que o Thesa não comporte todos os gêneros docu-
mentais citados. Uma saída para o criador do tesauro, caso isso ocorra, seria a criação de links
que redirecionem o usuário para o arquivo armazenado em um serviço de nuvem, por exemplo.

sumário
383
Nota-se, de acordo com o modelo acima, que poderiam ser in-
seridos no software três campos obrigatórios no momento da criação
do tesauro, seguindo a ordem mostrada na figura 4, em que a opção
“finalidade” seria a primeira a ser selecionada, antes mesmo do cam-
po já existente no Thesa, “nome do tesauro”. Sendo assim, o usuário
escolheria qual o propósito da criação do seu tesauro, ou seja, sua
finalidade, tendo duas opções: 1) tesauro voltado para arquivo; ou
a opção convencional, 2) voltado para a biblioteca. Caso decida-se
pela opção 2, que seria o tesauro convencional, os campos do Thesa
permaneceriam os mesmo sem necessidade de mudanças. Porém,
se o usuário seleciona-se a opção 1, relativa ao tesauro voltado para
documentação arquivística, surgiriam mais dois campos obrigatórios
como forma de metadados da opção 1: o campo gênero que, na
estrutura de edição/criação do Thesa, encontrar-se-ia logo após o
campo da metodologia, o qual estaria na forma de campo-seleção,
em que o usuário selecionaria por meio de seu cursor a opção de
gênero (opções essas citadas anteriormente) que mais se enquadre
em sua documentação; após isso, outro campo que se encontraria
logo depois do campo de gênero documental seria o de espécie/tipo-
logia, o qual estaria no formato descritivo, ou seja, em caixa de texto,
em que o usuário descreveria quais as espécies e tipologias da série
documental para qual está elaborando seu tesauro. Em vista disso,
observa-se, na figura 5, o aproveitamento dos campos existentes do
Thesa para adaptá-los ao âmbito do arquivo:

sumário
384
Figura 5 – Modelo teórico de preenchimento dos campos Thesa para arquivo

Fonte: página web do software Thesa78, 2021.

Dessa forma, viu-se a necessidade de reaproveitamento dos


campos para sua utilização e sentido no contexto do arquivo. No cam-
po 1, referente ao nome do tesauro, colocar-se-ia o nome da série do-
cumental e do produtor da série em que se baseará a construção do

78 Disponível em: https://www.ufrgs.br/tesauros/index.php/thesa. Acesso em: 05/12/2021.

sumário
385
tesauro; em seguida, no campo 2, alimentar-se-ia com as informações
relativas à instituição produtora da série, como, propósito, breve históri-
co e rápida explanação sobre a série; no campo 3, introdução, far-se-ia
uma apresentação do propósito do tesauro e contextualização deste; no
campo 4, público alvo, e no campo 5, metodologia da criação do tesau-
ro, alimentar-se-ia com dados de acordo com a necessidade do usuário.

Assim, entende-se como necessário demonstrar breve relação


semântica já existentes por meio das funcionalidades do Thesa que
podem auxiliar na organização do conhecimento arquivístico, no âmbi-
to desse software, de acordo com a figura 6:

Figura 6 – Funcionalidades do THESA

Fonte: página web do software Thesa.

Nota-se que o Thesa possui mecanismos que auxiliam na com-


preensão da relação semântica existente entre os termos do tesauro
que se cria. Uma das relações semânticas que podem ser de grande
utilidade no contexto arquivístico é a de Hiperonímia, que diz respeito

sumário
386
à relação hierárquica existente entre os termos, na imagem acima. Isso
fica claro na relação de hiperonímia existente entre o termo “contratos
imobiliários” e o termo “contratos”, em que o segundo seria o termo ge-
ral (TG) dessa série documental e o primeiro seria um termo específico
(TE) da mesma série. Para além disso, existem as possiblidades das
relações associativas, o que viabiliza ao usuário fazer maior gama de
associações entre suas séries documentais, caso necessário. Por fim,
percebe-se que outras duas funcionalidades do Thesa são demasia-
damente úteis no contexto do arquivo: a definição do conceito relacio-
nado ao termo que se alimenta no tesauro; e a possibilidade de inserir
documentos iconográficos, como mostra a figura acima, na qual existe
um exemplo do tipo documental representado pelo termo em questão.

5 CONSIDERAÇÕES FINAIS

Neste capítulo, buscou-se fazer breve explanação sobre os con-


ceitos de sistemas de organização do conhecimento (SOCs) e apon-
tou-se os tesauros, como parte integrante desses sistemas, tendo, com
isso, potencial para auxiliar na organização do conhecimento arquivís-
tico. Dentro desse escopo, identificou-se o Thesa, software voltado à
criação de tesauros, como potencial instrumento auxiliador na criação
de tesauros direcionado à organização do conhecimento arquivístico.

Desse modo, apontou-se as funcionalidades do Thesa e elabo-


rou-se uma proposta teórica de adição de campos e metadados nesse
software para comportar, de maneira mais eficaz, a documentação ar-
quivística. Para tal, descreveu-se também suas funcionalidades atuais e
como estas poderiam contribuir sem necessidade de uma alteração de
grande proporção para a organização da documentação arquivística.

Por fim, ressalta-se que esta proposta teórica é extremamente


delicada, visto que o Thesa foi desenvolvido inicialmente pensando

sumário
387
no contexto da Biblioteconomia, tornando essa proposta um desafio
de adaptação do software para o âmbito da Arquivologia. Entretanto,
espera-se que essa investigação possa servir de base para possíveis
pesquisas relacionadas a essa temática, e que as propostas teóricas
aqui mencionadas possam servir de base para o desenvolvimento de
estudos mais profundos – com relação a semântica e a linguagem de
programação – relativos à eficácia e funcionalidade do Thesa como
software voltado para o conhecimento arquivístico.

6 REFERÊNCIAS
ALENCAR, Maíra Fernandes, e CERVANTES, Brígida Maria Nogueira. Em
Questão, Organização e representação do conhecimento arquivístico:
e busca de um método para construção de um tesauro funcional. Porto
Alegre, v. 25, n. 1, p. 368-389, jan./abr. 2019. Disponível em: http://dx.doi.
org/10.19132/1808-5245251.368-389. Acesso em: 05/12/2021.
BARITÉ, Mário. Organización del Conocimiento: un nuevo marco teórico-
-conceptual en Bibliotecologia y Documentación. In: CARRARA K. (Org.).
Educação, Universidade e pesquisa. Marília: Unesp Marilia, 2001. p. 35-60.
BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Brasília, DF: CGU, 2011.
CINTRA, A. M. M. et al. Para entender as linguagens documentárias. 2. ed.
rev. e ampl. São Paulo: Polis, 2002. 92.
COOK, Terry. 1997. What is past is prologue: a history of archival ideas since
1898, and the Future Paradigm Shift. Archivaria 43, Feb. 1997. p. 19-20.
Disponível em: https://archivaria.ca/index.php/archivaria/article/view/12175.
Acesso em: 05/12/2021.
DAHLBERG, I. Knowledge organization: a new science? Knowledge Organi-
zation, Frankfurt, v. 33, n. 1, p. 11-19, 2006.
GABRIEL JUNIOR, R. F.; LAIPELT, R. C. Thesa: ferramenta para construção
de tesauro semântico aplicado interoperável. Revista P2P e INOVAÇÃO,
v. 3, n. 2, p. 124-145, 2017. Disponível em: 10.21721/p2p.2017v3n2.p124-
145. Acesso em: 10 dez. 2021.

sumário
388
GIBBONS, Paul; SHENTON, Caroline 2003 Implementing a records manage-
ment strategy for the UK Parliament: the experience of using Keyword AAA.
Journal of the Society of Archivists. Acesso em 23/05/2022. Disponível em:
https://www.tandfonline.com/doi/abs/10.1080/0037981032000127016.
GIMÉNEZ-CHORNET, Vincent; ESCRIG-GIMÉNEZ, Mercedes 2011 Designing
a thesaurus to give visibility to the historical archives in Archivo del Reino in
Valencia. Knowledge Organization. Acesso em 23/05/2022. Disponível em:
https://www.isko.org/ko382toc.pdf.
GOMES, Hagar Espanha. Manual de elaboração de tesauros monolíngües.
Programa Nacional de Bibliotecas das Instituições de Ensino Superior, 1990.
GUIMARÃES, J. A. C. A dimensão teórica do tratamento temático da in-
formação e suas interlocuções com o universo científico da International
Society for Knowledge Organization (ISKO). Revista Ibero-americana de
Ciência da Informação, v. 1, n. 1, p. 77-99, 2008.
HJØRLAND, B. What is Knowledge Organization (KO)? Knowledge Organi-
zation, v. 35, n. 2-3, p. 86-101, 2008.
HODGE, G. Systems of knowledge organization for digital libraries:
beyond traditional autority files. Washington, D.C.: The Digital Library Federa-
tion Council on Library Information Resources, 2000.

MARCONI, Maria de Andrade; LAKATOS, Eva Maria. Fundamentos da


metodologia científica. 5. ed. São Paulo: Atlas, 2003.
MINAYO, Maria Cecília de Sousa et al. (Org.). Pesquisa social: teoria, método
e criatividade. 21. ed. Petrópolis: Vozes, 2002.
NATIONAL ARCHIVES OF AUSTRALIA. Developing a Functions Thesaurus:
Guidelines for Commonwealth Agencies, Camberra: National Archives of
Australia, 2003.
PRODANOV, Cleber Cristiano; FREITAS, Ernani Cesar de. Metodologia do
trabalho científico: métodos e técnicas da pesquisa e do trabalho acadêmi-
co. 2. ed. Novo Hamburgo: Editora Feevale, 2013.
DE LIMA, Gercina Ângela. Organização e representação do conhecimento
e da informação na web: teorias e técnicas. Perspectivas em ciência da
informação, p. 57-97, 2020. Disponível em https://periodicos.ufmg.br/index.
php/pci/article/view/22283/17900. Acesso em: 05/12/2021.

sumário
389
SMIT, Johanna W.; KOBASHI, Nair Y. Como elaborar vocabulário contro-
lado para aplicação em arquivos. São Paulo: Imprensa Oficial do Estado
de São Paulo, 2003.
SMIT, J. W. A Informação na ciência da informação. ​InCID​: Revista de Ciência da
Informação​ ​e Documentação,​ ​Ribeirão​ ​Preto,​ ​v.​ ​3,​ ​n.​ ​2,​ ​p.​ ​84-101,​ ​jul./dez.​ ​2012.
SILVA, Amanda Marissa Soares da. A Arquivologia na organização do
conhecimento: uma análise de domínio. 2021. 100 f. Dissertação (Mestrado
em Ciência da Informação) – Programa de Pós-graduação em Ciências da
Informação, Universidade Federal Fluminense. Niterói: Universidade Federal
Fluminense, 2021.
TOGNOLI, Natália Bolfarini. A representação na Arquivística contemporânea.
Revista Ibero-Americana de Ciência da Informação, v. 5, n. 2, p. 79-92, 2012.
ZENG, Marcia Lei. Knowledge organization systems (KOS). KO Knowledge
Organization, v. 35, n. 2-3, p. 160-182, 2008.

sumário
390
14
Capítulo 14

A justiça social
na organização
do conhecimento

Social justice in knowledge


organization

Lucas Andrade Sá Corrêa

Lucas Andrade Sá Corrêa


Natália Bolfarini Tognoli

Natália Bolfarini Tognoli

A justiça social
na organização
do conhecimento
Social justice
in knowledge organization

DOI: 10.31560/pimentacultural/2022.95613.14
Resumo:
Este capítulo tem como objetivo discutir como o tema da justiça social vem
sendo abordado no domínio da Organização do Conhecimento (OC). Para
tanto, adotamos uma abordagem de pesquisa qualitativa e exploratória, que
usa a pesquisa bibliográfica para a coleta de dados associada a uma análise
interpretativa de textos recuperados nas bases Web of Science e EBSCO, com
vistas a identificar os autores que discutem o tema, os subtemas ligados à
justiça social e à OC, os conceitos que os baseiam e as teorias que subsidiam
essas discussões. Os resultados demonstram que as discussões acerca da
justiça social na OC estão inseridas no contexto das teorias críticas, com forte
influência das obras de Berman e Olson. Ao final, recomenda-se uma aproxi-
mação às contribuições da filósofa Nancy Fraser, para quem a justiça social
é vista como paridade de participação, amparada na distribuição e no reco-
nhecimento, fornecendo elementos para um aprofundamento no debate em
direção a uma Organização do Conhecimento crítica como subsídio à justiça
social em arquivos e bibliotecas.

Palavras-Chave: Justiça social; organização do conhecimento crítica; sistemas


de organização do conhecimento hegemônicos.

sumário
392
Abstract:
This chapter aims to discuss how social justice has been addressed in the Kno-
wledge Organization (KO) domain. For this purpose, we adopted a qualitative
and exploratory research approach using bibliographic research for data col-
lection associated with an interpretative analysis of papers from Web of Science
and EBSCO to identify the authors who discuss the subject, the subtopics linked
to social justice and KO, the concepts that underlie them, and the theories that
support these discussions. The results show that the discussions about social
justice in OC are rooted in the context of critical theories, with strong influence
from Berman’s and Olson’s works. In the end, we recommend an approach to
the contributions of the philosopher Nancy Fraser, for whom social justice is
defined as parity of participation, supported by distribution and recognition, pro-
viding elements for a deeper debate towards a critical Knowledge Organization
as a support for social justice in archives and libraries.

Keywords: Social Justice; critical knowledge organization; hegemonic knowledge


organization systems.

sumário
393
1 INTRODUÇÃO

Nas últimas décadas, a Organização do Conhecimento (OC),


especificamente em sua dimensão social e política, tem discutido a
universalidade dos processos de organização do conhecimento, emer-
gindo um conjunto de teorias, práticas e movimentos profissionais que
promovem debates críticos à lógica hegemônica dos sistemas de or-
ganização do conhecimento (SOCs). Esses debates incluem a defesa
da não neutralidade e a crítica à universalidade presentes nos prin-
cipais sistemas de organização do conhecimento, encontrando um
marco teórico na obra de Berman (1971), Prejudices and Antipathies,
e ecoando nos estudos que se seguiram sobre os problemas, precon-
ceitos e desvios no tratamento temático e descritivo nas bibliotecas,
com especial destaque para a obra de Hope Olson.

O tema, embora em debate há pelo menos 40 anos, está longe


de se esgotar e, com o passar do tempo, a confirmação de que os
processos de organização precisam levar em conta a desigualdade
econômica e informacional, o multiculturalismo e a diversidade da so-
ciedade – para além do conteúdo dos documentos e de seu produtor
– se faz cada vez mais presente nas discussões da área. Especifica-
mente, no que toca aos produtos e instrumentos de OC, seja nos arqui-
vos, seja nas bibliotecas, os desafios recaem sobre o reconhecimento
dessas estruturas enquanto construções sociais que, como tal, são
moldadas por um contexto de espaço e tempo que acaba privilegiando
e destacando alguns aspectos, conceitos, pontos de vista e experiên-
cias, enquanto marginaliza ou desloca seu olhar de outros (MAI, 2013).

A importância do reconhecimento dessas estruturas, enquan-


to construções em um contexto de espaço e tempo, encontra fulcro
no olhar sociocognitivo e cultural, destacado, também, a partir da
perspectiva da análise de domínio preconizada na OC por Hjørland e
Albrechtsen (1995), as discussões sobre as comunidades discursivas

sumário
394
envolvidas no domínio. Nesse contexto, considerando a análise de do-
mínio a partir de um viés sociológico-epistemológico, o foco desloca-
-se dos paradigmas físico e cognitivo – com ênfase no objeto e no indi-
víduo – para o paradigma social, enxergando o sujeito contextualizado
em sua relação com o objeto-informação (SMIT, 2012; HJØRLAND,
2002). Assim, é necessário compreender que cada domínio possui ne-
cessidades específicas e que a universalidade deve ser repensada na
construção dos sistemas de organização do conhecimento.

Frequentemente, ao debate da não neutralidade e da crítica à


universalidade nos sistemas de organização do conhecimento, é incor-
porada a discussão sobre a justiça social. Esta é compreendida como
um imperativo ético que se deve buscar nos processos de organização
e representação do conhecimento.

Face ao exposto, o presente trabalho pretende iniciar as refle-


xões sobre como o tema da justiça social vem sendo abordado no do-
mínio da Organização do Conhecimento. Para tanto, realizamos uma
revisão de literatura com vistas a identificar os autores que discutem o
tema, os subtemas ligados à justiça social e à OC, os conceitos que
os baseiam e as teorias que subsidiam essas discussões no âmbi-
to da OC. Cumpre destacar que o trabalho é fruto das discussões e
pesquisas desenvolvidas no âmbito do Grupo de Pesquisa do CNPQ/
UFF, “Arquivos, Bibliotecas e Organização do Conhecimento”, que vem
abordando o tema da justiça social no contexto da organização do
conhecimento na Arquivologia e Biblioteconomia.

Além dessa Introdução, o presente capítulo divide-se em quatro


seções. Na segunda seção, trazemos a metodologia do trabalho, elen-
cando os artigos recuperados e as categorias para análise dos textos.
Na terceira seção, apresentamos dois autores centrais para a discussão
que se pretende trazer nesse trabalho: Sanford Berman, autor de Preju-
dices and Antipathies (1971), e Hope Olson, autora de Power to Name
(2002). A introdução desses autores e de seus respectivos trabalhos é

sumário
395
necessária por eles ocuparem posição central entre as referências dos
artigos analisados. Na quarta seção, debatemos as ideias centrais dos
textos recuperados, relacionando-os e buscando compreender suas
propostas e questões que incidam sobre a justiça social e sua relação
com a OC. Por fim, apresentamos as considerações finais do trabalho.

2 METODOLOGIA

O presente trabalho teórico adota uma abordagem de pesqui-


sa qualitativa e exploratória, que usa a pesquisa bibliográfica para a
coleta de dados associada a uma análise interpretativa, utilizando-se
da técnica do close reading (MCCLENNEN, 2001). O objetivo da apli-
cação dessa técnica é a observação dos fatos e detalhes de um texto
ao “lê-lo mais de perto”.

Assim, para o cumprimento dos objetivos do trabalho, realiza-


mos buscas nas bases de dados Web of Science e EBSCO pelos ter-
mos combinados “knowledge organization” AND “social justice”, em
texto completo. A busca recuperou 73 resultados e, após análise prévia
com base nos critérios preestabelecidos, foram selecionados 21 arti-
gos para leitura e análise.

Em um primeiro momento, foram observadas “[...] todas as ca-


racterísticas marcantes do texto, incluindo os recursos retóricos, os
elementos estruturais, as referências culturais” (KAIN, 1998). Em um
segundo momento, essas observações foram interpretadas utilizando
o raciocínio indutivo com o auxílio da Análise de Conteúdo de Bardin
(2009), isto é, passamos da observação de fatos particulares e de de-
talhes para uma conclusão ou interpretação baseada nas categorias
de análise preestabelecidas.

sumário
396
3 ORGANIZAÇÃO DO CONHECIMENTO
CRÍTICA: AS CONTRIBUIÇÕES
DE SANFORD BERMAN E HOPE OLSON

As origens de uma prática em organização do conhecimento


voltada para a diferença social e preocupada com questões de justi-
ça são encontradas nos trabalhos de Sanford Berman e Hope Olson
(LEAZER; MONTOYA, 2020). Nesses trabalhos, os autores apresentam
uma crítica aos Sistemas de Organização do Conhecimento (SOCs)
hegemônicos a partir da análise da representação (ou da ausência
desta) dos grupos marginalizados.

Berman, considerado o catalogador radical mais conhecido en-


tre os bibliotecários (WATSON, 2020), observou, desde o início de sua
trajetória profissional, influenciado fortemente pela cultura da Guerra
Fria, a centralidade das questões que perpassam problemas da justiça
social, assim como a necessidade de uma biblioteconomia engajada
e compromissada. Em sua obra, Prejudices and Antipathies (1971), o
autor apresenta uma lista de 225 propostas de mudanças, inclusões
e exclusões à Lista de Cabeçalhos de Assunto da Biblioteca do Con-
gresso dos Estados Unidos da América (Library of Congress Subject
Headings), doravante LCSH, publicado e utilizado como referência
desde pelo menos 1909, exercendo uma influência hegemônica, sen-
do usado integralmente ou de forma adaptada em diversos países.
Para o autor, apesar da pretensão de universalidade do LCSH, apenas
um pequeno grupo sentir-se-ia representado pela sua lista: homens
europeus e norte-americanos nacionalistas e brancos, cristãos – espe-
cialmente protestantes – possuidores de rendas média e alta, imbuídos
da glória da civilização ocidental (BERMAN, 1971).

Os princípios que guiaram ou justificaram a reprodução do pen-


samento dessa elite no LCSH foram apresentados por David J. Haykin,

sumário
397
chefe da divisão de Catalogação de Assunto da Biblioteca do Congres-
so, em seu livro, Subject Headings: A Practical Guide. Segundo ele, “o
leitor é o foco de todo princípio e prática de catalogação”, dessa forma
a terminologia é determinada por uma aproximação à provável psico-
logia da maioria dos leitores (HAYKIN, 1951 apud MARSHALL, 1977).

Berman cita, ainda, a resposta de A.C. Foskett às críticas com


relação ao viés racista ou colonialista da LCSH. Segundo ele, esta
teria sido “projetada para o uso em bibliotecas ocidentais” e, por-
tanto, refletiriam “o viés (bias) histórico dessas bibliotecas e de seus
usuários”. A crítica de Berman a essa resposta é importante e será
considerada no conjunto da nossa análise. Para o autor, uma vez
reconhecida a parcialidade, o caráter equivocado e preconceituoso
de alguns termos, estes devem ser substituídos, pois não podem ser
vistos como censuráveis apenas pelas tradições não ocidentais, mas
em qualquer lugar (BERMAN, 1971).

Para Berman, a hegemonia do LCSH não deveria ser ignorada,


pois se é utópico pensar que este poderia se tornar um dia um ins-
trumento desinteressado, seria igualmente utópico acreditar que ele
seria facilmente substituível por uma alternativa ainda não existente
(BERMAN, 1971). Ainda, para ele, mais do que escolher entre o ponto
de vista local ou universal, o bibliotecário ou o catalogador deve res-
ponder à pergunta: “Qual lado você está?” (BERMAN, 1971, p. 16).
Em seu trabalho crítico, orientado “para ampliar, humanizar e simplifi-
car o acesso aos recursos e informações das bibliotecas” (BERMAN;
GROSS, 2017), o autor aconselha os colegas catalogadores a serem
criativos, abandonando a conformidade, exigindo um papel na tomada
de decisões, priorizando a imaginação e a integridade profissional.

Além da sua importância como um dos precursores de uma Bi-


blioteconomia e de uma Organização do Conhecimento orientada para
a justiça social, o trabalho de Berman foi eficiente também do ponto de
vista aplicado. Das 225 sugestões de mudanças apresentadas no livro,

sumário
398
abrangendo questões como raça, nacionalidades, fé, terceiro mundo,
política, classe, trabalho, sexo, mulheres e homens, crianças, entre
outros, 88 – isto é, 39% – foram mudadas quase exatamente como
sugeridos por Berman (KNOWTON, 2005).

Outro importante marco teórico nos estudos de uma Organiza-


ção do Conhecimento crítica, sem o qual muitas instâncias de opres-
são permaneceriam, até hoje, despercebidas (FOX, 2016), é a autora
Hope Olson, professora emérita na School of Information Studies da
Universidade de Wisconsin–Milwaukee. A sua obra influenciou sobre-
maneira os trabalhos encontrados em nossa busca, representando
inovações não apenas nas críticas feitas aos SOCs tradicionais, mas,
também, no instrumental teórico e epistemológico empregado por ela
ao trazer as teorias pós-estruturalistas e feministas para o debate.

Em 2002, Olson publica Power to Name: Locating the Limits of


Subject Representation in Libraries, a sua obra mais celebre e a mais
citada entre os artigos estudados nesse trabalho. O livro traz uma aná-
lise crítica contextualizada de dois autores – Melvil Dewey (1851-1931)
e Charles Cutter (1837-1903) – e de dois instrumentos de referência
hegemônicos na Biblioteconomia e Ciência da Informação: a Classifi-
cação Decimal de Dewey (CDD) e o LCSH.

Em sua obra, Olson (2002) declara ter como objetivo alcançar


tanto os interessados em organização do conhecimento, ou seja, bi-
bliotecários, cientistas da informação, web developers e gestores de
conhecimento, quanto os interessados nos estudos teóricos sobre a
representação, incluindo neste grupo as feministas e os teóricos pós-
-estruturalistas e pós-coloniais interessados nas “construções de signifi-
cado”. Os pressupostos teóricos de Olson estão ancorados nas teorias
pós-estruturalistas e feministas, ocupando lugar central na arquitetura ló-
gica e metodológica de sua obra, a feminista Drucilla Cornell e sua “filo-
sofia do limite”, assim como a sua releitura do método de desconstrução
de Derrida, que dá centralidade ao conceito de iterabilidade e iteração.

sumário
399
A iterabilidade é uma palavra formada pelo latim “iter”, que sig-
nifica “de novo” e o sânscrito “itara”, “outro”. Como conceito, estaria
ligado à característica de se repetir, como essência de uma “existência
absoluta”. Em relação com essa característica, a iteração seria uma
técnica de desconstrução da iterabilidade, negando o caráter universal
pela sua rearticulação em contextos diferentes.

Olson adota a iteração para criticar a noção de “público” im-


plícita nas regras de Cutter. A autora considera que o “público”,
ao qual se destina o catálogo de Cutter, é um “público singular”,
isto é, uma parte da humanidade, separada artificialmente e homo-
geneizada (OLSON, 2002). Nesse contexto, uma vez identificado o
procedimento que cria um “público singular” e exclui o “outro” de
sua lógica, Olson propõe um caminho para o enfrentamento dessa
realidade, recuperando uma imagem proposta por Audre Lorde, a
qual avaliamos ser central não apenas para as contribuições trazi-
das por Olson, mas para o conjunto de problemas enfrentado por
quem busca uma Organização do Conhecimento crítica e orientada
para a justiça social. Para Lorde (2019, p. 137),
“[...] as ferramentas do senhor nunca derrubarão a casa-gran-
de. Elas podem possibilitar que os vençamos em seu próprio
jogo durante certo tempo, mas nunca permitirão que provoque-
mos uma mudança autêntica”.

A resposta de Olson a esse desafio reside em subverter os SOCs


existentes, provocando reformas estruturais na casa-grande, fazendo
dela um espaço permeável às vozes dos excluídos (OLSON, 2002) ao
incorporar uma perspectiva mundana, cotidiana. Entretanto, a autora
parte de uma crítica a qualquer pretensão de universalidade, o que
recoloca o desafio de Lorde sobre a casa e os instrumentos do senhor.

Ao defender que “soluções universais não são viáveis” e que


sacrificam aspectos significativos das culturas locais, Olson propõe a

sumário
400
combinação de ações globais com ações locais. Se seria possível me-
lhorar instrumentos como o LCSH e a CDD e torná-los mais permeáveis
aos grupos marginalizados, a autora conclama os bibliotecários e cata-
logadores locais a assumirem a responsabilidade para o atendimento
dos seus usuários (OLSON, 2002). Dessa forma, se a compreensão das
deficiências do sistema hegemônico nos possibilita desenvolver seus
potenciais (OLSON, 2002), a crítica ao universalismo impõe limites às
propostas globais que abre ao poder de nomear, desde o “local”, como
a estratégia possível para as transformações.

Como veremos, os trabalhos de Berman e Olson podem ser


considerados marcos de uma importante agenda de pesquisa em Or-
ganização do Conhecimento que busca revelar os processos, esco-
lhas, projetos, interesses e disputas. Nestes, escondem-se os termos
e conceitos presentes nos sistemas de organização do conhecimento
globais, os quais frequentemente levam à perda dos significados e
práticas locais a favor de uma universalização e padronização.

Uma breve análise de citação nos textos analisados nos permitiu


identificar os autores Olson e Berman como os mais citados, sendo que
a primeira é mencionada em 18 dos 21 artigos analisados, enquanto
o segundo em 11 deles. Ao compararmos esses dados com aqueles
levantados por Castanha e Wolfran (2018) em um artigo que identificou
os autores mais citados no campo da OC, é possível percebermos
um contraste relevante com relação aos estudos sobre justiça social.
No referido artigo, os autores identificaram Hjørland, Mai e Tennis como
os três autores mais citados na OC, com Olson ocupando a oitava
posição e sem menção a Berman. Em contraposição, no pequeno uni-
verso analisado aqui, Olson e Berman ocupam posição central.

sumário
401
4 A JUSTIÇA SOCIAL NA ORGANIZAÇÃO
DO CONHECIMENTO

Para a análise dos artigos selecionados neste trabalho, utiliza-


mos o método da análise de conteúdo de Bardin (2009). Este consiste
em um conjunto de técnicas de análise das comunicações executada
em três pólos: pré-análise (constituição do corpus e elaboração das
categorias), exploração do material e tratamento dos resultados (infe-
rências e interpretações).

A fase da pré-análise consistiu na escolha do campo empírico


– as bases de dados internacionais – e nas buscas pelos artigos nos
títulos, resumos e palavras-chaves. A fase de formulação das hipóte-
ses e objetivos foi realizada a posteriori, em consonância com Bardin
(1977), que clarifica não ser obrigatória a existência de um corpus de
hipótese para a realização da análise. Segundo Bardin (1977), para a
execução da segunda fase, é necessário proceder-se à constituição de
um corpus, reunindo os documentos a serem submetidos à análise. As
categorias que guiaram a leitura e interpretação dos textos seleciona-
dos foram: 1) natureza do estudo; 2) teoria/epistemologia abordada; 3)
processo de organização do conhecimento; 4) sistema de organização
do conhecimento; 5) conceito de justiça social.

Essa pesquisa é composta por 21 artigos internacionais que


abordam a justiça social em conjunto com a Organização do Conhe-
cimento, recuperados a partir das buscas pelos termos combinados
“social justice” AND “knowledge organization”, nas bases EBSCO e
Web of Science, conforme demonstrado no Quadro 1.

sumário
402
Quadro 1 – Artigos analisados

Periódico e ano
Título Autor
de publicação
Indigenization of knowledge organiza- DOYLE, A. M., LAW- Journal of Library &
tion at the Xwi7xwa library SON, K., & Dupont, S Information Studies, 2015
How Subjects Matter: The Kinsey Ins- Information & Culture, 2017
titute’s Sexual Nomenclature: A
DRUCKER, D. J.
Thesaurus (1976)

Contemplating Co-creator Rights in Ar- Knowledge Organization, 2012


GILLILAND, A. J.
chival Description
“Priorities of Arrangement” or a “Hie- Knowledge Organization, 2016
rarchy of Oppressions?”: Perspectives
FOX, M. J.
on Intersectionality in Knowledge Or-
ganization
Race and Ethnicity in Classification Library Trends, 2018
ADLER M.; HAR-
Systems: Teaching Knowledge Organi-
PER, L. M.
zation from a Social Justice Perspective
Shifting sands and the prophet’s dream: Journal of education
Exploring the future of information orga- SNOW, K. for Library & Informa-
nization education tion Science, 2019
The case for taxonomic reparations ADLER, M. Knowledge Organization, 2016
Methodological aspects of critical theo- MARTINEZ-ÁVILA, Knowledge Organization, 2016
ries in knowledge organization. D.; SEMIDÃO, R;
FERREIRA, M.
The Politics of Knowledge Organization: LEAZER, G. H.; Knowledge Organization, 2020
Introduction to the Special Issue MONTOYA, R.
Knowledge Organization as Knowledge Knowledge Organization, 2019
Creation: Surfacing Community Parti- BAK, G.; ALLARD,
cipation in Archival Arrangement and D.; FERRIS, S.
Description
Dewey Deracialized: A Critical Race- Knowledge Organization, 2007
FURNER, J.
-Theoretic Perspective
Declassifying Knowledge Organization GARCIA GU- Knowledge Organization, 2014
TIERREZ, A.
Classifying for Social Diversity SZOSTAK, R. Knowledge Organization, 2014

sumário
403
Just KOS! Enriching Digital Collections Knowledge Organization, 2020
with Hypertexts to Enhance Accessibi-
THARANI, K.
lity of NonWestern Knowledge Mate-
rials in Libraries
Neoliberalism and Library & Informa- Progressive Libra-
tion Science: Using Karl Polanyi’s Fic- rian, 2014-2015
COPE, J.
titious Commodity as an Alternative to
Neoliberal Conceptions of Information
‘There was Sex but no Sexuality*:’ Criti- Cataloging and Classifi-
cal Cataloging and the Classification of WATSON, B.W. cation Quarterly, 2020
Asexuality in LCSH
Feminism and the Future of Library SADLER, B.; Code-4Lib Journal, 2015
Discovery BOURG, C.
Transcending Library Catalogs: A Com- Journal of web libra-
parative Study of Controlled Terms in rianship, 2009
Library of Congress Subject Headings ADLER, M.
and User-Generated Tags in Library-
Thing for Transgender Books
Transformative praxis – building spaces In the library with the
for Indigenous self-determination in li- THORPE, K. lead Pipe, 2019
braries and archives
Transforming Subject Access: Some South African Journal of
DICK, A.L.; BUR-
Critical Issues for South African Infor- Library & IC, 1995
GER, M.
mation Professionals
A Library Matter of Genocide: The Li- The International Indigenous
brary of Congress and the Historiogra- DUDLEY; M.Q. Policy Journal, 2017
phy of the Native American Holocaust

Fonte: Elaborado pelos autores, 2022.

Dos 21 trabalhos selecionados, 10 foram escritos por autores


vinculados a universidades dos Estados Unidos, 6 do Canadá, 1 da
Espanha, 1 da Alemanha e 1 do Brasil. Os artigos foram publicados
em 12 periódicos diferentes, sendo que apenas um deles se repete,
o Knowledge Organization (KO), no qual estão publicados 10 dos 21
artigos, o que demonstra a grande centralidade desse periódico nos
debates sobre o tema. A única autora que se repete no universo estu-
dado é Melissa Adler, com 3 artigos.

sumário
404
No tocante à natureza do trabalho, dos 21 artigos analisados,
7 são de natureza aplicada (DOYLE, 2015; DRUCKER, 2017; BAK,
ALLARD e FERRIS, 2019; FURNER, 2007; THARANI, 2020; WATSON,
2020; ADLER, 2009). Isso demonstra uma preocupação ainda mais
teórica no âmbito da OC quando tratamos da justiça social.

Sobre as teorias/epistemologias abordadas, 11 trabalhos


(DRUKER, 2017; BAK et al., 2019; WATSON, 2020; ADLER, 2009;
2016; ADLER e HARPER, 2018; FOX, 2016; MARTINÉZ-ÁVILA
et al., 2016; GARCIA GUTIÉRREZ, 2014; SZOSTAK, 2014; SADLER E
BOURG, 2015) trazem discussões que perpassam as questões de gê-
nero e sexualidade. Destes, 6 (DRUKER, 2017; FOX, 2016; ADLER,
2019; 2016; WATSON, 2020; SADLER E BOURG, 2015) tratam especi-
ficamente dessas questões, tendo, nas epistemologias feministas e na
Teoria Queer, seus principais fundamentos teóricos.

Em evidente continuidade com o trabalho de Berman e Olson, o


artigo de Melissa Adler, Transcending Library Catalogs: A Comparative
Study of Controlled Terms in Library of Congress Subject Headings and
User-Generated Tags in LibraryThing for Transgender Books (2009), faz
uma investigação dos termos referentes a temas relacionados a trans-
gêneros, comparando o LCSH e as tags criadas pelos usuários do
site Librarything. A autora inicia citando a proposta de Berman (2008)
de inclusão dos termos “Drag queens” e “Genderqueers” aos LCSH.
Apesar dos seus esforços, até a publicação do artigo, os termos não
haviam sido incluídos. Em contraste com esse fato, a autora chama
a atenção para a existência desses termos na experiência de folkso-
nomia das tags da LibraryThing, em que os usuários catalogam seus
próprios livros. Adler propõe um estudo de caso comparativo entre os
usos do cabeçalho na Worldcat – onde esse termo também existe – e
no Librarything, onde existem e são atribuídos pelos próprios usuá-
rios. Essa comparação é a base principal para a defesa de Adler da

sumário
405
importância do poder de uma comunidade de usuários de nomear
seus próprios “recursos” (ADLER, 2009).

A discussão sobre a inclusão de termos no LCSH e a sua relação


com grupos marginalizados foi estudada também por Watson (2020) ao
discutir a disputa política em torno da tentativa de substituição do termo
imigrante ilegal (ilegal alien) no LCSH. Após um amplo movimento de
diversos setores da sociedade e dos catalogadores radicais, o termo
estava para ser mudado, quando foi impedido pela bancada republi-
cana. O caso gerou o questionamento da deputada democrata Debbie
Wasserman Schultz: Se a Biblioteca do Congresso mudava centenas
de termos por ano sem a interferência do Congresso, “por que este?
Por que agora?” (WATSON, 2016). Watson defende a importância dos
catalogadores críticos (Critical Catalogers), nas leituras dos catálogos
e sistemas de classificação orientada para a justiça social, expondo e
desafiando “as formas como as bibliotecas e a profissão apoiam cons-
ciente e inconscientemente os sistemas de opressão” (WATSON, 2016).

A discussão sobre a organização e representação do conhe-


cimento no contexto dos povos indígenas está presente em 10 artigos
(DOYLE, 2015; GILLILAND, 2012; ADLER, 2016; 2018; MARTINÉZ-ÁVI-
LA et al., 2016; LEAZER E MONTOYA, 2020; BAK et al., 2019; THARANI,
2020, THORPE, 2019; DUDLEY, 2017). Como demonstra Dudley (2017) a
omissão e o eufemismo que marcam o holocausto indígena – no caso es-
tudado, da América do Norte, mas que, certamente, poderia ser genera-
lizado por outros territórios – apontam para o fato de que o imperativo de
conceber e instituir assuntos e classificações para o acesso não é uma
questão de historiografia, mas de justiça social (DUDLEY, 2017, p. 24).

Os “fracassos da teoria e da prática da biblioteca e do arquivo em


apoiar as prioridades indígenas” são o alvo da denúncia do arquivista
indígena australiano, Kirsten Thorpe (THORPE, 2019). Thorpe parte das
suas próprias experiências profissionais para demonstrar o sentimento
de “insegurança cultural” (culturally unsafe) provocada pelos arquivos e

sumário
406
bibliotecas aos usuários e profissionais indígenas. O autor propõe, entre
outras medidas, “uma agenda de pesquisa (…) em parceria com povos
e comunidades indígenas”, reforçando os apelos por participação dos
grupos excluídos presentes em grande parte da bibliografia abordada.

A forma como povos e nações podem ser excluídos ou sub-re-


presentados nos sistemas de organização do conhecimento hegemô-
nicos pode ser verificado também pelo exemplo sul-africano, discuti-
do por Dick e Burger (1995). Os autores demonstram como a busca
por uma “neutralidade” pode omitir e reproduzir relações de poder na
sociedade, colaborando para a exclusão e marginalização de alguns
grupos. O exemplo da inclusão do termo apartheid no LCSH apenas
em 1986, demonstra o quanto os SOCs podem prejudicar e enviesar o
autoconhecimento de um povo.

O racismo, a questão racial e a Teoria Crítica da Raça são temas


abordados em 6 artigos (FOX, 2016; ADLER, 2016; MARTINÉZ-ÁVILA
et al., 2016; LEAZER E MONTOYA, 2020; GARCIA GUTIÉRREZ, 2014;
FURNER, 2007). Destes, em três, é o foco específico (ADLER E HAR-
PER, 2018; ADLER, 2016; FURNER, 2007).

Furner (2007), ao perceber a necessidade do método ontogené-


tico para a compreensão de como a questão racial vem sendo tratada
na Classificação Decimal de Dewey, corrobora com Tennis (2002) so-
bre a necessidade de uma ontogenia dos assuntos. O autor demonstra
como a CDD buscou superar as estruturas racistas do seu sistema por
um processo de desrracialização, embora a erradicação do racismo,
não seja o mesmo que erradicar a termo “raça”. Ao propor a Teoria
Crítica da Raça como fundamento teórico para uma classificação que
não reproduza nem omita as estruturas racistas da sociedade, Furner
defende que é preciso reconhecer a realidade da “raça” como constru-
ção social e o seu papel na manutenção de opressões.

sumário
407
Um movimento parecido é proposto por Fox (2016), partindo
das teorias da interseccionalidade, para lidar com as inter-relações en-
tre opressões e como estas não costumam estar representadas nos
sistemas de classificação. Fox acompanha de perto a abordagem de
Olson e enfatiza a importância das mudanças locais para a solução
de problemas específicos, reduzindo a universalidade e aumentando
o controle local. Fox recupera a metáfora de Audre Lorde e corrobora
com a solução encontrada por Olson: se não há modelo para demolir a
casa-grande, seriam possíveis ainda “sérias redecorações”. O caminho
para isso, partindo do local, seria o de ampliação da participação dos
grupos excluídos nos processos de criação e de tomada de decisão
em temas relacionados a eles. Conceitos produzidos no âmbito dos
debates da interseccionalidade, como o de solipsismo branco (white
solipsism) – isto é, uma incapacidade epistemológica dos brancos de
perceberem o outro – demonstram a necessidade de participação dos
grupos excluídos na crítica e criação de alternativas aos sistemas de
organização do conhecimento hegemônicos (FOX, 2016).

Para além destes, foram recuperados artigos cujos temas en-


globam a decolonialidade e a crítica aos SOCs centrados no ociden-
te e que trazem as teorias críticas para discutir as questões pedagó-
gicas, epistemológicas e conceituais (MARTINÉZ-ÁVILA et al., 2016;
GILLILAND, 2012; SNOW, 2019; LEAZER E MONTOYA, 2020, BAK et
al., 2019; GARCIA GUTIERREZ, 2014; COPE; 2014), sem focar espe-
cificamente em comunidades específicas. Estão presentes, ainda, as
discussões sobre a educação e o ensino em organização do conhe-
cimento voltados para uma perspectiva crítica em todos os níveis de
formação (FOX, 2016; ADLER, 2018; SNOW, 2019).

Adler, a partir de revisão bibliográfica e exemplos de aplicação


em sala de aula, defende importância de discussões sobre diversida-
de, inclusão e justiça social. Para a autora, essas questões não são
apenas importantes em si mesmas, mas também por permitirem “que

sumário
408
os alunos compreendam os aspectos epistemológicos e os fundamen-
tos ontológicos sobre os quais os sistemas de organização do conhe-
cimento se baseiam” (ADLER, 2018, p. 67). Snow (2019), ao discutir as
mudanças no currículo nos cursos de “Organização da Informação”
– a qual a autora aproxima da OC –, defende uma ênfase maior nos
impactos éticos da Organização da Informação, além de uma articu-
lação entre teoria e prática como um elemento importante no ensino
para uma aproximação daqueles que estão atuando na linha de frente.

Além da crítica aos SOCs hegemônicos, parte dos artigos re-


cuperados em nossa busca apresentam estudos de caso discutindo
alternativas locais. Estas, de diferentes formas, pretendem orientar-se
para a justiça social, resolvendo as lacunas e superando os preconcei-
tos percebidos por especialistas e usuários.

Gilliland (2012) defende o conceito de co-produtor (co-creator)


na Arquivologia, a partir do estudo do Aboriginal and Torres Strait Islan-
der Data Archive (ATSIDA). Doyle, Lawson e Dupont (2015) apresentam
um estudo de caso sobre a biblioteca indígena Xwi7xwa Library, pro-
pondo elementos para a indigenização da Organização do Conheci-
mento. Drucker (2017) analisa o tesauro do Instituto Kinsey, o Sexual
Nomenclature, criado na década de 1970. Bak, Allard e Ferris (2019)
examinam dois projetos arquivísticos baseados em experiências co-
munitárias, no Canadá: O Project Naming da Library and Archives Ca-
nada, que trabalha com a comunidade Inuit e o The Sex Work Database
da Universidade de Manitoba, que trabalha com ativistas profissionais
do sexo. Por fim, Tharani (2020) estuda o desenvolvimento de um Sis-
tema de Organização de Conhecimento para garantir a acessibilidade
dos ginans, hinos devocionais dos muçulmanos Ismailis.

No que tange aos processos de organização e representação


do conhecimento abordados nos trabalhos, a classificação é men-
cionada na maioria dos artigos, seguido da catalogação. Sobre os

sumário
409
sistemas de organização do conhecimento, a CDD e o LCSH apare-
cem com mais frequência.

No tocante à última categoria de análise, o conceito de justiça


social, observamos que embora grande parte dos artigos trate da jus-
tiça social a partir do recorte de um ou mais grupos marginalizados,
notadamente nos SOCs, poucos enfrentam explicitamente a questão:
o que é Justiça Social? Os trabalhos são unânimes em considerar que
a justiça social está ligada à inclusão de grupos excluídos e margi-
nalizados, além do consenso ao diagnosticar o fracasso dos SOCs
hegemônicos em produzir justiça social.

Justiça Social é um termo em disputa. Diferentes interesses,


abordagens e autores lhe darão diferentes contornos e definições.
Como nos lembra Furner (2007), apenas a afirmação de estar orientado
para a justiça social não diz muito, já que poucos afirmariam defender
uma posição contrária – a injustiça. Dessa forma, mais que defender
uma Organização do Conhecimento orientada para a justiça social, é
necessário conceituá-la.

Os artigos analisados, em sua maioria, partem da necessidade


de se “historicizar o assunto”, de criticar os termos estabelecidos, de
mapear as classes e demonstrar a não neutralidade das categorias.
Apesar disso, muitas vezes o conceito de justiça social aparece como
dado, sem que ele mesmo seja historicizado, criticado, mapeado.

Podemos nos perguntar se a “centralidade do local”, a influência


do método da desconstrução e a crítica às pretensões de universalida-
de e objetividade não poderiam ter contribuído para a não definição de
um conceito de justiça social. Afinal, a conceituação de justiça social
não poderia apontar para uma teleologia? Para o “ponto de chegada”,
desacreditado por Olson?

Ao analisarmos os únicos dois trabalhos (FURNER, 2007; LEA-


ZER E MONTOYA, 2020) recuperados em nossa busca que discutem

sumário
410
e propõem explicitamente um conceito de justiça social, pretendemos
demonstrar que não há oposição entre a crítica e a sistematização.
Uma dialética entre esses dois polos pode não ser um trabalho fácil,
mas é o desafio posto pelo problema que enfrentamos quando ques-
tionamos os SOCs hegemônicos e seu “universalismo” excludente.

Para Furner (2007) a justiça social é equivalente à justiça distri-


butiva. Isto é, a justiça estaria relacionada à forma como uma socie-
dade distribui bens e serviços, não apenas materiais, mas também
culturais. O autor apresenta duas formas de compreensão da jus-
tiça social (distributiva). A primeira, é a contratualista, fundamenta-
da na clássica obra de John Hawls, Uma Teoria da Justiça (1971).
Nesta, Hawls parte do individualismo metodológico para propor um
modelo em que indivíduos optariam, por um cálculo racional, a en-
trar em um contrato que seria benéfico para todos (FURNER, 2007,
p. 149). As teorias contratualistas, entretanto, poderiam, segundo o
autor, servir como justificativa implícita para situações injustas surgi-
das não por interferência direta do Estado, mas pela relação entre
indivíduos na esfera privada. Dessa forma, o monopólio de bens e
serviços materiais e culturais permaneceria intacto.

Em oposição às teorias contratualistas, Furner apresenta as


teorias comunitárias. Para estas, “uma distribuição justa é aquela que
não viole direitos ou liberdades” de grupos ou comunidades, e seus
membros, em especial aquelas que estão alijadas do poder e/ou são
vítimas de opressão (FURNER, 2007, p. 150). Essa definição de justi-
ça social, ainda segundo o autor, permitir-nos-ia avaliar sistemas de
classificação como “geradores de distribuição de bens conceituais”.
Dessa forma, entendendo cada classe como unidade a ser distribuída
poderíamos nos perguntar, por exemplo, “Quão justo seria alocar, di-
gamos, 70% das subclasses disponíveis da classe principal ‘Religião’
para assuntos relacionados ao cristianismo?” (FURNER, 2007, p. 155).

sumário
411
Leazer e Montoya (2020) partem do trabalho de Berman e Olson
para apontar que as diferenças sociais criticadas por eles nos SOCs
não podem ser reduzidas à questão de distribuição. Os autores adotam
a definição da cientista política Iris Marion Young, para quem a “justiça
social significa a eliminação de dominação e opressão institucionali-
zada” (YOUNG 1990, p.15). Para Young (1990), as teorias distributivas
têm dois problemas principais: elas tendem a focar na distribuição de
bens materiais, “ignorando a estrutura social e o contexto institucio-
nal que muitas vezes ajudam a determinar os padrões distributivos”.
O segundo problema se dá justamente a partir da tentativa de incluir na
teoria distributiva bens sociais imateriais, reduzindo relações e proces-
sos sociais a “coisas” ou mercadorias (YOUNG, 1990, p. 16).

A autora pretende mudar o foco dos padrões distributivos para


processos de participação, em que todas as pessoas tenham direito
e oportunidade de participar, deliberar e tomar decisões em todas as
instituições da vida coletiva da qual fazem parte ou por qual são afeta-
das. Assim, para Young, “a democracia é elemento e condição para a
justiça social” (YOUNG, 1990, p. 91).

A partir da definição de Young, Leazer e Montoya consideram


que a Organização do Conhecimento é ferramenta e produto de he-
gemonia cultural e, ao reproduzir preconceitos e desigualdade sociais,
os sistemas de organização do conhecimento também podem ser-
vir – quando objetos de análises críticas – para revelar o sistema de
relações entre os conceitos que sustentam a dominação e opressão
social. Ao invés de instrumentos neutros de representação, os autores
propõem que os sistemas de organização do conhecimento possam
ser lidos como fonte de evidência do desenvolvimento de conceitos
social e politicamente opressores (LEAZER, MONTOYA, 2020).

Como vimos, poucos trabalhos discutiram o conceito de jus-


tiça social. Apesar disso, em sua crítica aos termos, às classes e à
própria lógica dos SOCs que reproduzem a opressão e a dominação

sumário
412
institucionalizada, os autores apontaram caminhos que não podem ser
ignorados e devem ser incluídos na busca por uma definição de justiça
social para a Organização do Conhecimento.

5 CONSIDERAÇÕES FINAIS

Buscamos, nesse trabalho, analisar a presença da justiça so-


cial na Organização do Conhecimento a partir de um levantamento
bibliográfico em bases de dados internacionais. Para tanto, partimos
em um primeiro momento da compreensão de uma Organização do
Conhecimento crítica que encontra fulcro na obra de dois marcos teó-
ricos, Berman e Olson. Para os autores, a lógica da reprodução dos
preconceitos que mantém o sistema de privilégios da nossa sociedade
nos SOCs hegemônicos está vinculada a uma “provável psicologia do
leitor” e à criação de um “público singular”, abstrato e não condizente
com toda a comunidade de usuários reais e potenciais.

Nos artigos recuperados e analisados aqui, as diversas críticas


e alternativas propostas a esses problemas apontam, cada uma a sua
maneira, para a ampliação da participação dos grupos socialmente
marginalizados na construção, crítica, atualização e adaptação dos
SOCs. Porém, não abordando necessariamente o conceito de justiça
social, mas incorporando-o de forma implícita nas discussões.

Ao discutirmos a compreensão da justiça social como distribui-


ção e como reconhecimento, podemos retomar o conceito de parida-
de de participação de Fraser (2002), segundo o qual todos os mem-
bros de uma sociedade devem interagir entre si como pares. Para a
autora as teorias distributivas não dão conta do conjunto de injustiças
e opressões em nossa sociedade e, consequentemente, não atendem
as demandas dos crescentes e diversificados movimentos sociais.

sumário
413
Por outro lado, a sua mera substituição pelo “reconhecimento” pode
causar uma incompreensão da relação entre a desigualdade econô-
mica e a ausência de justiça social. Ao propor a justiça social como
paridade de participação, Fraser (2002) defende uma distribuição de
recursos materiais que garanta independência e voz para todos, e que
“padrões institucionalizados de valor cultural exprimam igual respeito
por todos os participantes e garantam iguais oportunidades para al-
cançar a consideração social” (FRASER, 2002, p. 13).

Acreditamos que a contribuição de Fraser para um conceito de


justiça social, amparado na distribuição e no reconhecimento, possibili-
te-nos um aprofundamento no debate da construção de uma Organiza-
ção do Conhecimento crítica, orientada para a justiça social, garantindo
uma crítica teórica e a construção de SOCs destinados a uma ampliação
da paridade de participação nos processos de organização do conhe-
cimento em arquivos e bibliotecas. Por fim, ressaltamos que todos os
trabalhos – a partir de diferentes perspectivas teóricas e metodológicas –
corroboram o sentido de buscar maior participação de grupos marginali-
zados como forma de ampliar a justiça social nas bibliotecas e arquivos,
diminuindo vieses, preconceitos e desigualdade informacional.

6 REFERÊNCIAS
ADLER, M. Transcending Library Catalogs: a Comparative Study of Con-
trolled Terms in Library of Congress Subject Headings and User-Generated
Tags in Library Thing for Transgender Books. Journal of Web Librarianship,
v. 3, p. 309–331, 2009.
ADLER, M. The Case for Taxonomic Reparations. Knowledge Organization,
Würzburg: Ergon Verlag, v. 43, n. 8, p. 630-640, 2016. Disponível em: https://
www.ergon-verlag.de/isko_ko/downloads/ko_43_2016_8_f.pdf.
Acesso em: 10 fev. 2022.
ADLER, M; HARPER, L.M. Race and Ethnicity in Classification Systems:
teaching knowledge organization from a social justice perspective. Library
Trends, Baltimore, Johns Hopkins University Press, v. 67, n. 1, p. 52-73, 2018.

sumário
414
BAK, G; ALLARD, D; FERRIS, S. Knowledge Organization as Knowledge
Creation: surfacing community participation in archival arrangement and
description. Knowledge Organization, Würzburg: Ergon Verlag, v. 46, n. 7,
p. 502-521, 2019. Disponível em: www.ergon-verlag.de/isko_ko/downloads/
ko_46_2019_7_b.pdf. Acesso em: 10 fev. 2022.
BARDIN, L. Análise de Conteúdo. Lisboa, Portugal: Edições 70, LDA, 2009.
BERMAN, S. Prejudices and antipathies. Metuchen: Scarecrow Press,
1971. Disponível em: https://www.sanfordberman.org/prejant/prejant.pdf.
Acesso em: 10 fev. 2022.
BERMAN, S; GROSS, T. Expand, Humanize, Simplify: an interview with sandy ber-
man. Cataloging & Classification Quarterly, v. 55, n. 6, p. 347-360, 29 jun. 2017.
COPE, J. Neoliberalism and Library & Information Science: Using Karl Polanyi’s
Fictitious Commodity as an Alternative to Neoliberal Conceptions of Informa-
tion. Progressive Librarian, v. 43, p. 67-80, 2014. Disponível em: http://www.
progressivelibrariansguild.org/PL/PL43/067.pdf. Acesso em: 10 fev. 2022.
DICK, A. L.; BURGER, M. Transforming Subject Access: Some Critical Issues for
South African Information Professionals. In: BERMAN, S.; DANKY, J. (Ed.). Alter-
native Library Literature, 1996–1997. Jefferson: McFarland & Company, 1998.
DOYLE, A. M.; LAWSON, K.; DUPONT, S. Indigenization of Knowledge Organi-
zation at the Xwi7xwa Library. International Journal of Library And Informa-
tion Studies, Vancouver: University Of British Columbia Library, v. 2, n. 13, p.
107-134, dez. 2015. Disponível em: https://open.library.ubc.ca/soa/cIRcle/col-
lections/ubclibraryandarchives/494/items/1.0103204. Acesso em: 10 fev. 2022.
DRUCKER, D. J. How Subjects Matter: the kinsey institute’s sexual nomencla-
ture. Information & Culture: A Journal of History, Austin: University of Texas
Press, v. 52, n. 2, p. 207-228, 2017. Disponível em: https://muse.jhu.edu/arti-
cle/658180. Acesso em: 10 fev. 2022.
DUDLEY, M Q. A Library Matter of Genocide: the library of congress and the
historiography of the native american holocaust. International Indigenous
Policy Journal, v. 8, n. 2, 2017. Disponível em: https://ojs.lib.uwo.ca/index.
php/iipj/article/view/7519/6163. Acesso em: 10 fev. 2022.
FOX, M. J. “Priorities of Arrangement” or a “Hierarchy of Oppressions?”:
perspectives on intersectionality in knowledge organization. Knowledge Or-
ganization, Würzburg: Ergon Verlag, v. 43, n. 5, p. 373-383, 2016. Disponível
em: https://www.ergon-verlag.de/isko_ko/downloads/ko_43_2016_5_h.pdf.
Acesso em: 10 fev. 2022.

sumário
415
FRASER, N. A justiça social na globalização: redistribuição, reconhecimento
e participação. Revista Crítica de Ciências Sociais, n. 63, p. 7-20, 2002. Dis-
ponível em:  https://www.ces.uc.pt/publicacoes/rccs/artigos/63/RCCS63-Nan-
cy%20Fraser-007-020.pdf. Acesso em: 10 fev. 2022.
FURNER, J. Dewey Deracialized: A Critical Race-Theoretic Perspective. Kno-
wledge Organization, Würzburg: Ergon Verlag, v. 34, n. 3, p. 144-168, 2007.
GUTIÉRREZ, A.G. Declassifying Knowledge Organization. Knowledge Or-
ganization, Würzburg: Ergon Verlag, v. 41, n. 5, p. 393-409, 2014. Disponível
em: https://www.ergon-verlag.de/isko_ko/downloads/ko_41_2014_5_g.pdf.
Acesso em: 10 fev. 2022.
GILLILAND, A. J. Contemplating Co-creator Rights in Archival Descrip-
tion. Knowledge Organization, Würzburg: Ergon Verlag, v. 39, n. 5, p.
340-346, 2012. Disponível em: www.ergon-verlag.de/isko_ko/downloads/
ko_39_2012_5_e.pdf. Acesso em: 10 fev. 2022.
HJØRLAND, B.; ALBRECHTSEN, A. Toward a new horizon in Information
Science: Domain-Analysis. Journal of the American Society for Information
Science, v. 46, n. 6, p. 400-25, 1995.
HJØRLAND, B. Epistemology and the socio-cognitive perspective in infor-
mation science. Journal of the American Society for Information Science
and Technology, vol. 53, n. 4, p. 257-270, 2002. Disponível em: https://doi.
org/10.1002/asi.10042.
KAIN, P. How to do a close reading. S.l.: Harvard, 1998. Disponível em:
http://www.fas.harvard.edu/~wricntr/documents/CloseReading.html.
Acesso em: 22 ago. 2012.
LEAZER, G. H.; MONTOYA, R. The Politics of Knowledge Organization:
introduction to the special issue. Knowledge Organization, Würzburg: Ergon
Verlag, v. 47, n. 5, p. 367-371, 2020. Disponível em: https://www.ergon-verlag.
de/isko_ko/downloads/ko_47_2020_5_a.pdf. Acesso em: 10 fev. 2022.
LORDE, A. Irmã outsider: ensaios e conferências. Belo Horizonte: Autêntica, 2019.
MAI, J. E. Ethics, Values and Morality in Contemporary Library Classifications.
Knowledge Organization, v. 40, n. 4, p. 242-253, 2013.
MARSHALL, J. K. On Equal Terms: A Thesaurus for Nonsexist Indexing and
Cataloging, New York: Neal-Schuman, 1977.
MARTINEZ-ÁVILA, D.; SEMIDÃO, R.; FERREIRA, M. Methodological aspects of
critical theories in knowledge organization. Knowledge Organization,

sumário
416
Würzburg: Ergon Verlag, v. 43, n. 2, p. 118-125, 2016. Disponível em: www.ergon-
-verlag.de/isko_ko/downloads/ko_43_2016_2_f.pdf. Acesso em: 10 fev. 2022.
McCLENNEN, S. A. How to do a close reading. S.l.: Personal PSU, 2001.
Disponível em: http://www.personal.psu.edu/users/s/a/sam50/closeread.htm.
Acesso em: 30 jul. 2012.
OLSON, H. A. The power to name: locating the limits or subject representa-
tion in libraries. Dordrecht: Kluwer Academic Publisher, 2002.
SADLER, B.; BOURG, C. Feminism and the Future of Library Discovery.
Code4 Journal, 28, p.1-5, 2015. Disponível em: https://journal.code4lib.org/
articles/10425. Acesso em: 10 fev. 2022.
SMIT, J. W. A informação na Ciência da Informação. InCID: Revista de Ciên-
cia da Informação e Documentação, vol. 3, n. 2, p. 84-101, 2012.
SNOW, K. Shifting sands and the prophet’s dream: Exploring the future of
information organization education. Journal of Library and Information
Science Education, v. 60, n. 2, p. 139-151, 2019.
SZOSTAK, R. Classifying for Social Diversity. Knowledge Organization,
Würzburg: Ergon Verlag, v. 41, n. 2, p. 160-170, 2014. Disponível em:
https://www.ergon-verlag.de/isko_ko/downloads/ko_41_2014_2_g.pdf.
Acesso em: 10 fev. 2022.
THARANI, K. Just KOS! Enriching Digital Collections with Hypertexts to Enhan-
ce Accessibility of Non-Western Knowledge Materials in Libraries. Knowledge
Organization, Würzburg: Ergon Verlag, v. 47, n. 3, p. 220-230, 2020. Dispo-
nível em: www.ergon-verlag.de/isko_ko/downloads/ko_47_2020_3_b.pdf.
Acesso em: 10 fev. 2022.
THORPE, Kristen. Transformative praxis – building spaces for Indigenous
self-determination in libraries and archives – In the Library with the Lead Pipe.
In the Library with the lead pipe: an open access, open peer reviewed jour-
nal, S.l., 23 Jan. 2019. Disponível em: http://www.inthelibrarywiththeleadpipe.
org/2019/transformative-praxis/. Acesso em: 10 fev. 2022.
WATSON, B. M. There was Sex but no Sexuality: critical cataloging and the
classification of asexuality in lcsh. Cataloging & Classification Quarterly,
v. 58, n. 6, p. 547-565, ago. 2020. Disponível em: https://scholarworks.iu.edu/
dspace/handle/2022/25766. Acesso em: 10 fev. 2022.

sumário
417
15
Capítulo 15

Organização do conhecimento e
Arquivologia: diálogos e prospecções

Knowledge organization and Archival


Science: dialogues and prospects

Leolíbia Luana Linden

Leolíbia Luana Linden

Organização
do conhecimento e Arquivologia:
diálogos e prospecções

Knowledge organization
and Archival Science:
dialogues and prospects

DOI: 10.31560/pimentacultural/2022.95613.15
Resumo:
Cada vez mais são desenvolvidas pesquisas que alinham estudos teóricos e
metodológicos da Organização do Conhecimento à Arquivologia, nas quais, é
possível identificar os percursos e os traços da organização e representação
no âmbito dos arquivos. Dessa forma, o presente estudo busca contextualizar
a Organização do Conhecimento e a Arquivologia como áreas autônomas que
possuem diversos aspectos de convergência, analisando os diálogos estabe-
lecidos entre ambas as áreas por meio da análise das funções arquivísticas
de classificação e descrição à luz da organização e representação do conhe-
cimento e da informação. Do mesmo modo, também se busca identificar as
possíveis prospecções para o desenvolvimento de estudos que ampliem as
possibilidades de análise nesse campo de intersecção, para que seja possível
colaborar no avanço das discussões acerca da temática. Justifica-se pelas
possibilidades de avanço teórico e metodológico derivados da aproximação e
interposição de ambas as áreas. Por fim, ressalta-se a necessidade de melhor
explorar as relações interdisciplinares entre Organização do Conhecimento e
Arquivologia colaborando com seu mútuo desenvolvimento.

Palavras-Chave: Arquivologia; organização do conhecimento; representação


em arquivos.

sumário
419
Abstract:
There are more and more academic research that align theoretical and metho-
dological studies on the Knowledge Organization to Archival Science, in which
it is possible to identify the paths and traces of organization and representation
in the context of archives. Thus, this study seeks to contextualize Knowledge
Organization and Archival Science as autonomous areas that have different as-
pects of convergence, analyzing the updated dialogues between both areas
through the analysis of archival functions of classification and description in light
of the organization, representation and knowledge and of information. Likewise,
it also seeks to identify possible prospects for the development of studies that
expand the possibilities of analysis in this field of intersection, so that it is possi-
ble to collaborate in advancing the implications on the subject. The possibilities
for theoretical and methodological advances are justified by the approach and
interposition of both areas. Finally, it emphasizes the need to better explore the
interdisciplinary relationships between Knowledge Organization and Archives,
collaborating with their mutual development.

Keywords: Archival science; knowledge organization; archives representation.

sumário
420
1 INTRODUÇÃO

A Arquivologia, enquanto disciplina científica inserida nas Ciên-


cias Sociais Aplicadas, trabalha e desenvolve-se no Campo da In-
formação (MARQUES, 2011), ou seja, um espaço de interlocuções
entre disciplinas que têm a informação e/ou desdobramentos dela,
na suas mais diversas interpretações e usos, como objeto de estu-
do. Dentre as disciplinas e as áreas que estabelecem esse diálogo
com a Arquivologia, destacamos a Organização do Conhecimento.
Por sua vez, a Organização do Conhecimento (OC) é um campo de
pesquisa, ensino e prática, relacionada à Ciência da Informação, que
se preocupa com a natureza e a qualidade dos processos de organi-
zação do conhecimento, bem como os Sistemas de Organização do
Conhecimento (HJØRLAND, 2008).

As funções arquivísticas de classificação e de descrição, inter-


venções arquivísticas, são pensadas, elaboradas e contribuem para o
desenvolvimento de metodologias que possibilitam facilitar a recupera-
ção da informação. Dessa forma, é possível aproximar a Arquivologia da
Organização do Conhecimento, apropriando-se das metodologias de
tratamento e recuperação da informação e do conhecimento propostas
por esta (BARROS, 2016). Assim, chegamos a um cenário em que a
classificação e descrição arquivística são consideradas processos de
organização e representação do conhecimento e da informação desen-
volvidos nos arquivos (BARROS, 2010; SILVA, 2012; VITAL; MEDEIROS;
BRASCHER, 2017; MARTINS, 2019; BARROS; SOUSA, 2019).

A proposta desse estudo é compreender os diálogos existentes


entre OC e Arquivologia no que tange a concepção da classificação e
da descrição como intervenções que correspondem à organização e re-
presentação do conhecimento e da informação no âmbito dos arquivos.
Procura-se ressaltar as diferentes possibilidades de pesquisa a serem
desenvolvidas que valorizem ainda mais a intersecção entre as áreas.

sumário
421
2 ORGANIZAÇÃO DO CONHECIMENTO
E ARQUIVOLOGIA

2.1 DELINEAMENTOS DA ORGANIZAÇÃO


DO CONHECIMENTO

Pondera-se que o termo OC foi utilizado inicialmente por Henry


Evelyn Bliss, que também concebeu a OC como autônoma no cam-
po científico por meio de suas obras The Organization of Knowledge
and the System of Sciences (1929) e Organization of Knowledge in Li-
braries and the Subject Approach to Books (1933) (DAHLBERG, 1995,
p. 10). Diferente da perspectiva de Bliss que restringia a aplicação do
conceito ao ambiente biblioteconômico, Dahlberg (1993, p. 211) afirma
que a OC é a ciência que sistematiza conceitos de acordo com suas
características. Dessa forma, a autora defende que a teoria do conceito
seria o pressuposto mais importante da fundamentação teórica da OC,
uma vez que esta deve ser sistematizada segundo unidades do conhe-
cimento (conceitos) e seus elementos de conhecimento (característi-
cas). Essa ampliação das possibilidades de aplicação da classificação
e teoria do conceito a outras áreas pode ter posicionado a OC como um
possível novo campo de estudo (SALES, 2015). 

Complementarmente, Bräscher e Café (2008) definem a OC como: 


Delineamos a organização do conhecimento como o pro-
cesso de modelagem do conhecimento que visa a construção
de representações do conhecimento. Esse processo tem por
base a análise do conceito e de suas características para o
estabelecimento da posição que cada conceito ocupa num
determinado domínio, bem como das suas relações com
os demais conceitos que compõem esse sistema nocional
(BRÄSCHER; CAFÉ, 2008, p. 8, grifo nosso). 

sumário
422
Conjugando-se Dahlberg (1993), Sales (2015) e Bräscher e Café
(2008), entendemos que a OC é um campo científico que tem seu cer-
ne na modelagem do conhecimento e cujas bases estão na teoria do
conceito. Ocupa-se em observar os domínios nos quais os conceitos
são utilizados e entrega, para a sociedade, modelos apresentados em
representações do conhecimento. 

Hjørland (2008) afirma que a OC é um campo de pesquisa,


ensino e prática que pode se ocupar de atividades amplas e restri-
tas. Amplas no que diz a respeito à “[...] divisão social do trabalho,
a organização das universidades e outras instituições de pesquisa e
ensino superior, a estrutura das disciplinas e as profissões, a organiza-
ção social dos meios de comunicação, a produção e disseminação do
conhecimento”. Enquanto, no sentido restrito, vincula-se às atividades
específicas que se configuram como técnicas, “[...] como descrição
de documentos, indexação e classificação” (HJØRLAND, 2008, p. 86).

Buscando explorar as ações e produtos, ou, ainda, os modelos (re-


presentações) que são consequências subjacentes a esse processo, Ba-
rité (2001) conceitua amplamente o objeto de estudo e a atuação da OC: 
O objeto de estudo da Organização do conhecimento é – a
nosso juízo – o conhecimento socializado, e como disciplina
dá conta do desenvolvimento de técnicas para a construção,
gestão, uso e avaliação de classificações científicas, taxo-
nomias, nomenclaturas e linguagens documentais. De outra
parte, traz metodologias de uso e recuperação por linguagem
natural (BARITÉ, 2001, p. 41). 

Nessa perspectiva, Dahlberg (1993), Barité (2001), Hjørland


(2008) e Bräscher e Café (2008) nos conduzem à reflexão de que a OC,
para além de uma disciplina científica, protagoniza o desenvolvimento
de metodologias de gestão e organização do conhecimento socializa-
do. Essas metodologias, inerentes à gestão e organização no contexto
da OC, podem ser utilizadas no fomento de diálogos interdisciplinares

sumário
423
entre a OC e a Arquivologia. Diálogos estes que transcendem os as-
pectos teóricos e pousam na perspectiva pragmática. 

Em paralelo da OC, segundo Braschër e Café (2008, p. 8), a Or-


ganização da Informação (OI) é um processo que envolve a descrição
física e de conteúdo dos documentos e tem como produto a repre-
sentação da informação, que compõe os elementos descritivos de um
objeto. Lima e Álvares (2012, p. 35) afirmam que o principal objetivo da
OI é possibilitar a recuperação e o acesso à informação por meio da
estruturação dos elementos de organização do conhecimento.  

Guimarães (2009, p. 106, grifo nosso) pondera que: 


[...] a organização da informação deve ser entendida como um
conjunto de procedimentos que incidem sobre um conhecimento
socializado (que, por sua vez, é um produto social e tem uma uti-
lidade social e individual), os quais variam em virtude dos contex-
tos em que são produzidos ou os fins a que se destinam, pois é a
partir destes que se desenvolvem os parâmetros de organização. 

Sob a égide da OI, a descrição de conteúdo dos documentos


(BRASCHËR; CAFÉ, 2008), visando à recuperação e ao acesso (LIMA;
ALVARES, 2012), apoiada nos elementos entendidos nessa pesquisa
como representações e tendo como objetivo social contribuições (GUI-
MARÃES, 2009) para a sociedade, como um todo, pode ser identifica-
da como um ponto de intersecção com a Arquivologia.  

Svenonius (2000) corrobora com a reflexão anterior, quando in-


dica que, para ser passível de organização, a informação precisa ser
descrita. Uma vez descrita, passa-se a ter um enunciado, que, por
sua vez, representará as propriedades do objeto informacional ou de
suas relações com demais objetos que o identificam. O objetivo de
descrever um documento é comunicá-lo, por meio de uma linguagem
específica, desenvolvida e aplicada de acordo com um conjunto de
preceitos que contemplam determinados atributos.  

sumário
424
Nesse sentido, a organização da informação une os objetos que
apresentam características semelhantes, em relação a seu conteúdo
e formato, aos elementos que os possam descrever (SVENONIUS,
2000). Para o entendimento dessa pesquisa, o termo representação da
informação pode ser entendido como um processo e, também, como
produto(s) dele derivado(s). Nesse sentido, a representação busca es-
tabelecer uma correspondência entre o objeto a ser representado e o
padrão de representação utilizado (YAKEL, 2003). 

Em síntese, a OI compreende a organização de conjuntos de


objetos informacionais estruturados de maneira sistematizada. Já a
OC propõe-se na constituição de modelos de mundo a partir de abstra-
ções da realidade (DAHLBERG, 1993; SVENONIUS, 2000; BRÄSCHER;
CAFÉ, 2008; LIMA & ALVARES, 2012), demonstrados no Quadro 1:   

Quadro 1 – Síntese dos elementos de OI e OC

  ORGANIZAÇÃO ORGANIZAÇÃO
DA INFORMAÇÃO  DO CONHECIMENTO 
CONTEXTO  Objetos físicos  Cognição
PROCESSO  Descrição física e de conteúdo Construção de modelos de mundo
dos objetos informacionais.  que se constituem em abstrações
da realidade a partir de unidades
do pensamento (conceitos). 
MATERIALI-ZAÇÃO  Representação da informa- Representação do conhecimento
ção, conjunto de elementos que reflete, assim, um modelo de
descritivos que representam abstração do mundo real, construí-
os atributos de um objeto do para determinada finalidade. 
informacional específico. 

Fonte: Elaborado pela autora, a partir de Bräscher e Café (2008).

Como resultado dos processos de OC e OI, identificam-se dois


tipos de representação: a Representação do Conhecimento (RC) e a
Representação da Informação (RI), estes, por sua vez, processados
em Sistemas de Organização do Conhecimento (SOCs). Os SOCs são
planejados e desenvolvidos para auxiliar nos procedimentos de gestão

sumário
425
e recuperação do conhecimento registrado, como, por exemplo, tesau-
ros, ontologias e demais instrumentos de controle de vocabulário. Eles
cumprem importante papel de padronização da terminologia adotada
para organização e recuperação de informações, ao delimitar o uso
de termos e definir conceitos (teoria do conceito) e suas relações em
alguma área do conhecimento, de forma compartilhada e consensual
(DAHLBERG, 1993; BRÄSCHER; CARLAN, 2010).  

Barité (2001), em uma visão mais ampla, descreve que, enquan-


to disciplina, a organização do conhecimento desenvolve técnicas
para a construção de representações abstratas da realidade por meio
de seus instrumentos (SOCs), transpondo esse aporte teórico e meto-
dológico a aplicações em unidades de informação. Segundo Hodge
(2000, p. 1, tradução nossa, grifo nosso), os SOCs:
[...] englobam todos os tipos de instrumentos usados para
organizar a informação e promover o gerenciamento do co-
nhecimento. Incluem os esquemas de classificação que or-
ganizam materiais em nível geral (como livros em estantes),
cabeçalhos de assunto que provêm acesso mais detalhado
e listas de autoridade que controlam versões variantes de cha-
ves de acesso à informação (nomes geográficos e nomes de
pessoas). Incluem, ainda, esquemas menos tradicionais, tais
como redes semânticas e ontologias. 

No entendimento do autor, percebe-se a ampliação das apli-


cabilidades de SOC no que tange à organização da informação apli-
cada à Arquivologia, como, na classificação, materializada em seus
esquemas e, na descrição, quando da definição de elementos de
descritivos, por exemplo, pelos cabeçalhos de assunto. Corroboran-
do com esse entendimento, Hodge (2000, p. 1, tradução nossa) assi-
nala que “[...] sistemas de organização do conhecimento são meca-
nismos para organizar informações e, estão no ‘coração’ de todas as
bibliotecas, museus e arquivos.”

sumário
426
Desse modo, os SOCs passam a se tornar um meio de interface
comunicativa entre produtores e utilizadores da informação, por repre-
sentarem, de forma materializada, a organização do conhecimento de
determinada realidade (AGUIAR; KOBASHI, 2013, p. 8). Por meio dos
SOCs, é possível ampliar a compreensão das estruturas abstratas pro-
postas com a finalidade de melhorar os processos de comunicação, pes-
quisa, recuperação da informação e estruturas de modelos conceituais.

2.2 ARQUIVOLOGIA

Uma vez que tudo é social e culturalmente construído no mun-


do pós-moderno, desconstruir e reformular parecem ser a melhor
forma de refletir a diversidade na produção e na organização do co-
nhecimento arquivístico contemporâneo (TOGNOLI, 2012). Por outro
lado, é preciso avançar na teoria e na prática para que a arquivística
possa ter uma cientificidade indiscutível, isto é, a liberação do senso
comum (LOPES, 2009).

O ano de 1789 marcou o início da Idade Contemporânea com a


Revolução Francesa que inaugura um período de garantia de direitos
dos cidadãos. Nesse contexto, surge o primeiro Arquivo Nacional do
mundo, durante a Assembleia Nacional Francesa em 1789. Esse fato
repercutiu em importantes realizações para o campo arquivístico por
meio da criação de uma administração nacional dos arquivos, da pu-
blicidade de acesso aos arquivos e da responsabilidade do Estado em
custodiar esses documentos (SCHELLENBERG, 2006, p. 26).

Em 1922, o inglês Hilary Jenkinson registra, em A manual of ar-


chive administration, as teorias e práticas de arquivo de acordo com
suas experiências. Jenkinson enfatizou o trabalho do arquivista como
guardião de evidências, com a finalidade de tornar o trabalho de outras
pessoas possível. Para Cook (1997), o acúmulo de documentos gerados

sumário
427
pela Primeira Guerra Mundial (1914-1918), além de documentos produ-
zidos durante a Idade Média, possibilitou uma visão diferente daquela
partilhada pelos arquivistas holandeses em relação ao arquivo.

Ainda de acordo com Cook (1997), Jenkinson (1922) preocu-


pou-se em estudar o valor dos documentos de ordem administrativa e,
posteriormente, documentos de valor de prova, enfatizando as carac-
terísticas de organicidade, imparcialidade, unicidade e autenticidade.
Dessa forma, Jenkinson despertou o interesse sobre os problemas de
avaliação documental, que serviram como insumo necessário às teo-
rias norte-americanas relacionadas ao ciclo de vida dos documentos.

Em 1934, é criado o National Archives nos Estados Unidos, por


consequência de situações de sinistros na documentação e influência
da Associação Histórica Americana (SCHELLENBERG, 2006).
[...] os Arquivos Nacionais assumiram a responsabilidade por
10 milhões de metros cúbicos de documentos que haviam
sido acumulados durante um período de 150 anos. Além dis-
so, programas iniciados durante a Grande Depressão resul-
taram em uma expansão dos serviços governamentais e em
um aumento no volume de documentos [...] (STAPLETON,
1983, p. 76, tradução nossa).

A partir das revoluções tecnológicas e sociais na década de 1980,


começa a ser discutida a inclusão da arquivística na área da ciência
da informação (RIBEIRO, 2011). Em 1982, Carol Couture e Jean-Yves
Rosseau publicaram Les archives au XX siècle, em que é proposta uma
arquivística preocupada em integrar tanto as preocupações do arquivo
permanente quanto as atribuídas ao arquivo administrativo:
[...] garantir a unidade e a continuidade das intervenções do ar-
quivista nos documentos de um organismo e permitir assim uma
perspectiva do princípio das três idades e das noções de valor
primário e secundário; permitir a articulação e a estruturação das
atividades arquivísticas numa política de organização de arqui-
vos; integrar o valor primário e o valor secundário numa definição
alargada de arquivo (ROUSSEAU; COUTURE, 1998, p. 70).

sumário
428
Essas intervenções que necessitam de continuidade são espe-
cificadas pelos próprios autores na sistematização das funções arqui-
vísticas, que seriam as atividades norteadoras no contexto do arquivo:
produção/criação, avaliação, classificação, descrição, difusão, preserva-
ção e aquisição. As funções arquivísticas podem ser cumpridas de ma-
neira dinâmica, gradual e até mesmo simultânea, o que abre espaço para
sua interlocução e integração com a Organização do Conhecimento.

3 INTERSECÇÕES ENTRE ORGANIZAÇÃO


DO CONHECIMENTO E ARQUIVOLOGIA

Pesquisas na área de Arquivologia indicam que os estudos teó-


ricos e metodológicos da área de Organização e Representação do
Conhecimento e da Informação são essenciais para o aprofundamento
da Arquivologia e vice e versa. Essas pesquisas aproximam-se cada
vez mais do entendimento das funções de classificação e descrição
arquivística como processos de representação do conhecimento e da
informação (BARROS, 2010; 2016; TOGNOLI, 2012; SILVA, 2012; VI-
TAL; MEDEIROS; BRASCHER, 2017; MARTINS, 2019; BARROS, SOU-
SA, 2019; LEHMKUHL et al., 2019).

Lehmkuhl et al. (2019) confrontam as características dos agru-


pamentos de SOC, sistematizados por Hodge (2000), com as fun-
ções arquivísticas, concluindo que a OC e a Arquivologia possuem
bases metodológicas semelhantes quanto à construção de represen-
tações de domínios de conhecimento e vocabulários, que resultam
em distintos instrumentos, tendo em vista as especificidades de cada
contexto. Assim, os arquivos trabalham com domínios específicos do
conhecimento, apresentando metodologias que também contribuem
com a OC no sentido de abordar as diversidades sociais e políticas
inerentes às atividades humanas. 

sumário
429
Barros (2014), nessa linha, parte do pressuposto de que a
representação vinculada à Arquivologia está baseada nas funções
arquivísticas de classificação e descrição, indicando que o termo
“representação” amplia as possibilidades de compreensão desses
processos. O autor expande a reflexão indicando que 
A compreensão da descrição e classificação enquanto ativi-
dades conjuntas possibilita a existência de relações interdisci-
plinares entre a Arquivística e a Organização do Conhecimento,
possibilitando as primeiras abordagens teórico metodológicas
constituindo um novo momento para a organização de arquivos
e neste universo apropriar-se de metodologias de tratamento
[...] (BARROS, 2016, p. 39-40, grifo nosso). 

Nesse entendimento, abre-se as possibilidades acerca da teoria


e da prática arquivística baseadas nos preceitos advindos da área da
Organização do Conhecimento, dado o entendimento de que as fun-
ções arquivísticas de classificação e descrição são as atividades a se-
rem planejadas e implementadas de maneira conjunta. A partir desse
entendimento, as lentes teóricas dessa análise se calcam respaldadas
pelos autores que se seguem. 

Esteban Navarro (1993) é pontual quando indica que a classifi-


cação e a descrição arquivísticas são operações nas quais ocorrem a
representação do conhecimento e da informação nos arquivos. Tognoli
(2012) assinala que a classificação e a descrição arquivística são a
materialização da representação nos arquivos, sobretudo na definição
da proveniência dos documentos: 
[...] o estudo da proveniência como um pressuposto para a re-
presentação arquivística encontra fulcro não apenas na com-
preensão do conteúdo imediato do documento, mas também
em sua relação com os criadores, as funções e os sistemas
de gerenciamento e manutenção. Mais uma vez, todos os
contextos devem ser representados no momento de classi-
ficação/arranjo e descrição do conhecimento arquivístico
(TOGNOLI, 2012, p. 85, grifo nosso). 

sumário
430
 Tognoli e Barros (2015) buscam evidenciar elementos históricos
e conceituais de classificação e descrição, relacionando-os diretamen-
te com a organização e representação de arquivos: 
A Classificação e a Descrição são atividades nucleares no
processo de organização e representação de arquivos. Esse
conhecimento pode ser entendido como todo conhecimento
gerado a partir das atividades realizadas por pessoas físicas ou
jurídicas e que resultam em informações orgânicas (TOGNOLI;
BARROS, 2015, p. 94, grifo nosso). 

No protagonismo dos instrumentos arquivísticos, as funções ar-


quivísticas da classificação e da descrição, técnicas arquivísticas, são
pensadas, elaboradas e contribuem no desenvolvimento de metodolo-
gias que possibilitam facilitar a recuperação da informação. Dessa forma,
enquanto atividades conjuntas, aproximam a Arquivologia da Organiza-
ção do Conhecimento, apropriando-se das metodologias de tratamento
e recuperação da informação e do conhecimento (BARROS, 2016). 

Freitas (2017) trata da “Classificação Arquivística como Siste-


ma de Organização do Conhecimento” em uma das seções do texto,
apresentando um vasto aprofundamento teórico sobre o tema. Conclui
seu texto afirmando:  
Sendo assim, a classificação arquivística, como um sistema de
organização do conhecimento, objetiva assegurar a proteção e
salvaguarda dos documentos, que servem as estratégias dos
negócios organizacionais, pois o processo de construção das
classificações arquivísticas resulta em uma representação do
universo contextual de uma instituição (FREITAS, 2017, p. 129). 

Segundo Yakel (2003), sobre o processo de representação da


informação aplicado aos arquivos: 
Representação refere-se a ambos os processos arranjo (res-
peitando ou desrespeitando a ordem) e descrição, tais como a
criação de ferramentas de acesso (guias, inventários, instrumen-
tos de pesquisa, bibliografia registros) ou sistemas (catálogos de

sumário
431
cartões, bancos de dados bibliográficos, bancos de dados EAD)
resultantes dessas atividades (YAKEL, 2003, p. 2, grifo nosso). 

Endossando esta discussão, Aguiar e Kobashi (2013) acentuam


que é no exercício das atividades arquivísticas de classificação e de
descrição que é realizada a representação da informação em docu-
mentos de arquivo. As autoras ainda asseguram que, para a organi-
zação e representação da informação arquivística, tem-se como ponto
de partida os princípios de proveniência e da organicidade. 
Destacam-se os conceitos da “proveniência e da organicida-
de” enquanto princípios teórico-conceituais para orientar os
fundamentos metodológicos da Organização e Representação
da Informação Arquivística (ORIA). O princípio da proveniência
vincula e fixa na informação arquivística a estrutura e o contexto
ao seu produtor, já a organicidade reflete a estrutura, funções
e atividades da entidade produtora ou acumuladora (AGUIAR;
KOBASHI, 2013, p. 9). 

Nessa mesma linha, Silva e Moreira (2015) indicam que, dentre


as intervenções arquivísticas, é possível identificar a classificação e a
descrição, expressadas por meio da indexação, como elementos que
se conectam diretamente à OC em sua forma e materialização mais es-
pecífica, por definir de qual maneira o conhecimento será representado
em determinado contexto, por meio de seus processos e instrumentos,
quando por fim socializado. Assim,
A organização do conhecimento se preocupa, em seu sentido
amplo, em identificar como o conhecimento é socialmente or-
ganizado para então desenvolver as práticas de organização do
conhecimento, tais como indexação e classificação, que são o
sentido mais estreito de Organização do Conhecimento (SILVA;
MOREIRA, 2015, p. 2, grifo nosso). 

Silva et al. (2017, p. 51) nos asseguram que, “[...] por repre-
sentarem pontos de intersecção entre as demais ações relacionadas
aos documentos de arquivo, revelando um universo axiológico rico e
diversificado”, as funções arquivísticas de classificação e descrição

sumário
432
são elementarmente indispensáveis e integradas na organização e
representação do conhecimento arquivístico. Barros (2016, p. 35)
complementa explicando que a teoria arquivística começa a ser en-
tendida “como um processo único e contínuo de análise e síntese da
informação contida nos arquivos, ou seja, o processo compreendido
aqui como a representação orgânico-contextual”. 

Vital e Bräscher (2016) buscam identificar as funções de clas-


sificação e descrição arquivísticas no contexto do processo de orga-
nização e representação da informação no âmbito dos arquivos por
meio de suas características. As autoras relacionam a classificação, a
ordenação física e intelectual dos documentos, enquanto a descrição
se ocupa da organização e representação da informação. A classifica-
ção, neste ínterim, em nossa visão, tem resultado na manutenção das
relações entre os documentos, e a descrição resulta na recuperação
das informações contidas nos documentos de arquivo.  

O desenvolvimento de pesquisas e estudos acerca da temá-


tica da descrição arquivística e seus pontos de intersecção interdis-
ciplinar com a área da representação da informação trouxe à área
novas perspectivas teóricas e metodológicas. Para tanto, na visão
de Michael Cook (apud HAGEN, 1998, p. 2), “a descrição tem como
base a teoria da representação”. 

Nesse entendimento, García Marco (1995, p. 110, tradução


nossa) indica que “[...] a descrição documental e arquivística com
designação das tarefas de representação documental para facilitar o
acesso aos fundos de um arquivo tem sido denominada descrição”.
Essa concepção foi ampliada pelos aspectos convergentes nas áreas
de Ciência da Informação e Organização do Conhecimento com a Ar-
quivística e, claro, pelas novas teorias inauguradas pelas abordagens
arquivísticas contemporâneas. 

No âmbito da produção científica nacional, Lehmkuhl et al.


(2019) indicam o crescimento exponencial dos trabalhos publicados

sumário
433
no âmbito da Organização do Conhecimento, no Brasil, por meio de
uma análise nos anais da ISKO Brasil (2012-2015). Estes evidenciam
pontos de convergência e intersecção entre ambas as áreas que
trilham os caminhos da interdisciplinaridade, em um período de as-
censão da produção científica, no qual as temáticas de maior interes-
se têm sido: a) classificação arquivística; b) descrição arquivística; e
c) linguagens documentárias aplicadas aos arquivos. 

Barros (2016) descreve, ao longo de seu estudo, o percurso his-


tórico da classificação e descrição arquivísticas, visando demarcar o
espaço de atuação do processo de representação em arquivos. Indica,
ainda, que a classificação serviria como fundamento para o processo
de representação, enquanto a descrição faria uso das categorias de
classificação para representar os documentos. 

Com isso, Vital, Medeiros e Brascher (2017) buscam alinhar o


processo de organização e representação do conhecimento à classi-
ficação arquivística, assim como o processo de organização e repre-
sentação da informação à descrição arquivística, demonstrado abaixo: 

Quadro 2 – Síntese de organização e representação do


conhecimento e da informação na Arquivologia

ORGANIZAÇÃO  REPRESENTAÇÃO  ARQUIVOLOGIA 


ORGANIZAÇÃO DO REPRESENTAÇÃO DO CLASSIFICAÇÃO
CONHECIMENTO  CONHECIMENTO  ARQUIVÍSTICA 

ORGANIZAÇÃO REPRESENTAÇÃO DA DESCRIÇÃO ARQUIVÍSTICA 


DA INFORMAÇÃO  INFORMAÇÃO 

Fonte: Vital et al., 2017.

Dessa maneira, identificamos que a função de classificação


arquivística está contida na organização do conhecimento e da infor-
mação, visando construir classes por meio da análise das funções,
atividades e estrutura organizacional, ou seja, conhecimento con-
textual. Do mesmo modo, a descrição arquivística está contida na
organização e representação da informação, fundamentando-se na

sumário
434
análise contextual e, posteriormente, o processo de representação
das informações dos conjuntos documentais considerado relevante
para seu entendimento e recuperação.  

Faz-se necessário ressaltar a natureza interseccional do proces-


so de representação em arquivos, em que as definições de conceitos
da estrutura de classificação podem ser consideradas descritores e
a descrição parte do pressuposto da classificação para cumprir seu
objetivo (VITAL; MEDEIROS; BRASCHER, 2017). Ou seja, essas fron-
teiras não são rígidas, são porosas e demonstram a possibilidade de
versatilidade desses processos, associando de modo transversal os
conceitos de conhecimento e informação.

Observa-se que a classificação e a descrição arquivísticas são,


de fato, as intervenções arquivísticas que são mais vinculadas aos
processos de representação em arquivos no âmbito da OC. Diante
dessas circunstâncias, pontuam-se algumas diferentes possibilidades
que podem endossar as articulações metodológicas entre as áreas e
prospectar outras oportunidades e perspectivas de análises e estudos.

Para além das funções de classificação e descrição arquivísti-


cas, cabe-nos ressaltar que as demais intervenções delimitadas por
Rousseau e Couture (1998) também são capazes de estabelecer suas
intersecções com a OC. As funções de produção e avaliação também
reúnem características que as aproximam do debate da organização e
representação do conhecimento e da informação, embora esses estu-
dos ainda não tenham sido realizados.

A exploração dos diferentes SOCs e suas respectivas carac-


terísticas também são importantes para que seja possível traçar um
paralelo com as características de intervenções arquivísticas e seus
respectivos instrumentos de gestão e descrição. Além disso, é pos-
sível desenvolver estudos que possam caracterizar e identificar o uso
de SOCs no âmbito da prática da arquivologia. Outra oportunidade de

sumário
435
pesquisa e análise é a perspectiva de definição de diretrizes e procedi-
mentos que possam auxiliar no processo de padronização estratégica
e operacional para a organização e representação do conhecimento e
da informação em arquivos, a fim de tornar factível a aplicação dessas
metodologias no cenário arquivístico.

Quanto à organização do conhecimento, é possível desenvolver


estudos que identifiquem quais são os SOCs utilizados no âmbito de
cenários institucionais que possam revelar cenários contextuais que
contribuam nas atividades de intervenções arquivística. Isso é possível,
uma vez que toda intervenção arquivística, estratégica ou técnica, pre-
cede do reconhecimento e caracterização do contexto organizacional
responsável pelo acúmulo dos documentos.

Infere-se, ainda, a relevância de ampliar as discussões quanto a


análise de domínio no âmbito da Arquivologia como possibilidades de
investigação. Isso se dá no que tange a alinhamentos metodológicos
da caracterização do conhecimento de uma comunidade ou conjunto
de atores discursivos.

Com o avanço das tecnologias e sua aplicabilidade no cenário


dos arquivos, ampliam-se as possibilidades de aplicação e configura-
ção da representação em arquivos quando se trata do uso de sistemas
informatizados e plataformas de acesso aos documentos. No cenário
tecnológico, intensificam-se os usos de SOCs no que tange aos meca-
nismos de produção, tramitação e controle dos documentos por conta
da complexidade da estrutura digital.

4 CONSIDERAÇÕES FINAIS

A organização e representação do conhecimento e da informa-


ção aplicada a documentos de arquivo apresenta um potencial sig-
nificativo de desenvolvimento de pesquisas, quanto a esses tipos de

sumário
436
documentos. A ampliação do diálogo entre as áreas de Arquivologia
e Organização do Conhecimento se faz necessária e construtiva para
que se tenham avanços no campo teórico e prático dessa intersecção.

Verificou-se que as funções de classificação e descrição arqui-


vísticas são condicionantes na relação da Arquivologia com a organi-
zação e representação do conhecimento e da informação e integram,
entre si, um primeiro nível (explícito) de relacionamento entre as áreas.
Ademais, em um segundo nível (não-explícito), é possível desenvolver
estudos em que as aplicações de OC sejam capazes de inferir demais
relações multifacetadas da Arquivologia com a OC.

Identifica-se que há um reconhecimento crescente acerca da


relevância de promover interfaces da Arquivologia em vista do desen-
volvimento teórico-metodológico da OC, tendo em vista que o desen-
volvimento de estudos em OC podem contribuir com a própria Arqui-
vologia. Não se buscou uma limitação nos pontos de convergência
entre OC e Arquivologia, mas sim o entendimento de que a ampliação
de nossas perspectivas e a flexibilidade dos conceitos já consagrados
podem nos levar a descobertas e redescobertas sobre a compreensão
dessas concepções em um patamar de aplicação diferente.

REFERÊNCIAS
AGUIAR, Francisco Lopes de; KOBASHI, Nair Yumiko. Organização e Re-
presentação do Conhecimento: Perspectivas de Interlocução Interdisciplinar
entre Ciência da Informação e Arquivologia. In: XIV Encontro Nacional de
Pesquisa em Ciência da Informação, 2013, Florianópolis. Anais [...]. Disponí-
vel em: http://enancib2013.ufsc.br/index.php/enancib2013/XIVenancib/paper/
view/155/147. Acesso em: 30 jan. 2021.
BARITÉ, Mario. Organización del Conocimiento: un nuevo marco teórico-
-conceptual en Bibliotecología y Documentación. In: CARRARA, K. (Org.).
Educação, universidade e pesquisa. Marília, 2001. p.35-50.

sumário
437
BARROS, Thiago Henrique Bragato. A construção discursiva em arquivística:
uma análise do percurso histórico e conceitual da disciplina por meio dos
conceitos de classificação e descrição. 2010. 132 f. Dissertação (Mestrado
em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade
Estadual Paulista. São Paulo: Universidade Estadual Paulista, 2010. Disponível
em: http://hdl.handle.net/11449/93667. Acesso em: 11 out. 2021.
BARROS, Thiago Henrique Bragato. A representação da informação arqui-
vística: uma análise do discurso teórico e institucional a partir dos contextos
Espanhol, Canadense e Brasileiro. 2014. 222 f. Dissertação (Doutorado
em Ciência da Informação) – Faculdade de Filosofia e Ciências de Marí-
lia, Universidade Estadual Paulista, 2014. Disponível em: http://hdl.handle.
net/11449/110391. Acesso em: 11 out. 2021.
BARROS, Thiago Henrique Bragato. A Indexação e a Arquivística: aproxima-
ções iniciais no universo teórico da organização e representação do conhe-
cimento. Encontros Bibli, Florianópolis, v.21, n.46, p.33-44, 2016. Disponível
em: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2016v-
21n46p33/31600. Acesso em: 30 jun. 2021
BARROS, Thiago Henrique Bragato.; SOUSA, Renato Tarcísio Barbosa.
Organização do conhecimento e arquivologia: abordagens metodológicas.
Informação & Informação, Londrina, v. 24, n. 2, p. 76-92, 2019. Disponível
em: https://www.uel.br/revistas/uel/index.php/informacao/article/view/38290 .
Acesso em: 10 nov. 2021.
BRÄSCHER, Marisa.; CAFÉ, Lígia. Organização da informação ou organi-
zação do conhecimento?. In: Encontro Nacional de Pesquisa em Ciência
da Informação, 9., 2008, São Paulo. Anais [...]. São Paulo: Universidade de
São Paulo, 2008.
BRÄSCHER, Marisa; CARLAN, Eliana. Sistemas de organização do conheci-
mento: antigas e novas linguagens. In: ROBREDO, J.; BRÄSCHER, M. (Orgs.).
Passeios no Bosque da Informação: Estudos sobre Representação e Organiza-
ção da Informação e do Conhecimento. Brasília DF: IBICT, 2010. p. 147-176.
COOK, Terry. What is past is prologue: a history of archival ideas since 1898,
and the future paradigm shift. Ottawa: Archivaria, 1997.
DAHLBERG, Ingetraut. Current trends in knowledge organization. In: GARCIA
MARCO, F. J. (Org.). Organización del conocimiento em sistemas de infor-
mación y documentación. Zaragoza: Universidad de Zaragoza, 1995. p. 7-25.
DAHLBERG, Ingetraut. Knowledge organization: its scope and possibilities.
Knowledge Organization, v. 20, n. 4, p. 211-222, 1993.

sumário
438
ESTEBAN NAVARRO, Miguel Ángel. La representación y la organización del
conocimiento en los archivos. In: Actas del I Encuentro de Isko-España, Zara-
goza, 1993. Anais [...]. Zaragoza: Universidad Librería General. 1993.
FREITAS, Lidiane Marques. A organização do conhecimento sensível sob
a ótica da Arquivologia: um estudo de caso na Embrapa Soja. 2017. 150 f.
Dissertação (Mestrado em Ciência da Informação) – Curso de Ciência da
Informação, Programa de Pós-graduação em Ciência da Informação, Univer-
sidade Estadual de Londrina. Londrina: Universidade Estadual de Londrina,
2017. Disponível em: http://www.bibliotecadigital.uel.br/document/?code=-
vtls000215310 . Acesso em: 10 abr. 2020.
GARCÍA MARCO, Francisco Javier. Paradigmas científicos en recuperación de
información. In: GARCÍA MARCO, F. J. (Ed.). Organización del conocimiento en
sistemas de información y documentación. Zaragoza: ISKO, 1995. p.99-112.
GUIMARÃES, José Augusto Chaves Guimarães. Abordagens teóricas de
tratamento temático da informação: catalogação de assunto, indexação e
análise documental. Ibersid: revista de sistemas de información y documen-
tación, v. 3, p. 105-117, 2009.
HAGEN, Acácia Maria Maduro. Algumas considerações a partir do processo
de padronização da descrição arquivística. Ciência da Informação, Brasília,
v. 27, n. 3, 1998.
HJØRLAND, Birger. What is knowledge organization (KO)? Royal School of
Library and Information Science, 6 Birketinget, Denmark, 2008. Disponível
em: https://eclass.aueb.gr/modules/document/file.php/INF180/bibliography/
What_is_Knowledge_Organization.pdf. Acesso em: 5 mar. 2020.
HODGE, Gail. Systems of Knowledge Organization for Digital Libraries:
beyond traditional authority files. Washington, DC: The Council on Library and
Information Resources, 2000. Disponível em: http://www.clir.org/wp-content/
uploads/sites/9/pub91.pdf. Acesso em: 30 jan. 2019.
JENKINSON, Hilary. A manual of Archive Administration. Oxford: Oxford
University Press, 1922.
LEHMKUHL, Camila Schwinden.; LINDEN, Leolíbia Luana. BARROS, Ca-
mila Monteiro; SILVA, Eva Cristina Leal da.; VITAL, Luciane Paula. Sistemas
de organização do conhecimento e arquivologia: diálogos possíveis. ISKO
Brasil, Londrina, v. 6, p. 58-66, 2019. Disponível em: http://hdl.handle.
net/20.500.11959/brapci/123195. Acesso em: 10 nov. 2021
LIMA, José Leonardo de Oliveira; ALVARES, Lilian. Organização e repre-
sentação da informação e do conhecimento. In.: ALVARES, Lilian. (Org.).

sumário
439
Organização da informação e do conhecimento: conceitos, subsídios
interdisciplinares e aplicações. São Paulo: B4 Editores, 2012. p. 21-47.
LOPES, Luis Carlos. A nova arquivística na modernização administrativa.
2. ed. Brasília: Projeto Editorial, 2009. 416p
MARTINS, Wanessa Rodrigues. Representação arquivística: o papel do CIA e
do CONARQ para o desenvolvimento de políticas de descrição. 2019. 80 f. Dis-
sertação (Mestrado em Ciência da Informação) – Programa de Pós-graduação
em Ciência da Informação, Instituto de Ciências Sociais Aplicadas, Universida-
de Federal do Pará. Belém: Universidade Federal do Pará, 2019. Disponível em:
http://repositorio.ufpa.br/jspui/handle/2011/11427. Acesso em: 10 out. 2021.
MARQUES, Angélica Alves da Cunha. Interlocuções entre a arquivologia
nacional e a internacional no delineamento da disciplina no Brasil. 2011.
399 f. Tese (Doutorado em Ciência da Informação)-Universidade de Brasília,
Brasília, 2011. Disponível em: https://repositorio.unb.br/handle/10482/8730
Acesso em: 10 out. 2021.
RIBEIRO, Fernanda. A Arquivística como disciplina aplicada no campo da
Ciência da Informação. Perspectivas em Gestão & Conhecimento, João Pes-
soa, v. 1, n. 1, p. 59-73, jan./jun. 2011. Disponível em: https://periodicos.ufpb.
br/ojs/index.php/pgc/article/view/9887. Acesso em: 28 nov. 2021.
ROUSSEAU, Jean.-Yves; COUTURE, Carol. Os Fundamentos da Disciplina
Arquivística. Lisboa: Publicações D. Quixote, 1998. 356p.
SALES, Rodrigo de. O diálogo entre a organização do conhecimento e a ciên-
cia da informação na comunidade científica da ISKO-Brasil. In: XIV Encontro
Nacional de Pesquisa em Ciência da Informação, 2015, João Pessoa. Anais
[...]. João Pessoa: Universidade Federal da Paraíba, 2015.
SILVA, Andrieli Pachu da; TOGNOLI, Natalia Bolfarini.; GUIMARÃES, José
Augusto Chaves Guimarães. Os valores éticos na organização e representa-
ção do conhecimento arquivístico. Brazilian Journal of Information Science,
Marília, v. 11, n. 1, 2017. Disponível em: https://revistas.marilia.unesp.br/index.
php/bjis/article/view/6678. DOI:10.5016/brajis.v11i1.6678
SCHELLENBERG, Theodore Rosevelt. R. Arquivos modernos: princípios e
técnicas. Tradução de Nilza Teixeira Soares. Rio de Janeiro: Editora FGV, 2006.
SILVA, Eliezer Pires. A noção de informação arquivística. In: RODRIGUES, G.
M.; COSTA, M. G. (Orgs.). Arquivologia: configurações da pesquisa no Brasil:
epistemologia, formação, preservação, uso e acesso. Brasília: Editora Univer-
sidade de Brasília, 2012.

sumário
440
SILVA, M. A.; MOREIRA, Walter. Relações conceituais em ontologias e lingua-
gens documentárias: análise de periódicos Qualis A1 de ciência da informa-
ção. In: Seminário de Arquivologia e Biblioteconomia, 2015, São Paulo. Anais
[...]. São Paulo: Universidade Estadual de São Paulo, 2015.
STAPLETON, Richard. Jenkinson and Schellenberg: a comparison. Archivaria,
Ottawa, n.17, p. 75-85, 1983.
SVENONIUS, Elaine. The intellectual foundations of information organiza-
tion. Cambridge: The MIT Press, 2000. 255p.
TOGNOLI, Natalia Bolfarini. A contribuição epistemológica canadense para
a construção da Arquivística Contemporânea. 2010. 120 f. Dissertação
(Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências,
Universidade Estadual Paulista. Marília: Universidade Estadual Paulista, 2010.
TOGNOLI, Natalia Bolfarini. A representação na Arquivística contemporâ-
nea. Revista Ibero-Americana de Ciência da Informação, Brasília, v. 5,
n. 2, p. 79-92, 2012. Disponível em: http://hdl.handle.net/11449/115396.
Acesso em: 30 jan. 2019.
TOGNOLI, Natalia Bolfarini; BARROS, Thiago Henrique Bragato. Os processos
de representação do conhecimento arquivístico: elementos históricos e concei-
tuais da classificação e descrição. ISKO Brasil, v. 3, p. 94-99, 2015. Disponível
em: http://hdl.handle.net/20.500.11959/brapci/135201. Acesso em: 10 nov. 2021.
VITAL, Luciane Paula, MEDEIROS, Graziela Martins de; BRASCHER, Marisa.
Classificação e descrição arquivística como atividades de organização e
representação da informação e do conhecimento. Brazilian Journal of Infor-
mation Science: Research Trends, São Paulo, v. 11, n. 4, dez. 2017. Disponí-
vel em: http://www2.marilia.unesp.br/revistas/index.php/bjis/article/view/7507.
Acesso em: 05 fev. 2019.
VITAL Luciane Paula; BRASCHER, Marisa. Descrição Arquivística: uma dis-
cussão conceitual. Informação & Informação, Londrina, v. 21, n. 1, p. 213-
229, jun. 2016. ISSN 1981-8920. Disponível em: http://www.uel.br/revistas/uel/
index.php/informacao/article/view/22497/18994. Acesso em: 05 fev. 2019.
YAKEL, Elizabeth. Archival representation. Archival Science, Switzerland, v. 3,
n. 1, p. 1-25. 2003.

sumário
441
Sobre os organizadores

Thiago Henrique Bragato Barros


Professor Adjunto no Departamento de Ciência da Informação da Universidade
Federal do Rio Grande do Sul (UFRGS), professor permanente nos Programas
de Pós-Graduação em Ciência da Informação da UFRGS e UFPA. Pós-dou-
torado em Ciência da Informação pela Universidade de Brasília (2018-2019).
Pesquisador em grupos de pesquisa da UNB, UFPA, UFSCAR e UFRGS. Pre-
sidente eleito da International Society for Knowledge Organization (2020-2024).
Deputy Editor da revista Knowledge Organization. Coordenador do Programa
de Pós-Graduação em Ciência da Informação – PPGCIN UFRGS (2020-2022).
Membro da Comissão Editorial da Em questão. Tem experiência na área de
Arquivologia e Ciência da Informação, atuando principalmente nos seguintes
temas: Abordagens linguísticas em Ciência da informação e Representação e
Organização do Conhecimento.

Rita do Carmo Ferreira Laipet


Professora Adjunta do Departamento de Ciências da Informação da Faculdade
de Biblioteconomia e Comunicação da Universidade Federal do Rio Grande
do Sul (UFRGS). Doutora em Linguística Aplicada pela Universidade do Vale
do Rio dos Sinos (UNISINOS). Mestre em Comunicação e Informação pelo
Programa de Pós-Graduação em Comunicação e Informação da Universida-
de Federal do Rio Grande do Sul (UFRGS) e Bacharel em Biblioteconomia
pela UFRGS. Chefe do Departamento de Ciências da Informação (DCI) da
Faculdade de Biblioteconomia e Comunicação da UFRGS. Pesquisadora do
Grupo de Pesquisa de Comunicação Científica da UFRGS com atuação na
linha de Estudos em Organização do Conhecimento. Membro associado da
ISKO-BRASIL (Sociedade Brasileira de Organização do Conhecimento). Líder
do grupo de pesquisa Organização e Representação do conhecimento abor-
dagens linguísticas em arquivos e bibliotecas - ORCALAB. Tem experiência na
área de Ciência da Informação, com ênfase em Biblioteconomia nos seguintes
temas: Representação do Conhecimento, Sistemas de Organização do Co-
nhecimento (SKOS), Terminologia, Web Semântica, Ontologias, Folksonomia,
Telecentros Comunitários, Inclusão Digital, Acesso à Informação. Os temas de
pesquisas atuais envolvem o estudo e aplicação da Terminologia na Ciência
da Informação, Teoria do Conceito, Teoria da Classificação Facetada, Relações
Semânticas entre termos, Sistemas de Organização do Conhecimento (SKOS),
Elaboração de Tesauros, Recuperação da Informação, Análise de Logs.

sumário
442
Sobre os autores

Andréa Fontoura da Silva


Mestranda em Ciência da Informação no Programa de Pós-Graduação em
Ciência da Informação na UFRGS. Possui graduação em Arquivologia (2012) e
Biblioteconomia (2000), também pela UFRGS. Participa do Grupo de Pesquisa
Organização e Representação do Conhecimento - ORCALAB. É tutora desde
2020 do Curso EAD em Biblioteconomia da UFRGS pela Universidade Aberta
do Brasil UAB, bibliotecária chefe na Província Franciscana do Rio Grande do
Sul no Brasil, da Escola Superior de Teologia e Espiritualidade Franciscana -
ESTEF e da Escola Técnica Cristo Redentor - ETCR. Tem experiência na área
de gestão de bibliotecas, coordenando equipes e eventos. Coordena projetos
de incentivo à leitura. Formanda em Letras Português/Inglês - UNICESUMAR.

Adriana Santos
Mestranda em Ciência da Informação PPGCI (UFPA). Graduada em Letras/
Português (UFPA). Especialista em Educação, Cultura e Organização Social
(UFPA). Graduanda em Arquivologia (UFPA). Estagiária do setor de documen-
tação do Arquivo Público do Estado do Pará. Membro do Grupo de Estudos:
ORCALAB/UFRGS. Voluntária no Projeto de Extensão: Difundindo Arquivos,
revelando memórias e narrando histórias (UFPA).

Brisa Pozzi de Sousa


Concluiu, em 2019, o doutorado em Ciência da Informação pela Universi-
dade Federal de Minas Gerais (UFMG). O mestrado em Ciência da Informa-
ção, pela Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP
câmpus de Marília) em 2012 e, o bacharelado em Biblioteconomia, pela
Universidade Federal do Espírito Santo (UFES), em 2004. Desde 2013 atua
como docente nos cursos de bacharelado e licenciatura em Biblioteconomia
da Universidade Federal do Estado do Rio de Janeiro (UNIRIO). Pesquisa na
Biblioteconomia e Ciência da Informação o contexto temático que envolve a
Organização da Informação e a Organização do Conhecimento, destacando-
-se os fundamentos teóricos e práticos sobre a noção de assunto, a indexa-
ção, a classificação e a catalogação. 

sumário
443
Bruna Carballo Dominguez de Almeida
Mestranda no Programa de Pós-Graduação em Ciência da Informação pela
Universidade Federal do Rio Grande do Sul. Especialista em Gestão em Ar-
quivos pela Universidade Federal de Santa Maria (2017). Possui graduação
em Arquivologia pela Universidade Federal do Rio Grande (2014). É Técnica
Administrativa em Educação (TAE) na Universidade Federal do Rio Grande.
Pesquisadora nos Grupos de Pesquisa: Organização e Representação do co-
nhecimento abordagens linguísticas em arquivos e bibliotecas - ORCALAB e
Arquivologia e Memória: documentos e identidade.

Camila Monteiro de Barros


Doutora em Ciência da Informação pela Universidade Federal de Santa Ca-
tarina (UFSC), com período sanduíche na Université de Montréal (UdeM,
Canadá), mestre em Ciência da Informação pela Universidade Federal de
Santa Catarina (UFSC), graduada em Biblioteconomia pela Universidade do
Estado de Santa Catarina (UDESC). Professora do Departamento de Ciência
da Informação (CIN/UFSC), subcoordenadora do Programa de Pós-Gradua-
ção em Ciência da Informação (PGCIN/UFSC). Líder do Grupo de Pesquisa
Representação e Organização do Conhecimento (ROC/UFSC). Membro do
grupo de pesquisa Fundamentos Teóricos da Informação (FTI) da Univer-
sidade Estadual Paulista Júlio de Mesquita Filho (UNESP). Atua nas áreas
de Organização e Representação do Conhecimento e da Informação, com
ênfase teórico-metodológica nos sistemas de organização do conhecimento.
Tem interesse nas questões relativas à informação musical.

Carine Melo Cogo Bastos


Graduada em Arquivologia pela Universidade Federal de Santa Maria. Pós-
-graduada em Gestão Estratégica de Tecnologia da Informação pela Pontifícia
Universidade Católica do RS, PUC/RS. Pós-graduada em Gestão de Arquivos
pela Universidade Federal de Santa Maria, UFSM/RS. Mestra pelo Programa
de Pós-graduação em Ciência da Informação da Universidade Federal do Rio
Grande do Sul UFRGS/RS.

Daniel Martínez Ávila


Professor assistente doutor da Universidad de León, na Espanha, e professor
permanente do Programa de Pós-Graduação em Ciência da Informação (PP-
GCI) da Universidade Estadual Paulista (UNESP). Possui graduação em Bi-
blioteconomía y Documentación pela Universidad Carlos III de Madrid (2005),

sumário
444
licenciatura em Documentación pela Universidad Carlos III de Madrid (2007),
mestrado em Investigación en Documentación pela Universidad Carlos III de
Madrid (2009), e doutorado internacional pelo Programa Oficial de Doctorado
en Documentación: Archivos y Bibliotecas en el Entorno Digital da Universidad
Carlos III de Madrid (2012). Foi professor assistente doutor da Universidad
Carlos III de Madrid até agosto de 2013 e desde setembro de 2019 até agosto
de 2021, pesquisador e instrutor adjunto da University of Wisconsin-Milwaukee
até 2014, professor assistente doutor da Universidade Estadual Paulista desde
outubro de 2014 até agosto de 2019, e professor assistente doutor da Univer-
sidad Complutense de Madrid desde setembro de 2021 até fevereiro de 2022.

Donald Grant Campbell


Phd in English from Queen’s University (1990) Chair of Master of Library & In-
formation Science MLIS Program. Associate Professor at Faculty of Information
and Media Studies, Western University of Ontario.

Edgar Bisset Alvarez


Doutor em Ciência da Informação pelo Programa de Pós-Graduação em Ciên-
cia da Informação da Universidade Estadual Paulista (UNESP), com período
sanduíche na Universidad de Murcia/Espanha. Mestrado em Biblioteconomia
e Ciência da Informação - Universidade da Havana (2012) e Graduação em
Informação Cientifico-Técnica e Biblioteconomia - Universidade da Havana
(2007). Atua como Professor nos cursos de Graduação e Pós-Graduação, do
Departamento de Ciência da Informação no Centro de Ciências da Educação,
Universidade Federal de Santa Catarina (UFSC), Coordenador do Programa
de Pós-Graduação em Ciência da Informação da UFSC e Editor da Revista
Encontros Bibli. Foi Professor Assistente na Faculdade de Comunicação Social
e Especialista Principal na Direção de Informação da Universidade da Havana,
Coordenador da Rede de Bibliotecas da Universidade da Havana. Pertence
à Associação Cubana de Bibliotecarios (ASCUBI), também ao Grupo de Tra-
balho GT-8 Informação e Tecnologia da Associação Nacional de Pesquisa e
Pós-Graduação em Ciência da Informação (ANCIB). Participa como membro
da Linha de Pesquisa 02: Informação, Comunicação Científica e Competência
do PGCIN e pesquisador no grupo de pesquisa ITI-RG (Inteligência, Tecnologia
e Informação - Research Group) da UFSC, e atua como pesquisador no Grupo
de pesquisa das Novas Tecnologias da Informação, da Linha de Informação
e Tecnologia do Programa de Pós-Graduação de Ciência da Informação da
Universidade Estadual Paulista “Hyginio Mesquita Filho” UNESP/Marília-SP.

sumário
445
Fabio Assis Pinho
Professor na Universidade Federal de Pernambuco (UFPE) atuando nos cursos
de graduação e pós-graduação. Possui graduação em Biblioteconomia e Ciên-
cia da Informação (2002) pela UFSCar, Mestrado (2006) e Doutorado (2010) em
Ciência da Informação pela UNESP. É bolsista de produtividade do CNPq (PQ2)
e coordenador adjunto da área de Comunicação e Informação na CAPES (2018-
2022). Tem interesse nos temas de pesquisa de Organização e Representação
do Conhecimento e Memória da Informação Científica e Tecnológica.

Isabel Cristina Pereira dos Santos


Mestre em Ciência da Informação pelo Programa de Pós-Graduação em Ciên-
cia da Informação (PPGCIN) da Universidade Federal do Rio Grande do Sul
(UFRGS). Bacharela em Letras pela UFRGS. Servidora técnico-administrativa
lotada no Programa de Pós-Graduação em Controladoria e Contabilidade da
Faculdade de Ciências Econômicas da UFRGS. Tem experiência na área de
Letras, com ênfase em Revisão Textual, atuando principalmente em temas re-
lacionados a Ciências Econômicas e Ciências Contábeis.

Isadora Victorino Evangelista


Possui graduação em Biblioteconomia pela Universidade Estadual Paulista –
UNESP, Mestrado e Doutorado em Ciência da Informação pela mesma univer-
sidade. Fez parte de sua pesquisa de mestrado na Universidade de Coimbra,
sob supervisão da Dra. Maria da Graça de Melo Simões, investigando sobre
os aspectos éticos de características da Indexação como a exaustividade e
especificidade. Parte de sua pesquisa de doutorado foi desenvolvida na Wes-
tern Ontario University, em London/Canadá, investigando sobre a comunidade
epistêmica e as revoluções científicas ocorridas no âmbito das pesquisas éti-
cas em Organização do Conhecimento. Atualmente atua como Bibliotecária
na Universidade Federal de São Carlos, campus Lagoa do Sino. Possui como
interesse de pesquisa Ética em Organização do Conhecimento, Sociologia do
Conhecimento e Comunidades Epistêmicas.

Joana Peregrina Hernandes


Possui graduação em Arquivologia pela Universidade Federal do Rio Grande
do Sul (2011) e mestranda em Ciência da Informação pela Universidade Fe-
deral do Rio grande do Sul (2020). Tem experiência na área de Gerenciamento
Eletrônico de Documentos, Gestão de Arquivos e atualmente complementan-
do estudos acadêmicos na área da Ciência da Informação: com ênfase em
Arquivologia, atuando principalmente no seguinte tema: Organização do co-
nhecimento e estudos de usuários.
sumário
446
José Augusto Chaves Guimarães
Bacharel em Biblioteconomia (UNESP, 1981) e em Direito (Univem, 1981), Mestre
em Ciência da Comunicação (USP, 1989) e Doutor em Ciência da Informação
(USP, 1994). Realizou estágio pós-doutoral em Documentação na Universidad
Carlos III de Madrid (2009). É Professor Titular aposentado da UNESP-Marília,
onde ainda atua como Docente Permanente do Programa de Pós-graduação
em Ciência da Informação. Foi fundador do capítulo Brasileiro da International
Society for Knowledge Organization (ISKO-Brasil), do qual foi presidente por três
gestões. Foi membro do Executive Board da ISKO e organizou a 14th ISKO In-
ternational Conference (Rio de Janeiro, 2016). Foi presidente da Associação Bra-
sileira de Ensino de Biblioteconomia - ABEBD e da Asociación de Educadores e
Investigadores en Biblioteconomía, Documentación y Ciencias de la Información
de Iberoamérica y el Caribe - EDICIC na área de Documentação. Atualmente
atua como membro titular do Comitê Assessor de Artes, Ciência da Informação
e Comunicação do CNPq.  Atua também como membro de comitê científico de
várias revistas e eventos na área de Ciência da Informação no Brasil e no exterior
assim como parecerista ad hoc de revistas evento e agências de fomento no
Brasil e no exterior.  Suas áreas de pesquisa são: organização do conhecimento,
análise de domínio, ética informacional, e produção científica.

Leolíbia Luana Linden


Professora Assistente do Curso de Arquivologia no Departamento de Ciên-
cias da Informação (DCI) da Faculdade de Biblioteconomia e Comunicação
(FABICO) da Universidade Federal do Rio Grande do Sul (UFRGS). Arquivista
formada pela Universidade Federal de Santa Catarina (UFSC). Mestre e Dou-
tora em Ciência da Informação pelo Programa de Pós Graduação em Ciência
da Informação (PGCIN) na UFSC. Possui experiência na área de Ciência da
Informação com ênfase em Arquivologia. Tem interesse nos temas relaciona-
dos à Organização e Representação da Informação, Políticas e Programas de
Gestão de Documentos.

Luís M. Machado
Doutorando e Mestre (2016) em Ciência da Informação na Universidade de
Coimbra, graduado (2001) em Ensino pelo Instituto Politécnico de Lisboa. In-
vestigador colaborador no Centro de Estudos Interdisciplinares do Século XX
da Universidade de Coimbra (2018), no Grupo de Pesquisa Representação
do Conhecimento, Ontologias e Línguas, da Universidade Federal de Minas
Gerais (2020) e no Grupo de Pesquisa Fundamentos Teóricos da Informação
da Universidade Estadual Paulista (2021). Editor convidado na Multidisciplinary
Digital Publishing Institute (2021).

sumário
447
Luciana Monteiro-Krebs
Doutora em Ciências Sociais (KU Leuven, Bélgica) e Doutora em Comunicação
e Informação (UFRGS, Brasil). Luciana é mestre em Linguística Aplicada e ba-
charel em Biblioteconomia, com experiência internacional em pesquisa Universi-
dade do Porto – Portugal (2010-2011) e na KU Leuven – Bélgica (2018-2022). No
Meaningful Interactions Lab - Mintlab (KU Leuven), Luciana trabalha em projetos
de pesquisa em Interação Humano-Computador, como o Algorithmic Mediation
in Academic Social Systems (AMASS) e o Algorithmic Transparency & Accounta-
bility in Practice (ATAP), pesquisando os efeitos dos algoritmos de recomenda-
ção na mídia a partir de uma abordagem centrada no usuário. Luciana é membro
dos grupos de pesquisa Organização e Representação do conhecimento - abor-
dagens linguísticas em arquivos e bibliotecas (ORCALAB) do PPGCIN/UFRGS, e
Comunicação Científica (GP ComCient) do PPGCOM/UFRGS. Seus tópicos de
interesse são algoritmos de recomendação, comunicação científica, padrões de
uso em mídias sociais online, folksonomias, ontologias, análise de logs, recupe-
ração da informação e terminologias das áreas jurídica e saúde.

Lucas Andrade Sá Corrêa


Doutorando em Ciência da Informação pelo PPGCI/UFF, Mestre em História,
Política e Bens Culturais pelo Centro de Pesquisa e Documentação de História
Contemporânea do Brasil (CPDOC/FGV) (2014) e Bacharel em Ciências Sociais
(CPDOC/FGV) (2011). Graduando em Arquivologia (UFF). É integrante do Grupo
de Pesquisa Arquivos, Bibliotecas e Organização do Conhecimento (GP-ABOC).

Marcos Oliveira da Costa


Graduado em Biblioteconomia - UFPA, Especialista em Neuropsicopedago-
gia – (UNICID), Mestrando do Programa de Pós-graduação em Ciência da
Informação (UFPA). Integrante do Grupo de Pesquisa ORCALAB (UFRGS).
Atualmente é Bolsista Capes e desenvolve pesquisas de cunho teórico - me-
todológico e tem como áreas de interesse: Estudos Linguísticos no contexto
da Ciência da Informação e da Organização do Conhecimento; Epistemolo-
gia da Ciência da Informação e da Organização do Conhecimento (OC); Tec-
nologias da Informação e Comunicação; Problemática de Acesso; Inclusão
e Exclusão educativa; Teoria Crítica da CI.

sumário
448
Mario Barité
Es Doctor y Máster en Información Científica por la Universidad de Granada,
España. Asimismo, cuenta con un Diploma de Estudios Avanzados de la Uni-
versidad de Granada, España. Es Licenciado en Bibliotecología y Escribano
Público por la Universidad de la República del Uruguay. Actualmente reviste
como Profesor Titular efectivo, en régimen de dedicación total, del Instituto de
Información de la Facultad de Información y Comunicación, Universidad de la
República, con docencia de grado y posgrado, e investigación en las áreas
de organización del conocimiento, terminología y gobierno electrónico. Es res-
ponsable del grupo de investigación “Terminología y Organización del Conoci-
miento” (GTERM), que cuenta con miembros provenientes de la ciencia de la
información, la comunicación, la lingüística y la traducción. Fue Pro-Rector de
Extensión y Relaciones con el Medio de la Universidad de la República. Autor
y/o coordinador de una quincena de libros ha realizado alrededor de un cente-
nar de contribuciones en forma de capítulos de libros, ponencias a congresos
y artículos en revistas especializadas de varios países. Es editor responsable
de la revista académica Informatio.

Natália Bolfarini Tognoli


Bacharel em Arquivologia, Mestre e Doutora em Ciência da Informação. É pro-
fessora adjunta no departamento de Ciência da Informação e no Programa
de Pós-graduação em Ciência da Informação da a Universidade Federal Flu-
minense (UFF). É líder do Grupo de Pesquisa Arquivos, Bibliotecas e Orga-
nização do Conhecimento (GP-ABOC). Presidente do Capítulo Brasileiro da
International Society for Knowledge Organization (2020-2021; 2022-). 

Rafael Port da Rocha


Possui graduação em Ciências de Computação pela Universidade Federal do
Rio Grande do Sul (1988), mestrado em Computação pela Universidade Fede-
ral do Rio Grande do Sul (1992) e doutorado em Computação pela Universi-
dade Federal do Rio Grande do Sul (2000). Atualmente é professor associado
do Departamento de Ciência da Informação da Universidade Federal do Rio
Grande do Sul. Tem experiência nas áreas de Ciência da Informação e Ciência
da Computação, atuando principalmente nos seguintes temas: metadados,
banco de dados, ontologias, preservação digital, gestão de dados da pesqui-
sa. É fundador e atualmente coordena o Centro de Documentação e Acervo
Digital da Pesquisa (CEDAP), órgão auxiliar da FABICO/UFRGS que busca dar
suporte para pesquisas científicas, tecnológicas, artísticas e culturais realizada
na Universidade, visando à gestão, preservação e uso científico e cultural de
seus ativos digitais de pesquisa, natos ou decorrentes da digitalização. 

sumário
449
Rita do Carmo Ferreira Laipelt
Professora Adjunta do Departamento de Ciências da Informação da Faculdade
de Biblioteconomia e Comunicação da Universidade Federal do Rio Grande
do Sul (UFRGS). Doutora em Linguística Aplicada pela Universidade do Vale
do Rio dos Sinos (UNISINOS). Mestre em Comunicação e Informação pelo
Programa de Pós-Graduação em Comunicação e Informação da Universida-
de Federal do Rio Grande do Sul (UFRGS) e Bacharel em Biblioteconomia
pela UFRGS. Chefe do Departamento de Ciências da Informação (DCI) da
Faculdade de Biblioteconomia e Comunicação da UFRGS. Pesquisadora do
Grupo de Pesquisa de Comunicação Científica da UFRGS com atuação na
linha de Estudos em Organização do Conhecimento. Membro associado da
ISKO-BRASIL (Sociedade Brasileira de Organização do Conhecimento). Líder
do grupo de pesquisa Organização e Representação do conhecimento abor-
dagens linguísticas em arquivos e bibliotecas - ORCALAB. Tem experiência na
área de Ciência da Informação, com ênfase em Biblioteconomia nos seguintes
temas: Representação do Conhecimento, Sistemas de Organização do Co-
nhecimento (SKOS), Terminologia, Web Semântica, Ontologias, Folksonomia,
Telecentros Comunitários, Inclusão Digital, Acesso à Informação. Os temas de
pesquisas atuais envolvem o estudo e aplicação da Terminologia na Ciência
da Informação, Teoria do Conceito, Teoria da Classificação Facetada, Relações
Semânticas entre termos, Sistemas de Organização do Conhecimento (SKOS),
Elaboração de Tesauros, Recuperação da Informação, Análise de Logs.

Renato Tarciso Barbosa de Sousa


Graduação em História pela Universidade de Brasília (1990), especialização
em Organização de Arquivos pela Universidade de São Paulo (1992), mestrado
em Biblioteconomia e Documentação pela Universidade de Brasília (1995) e
doutorado em História Social pela Universidade de São Paulo (2005). Atual-
mente, é Professor Associado IV do Curso de Graduação em Arquivologia e
do Programa de Pós-Graduação em Ciência da Informação, da Faculdade de
Ciência da Informação, da Universidade de Brasília. É diretor da Faculdade
de Ciência da Informação no quadriênio 2018-2022. Vice-líder do Grupo de
Pesquisa Estudos de Representação e Organização da Informação e do Co-
nhecimento. Tem experiência na área de Ciência da Informação, com ênfase
em Organização de Arquivos, atuando principalmente nos seguintes temas:
arquivologia, organização e recuperação de documentos de arquivo, gestão
de documentos e políticas públicas de arquivo.

sumário
450
Raí Costa
Possui graduação em Arquivologia pela Universidade Federal do Pará (2018).
Especialista em Gestão Pública, pelo Centro de Estudos de Especialização
e Extensão (2022), Mestrando em Ciência da Informação, PPGCI/UFPA. Inte-
grante do Grupo de Pesquisa Orcalab (UFRGS). Atualmente é Arquivista da
Universidade Federal do Pará.

Thiago Henrique Bragato Barros


Professor Adjunto no Departamento de Ciência da Informação da Universidade
Federal do Rio Grande do Sul (UFRGS), professor permanente nos Programas
de Pós-Graduação em Ciência da Informação da UFRGS e UFPA. Pós-dou-
torado em Ciência da Informação pela Universidade de Brasilia (2018-2019).
Pesquisador em grupos de pesquisa da UNB, UFPA, UFSCAR e UFRGS.
Presidente da International Society for Knowledge Organization (2022-2026).
Deputy Editor da revista Knowledge Organization. Coordenador do Programa
de Pós-Graduação em Ciência da Informação - PPGCIN UFRGS (2020-2022).
Membro da Comissão Editorial da Emquestão. Tem experiência na área de
Arquivologia e Ciência da Informação, atuando principalmente nos seguintes
temas: Abordagens linguísticas em Ciência da informação e Representação e
Organização do Conhecimento.

Talita Morgana Arruda Tavares


Graduada em Jornalismo pela UNICAP (2009). Especialista em Marketing e As-
sessoria Política pela USURP (2011). Bacharel em Biblioteconomia pela UFPE
(2021). Exerceu atividades de docência, particularmente de professora tutora.

Wilson Roberto Veronez Junior


Doutorando e Representante Discente do Programa de Pós-Graduação em
Ciência da Informação (PPGCI-UNESP 2021-). Membro do Grupo de Pes-
quisa: Fundamentos Teóricos da Informação (GPFTI). Membro do Conselho
do Programa de Pós-graduação em Ciência da Informação (PPGCI/UNESP)
e da Comissão Gestora de Recursos PROEX. Especialização em Processos
Didáticos-Pedagógicos para Cursos na Modalidade à Distância na UNIVESP
(2019-2021). Atuou como facilitador de ensino à distância nos cursos de Ges-
tão Pública, Engenharia de Computação, Engenharia de Produção e Peda-
gogia da UNIVESP (2019-2021). Realizou consultoria arquivística na empresa
CAP Arquitetura & Construção LTDA (2019). Mestre em Ciência da Informação
pelo Programa de Pós-graduação em Ciência da Informação (PPGCI-UNESP

sumário
451
2019-2021). Graduação interrompida em Biblioteconomia pela Unesp de Marí-
lia (2017-2019). Bacharel em Arquivologia pela Unesp de Marília (2012-2017).
Tem como interesse de pesquisa: Arquivologia Científica, Arquivo Histórico do
Partido dos Trabalhadores, Classificação Arquivística, Diplomática Arquivística,
Epistemologia Social, Gestão de Arquivos, Linguagem Documentária, Organi-
zação e Representação da Informação e do Conhecimento Arquivístico.

sumário
452

Você também pode gostar