Resumo: A Engenharia de Documentos é uma disciplina da Ciência da Computação que investiga os documentos em meio eletrônico. O objetivo deste artigo consiste em comparar e articular os diferentes enfoques da Engenharia de Documentos, Arquivologia, Diplomática Digital e Ciência da Informação sobre documentos e informações. A metodologia utilizada é a pesquisa documental da literatura que inclui a Diplomática Digital, a Tipologia Documental e as funções arquivísticas de Criação e Descrição. Como resultado foi identificado a proximidade entre os conceitos sobre documentos utilizados pelas diferentes áreas de conhecimento e a concepção do documento a partir de processos de negócio ou conjuntos documentais. As principais diferenças residiram na falta de equivalência dos conceitos de espécie e tipos documentais utilizados pela Arquivologia; na lacuna do tratamento de questões de autenticidade de documentos nato-digitais objeto da Diplomática Digital.
Palavras-chave:Engenharia de DocumentosEngenharia de Documentos,ArquivologiaArquivologia,Ciência da InformaçãoCiência da Informação,Diplomática DigitalDiplomática Digital,Tipologia DocumentalTipologia Documental.
Abstract: The Engineering of Documents is a Computer Science discipline that investigates the electronic documents. The present article consists of comparing and articulating the diverse information by the Engineering of Documents, Archivology, Digital Diplomatics and Information Science about documents and information. The methodology used is the documentary research of the literature that includes Digital Diplomatics, Documentary Typology and the archival characteristics of Creation and Description. The results were findings similarity between the document concepts used by the different areas of knowledge and the document conception from business processes or documentary sets. The main differences were: the lack of equivalence between the concepts of type and use of Archivology; the lack of treatment of issues of authenticity of anatomical documents of the Digital Diplomatics.
Keywords: Document Engineering, Archivology, Information Science, Digital Diplomatics, Documentary Typology.
Engenharia de Documentos e suas relações com a Arquivologia, a Diplomática Digital e a Ciência da Informação
Document Engineering and its relationships with Archivology, Digital Diplomatics and Information Science
Recepção: 10 Fevereiro 2019
Aprovação: 17 Julho 2019
A Engenharia de Documentos é uma disciplina da Ciência da Computação que investiga os sistemas eletrônicos de documentos em qualquer forma e em todas as mídias a partir de princípios, ferramentas e processos que aperfeiçoem a criação, o gerenciamento e a manutenção de documentos (MUNSON, 2001). Não obstante a Arquivologia e a Ciência da Informação também tratarem dos documentos como objeto de estudo direta ou indiretamente, há uma lacuna na literatura que as relacione à Engenharia de Documentos.
Considerando a importância crescente da tecnologia da informação, formulamos a seguinte pergunta: como a Engenharia de Documentos pode contribuir com a Arquivologia e a Ciência da Informação? Nesse sentido, o objetivo geral deste trabalho consiste em comparar e articular os seus diferentes enfoques em relação aos documentos e as informações.
A metodologia a ser utilizada é a pesquisa documental combinada com a análise qualitativa dos documentos. A seleção de trabalhos, entre 1900 e abril de 2019, foi iniciada pela busca textual com os operadores: engenharia de documentos, document engineering, ingénierie documentaire e ingeniería documental, nas seguintes bases: Base de Dados em Ciência da Informação (BRAPCI), Portal de Periódicos da CAPES, Catálogo de Teses e Dissertações da CAPES, Biblioteca Digital Brasileira de Teses e Dissertações, Bielefeld Academic Search Engine (BASE), Directory of Open Access Journals (DOAJ), Networked Digital Library of Theses and Dissertations (NDLTD). Foram identificados 526 trabalhos no Portal da CAPES de 1969 a 2019, 120 na BASE de 1990 a 2019, 1.785 na DOAJ de 2000 a 2019, 488 na NDLTD de 1987 a 2019 e nenhum trabalho na BRAPCI e Biblioteca de Teses e Dissertações. No processo de pesquisa foram muito importantes as consultas às referências citadas nos trabalhos.
No que se refere à Arquivologia, à Diplomática Digital e à Ciência da Informação, a pesquisa documental foi direcionada para a literatura que aborda assuntos com potencial de interesse para a Engenharia de Documentos por se relacionarem com funções, atividades e modelos de documentos eletrônicos: Diplomática Digital, Tipologia Documental e as funções arquivísticas de Criação e Descrição.
Após a revisão da literatura, foram selecionados e articulados os conceitos que aproximam as diferentes áreas. O presente artigo está organizado em seções sobre a evolução da Engenharia de Documentos, a apresentação de temas relacionados à Arquivologia, à Diplomática Digital e à Ciência da Informação, análise dos resultados e conclusões.
O advento do digital serve ao início da razão computacional, que abre caminho para novos métodos de registro que induzem a constituição de modos inovadores de representação (CROZAT, 2012). Roger Pédauque (2007[1]apud CROZAT, 2012) considera que o digital favorece a produção e a transmissão de documentos, o que gerou uma revolução conhecida como redocumentarização, que corresponde ao retorno à antiga documentarização, mas em um novo suporte fornecido pela evolução tecnológica e diante mudanças sociais percebidas nas múltiplas dimensões do documento e nos movimentos de suas mediações.
De acordo com Ayuang (2004[2]apud BACHIMONT, 2007), a ciência busca descobrir conhecimentos que ainda não temos, ao passo que a técnica visa inventar artefatos que ainda não existem. As leis universais são liberadas pela ciência, como o que é válido sempre e em toda parte, o que se repete sem exceção. Já a técnica constrói o que não poderia existir, pois é na contingência que ela se encontra. Só que a técnica também faz parte das possibilidades do Ser na medida em que inventa onde a necessidade da natureza deixa a possibilidade (BACHIMONT, 2007). A técnica então inventa as possibilidades em vez de apenas preenche-las com artefatos, momento em que abre novos horizontes para a ação, construindo o que as leis do Ser não nos permitiram antecipar.
Por sua vez, o savoirfaire (know-how) gerado pela técnica dá origem à implementação da Engenharia, que contém
[...] objetivos contingentes e utilitários ao exame teórico e reflexivo ao mergulhar no pensamento abstrato e científico idealizado na complexidade do concreto, que os exerce e os faz progredir. (BACHIMONT, 2007, p. 12, tradução nossa).
Assim, a Engenharia não se resume a uma ciência aplicada que se limita a implementar o conhecimento teórico em um contexto prático, pois ela vai além e adentra uma dimensão original do conhecimento humano que excede a postura científica. A evolução da tecnologia permite o construir e o “fazer coisas” que a ciência ainda não entende, de modo a qualificar o papel da técnica também para expandir novos horizontes.
O primeiro estágio dessa evolução é o da engenharia artesanal, em que o mundo é pensado no modelo de uma oficina de trabalhos manuais com o uso improvisado de ferramentas para se ajustar à natureza única dos materiais utilizados e ao produto singular a ser obtido ao final (BACHIMONT, 2007). No segundo estágio, o da engenharia industrial, o mundo passa a ser projetado no modelo da fábrica, a partir de um sistema de produção que se utiliza de materiais mais brutos (crus), só que eles já estão pré-formatados para a produção, que é assim marcada pela repetibilidade e padronização. É como engenharia industrial que a Engenharia de Documentos surge, relacionada à escalabilidade das soluções, à reusabilidade e ao intercâmbio de dados e padrões, com processo de validação similar ao processo produtivo industrial físico (PIEZ, 2001).
A origem da Engenharia de Documentos, como disciplina, remonta a uma apresentação feita em 1967 por William Tunnicliffe, presidente da Graphic Communications Association, na qual enunciou a necessidade de separação do conteúdo intelectual dos documentos da sua apresentação (GEURTS, 2010). Essa noção de separação do conjunto de dados contidos no documento de sua apresentação é conhecida na literatura da área como o “paradigma da engenharia de documentos”, “modelo de múltiplas entregas de publicação” ou “separação do conteúdo do estilo” (GEURTS, 2010, p. 14, tradução nossa).
Quint, Nanard e André publicaram em 1990 o artigo Towards Document Engineering, no qual comparam os métodos e técnicas utilizados na Engenharia de Softwares com os usados para edição de documentos eletrônicos:
Os documentos possuem peculiaridades em sua produção, como a falta de passos previamente definidos para a sua produção, diferentemente da abordagem sequencial clássica de desenvolvimento de software (QUINT; NANARD; ANDRÉ, 1990). Isso porque a produção dos documentos é livre, não ordenada e, em geral, não é previsível ao lidar com as trocas entre os processos envolvidos de produzir sentença e parágrafos, reunir ideias e dados, revisar e organizar ideias no nível semântico, formatar e estruturar logicamente o documento e administrar a produção dos documentos.
A definição expressa da Engenharia de Documentos demorou a surgir, com a primeira aparição em artigo de Bebo White, da Universidade de Stanford, em 1996, sobre Engenharia de Documentos da Web. No quadro abaixo podemos observar a evolução das definições no tempo:
Podemos constatar que a Engenharia de Documentos tem evoluído pela contribuição que cada autor enfatizou em sua época de modo a acumular e sofisticar o conhecimento produzido na área. Como exemplos, mencionamos White (1996) (design, hipertexto e hipermídia), Brüggemann-Klein e Wood (2000) (modelos formais explícitos), Munson (2001) (criar, gerenciar e manter documentos), Glushko e McGrath (2005) (estratégia do negócio) e Crozat (2016) (manipulação técnica articulada com interpretação cultural). A intenção aqui foi apenas ilustrar as ideias dos autores a partir da definição por eles apresentada, pois suas obras são muito mais amplas e exigiriam um nível de detalhamento que não compreende a intenção do presente artigo.
Os limites da Engenharia de Documentos parecem estar ainda em consolidação. No The ACM Symposium on Document Engineering, o evento mais representativo da área, uma quantidade significativa dos papers publicados não faz menção expressa ao termo Engenharia de Documentos, a mesma situação encontrada em outros eventos da área que foram pesquisados.
De todo modo, a Engenharia de Documentos contempla um amplo espectro de abordagens que inclui desde a utilização de análise de estrutura lógica/linguística e reconhecimento de documentos, pesquisa de imagem e multimídia e conversão raster-vetor de linhas de arte, mapas e desenhos técnicos, até a geração automática de documentos, documentos para dispositivos móveis e o processamento e interação de documentos web (LINS, 2011; SABLATINIG; HASSAN, 2016).
Para fins didáticos, propomos separar a Engenharia de Documentos em dois campos de estudo semelhantes aos que iremos abordar adiante na Diplomática Digital. O primeiro deles lida com os documentos do passado, aqueles que já foram criados e que agora precisam ter as suas informações organizadas para recuperação.
Antona Copoulos, Karatzas, Krawczyk e Wiszniewski (2004) desenvolveram um modelo de estrutura e conteúdo para o ciclo de vida de documentos históricos digitais, que compreende a digitalização, qualificação, segmentação, extração, aceitação e a exploração. Witschurke (2005) elaborou um conjunto de ferramentas para apoiar o processo de digitalização de documentos de arquivo, desde o seu escaneamento até a apresentação do conteúdo a ser recuperado. Já Burkard, Vogeler e Gruner (2008) e Becker, Rauber, Heydegger, Schnasse e Thaller (2008) criaram ferramentas para a marcação XML de documentos medievais digitalizados e seus impactos nas Ciências da História para apoiar a preservação de documentos digitais.
O segundo campo envolve uma abordagem prospectiva para a criação de modelos de documentos nato-digitais a serem utilizados em aplicações no futuro:
Nessa abordagem prospectiva, o objetivo da Engenharia de Documentos consiste em modelar documentos e serviços que sejam práticos e efetivos (GLUSHKO; McGRATH, 2005). Ela tem raízes interdisciplinares na análise de informações e sistemas, na publicação eletrônica, na análise de processos de negócio e informática de negócios, e o design centrado no usuário.
Um dos objetivos da Arquivologia consiste no acesso à informação, seja ela para subsidiar o processo decisório, para servir como defesa dos direitos do cidadão ou para preservar a memória da sociedade e seus atores. Tudo isso é feito por meio da organização de dados contidos nos arquivos com vistas à informação.
A Diplomática é a disciplina que estuda o documento único, a unidade arquivística elementar, para analisá-lo em seus aspectos formais com o propósito de definir a natureza jurídica dos atos tanto na sua formação como nos seus efeitos (CARUCCI, 1987[3]apud TOGNOLI, 2013). Ela estuda a espécie documental, assim entendida como o modelo prescrito pelas normas jurídicas, com redação que segue um determinado padrão semântico e formatado de modo a ter validade e credibilidade (BELLOTTO, 2002). A Diplomática e, mais propriamente, a Diplomática Contemporânea ou Tipologia Documental, fundamentam a Arquivologia nas pesquisas sobre práticas de gestão documental e tratamento de massas documentais acumuladas em arquivos (RODRIGUES, 2008).
A união da espécie documental com a função para a qual o documento foi elaborado resulta no tipo documental, que é objeto de estudo da Tipologia Documental, disciplina que ampliou a Diplomática para abranger o contexto, as atribuições, as competências, as funções e as atividades da entidade geradora/acumuladora dos documentos (BELLOTTO, 2002). Por meio da Tipologia Documental são analisados os vínculos de proveniência e organicidade do conjunto de documento, identificando primeiro os que participaram da mesma transação para, então, estabelecer as relações recíprocas dos procedimentos existentes, dos documentos entre si e dos documentos do mesmo grupo que executou outras transações (DURANTI, 1998).
Schellenberg enuncia que os documentos de arquivo “[...] se revelam significativos em relação à atividade e só secundariamente quanto ao assunto.” (SCHELLENBERG, 1980[4]apud RODRIGUES, 2008). E os documentos seriam então “[...] as provas primordiais para as suposições ou conclusões relativas a essas atividades e às situações que elas contribuíram para criar, eliminar, manter ou modificar.” (DURANTI, 1998, p. 2), desse modo, tanto as ações como os efeitos delas decorrentes.
A descrição é a função arquivística que busca identificar e explicar o contexto e o conteúdo dos documentos de arquivo para promover o acesso a eles, o que é feito por meio de representações precisas e adequadas de acordo com modelos predeterminados (CONSELHO INTERNACIONAL DE ARQUIVOS, 2000). Os documentos eletrônicos permitem o registro da representação neles mesmos com as linguagens de marcação como o XML, o que é baseado em uma estruturação prévia de acordo com tipologias documentais específicas (ORTEGA, 2008). O meio digital viabiliza a pré-representação, em que as etapas para apresentar, representar e indicar os pontos de acesso são realizadas no mesmo momento da construção do documento eletrônico.
A identificação consiste no “[...] ato de determinar a identidade do documento de arquivo, de caracterizar os caracteres próprios e exclusivos que conferem essa identidade.” (RODRIGUES, 2008, p. 65). Como função arquivística, a identificação é utilizada para delimitar a identidade do documento de arquivo por meio da atribuição de caracteres que lhe são próprios e exclusivos, em reunir as informações sobre o documento no contexto de sua produção com o uso da descrição dos elementos que constituem a sua identidade (RODRIGUES, 2011).
A vontade de manifestar e dar origem ao ato é que inicia o fluxo de criação do documento que, devido à sua relevância, demanda intervenção arquivística desde esse momento inicial (GAGNON-ARGUIN, 1999). A função arquivística de criação de informação consiste na atividade profissional para estabelecer as condições que assegurem qualidade, validade, credibilidade e sustentabilidade do sistema de informações, o que envolve a seleção da forma mais apropriada e dos relacionamentos entre os diferentes tipos de informação.
No âmbito da Diplomática Digital, iremos enfatizar o Projeto InterPARES (International Researchon Permanent Authentic Records in Electronic Systems), uma iniciativa acadêmica com pesquisadores de diversos países, coordenada pela Universidade de British Columbia, no Canadá, que busca desenvolver conhecimento teórico-metodológico para a preservação de longo prazo de documentos arquivísticos digitais autênticos.
O projeto é composto pela fase 1, desenvolvida de 1999 a 2001, que se concentrou na preservação da autenticidade de registros eletrônicos principalmente de documentos textuais produzidos e mantidos em bancos de dados e sistemas de gerenciamento de documentos (DURANTI; THIBODEAU, 2006). A fase 2, que avançou de 2002 a 2007, buscou desenvolver e articular os conceitos, princípios, critérios e métodos que possam assegurar a criação e manutenção de registros precisos e confiáveis e a preservação a longo prazo de registros autênticos no contexto das atividades artísticas, científicas e governamentais que são conduzidas. Já a fase 3, de 2007 a 2012, consistiu na aplicação da teoria e dos métodos de preservação digital desenvolvidos pelo InterPARES e outros esforços de pesquisa até hoje em planos de ação concretos para corpos de registros existentes que devem ser mantidos a longo prazo por arquivos.
Desde 2012 está em andamento o InterPARES Trust, que busca criar um arcabouço teórico e metodológico que apoie o desenvolvimento de redes integradas e consistentes de políticas, procedimentos, regulamentos, padrões e legislações que possam ser aplicados aos registros digitais criados, armazenados e acessados usando a Internet, de modo a aumentar a prover confiança pública e boa governança em benefício da economia digital e da memória persistente (JANSEN; DURANTI, 2013).
O InterPARES 1 definiu as características do registro eletrônico com base tanto na teoria arquivística como na teoria diplomática de forma complementar (DURANTI; THIBODEAU, 2006). Do ponto de vista arquivístico, os registros são partes de agregações, incluindo o exame das suas relações com outros registros, com as pessoas envolvidas em sua criação e com as atividades no curso das quais elas são criadas e usadas. Já a teoria diplomática propõe-se a examinar registros como itens, o que viabiliza a identificação das características incorporadas nos próprios registros.
InterPARES 1 também estabeleceu as seguintes características necessárias de um registro eletrônico: forma fixa, conteúdo completo e inalterado; conteúdo imutável; ligações com outros registros por meio de código de classificação; contexto administrativo identificável; um autor, um destinatário e um redator; uma ação na qual o registro participa ou em que eles auxilia procedimentalmente ou como parte do processo de decisão (DURANTI; THIBODEAU, 2006).
Em seguida, o InterPARES 1 adotou a hipótese a partir da Diplomática de que os registros tradicionais e os eletrônicos são semelhantes o suficiente para possibilitar a concepção de uma forma documental ideal, típica, com todos os elementos possíveis de um registro (DURANTI; THIBODEAU, 2006). A partir daí, foi criado um modelo (template) de registro eletrônico ideal com quatro seções: (1) Forma documental (elementos intrínsecos, nomes das pessoas que concorrem para a criação do registro, data cronológica, local de origem do registro, indicação e descrição da ação ou assunto, a atestação, e a declaração de validação; elementos extrínsecos: recursos de apresentação, assinaturas eletrônicas e selos, carimbo digital de data, sinais especiais); (2) Anotações (adições feitais ao registro após sua criação como parte de sua transmissão; adições feitas ao registo no curso de sua manipulação na qual o registro participa; adições feitas no registro no curso de sua gestão como um registro); (3) Contexto (categorização do registro em jurídico-administrativo, contexto de proveniência, contexto procedimental, contexto documentário e contexto tecnológico); e (4) Meio, que não está ligado indissociavelmente à mensagem por não armazenar o registro como tal.
Glushko e McGrath (2005) apontam a surpreendente estabilidade do conceito de documento, o que seria explicado pela sua constituição e nítida utilidade: documento é um pacote independente de informações relacionadas por meio do qual as pessoas e as empresas interagem umas com as outras. A Engenharia de Documentos tem como objeto os documentos devido ao fato deles estruturarem a interface do aplicativo para o usuário, ou seja, eles são as interfaces para os serviços e os processos de negócios. A interface do documento é o que vai manter limpas e estáveis as relações entre os parceiros de negócio. Nesse sentido, a utilidade do documento ultrapassa a comunicação de informações para alcançar o próprio consenso sobre as atividades de diferentes agentes e a execução dessas mesmas ações.
Os documentos transacionais podem ser assim classificados como documentos dispositivos na Diplomática, em que a ação e a documentação são concomitantes, ambas intrinsecamente ligadas, tendo o documento como o princípio e o fim da ação jurídica (PAOLI, 2010[5]apud TOGNOLI, 2013).
Na Arquivologia, o conceito de Tipo Documental é o que apresenta características que o aproximam do documento transacional, em especial pelo vínculo estreito entre o documento e o procedimento que lhe dá origem, bem como pela homogeneidade de formato, conteúdo informativo e suporte (RODRIGUES, 2008). As relações entre espécie e tipo dos documentos são consideradas “[...] formas relativamente estáveis de enunciados em sua estrutura composicional, estilo e conteúdo temático.” (SANTOS; SOUSA; BARRANCOS, 2017).
O InterPARES 1 concluiu, a partir dos estudos de casos realizados pela pesquisa, que o meio não é um fator relevante na avaliação da autenticidade de um registro, de modo que a preservação de um registro eletrônico está ligada à capacidade em reproduzi-lo (DURANTI; THIBODEAU, 2006).Há então a diferença significativa entre a forma como um documento eletrônico é manifestado a uma pessoa e a forma em que ele é armazenado digitalmente, o que evidencia a diferença do documento digital de um tradicional, além de exigir uma descrição exata da natureza de um documento para que se possa verificar se ele tem sua identidade preservada quando sofre alterações em seu meio de armazenamento ou no formato de processamento (DURANTI; THIBODEAU, 2006).
E que a relação entre um registro eletrônico e um arquivo de computador pode ser de um-para-um, um-para-muitos, muitos-para-um ou muitos-para-muitos, na medida em que os termos recorde file nunca devem ser usados como intercambiáveis (DURANTI; THIBODEAU, 2006).
Foi evidenciado nos estudos de caso a importância de um conceito-chave: os atributos dos registros, ou seja, as características definidoras de cada registro ou de um elemento de registro, sendo que este já uma parte constituinte da forma documental do registro (DURANTI; THIBODEAU, 2006). Os atributos explicitados fora do registro, a exemplo dos metadados, são essenciais para identificar objetos digitais que não possuem um conteúdo estável ou uma forma fixa.
Para demonstrar os conceitos das diferentes áreas é que elaboramos o quadro abaixo:
A partir da comparação podemos concluir que há muitas semelhanças e complementaridade no tratamento de documentos pela Engenharia de Documentos, Arquivologia e Diplomática Digital. Os conceitos utilizados não são exatamente idênticos, pois eles têm origem em áreas com objetivos diferentes, mas encontram-se muito próximos. Iremos adiante destacar dois pontos em que as abordagens são mais complementares entre si.
Os conceitos de espécie e tipo documental são centrais na Arquivologia e Diplomática Digital, mas não são utilizados conceitos semelhantes na Engenharia de Documentos. O paradigma da Engenharia de Documentos vai trabalhar a transformação da função em forma, o que é feito por meio de mudanças sequenciais em que o resultado da etapa anterior é usado como insumo da próxima fase (GEURTS, 2010). É o que se designa como cadeia de transformação, na qual as aplicações modernas utilizam o processo de três estágios (passos de transformação) de produção do documento:
Na Autoria o conteúdo do documento é abstraído do seu formato para gerar um conjunto de dados explicitamente estruturado (Structured document), só que não é feita menção a modelos de referência utilizados, à semelhança do que seriam espécies ou tipos documentais. Na mesma linha, a Formatação é determinada pela aplicação do formato de documento adequado para um contexto de entrega específico, porém mais uma vez nos parece faltar conceitos como o de espécie e tipo documental para balizar essa aplicação. Afinal, para selecionar a estruturação dos dados e a forma do documento mais adequados é essencial que sejam confrontados com paradigmas existentes já consagrados pelo uso.
A espécie e o tipo documental carregam características próprias como uma estrutura de informações pensada para o exercício de determinada função por parte de uma organização, o que permite a identificação das séries documentais utilizadas. Com isso, a partir do modelo lógico e formato do documento identificado (espécie e tipo documental), é possível deduzir a função exercida. Ou, no sentido inverso: uma vez identificada a função, será possível deduzir qual a espécie e o tipo documental adequados no caso.
O ambiente digital disponibiliza uma variedade imensa de alternativas para organizar e representar os processos de negócios e suas transações, ou seja, poderíamos presumir que a abordagem prospectiva da Engenharia de Documentos abre caminho para criar formatos e estruturas lógicas inovadores das informações a serem produzidas.
Mas, como é possível demonstrar, o caminho trilhado é exatamente o inverso. Primeiro, porque a abordagem da Engenharia de Documentos está toda centrada na figura do documento, este artefato com milênios de existência. Em segundo lugar, os conceitos articulados pela Engenharia de Documentos convergem para estudos da Diplomática que remontam há quase quatrocentos anos, e de Tipologia Documental que se desenvolveram nos últimos sessenta anos.
A utilização dos conceitos de documento, espécie e tipo documental como pontos de partida permitem que, uma vez combinados com a tecnologia existente, tenham seu potencial de representar informações multiplicadas exponencialmente. Portanto, os conceitos de espécie e tipo documentais trazem muitas possibilidades de contribuição significativa no desenvolvimento de pesquisas no âmbito da Engenharia de Documentos.
Outro ponto marcante identificado foi a proximidade dos elementos de descrição utilizados na Arquivologia e Diplomática Digital com os componentes de documento propostos pela Engenharia de Documentos. Um dos objetivos da Arquivologia é o acesso à informação pelo usuário, o que envolve instrumentos para organizar e representar as informações em níveis conceituais, tais como os elementos de descrição da Norma Brasileira de Descrição Arquivística (NOBRADE) e linguagens documentárias.
Já na Engenharia de Documentos a questão conceitual é uma etapa intermediária para o seu fim último, o qual consiste em executar aplicações de documentos, o que requer a definição dos seus componentes. O modelo básico de um documento é subdividido em dois tipos de componentes:
a) componentes de conteúdo, que contém os valores de informação discreta;
b) componentes estruturais, que são agregações dos anteriores, subdividindo-se em semânticas e de apresentação (GLUSHKO; McGRATH, 2005).
O componente estrutural de apresentação permite identificar a localização das informações no documento, o que muitas vezes pode indicar qual o tipo de significado daquela informação, ou seja, o componente de conteúdo do documento pode ser implicado pelo componente de apresentação desse mesmo documento.
Antona Copoulos, Karatzas, Krawczyk e Wiszniewski (2004) desenvolveram pesquisa em documentos textuais de relatos de prisioneiros da Segunda Guerra Mundial nos campos de concentração em que relacionaram os itens dos modelos de layout utilizados (componentes de apresentação) com os tipos de conteúdo (componentes de conteúdo) em cada item do layout. Com isso, puderam propor um Modelo de desenvolvimento de Ciclo de Vida de Documento Digital que atribui ao profissional especialista a tarefa de aceitação das informações somente nas hipóteses em que a classificação automatizada não apresentou resultados satisfatórios.
Assim, os componentes de documentos devem ser especificados e implementados não como definições de tipos de documentos somente, mas como artefatos participantes de uma arquitetura orientada a objetos para execução em aplicações (BRÜGGEMANN-KLEIN; WOOD, 2000).
Os componentes de documentos podem materializar nos sistemas eletrônicos das organizações as regras derivadas dos requisitos funcionais de um processo de negócio de modo a prover confiabilidade ao documento arquivístico ao estabelecer os formatos adequados para cada tipo de transação, estabelecer os elementos fixos de cada formato de documento e delimitar as possibilidades de criação do documento alinhadas ao processo padronizado (KETELAAR, 1997). Temos, assim, uma similaridade grande entre os componentes de documentos e os elementos de descrição quanto ao tratamento conceitual dos dados e da informação, sendo que a maior diferença nos parece estar voltada à exigência de que os componentes atendam a determinados requisitos para compor aplicações.
No modelo contemporâneo de rede de relacionamentos entre organizações, os processos de negócio não ficam restritos a uma única organização, eles perpassam diversas delas em relações business to business (GLUSHKO; McGRATH, 2005). Para viabilizar as integrações, aqui consideradas como o controle compartilhado de dados ou processos de negócio entre aplicativos conectados ou fontes de dados, uma das opções é promover o tightcoupling, próprio para transações com altas taxas de dados. A sua principal desvantagem é a constante possibilidade de mudanças incontroláveis ou inesperadas nas interfaces (tais como o layout da tela, as estruturas de registro ou tabelas), situação que não é recomendada para integrações entre organizações.
Por isso, a Engenharia de Documentos e o InterPARES adotam a arquitetura fracamente acoplada (loosecoupling) para a integração entre aplicações de diferentes organizações por utilizar descrições mais abstratas de componentes dos documentos (DURANTI; THIBODEAU, 2006; GLUSHKO; McGRATH, 2005). Assim, justifica-se que a Engenharia de Documentos tenha uma abordagem centrada nos documentos pelo seu alto grau de estabilidade, o que contribui para a formação de consensos mais estáveis entre as organizações quanto aos significados dos documentos e os propósitos dos processos de negócios.
É muito significativo observar que, não obstante o volume imenso de dados e informações produzidos em documentos eletrônicos no mundo, as integrações entre os sistemas de organizações sejam baseadas de modo predominante nas descrições mais abstratas de componentes de documentos, que estruturam as regras dos processos de negócio envolvidos. Tais descrições representam um volume muito pequeno de dados e informações que são produzidos nessas organizações, mas a Engenharia de Documentos demonstra como as descrições abstratas desempenham papel crucial para que os processos de negócio possam se desenvolver com mais eficiência.
O segundo ponto é que a Diplomática Digital tem como um de seus principais objetivos a preocupação com a autenticidade e confiabilidade do documento eletrônico, o que é viabilizado por meio da utilização do modelo (template), o registro eletrônico ideal. InterPARES 2 definiu uma taxonomia de documentos em: documentos estáticos (não possibilitam alteração de conteúdo ou forma, mas apenas abertura, fechamento e navegação); documentos interativos (possuem conteúdo e/ou forma variáveis), podendo ser não-dinâmicos (com regras de conteúdo e forma que não variam) ou dinâmicos (DURANTI; THIBODEAU, 2006). Em seguida, analisou as implicações dos tipos de documentos conforme a sua capacidade em prover registros autênticos.
Na Engenharia de Documentos não foi identificada essa preocupação na criação de modelos de documentos nato-digitais para utilização em aplicações no futuro, pois seu objetivo maior foi de transformar documentos como interfaces de aplicações para implementar processos de negócios (GLUSHKO; McGRATH, 2005).
Nessa medida, a abordagem multidisciplinar nos parece muito útil para o preenchimento desta lacuna, em que a Diplomática Digital pode colaborar com a Engenharia de Documentos na aplicação de requisitos de autenticidade nos seus conceitos de Document components, Form convention, Document model, Schema document e Styles heet.
No presente artigo pudemos abordar a evolução da Engenharia de Documentos, disciplina que ainda é pouco difundida no Brasil. O artigo de Quint, Nanard e André (1990), apresentado há 29 anos, dialoga sobre um conjunto significativo de desafios para a Engenharia de Documentos:
a) as dificuldades de semântica devido aos diferentes usos do documento;
b) a falta de elicitação de requisitos pelo autor do documento;
c) a duplicidade de gramáticas que regem documentos (estrutura lógica e linguagem natural);
d) os limites imprecisos entre os elementos estruturais (estrutura lógica, estrutura física e conteúdo);
e) estrutura gráfica complexa para atender a leitura humana;
f) início da escrita pelo autor em texto desestruturado;
g) falta de conhecimento pelo editor do documento de sua estrutura lógica abstrata.
Os resultados da pesquisa revelaram como muitos desses desafios estão sendo superados e como as abordagens utilizadas se aproximam da Arquivologia e da Ciência da Informação. Isso aponta caminhos para a elaboração de estudos futuros sobre temas como documentos transacionais e documentos de arquivo, schema documents e elementos internos, stylesheet e elementos externos, procedimentos de análise e concepção do documento a partir de processos de negócio ou conjuntos documentais.
Retomamos a lição de Bachimont (2007) de que a Engenharia adentra uma dimensão original do conhecimento que inclusive excede a postura científica, por concretizar ações que a própria ciência não entende ainda. Stéphane Crozat (2012) resgatou o famoso artigo de Vannevar Bush de 1945, As we may think, elaborado no final da Segunda Guerra Mundial como reflexão sobre os meios técnicos para melhorar o armazenamento e recuperar informações dos grandes volumes documentais de produção científica da época. Passados 67 anos, Crozat (2012) inicia seu capítulo de livro com o título As we may write para mostrar que o digital também se tornou um outro meio para produzir o documento, em que impõe à escrita suas propriedades técnicas que transforma a própria natureza fundamental do documento.
No ambiente digital, a forma como o documento é escrito pode ter os seus efeitos potencializados ao ser produzido em sistemas eletrônicos, sejam eles para fins de recuperação da informação, seja para garantir a conformidade de execução dos processos de negócio. As contribuições da Engenharia de Documentos revelam mais uma necessidade de continuar a partir de conceitos utilizados na Arquivologia, Diplomática Digital e Ciência da Informação a partir das potencialidades e limitações da tecnologia, do que provocar propriamente uma ruptura nesse desenvolvimento.
edw.sfs@gmail.com
renasou@unb.br