Preservação digital engloba o conjunto de atividades ou processos responsáveis por garantir o acesso continuado, a longo-prazo, à informação existente em formato digital. A preservação digital consiste na capacidade de garantir que a informação digital permanece acessível e com atributos de autenticidade suficientes para que possa ser interpretada no futuro mesmo recorrendo a uma plataforma tecnológica diferente daquela que foi originalmente utilizada no momento da sua criação.

A KEEP SOLUTIONS assume, desde a sua génese, um papel pioneiro na construção de ferramentas e conhecimento científico na área da preservação digital. A sua atividade não se fecha na venda de serviços e produtos, mas sim na investigação, desenvolvimento e construção de uma maior de compreensão dos fenómenos que ameaçam a longevidade da informação digital e as estratégias mais adequadas para os mitigar.

A atividade da KEEP SOLUTIONS neste domínio contempla, mas não se resume a:

Desenvolvimento de ferramentas ou serviços

A KEEP SOLUTIONS participou no desenvolvimento de algumas das ferramentas mais interessantes no domínio da preservação digital, tendo fornecido código-fonte para enriquecer produtos como o DSpace, FITS, RODA, Koha, entre outros.

Participação em projetos europeus

A KEEP SOLUTIONS participa ou participou ativamente em diversos projetos de I&D de âmbito europeu, trabalhando lado-a-lado com os maiores especialistas da área e com instituições de renome internacional. A destacar a participação da KEEP SOLUTIONS nos projetos SCAPE, 4C e e-ARK.

Participação em eventos científicos

Os nossos colaboradores têm vindo a marcar presença como oradores em todos os eventos científicos de maior relevância nesta área, e.g. iPres, International Conference on Theory and Practice of Digital Libraries, International Conference on Asia-Pacific Digital Libraries, Open Repositories, Congresso da BAD, Conferência Luso-Brasileira sobre o Acesso Aberto, entre outros.

Fruto do seu vasto conhecimento na área da preservação digital, a KEEP SOLUTIONS disponibiliza aos seus clientes os seguintes produtos e serviços especialmente desenhados para auxiliar a implementação de processos de preservação digital.

Consultoria para a certificação ISO 16363 – Audit and Certification of Trustworthy Digital Repositories

Em 2007 foi publicado o documento Trustworthy Repositories Audit & Certification: Criteria & Checklist vulgarmente conhecido por TRAC, que reúne um conjunto de requisitos que visam aferir a capacidade de um repositório digital em armazenar e garantir o acesso continuado a coleções de materiais digitais. Em Junho de 2012, o TRAC foi promovido a norma internacional, tendo sido aprimorado e republicado sob a designação de ISO 16363 – Audit and certification of trustworthy digital repositories.

A implementação da norma ISO 16363 potencia a confiança junto dos principais atores que gravitam em torno de um repositório digital (i.e. produtores, consumidores, operadores, administradores, etc.) pois estabelece um clima de maior compreensão e transparência relativamente aos processos subjacentes à gestão da informação digital armazenada. Este referencial normativo identifica e define os requisitos que um repositório digital deverá assegurar para ser considerado um repositório “confiável”.

A organização responsável por um repositório “confiável” deverá ser capaz de demonstrar que possui os processos necessários que lhe permitam, de forma controlada e sistemática, identificar e prevenir as ameaças que colocam em risco a salvaguarda e o acesso continuado à informação digital sob a sua alçada. Estas ameaças poderão ser de natureza diversa (e.g. organizacional, financeira, tecnológica, social, física, ambiental, etc.), pelo que a monitorização do meio ambiente, o planeamento adequado, a manutenção do sistema e a sua sustentabilidade financeira deverão ser preocupações constantes de quem assume a responsabilidade por um repositório.

A KEEP SOLUTIONS, alicerçada na sua imensa experiência e know-how na área da preservação digital, disponibiliza um conjunto de competências para a implementação da norma ISO 16363. Entre estas encontram-se o diagnóstico de conformidade, auditorias internas ao repositório e respetivos processos de preservação, aconselhamento na aquisição de serviços e sistemas, etc.

O nosso processo de consultoria para a certificação é composto pelas seguintes fases:

  • Diagnóstico – Realização de um diagnóstico preliminar para determinar o nível de conformidade do repositório com a ISO 16363.
  • Plano de ações – Elaboração de um plano de ações após análise de relatório de diagnóstico que visam aumentar a conformidade do repositório à norma ISO 16363.
  • Implementação das ações – Implementação das ações reportadas no plano de ações por parte dos responsáveis pelo repositório e infraestruturas de suporte.
  • Auditoria interna – Realização de auditoria para análise das ações implementadas e inspeção de evidências apresentadas.
  • Relatório de auditoria – Elaboração de relatório final de auditoria onde são reportadas as não conformidades detetadas, bem como potenciais sugestões de melhoria.

Para mais informações ou esclarecimentos, não hesite em contactar-nos através do endereço sales@keep.pt.

Caracterização de formatos e análise de riscos de preservação

Um repositório digital é geralmente composto por metadados (descritivos, técnicos, de preservação, entre outros) e por informação digital. A informação digital materializa-se geralmente sob a forma de ficheiros ou conjuntos de ficheiros que vulgarmente designamos por “representações digitais”.

Por vezes, os responsáveis por um repositório digital não sabem exatamente qual a dimensão e o teor do seu conteúdo digital. Isto pode acontecer por um conjunto variado de razões: o software de gestão não é capaz de gerar metainformação técnica sobre a informação incorporada, formatos incorretamente identificados durante o processo de ingestão, informação corrompida ou mal formada, etc…

O desconhecimento sobre as características técnicas dos ficheiros que se encontram no nosso repositório introduzem um risco elevado para a preservação desses materiais. Se não soubermos exatamente quais as características dos nossos materiais, não será possível delinear uma estratégia de preservação adequada que considere os riscos inerentes a cada formato e defina um plano de ação eficaz e ajustado às reais necessidades da comunidade de interesse do repositório. Mais ainda, as ações de preservação a implementar dependem diretamente dos formatos existentes, pelo que, o desconhecimento destas características impede o repositório de agir e de preservar adequadamente os seus materiais.

A atividade que visa identificar, validar e extrair propriedades de representações digitais designa-se por “caracterização”. Esta atividade é vital para se conhecer o conteúdo do repositório e para elaborar planos de preservação que visem assegurar o acesso continuado à informação digital.

A KEEP SOLUTIONS disponibiliza ferramentas e workflows de caracterização que contemplam as três atividades intrínsecas à caracterização de formatos:

  • Identificação de formatos (e.g. PUID, Mimetype)
  • Validação de formatos de acordo com a sua especificação
  • Extração de propriedades (largura, altura, esquema de compressão, esquema de cor, nº de páginas, nº de figuras, nº de tabelas, etc.)

As ferramentas desenvolvidas pela KEEP SOLUTIONS são capazes de se ligar a qualquer sistema de gestão de conteúdos digitais, quer este seja, baseado no sistema de ficheiros, base de dados relacional, orientado ao serviço, ou outros.

A KEEP SOLUTIONS disponibiliza também um serviço de análise de riscos associados aos formatos armazenados, sugerindo ações que visam aumentar a sua acessibilidade no momento e a longo-prazo.

Para mais informações ou esclarecimentos, não hesite em contactar-nos através do endereço sales@keep.pt.

Validação de projetos de digitalização

Para sermos capazes de garantir o acesso continuado à informação digital é necessário ter a certeza que a informação que detemos está correta. Isto significa, termos a certeza que a informação está válida de acordo com a especificação do formato e que todos os restantes requisitos relevantes para a sua preservação se encontram devidamente assegurados.

Quando se inicia um projeto de digitalização, são geralmente definidos os requisitos do processo. Geralmente, esses requisitos envolvem a definição do formato dos materiais que resultarão da digitalização, a resolução dos mesmos, algoritmos de compressão, esquemas de cor, metadados que é necessário produzir, etc.

Num projeto de digitalização que envolva vários milhares de itens, é comum ocorrerem erros e omissões. O controlo de qualidade é, assim, uma atividade fundamental para quem recorre ao outsourcing em projetos de digitalização. Se os critérios de qualidade da digitalização não forem devidamente definidos à partida e posteriormente validados durante a receção dos materiais, há um risco elevado de que uma percentagem significativa dos materiais digitalizados não estar de acordo com o que era esperado.

A KEEP SOLUTIONS disponibiliza um conjunto de ferramentas e workflows para validação de materiais digitalizados que verificam, entre outras, as seguintes situações:

  • Validação de formatos de acordo com a sua especificação (e.g. PDF/A, TIFF, JP2, etc.)
  • Validação do perfil de digitalização (i.e. resolução, esquema de cores, compressão, etc.)
  • Validação de metadados descritivos (i.e. completude dos metadados descritivos)
  • Deteção de páginas repetidas
  • Deteção de páginas em branco

Estas ferramentas produzem relatórios de conformidade que possibilitam a identificação dos objetos que não respeitam o perfil de digitalização pré-acordado. Com base nesta informação o contratante poderá exigir a repetição parcial ou global da digitalização.

Para mais informações ou esclarecimentos, não hesite em contactar-nos através do endereço sales@keep.pt.

Migração de formatos em larga-escala

A grande maioria dos sistemas de gestão de informação não apresentam quaisquer restrições quanto aos formatos de informação que são capazes de incorporar. Esta capacidade, associada à ausência de políticas de incorporação digital, conduz inevitavelmente a uma situação onde a dispersão de formatos é de tal forma variável que se torna praticamente impossível do ponto de vista técnico e/ou financeiro assegurar o acesso continuado aos seus conteúdos.

A forma de mitigar este fenómeno é diminuir a dispersão de formatos através de um processo que se designa por “normalização”. Isto significa converter objetos digitais para formatos mais adequados para preservação a longo-prazo.

Por exemplo, formatos comprimidos (e.g. JPEG ou ZIP) são mais vulneráveis perante situações de bit rot (i.e. modificações acidentais dos bits de um ficheiro) do que formatos não comprimidos. Ao alterar um bit de informação num ficheiro ZIP, este perde a capacidade de ser descomprimido e perdemos o acesso total à informação. No entanto, a modificação de um bit num ficheiro não comprimido, tem um impacto substancialmente menor, e.g. um pixel pode mudar de cor ou uma letra num documento de texto pode ser substituída por outra.

É, sobretudo, por esta razão que converter a informação digital para formatos mais adequados para preservação a longo-prazo é uma operação vital num contexto de preservação digital.

A KEEP SOLUTIONS disponibiliza um serviço de conversão/normalização de formatos capaz de integrar com qualquer sistema existente na sua organização. O sistema é baseado em Web services pelo que pode facilmente ser invocado por sistemas já existentes. O seu modo de expansão é baseado em add-ons, permitindo que se adapte rapidamente a novas necessidades e requisitos do cliente.

Para mais informações ou esclarecimentos, não hesite em contactar-nos através do endereço sales@keep.pt.

Preservação de bases de dados relacionais

Por vezes, os sistemas que suportam determinadas atividades de negócio ou serviços de uma organização são desativados. As razões que conduzem a esta ocorrência são variadas, e.g. o sistema foi substituído, sofreu uma atualização ou simplesmente o serviço ou atividade que este suportava já não existe.

Acontece, no entanto, que por razões patrimoniais, evidenciais ou até por questões de recuperação de informação em caso de desastre, existe a necessidade de preservar as bases de dados que suportavam os sistemas e as atividades entretanto terminadas. A preservação dessas bases de dados é fundamental na medida em que estas constituem evidência material de que determinada atividade foi realizada. Os registos dessa atividade podem não ter migrado para o novo sistema (e.g. por já não existir) ou porque podem ter sofrido adulterações durante o processo de cópia.

A KEEP SOLUTIONS dispõe de ferramentas de extração de dados com respetiva transformação para formatos neutros, independentes da tecnologia, que asseguram o acesso aos dados dezenas de anos após a base de dados ter sido terminada. Disponibilizamos, também, ferramentas de navegação, pesquisa e visualização sobre a informação extraída com capacidade de operar sobre grandes volumes de dados.

Para mais informações ou esclarecimentos, não hesite em contactar-nos através do endereço sales@keep.pt.

__

As ilustrações incluídas nesta página foram criadas por Tom Woolley da Curve Agency para o Digital Preservation Business Case Toolkit sob a licença Creative Commons Attribution-NonCommercial 3.0 Unported License.
Share