Daniel Gomes, investigador da Fundação para a Computação Científica Nacional (FCCN) criou e é atualmente o líder do Arquivo.pt, um serviço criado para funcionar como um backup e motor de busca do passado da web portuguesa. A principal missão desta iniciativa é preservar os projetos que vão sendo criados sob o domínio .PT. Em bom rigor, é a memória da web portuguesa.

O Arquivo.pt já agrega perto de cinco milhões de sites e cerca de quatro mil milhões de páginas, com dados desde 1996. Estes são valores de um repositório que é rico em conteúdos, mas também são valores que não deixam os elementos do Arquivo.pt totalmente satisfeitos. Há sempre sites que não são preservados, há sempre uma parte da história da internet portuguesa que se perde para sempre. O objetivo desta plataforma é exatamente que isso não aconteça.

Desde 1996, à medida que surgiam novos projetos web portugueses – como os primeiros jornais online – os investigadores procuravam-nos no Internet Archive para verificarem o processo de preservação. Foi aí que repararam que esse processo não era o mais completo e chegava mesmo a não contemplar algumas páginas web portuguesas.
Segundo Daniel Gomes, “nós começamos a pensar ‘Bem, o Internet Archive faz um bom trabalho, mas se calhar nós aqui também temos esta necessidade de fazer um arquivo mais exaustivo’. Fizemos um projeto inicial, no ano 2000, com a Biblioteca Nacional de Portugal. Tentou-se fazer uma recolha seletiva das publicações online portuguesas, não era uma recolha de larga escala, como fazemos hoje, era algo mais focado”.

Mais tarde, em 2001 nasce o TUMBA!, um acrónimo para Temos Um Motor de Busca Alternativo!. A tecnologia criada em torno do TUMBA!, um motor de pesquisa mais focado na internet portuguesa, acabaria por funcionar como a génese de desenvolvimento do Arquivo.pt.

Só em 2006 é que foi disponibilizado um protótipo do arquivo e em 2008 é que o projeto arrancou de forma oficial. Em 2010 foi lançado o primeiro protótipo experimental do serviço de pesquisa e acesso do Arquivo.pt. Agora o sistema é um devorador de informação.

“No Arquivo.pt quando a pessoa clica no resultado, o Arquivo.pt reproduz a página como ela era na data em que foi recolhida. É uma preocupação e um desafio diferente: tem de se preservar a informação da forma mais fidedigna e original possível. Isto é um desafio de investigação e tecnológico bastante grande que nós temos que enfrentar. Além disso, além de preservarmos uma determinada página numa determinada data, preservamos também a evolução da página ao longo do tempo”.

Em 2016 o Arquivo.pt teve em média 3.900 utilizadores por mês. Este ano a média de acessos ronda os 7.000 utilizadores por mês, um crescimento assinável, mas que os responsáveis do projeto gostavam de ver ainda mais acentuado.

Fonte e mais informações: https://www.futurebehind.com/arquivo-pt-memoria-da-web-portuguesa/

Share