Semana de estágio Erasmus+ no Arquivo.pt de Praga a Lisboa

Visit to FCCN tv studio

Por: Marie Haškovcová and Luboš Svoboda, Webarchiv, National Library of the Czech Republic, 13 a  17 de maio de 2024.

Visita no âmbito do Erasmus+

Graças ao programa europeu Erasmus+ da UE, centrado na educação de adultos – mobilidade de pessoal, tivemos a oportunidade de passar uma semana a acompanhar o Arquivo.pt e comparar as estratégias do arquivo Web checo – Webarchiv – com as abordagens dos nossos colegas portugueses.

Em ambos os casos, trata-se de arquivos centrados em conteúdos nacionais (checos e portugueses) na Internet.

O Arquivo.pt

Enquanto o arquivo web checo faz parte da Biblioteca Nacional da República Checa, o arquivo português faz parte da FCCN, no âmbito da FCT – Fundação para a Ciência e a Tecnologia, que tem como objetivo contribuir para o desenvolvimento da ciência, da tecnologia e do conhecimento.

A FCT presta serviços de IT ao sistema de ensino superior e de Investigação português, bem como conetividade de alta velocidade à Internet. O contexto institucional de ambos os arquivos reflecte-se também nas especificidades dos seus conceitos.

A visita incluiu uma apresentação da equipa e dos espaços do campus e dos departamentos, uma apresentação das actividades de ambos os arquivos e uma discussão sobre os diferentes aspectos do nosso trabalho – ferramentas técnicas e curatoriais, tecnologias e processos, ambiente legislativo e questões éticas, armazenamento de dados, alguns serviços, actividades de investigação, perspectivas e planos futuros.

O arquivo da Web checo

O arquivo web checo foi fundado em 2000, as cópias de arquivo mais antigas datam de 2001 e tem atualmente mais de 580 TB de dados. Tal como o Arquivo.pt, recolhe conteúdos num domínio nacional com base numa lista de endereços URL obtida junto do seu fornecedor. Na sua estratégia de aquisição, complementa estas recolhas, ditas abrangentes, com recolhas temáticas e selectivas.

As colecções temáticas referem-se a um tópico ou evento específico, podem ser pontuais ou de construção contínua, e combinam recursos seleccionados manualmente e recursos extraídos automaticamente. As colecções selectivas destinam-se a ser recolhidas a longo prazo, têm registos de catalogação detalhados que fazem parte da bibliografia nacional checa e são licenciadas – as cópias de arquivo estão, portanto, disponíveis gratuitamente através do catálogo.

No âmbito das actividades de investigação em arquivos da Web, apresentámos o nosso projeto destinado a detetar as chamada web morta através da aplicação Extinct Websites e a criar uma base de dados que sirva de base para monitorizar mudanças mais amplas na web checa, bem como o projeto WACloud destinado a extrair grandes volumes de dados do arquivo da web.

Troca de conhecimentos e experiências

Entre os projectos portugueses, interessou-nos, por exemplo, o CitationSaver, e também discutimos o projeto Memorial, a recolha da Wikipédia portuguesa, e as actividades do arquivo português relacionadas com a formação sobre a preservação da Web (módulos de formação).

A reunião foi enriquecida pela discussão de colecções temáticas específicas.

  • A coleção de Net Art checa documenta a arte digital e a sua transformação no espaço em linha, proporcionando uma perspetiva histórica da arte única.
  • Outra coleção importante é a coleção “Redes sociais dos Membros do Parlamento da República Checa 2021-2025”, que preserva as comunicações e interacções em linha dos deputados checos, de valor inestimável para o estudo do marketing político e da vida política pública.
  • A coleção GitHub arquiva repositórios importantes desta popular plataforma para programadores, preservando os principais projectos de software nacionais e o seu código para as gerações futuras.
  • Por último, a coleção Crypto, NFT, Blockchain, Web3, Metaverse traça o crescimento e o impacto da tecnologia no espaço dos bens digitais. Estas colecções são recursos fundamentais para a investigação e análise da cultura, política e tecnologia digitais, e a discussão destas colecções em reuniões de arquivistas da Web contribui para o desenvolvimento de métodos de arquivo e inovação tecnológica.

Concentrámo-nos na troca de conhecimentos e experiências na identificação de endereços para gravar (seeds), na otimização do fluxo de trabalho e na partilha de dicas e aspectos técnicos.

Partilha de boas práticas

Discutimos as melhores práticas para identificar e recolher os principais recursos da Web, um passo fundamental para garantir um arquivo abrangente e representativo. Partilhámos várias estratégias para automatizar e simplificar os fluxos de trabalho, incluindo a utilização de ferramentas de raspagem da Web e filtragem avançada de conteúdos.

As conversas técnicas incluíram soluções para problemas comuns, como a recolha de páginas Web dinâmicas e a superação de restrições de acesso. A reunião constituiu uma plataforma valiosa para a partilha de métodos inovadores e para a promoção da colaboração entre peritos, promovendo o desenvolvimento de um arquivo digital eficaz e sustentável.

Erasmus+ visti to FCCN TV studio
Luboš Svoboda, curador digital, Marie Haškovcová,coordenadora do Webarchiv e Ricardo Basílio, curador digital do Arquivo.pt em visita ao Estúdio da FCCN, FCT.

 

Heritales e Crowd-Recycling mostram websites antigos do Alentejo no Dia Internacional dos Museus

Heritales Crowd-Recycling e Arquivo.pt no Dia Internacional dos Museus

O dia 18 de maio, Dia Internacional dos Museus, foi assinalado por todo o país com entradas gratuitas, visitas guiadas, animação de espaços e exposições relacionadas com a memória e o património.

O Arquivo.pt contribuiu com uma exposição de páginas antigas, intitulada “Memória Digital através da Internet do Passado”, que esteve patente num dos stands no Museu dos Coches, em Lisboa.

As páginas foram selecionadas para mostrar diversos aspetos do Alentejo ao longo do tempo. A partir de 2016, selecionou-se páginas relativas ao projeto Heritales.

Heritales e Crowd-Recycling chamaram a atenção para a preservação da memória da Internet

Heritales é um projeto sediado em Évora que tem por objetivo estudar e divulgar o património em todas as suas manifestações. É conhecido pelo seu evento principal criado em 2016, o HERITALES – International Heritage Film Festival.

Crowd-Recycling é um projeto focado nas boas práticas para a sustentabilidade.

O Heritales, o Crowd-Recycling e o Arquivo.pt concretizaram esta ação em colaboração com o objetivo de dar visibilidade aos conteúdos publicados na Web ao longo do tempo. Preservar e dar acesso aos conteúdos digitais é fundamental para valorizar o património.

Porque é que fazer uma exposição de websites antigos é um boa ideia

Fazer uma exposição de websites ao longo do tempo é relativamente fácil, bastando ter um tema que pode ser também a história de uma instituição e escolher páginas conservadas no Arquivo.pt.

Uma exposição de sites antigos é uma ideia original para o público-alvo. Muitas vezes apresenta textos e imagens que só existiram na Web.

Ao chamar a atenção para os websites damo-nos conta que muitas coisas ficaram por gravar e isso muda a nossa visão sobre os conteúdos que publicamos hoje. Passados a cuidar mais da gravação de páginas importantes, por exemplo, tomando medidas ou gravando-as na hora com o SavePageNow.

Heritales Crowd-Recycling e Arquivo.pt no Dia Internacional dos Museus
Heritales, Crowd-Recycling e Arquivo.pt presentes no Dia Internacional dos Museus no Museu dos Coches

Dia Mundial da Internet foi a 17 de maio

No dia anterior ao Dia Internacional do Museus assinalou-se o Dia Mundial da Internet (17 de maio). A proximidade das duas comemorações vem mesmo a propósito do tema da preservação da memória.

Portugal ligou-se à Internet, pela primeira vez, em 1991, com o projeto da FCCN “Serviço IP da RCCN”.

Para relembrar como tudo aconteceu, deixamos-lhe as três sugestões que a FCCN publicou nas redes sociais para este dia:

Arquivo.pt é finalista dos prémios do Digital Preservation Coalition

dpc-award-thumb

Última atualização em 25 de Junho de 2024 às 14:23

Os prémios do Digital Preservation Coalition

O Digital Preservation Coalition (DPC) é um consórcio internacional dedicado à promoção da preservação digital e das suas boas práticas.

Os DPC Awards são uma forma de divulgar e promover casos de uso exemplares e inovadores, provenientes de candidaturas de todo o mundo.

Por essa razão, o Arquivo.pt aceitou o desafio para dar a conhecer os seus serviços à comunidade internacional.

A equipa do Arquivo.pt apresentou duas candidaturas aos DPC Awards 2024 nas categorias de “Award for Safeguarding the Digital Legacy” (prémio para a salvaguarda da herança digital) e “Award for Research and Innovation” (prémio para investigação e inovação).

Candidaturas do Arquivo.pt aos Prémios DPC

#1 Catálogo de ferramentas do Arquivo.pt para preservação digital

A informação que rege a vida atual nasce digital e é divulgada online. No entanto, objetos digitais de valor incalculável publicados em linha têm vindo a perder-se irremediavelmente.

O Arquivo.pt é uma infraestrutura pública que preserva objetos digitais publicados em linha para salvaguardar este legado digital para as gerações futuras.

Em outubro de 2023, após 15 anos de investigação e desenvolvimento, o Arquivo.pt lançou um Catálogo de 13 ferramentas inovadoras para apoiar a preservação de conteúdos online em risco, desde a sua aquisição até à sua disseminação (ex. pesquisa e acesso, APIs, formação, conjuntos de dados abertos ou exposições).

O Catálogo de ferramentas do Arquivo.pt para preservação digital for selecionado como finalista do Award for Safeguarding the Digital Legacy.

#2 Pesquisa de imagens preservadas da Web

As imagens publicadas online são artefactos digitais preciosos que documentam a época contemporânea para as gerações futuras.

Esta iniciativa descreve a investigação e o desenvolvimento de um sistema inovador de pesquisa de imagens que permite a descoberta e acesso a milhares de milhões de imagens preservadas da web desde a década de 1990.

Esta investigação foi aplicada para potenciar o Arquivo.pt com um serviço de pesquisa de imagens único no mundo e disponível publicamente a qualquer utilizador da Internet.

As publicações científicas resultantes estão disponíveis em acesso aberto e o software desenvolvido está disponível através de projetos livres de código aberto para serem reutilizados e melhorados pela comunidade.

Um serviço de Portugal para o mundo

O Arquivo.pt é um serviço de preservação acessível na Internet e são cada vez mais os casos de uso do Arquivo.pt em estudos científicos por investigadores de outros países.

Os motivos para esse uso internacional do Arquivo.pt são o facto de preservar conteúdos em várias línguas, como por exemplo acerca das Eleições Europeias de 2019, e por ser inovador nos serviços que disponibiliza para pesquisa e acesso à informação preservada.

Assim sendo, um investigador de qualquer parte do mundo pode pesquisar textos, imagens ou treinar modelos de Inteligência Artificial com base na informação histórica preservada pelo Arquivo.pt.

Para saber mais

Comemoração dos 50 anos do 25 de Abril com o Arquivo.pt

50anos25abril-ArquivoPT-IG-Feed-2

O Arquivo.pt associou-se às comemorações dos 50 anos do 25 de Abril no âmbito das iniciativas promovidas pela Fundação para a Ciência e a Tecnologia, I.P. (FCT), em parceria com a Estrutura de Missão – Comissão Comemorativa 50 anos 25 de Abril.

As iniciativas foram as seguintes: uma viagem no tempo, uma recolha especial sobre o tema “25 de Abril”, uma comunicação no Congresso Internacional 50 anos de Abril e a inclusão de uma menção especial na edição de 2025 do Prémio Arquivo.pt.

Exposição “Memórias do 25 de Abril na Internet”

A exposição Memórias do 25 de Abril na Internet apresenta uma seleção de páginas Web sobre as comemorações do 25 de Abril em diversas regiões do país, desde o princípio da Web na década de 1990.

Os critérios para a escolha das páginas da exposição foram os seguintes:

  • Páginas relativas a comemorações do 25 de Abril;
  • Páginas encontradas no Arquivo.pt em datas próximas da efeméride, em cada ano;
  • Diversidade para incluir diversas zonas do país;
  • Manifestações populares e cerimónias oficiais.

Uma memória histórica sem os arquivos da Web é incompleta. Com esta viagem no tempo pretende-se convidar os cidadãos a viajarem no tempo, percorrendo páginas Web antigas e reavivando episódios recentes da nossa vida em democracia.

Visite a exposição: arquivo.pt/50anos25abril

Recolha especial sobre o 25 de Abril

Para assinalar a efeméride, o Arquivo.pt realizou uma recolha especial sobre o tema “25 de Abril” e disponibilizou os resultados num conjunto de dados abertos, publicado no portal Dados.gov.

O conjunto de dados contém uma lista de palavras-chave colocadas num motor de busca a fim de obter resultados sobre o tópico “25 de Abril”.  Na pesquisa considerou-se nomes de pessoas, lugares, aspetos políticos, sociais, culturais e ainda palavras associadas ao acontecimento.

As pesquisas foram realizadas no dia 22 de março de 2024 utilizando o Bing Search API, um serviço de pesquisa automática que devolve resultados de acordo com critérios de relevância do próprio serviço Bing e de outros configurados por nós.

No total foram obtidos 12.650 endereços únicos de páginas Web. Espera-se que a gravação destas páginas seja útil para as organizações que produziram esses conteúdos, para os investigadores que pretendem estudar a nossa história e para os cidadãos que cultivam o sentido da memória e da democracia.

Participação no Congresso Internacional 50 anos de Abril

memorial-congresso-internacional-50anos25abril
João Gomes, Diretor Serviços Avançados, FCCN-FCT apresentando o serviço Memorial do Arquivo.pt no Congresso Internacional 50 anos de Abril

No dia 2 de maio de 2024, João Gomes, Diretor dos Serviços Avançados da FCCN Unidade de Computação Científica da Fundação para a Ciência e a Tecnologia I.P., apresentou o Arquivo.pt aos participantes do Congresso Internacional 50 anos de Abril, como um serviço distinto, aberto aos cidadãos e útil para as organizações.

Este evento organizado pela Comissão Comemorativa 50 anos 25 de Abril e pela Universidade de Lisboa e incluiu uma apresentação de dois serviços da FCT para os cidadãos: o Arquivo.pt e os cursos massivos online da NAU.

O Arquivo.pt é um serviço de preservação da Web disponível para todos os cidadãos que pretendem pesquisar conteúdos antigos publicados na Web.

A utilização do Arquivo.pt contribui para uma melhor compreensão da nossa história. Além disso, fornece serviços úteis para a cibersegurança, como por exemplo o Memorial do Arquivo.pt que é capaz de manter os sites antigos das instituições, prevenindo ataques e poupando-lhes recursos.

Menção especial “O 25 de Abril e a Democracia” no Prémio Arquivo.pt 2025

O Prémio Arquivo.pt realiza-se anualmente e distingue trabalhos que utilizem o Arquivo.pt.

Em 2025, na continuação das comemorações dos 50 anos do 25 de Abril, será incluída uma menção especial a trabalhos sobre o tema “O 25 de Abril e a Democracia”.

Desafia-se pois os investigadores e cidadãos interessados a criarem trabalhos inovadores utilizando o Arquivo.pt.

Para questões relacionadas com o Prémio Arquivo.pt, contacte-nos.

Formação sobre a preservação da Internet na Madeira

jornadas-fccn-2024-funchal-thumb

Última atualização em 8 de Maio de 2024 às 19:31

A equipa do Arquivo.pt esteve no Funchal, entre os dias 15 e 19 de abril de 2024, e  apresentou duas sessões distintas acerca da preservação da Web. A primeira teve lugar durante as Jornadas FCCN 2024 e a segunda foi um workshop, depois de terminado o evento, na sede da Agência Regional para o Desenvolvimento da Investigação, Tecnologia e Inovação (ARDITI).

Arquivo.pt nas Jornadas FCCN 2024

A sessão realizada durante as Jornadas FCCN intitulou-se “Arquivo.pt ao serviço da cultura” e teve por objetivo destacar duas colaborações do Arquivo.pt no domínio da cultura e do conhecimento, nomeadamente, com a Wikimédia Portugal e com o Museu Virtual do Turismo (MUVITUR).

Na sessão Zapping FCCN o Arquivo.pt apresentou o serviço Arquivo404 que permite aos sites oferecerem conteúdos históricos em vez da negativa “Página não encontrada”.

Workshop com a ARDITI

O Workshop pós-Jornadas, promovido pela ARDITI, foi aberto às instituições regionais e aos cidadãos em geral. Intitulou-se “O Arquivo.pt e a preservação da memória da Internet”.

Os conteúdos foram estruturados seguindo o programa de formação que o Arquivo.pt e precedidos pelo enquadramento entre os outros serviços da FCCN – Computação Científica da FCT.

Tão importante como os conteúdos foi o diálogo que se estabeleceu durante as sessões entre os participantes e a equipa do Arquivo.pt para esclarecer dúvidas ou para colocar questões.

A preservação da Web é cada vez mais importante para as organizações que pretendem conservar parte da memória institucional e desenvolver políticas de segurança.

A ARDITI deu um sinal importante acerca da preservação da memória Web das instituições madeirenses ao acolher e promover as ações formativas do Arquivo.pt.

Se pretende promover a preservação de conteúdos Web na sua organização consulte a formação do Arquivo.pt e contacte-nos.

Mais informação

Arquivo.pt atinge 1 PetaByte de informação preservada!

Última atualização em 5 de Dezembro de 2023 às 20:12

O Arquivo.pt acabou de acumular 1 PetaByte de conteúdos no seu acervo no mês em que completou 16 anos de existência.

Esta informação está acessível tanto para os investigadores como para o cidadão comum.

No Arquivo.pt é possível pesquisar informação publicada na Web no passado, como por exemplo:

Descubra mais páginas através das paginas selecionadas nas Exposições Online do Arquivo.pt.

Primeira página da Web portuguesa
O site oficial da Expo’98
Notícias do jornal Público no dia da final do Campeonato Europeu de Futebol de 2016
Exposição Online “Memória da Imprensa Portuguesa. Páginas Web antigas de jornais e revistas (1996-2018)”

Objetivo e missão do arquivo da Web de Portugal

O Arquivo.pt foi criado a 8 de novembro de 2007 com o objetivo de preservar conteúdos da Web portuguesa.

Em 2013, enquanto serviço operado pela Fundação para a Ciência e a Tecnologia, a sua missão foi formulada nestes termos: “Promover a preservação de conteúdos disponíveis na Internet nacional, garantindo a disponibilização deste à comunidade científica e ao público em geral” (Decreto Lei nº55/2013).

Nos anos mais recentes, o Arquivo.pt tem criado novos serviços tais como o CitationSaver que permite aos investigadores gravarem as referências a conteúdos Web que constam nos seus artigos científicos. O Memorial e o Completar a Página facilitam o acesso aos conteúdos dispersos no enorme bloco de 1 PetaByte de dados.

De onde veio tanta informação?

Para atingir o volume de 1 PetaByte, o Arquivo.pt gravou periodicamente conteúdos dos sites do domínio .PT e de sites portugueses noutros domínios.

Além disso, foram feitas recolhas frequentes, diárias e mensais, a um pequeno conjunto de sites governamentais e aos principais sites noticiosos em Portugal.

No âmbito de colaborações internacionais, foram recolhidos conteúdos de sites em diversas línguas, como por exemplo sobre as Eleições Europeias de 2019.

Os conteúdos anteriores a 2008 vieram do Internet Archive e de doações, como é o caso de uma coleção feita pela Biblioteca Nacional e pelo INESC sobre as Eleições Legislativas de 2005.

O maior conjunto de dados em língua portuguesa em acesso aberto para os investigadores

Ao disponibilizar 1 PetaByte de informação, em acesso aberto e através do uso de APIs (Application Programming Interfaces), o Arquivo.pt é uma ferramenta útil para a investigação.

Por exemplo, um investigador que pretender fazer um estudo sobre as eleições em Portugal pode utilizar todo o acervo do Arquivo.pt. Melhor ainda, pode focar-se apenas em algumas recolhas especiais dedicadas às eleições, escolhendo as que lhe interessam e descarregando apenas alguns Terabytes para processar automaticamente com as APIs.

Contributo de diversas equipas e dos amigos do Arquivo.pt

O desenvolvimento do Arquivo.pt vai para além da questão tecnológica e deve-se à dedicação e persistência das diversas pessoas que nele trabalharam, desde 2007.

Deve-se também ao contributo de muitos amigos do Arquivo.pt, sempre atentos para ajudar a melhorar, e à resposta da comunidade de utilizadores.

“Parabéns campeões! Obrigado”

Dia Mundial da Preservação Digital dedicado à Justiça

Última atualização em 13 de Novembro de 2023 às 8:59

O Instituto de Gestão Financeira e Equipamentos da Justiça (IGFEJ) e a Secretaria Geral do Ministério da Justiça (SGMJ), em colaboração com a BAD, organizaram o evento “Preservação Digital na Justiça” para assinalar o Dia Mundial da Preservação Digital, a 2 de novembro de 2023.

Neste evento, realizado no auditório da Polícia Judiciária, em Lisboa, estiveram presentes representantes da área governativa da Justiça e profissionais no âmbito dos arquivos, da comunicação e dos departamentos de informática.

Como usar o Arquivo.pt para preservar os websites institucionais

O Arquivo.pt participou com a apresentação “Preserve o seu website” na qual se abordou a questão da preservação dos websites institucionais e aspetos cada vez mais importantes como a cibersegurança.

As entidades da área da Justiça podem beneficiar do Arquivo.pt e dos seus diversos serviços para assegurar uma boa preservação dos seus websites, mitigar ameaças à cibersegurança e fornecer conteúdos históricos aos cidadãos.

Como conclusão desta apresentação ficaram as seguintes recomendações:

  • Faça o inventário e dê a conhecer os seus Websites atuais e históricos
  • Use colaborativamente os serviços do Arquivo.pt
  • Grave no formato normalizado os conteúdos com o ArchiveWeb.page

Materiais

FCUL preservou mais de 100 websites históricos no Memorial

thumb-memorial-fcul

Última atualização em 27 de Março de 2024 às 11:16

Mais de 100 websites históricos da Faculdade de Ciências da Universidade de Lisboa (FCUL) passaram a estar acessíveis através do serviço Memorial do Arquivo.pt.

O Departamento de Informática da FCUL enviou ao Arquivo.pt uma lista de websites antigos alojados nos seus servidores que já não eram atualizados, mas cujo conteúdo histórico continua a ser interessante para a comunidade (ex. websites de projetos de investigação ou eventos científicos).

O Arquivo.pt preservou estes websites em colaboração com os seus responsáveis, procurando manter para o futuro uma representação fiel dos conteúdos publicados.

A FCUL redirecionou o endereço de cada website para o Arquivo.pt, e pôde então desligar os servidores respetivos e passar a poupar os recursos que dispendia na sua manutenção (ex. eletricidade, espaço, recursos humanos).

O caso exemplar do MiNEMA

print-memorial-minema

Página de aterragem do www.minema.di.fc.ul.pt no Memorial do Arquivo.pt.

O website do programa científico MiNEMA foi o primeiro que a FCUL integrou no Memorial do Arquivo.pt. Este website deixou de ser atualizado em 2009 quando o projeto terminou. A FCUL investiu recursos na manutenção do website por mais 10 anos até ser necessário desligá-lo por motivos de cibersegurança.

O Memorial do Arquivo.pt surgiu então como uma opção e a partir de 2020, a FCUL passou a ter de manter apenas o domínio www.minema.di.fc.ul.pt enquanto que o Arquivo.pt passou a preservar a informação contida no website.

Note-se que os conteúdos do website continuam a ser apresentados nos resultados dos motores de busca.

Faça como a FCUL e preserve os seus websites históricos no Memorial!

Cada vez mais as instituições recorrem ao Memorial do Arquivo.pt para preservar de forma segura os conteúdos dos seus websites históricos. Por exemplo, a FCUL preservou 116 websites, o Centro de Gestão da Rede Informática do Governo preservou 23 e a Fundação para a Ciência e a Tecnologia preservou 40.

As instituições públicas têm prioridade para beneficiar deste serviço. No entanto, outras entidades também o podem solicitar desde que sejam detentoras do domínio do website.

Identifique os seus websites históricos que podem ser integrados no Memorial do Arquivo.pt e contacte-nos!

Saber mais

Completar páginas do passado: sim é possível!

Última atualização em 16 de Outubro de 2023 às 19:04

Existem páginas arquivadas da web que são reproduzidas de forma incompleta devido a problemas ocorridos durante o processo de arquivo (ex. desformatadas ou com falta de imagens embedidas).

Completar a página é uma funcionalidade do Arquivo.pt que permite recuperar os elementos em falta nas páginas arquivadas a partir de outros arquivos da web ou dos websites originais.

Quando um utilizador visualiza uma página arquivada no Arquivo.pt, basta aceder ao menu Opções no canto superior direito e escolher Completar a página.

Este processo é realizado de forma automática e o Arquivo.pt é o único arquivo da web no mundo que o disponibiliza!

Como funciona o Completar a página?

Se abrir uma página arquivada que lhe pareça incompleta, tente a opção Completar a página e aguarde.

O Arquivo.pt efetuará uma busca pelos elementos em falta, na Internet e noutros arquivos da Web utlizando o protocolo Memento. Em caso de sucessso, os elementos obtidos serão imediatamente mostrados na página.

Posteriormente, estes elementos recuperados são integrados no acervo do Arquivo.pt, para que a página apareça sempre mais completa em futuras consultas realizadas por qualquer utilizador.

complete-page-website-cristina-guerra

Completar a página de entrada do website da artista Cristina Guerra encontrou uma imagem em falta.

Por exemplo, o website da artista Cristina Guerra, arquivado em 2005, tinha uma imagem em falta. Mas utilizando o Completar a página, foi possível em 2021 obtê-la a partir de outro arquivo da web que a tinha preservado e passar a presentar a página de forma mais completa.

Participe na curadoria colaborativa para melhorar a qualidade do Arquivo.pt!

Devido ao elevado número de páginas arquivadas não é possível ao Arquivo.pt tentar completar todas automaticamente. Por isso, a colaboração dos utilizadores para identificar páginas importantes com elementos em falta e tentar completá-las é importante.

Ao utilizar o Completar a página a comunidade de utilizadores está  a contribuir para melhorar a qualidade das páginas preservadas no Arquivo.pt!

Experimente sempre completar as páginas arquivadas que lhe pareçam incompletas e se detectar algum problema contacte-nos.

Divulgue o Completar a página do Arquivo.pt!

Participação do Arquivo.pt em eventos internacionais sobre arquivos da Web

logo-IIPC

Última atualização em 1 de Agosto de 2023 às 12:54

Encontro com a comunidade dos arquivos da Web

O Internacional Internet Preservation Consortium (IIPC), consórcio que reune inicitivas de preservação da Web de todo o mundo, realizou a Assembleia Geral com os seus associados no dia 10 de maio de 2023.

Nos dias seguintes, 11 e 12 de maio, realizou-se a IIPC Web Archiving Conference (IIPC WAC), uma iniciativa aberta à comunidade, onde podem participar pessoas ou entidades não associodas ao IIPC e interessadas no domínio da preservação da Web.

O acolhimento dos dois eventos foi feito conjuntamente pela KB – National Library of the Netherlands, e pelo Beeld &  Geluid – Netherlands Institute for Sound & Vision.

Contributos do Arquivo.pt na Web Archiving Conference

O Arquivo.pt participou nas reuniões dos grupos de trabalho do IIPC (Training Working Group e Curators Working Group) e contribuiu com apresentações nas sessões temáticas  Collaborations & Outreach e Program infrastructure (sessões 7 e 17).

  • Arquivo.pt updates 2023 (slides)
  • Linking web archiving with arts and humanities: the collaboration between ROSSIO and Arquivo.pt (video, slides)
  • Arquivo.pt behind the curtains (slides)

Encontro com a comunidade dos investigadores RESAW

RESAW (Research Infrastructure for the Study of Archived Web Materials) é uma iniciativa criada em 2012 com o objetivo de promover os estudos baseados em conteúdos Web arquivados, em áreas como Ciências Sociais, Artes e Humanidades Digitais.

A conferência RESAW 2023 foi realizada no MUCEM Lab (Mediterranean Institute of Heritage Crafts), em Marselha, de 5 a 6 de junho de 2023, sob o tema Exploring the Archived Web During a Highly Transformative Age.

Contributos do Arquivo.pt no RESAW 2023

O Arquivo.pt contribuiu com apresentações para as sessões Web Archive in Mediterranean area and its merge(4.A,), From online Tools to Web Archive (6.B.), Towards a participatory approach to collections (9. A.), Digging up the materials for writing web history (9.B.).

  • How to research governmental web data? (abstract, slides)
  • Archiving Cryptocurrencies (abstract, slides)
  • Time to explore, time to learn from the archived web: Arquivo.pt training initiative (abstract, slides)
  • Exhibiting Web Memories from Arquivo.pt: a call for community participation (abstract, slides)

Encontro do Projeto CLEOPATRA

O Projeto CLEOPATRA, liderado pelo L3S Research Center at the Gottfried Wilhelm Leibniz University of Hannover, desenvolveu desde 2019 um progama de formação para investigadores doutorandos (Early Stage Researcher, PhD).

O Arquivo.pt participou em três cursos: Incentives design for hybrid multilingual information processing and analytics, em Southampton; National and transnational media coverage of European parliamentary elections, 2004-2014, Londres; e NLP for under-resourced languages, em Zagreb, na Croácia.

Em 2022, o Arquivo.pt acolheu dois investigadores nas suas instalações os quais utilizaram os recursos arquivados e tiveram apoio especial da equipa do Arquivo.pt para desenvolverem a sua investigação.

O projeto CLEOPATRA terminou em 2023 com a realização de um encontro a 16 de maio, em Hannover, que reuniu professores, investigadores e representantes de instituições envolvidas.

Daniel Gomes, Gestor do Arquivo.pt, destacou as novas ferramentas que o Arquivo.pt disponibiza e os resultados dos trabalhos realizados pelos investigadores que passaram pelo Arquivo.pt.

  • Secondments@Arquivo.pt and new research tools available (Slides)