Participação na Web Archiving Conference em Bruxelas

thumbnail-iipc-wac-2026

A equipa do Arquivo.pt participou na Web Archiving Conference (WAC) e na Assembleia Geral do International Internet Preservation Consortium (IIPC), em Bruxelas, entre 20 e 23 de abril de 2026.

A Web Archiving Conference é o maior evento dedicado à preservação da Internet. Tem a participação de iniciativas de todo o mundo, como por exemplo, o Internet Archive, bibliotecas nacionais  e centros de investigação que desenvolvem metodologias para usar conteúdos históricos da Web.

O IIPC (International Internet Preservation Consortium)  é a entidade que procura reunir as diversas iniciativas de arquivo da Web, coordenando esforços para a manutenção e desenvolvimento de normas, ferramentas, coleções e formação.

O estado atual do arquivo da Web belga

A KBR (De Koninklijke Bibliotheek van België), biblioteca nacional belga, situada no coração de Bruxelas, foi a anfitriã da Web Archiving Conference, que teve cerca de 250 participantes. A sessão de abertura da conferência foi a de apresentação de resultados e do fecho do projeto piloto para o arquivo da Web belga.

Em 2017,  a Bélgica iniciou um projeto denominado PROMISE ((PReserving Online Multiple Information: towards a Belgian Strategy) para o arquivo da Web nacional. A partir de 2019, com o financiamento do Belgian Science Policy Office (BELSPO), houve um período de cinco anos de experimentação que terminou com a apresentação de um protótipo de arquivo da Web em 2026. Foram parceiros deste projeto a entidade dos arquivos nacionais, o State Archives of Belgium (AGR) e, da parte da investigação, a Ghent University.

A recolha de conteúdos da Web belga foi feita no quadro do depósito legal existente para materiais impressos, adaptado em dezembro de 2016 para os conteúdos digitais da Web.

O projeto PROMISE utilizou as ferramentas abertas, partilhadas pela comunidade do IIPC (para a recolha, o Browsertrix-crawler, ferramenta do Webrecorder.net; para a reprodução, o software pywb). O acesso aos conteúdos é restrito e limitado ao sistema da biblioteca e a coleção foi enriquecida com metadados e informação no catálogo.

Apresentações do Arquivo.pt

Para mostrar o que o Arquivo.pt tem feito para promover o acesso e demonstrar o valor do seu serviço, contribuímos com três apresentações.

Galeria de imagens

IIPC WAC 2026

Abertura da WAC 2026 na KBR
Equipa do Arquivo.pt no IIPC WAC
Apresentação de Vasco Rato
Apresentação de Pedro Gomes
wac-iipc-memorial-cabon-footprint-1
Abertura da WAC 2026 na KBR Equipa do Arquivo.pt no IIPC WAC Apresentação de Vasco Rato Apresentação de Pedro Gomes wac-iipc-memorial-cabon-footprint-1

Projeto Bridges “Ponte cultural” da Universidade de Évora colabora com o Arquivo.pt

thumbnail-i-seminario-bridges

Última atualização em 27 de Maio de 2026 às 11:37

O Arquivo.pt está a colaborar com o projeto Bridges “Ponte Cultural”, do CIDEHUS – Centro Interdisciplinar de História, Culturas e Sociedades, da Universidade de Évora.

O contributo do Arquivo.pt consiste em apresentar conteúdos formativos acerca da preservação de conteúdos publicados na Internet e realizar coleções especiais no âmbito temático do projeto, como por exemplo, a mulher, a imigração e os conteúdos regionais do Alentejo na blogosfera.

O projeto BRIDGES, dirigido pela Investigadora Principal María Zozaya, é um trabalho resultante do concurso Science for Policy, (PLANAPP-FCT, S4P25-LT 24) “desenvolvido no âmbito do concurso Estudos de Ciência para as Políticas Públicas, uma iniciativa do Centro de Planeamento e de Avaliação de Políticas Públicas em parceria com a Fundação para a Ciência e a Tecnologia, I.P. e financiada pelo Plano de Recuperação e Resiliência”.

I Seminário Internacional “Mulheres em Foco”

Nos dias 17 e 18 de março, realizou-se o primeiro Seminário Internacional do Projeto BRIDGES intitulado “Mulheres em Foco: da narrativa à representação na linguagem, arte, património e mundo digital”.

O Arquivo.pt participou na sessão online com a apresentação “Visibilidade das mulheres na Web: reflexo da nossa sociedade desde a década de 1990”. Mostrou-se como o arquivo contém informação da Web do passado, útil para o estudo da temática da mulher. Destacou-se três trabalhos que utilizaram o Arquivo.pt, nomeadamente:

No âmbito deste tema, o Arquivo.pt está a realizar uma coleção temática sobre as mulheres portuguesas que se evidenciaram no âmbito da cultura, arte e ciência. A lista de URLs ficará acessível no portal Dados.gov.

Materiais da sessão

II Seminário Internacional “I have a dream”

Nos dias 15, 16 e 17 de abril, realizou-se o segundo Seminário Internacional do Projeto BRIDGES intitulado «I have a dream. À luz da diversidade: arte, cultura, políticas públicas e mundo digital».

Erik Bran Marino e Rafael Prezado, alunos doutorandos da Universidade de Évora, apresentaram o “Narrative Monitoring: Análise de Teorias Conspirativas de Substituição Populacional no Arquivo Web Português (1996-2021)“.

No website Narrative Monitor é possível visualizar os resultados e fazer um quiz.

O trabalho Narrative Monitoring, é um dos vencedores do Prémio Arquivo.pt 2025, classificado em 3º lugar. Foi desenvolvido pela equipa de investigadores do CIDEHUS, constituída por Erik Bran Marino, Rafael Prezado, Ana Sofia Ribeiro, Renata Vieira. É um excelente exemplo de utilização do Arquivo.pt em contexto de investigação.

O curador digital do Arquivo.pt, abordou o tema “Os dados da diversidade multiracial no Arquivo.pt” mostrando como a Web tem sido um espaço de liberdade de expressão, de afirmação e reivindicação.

A atividade de arquivar a Web e preservar a memória, por sua vez, é algo que implica iniciativa e participação da comunidade. Foram dados alguns exemplos internacionais e nacionais dessa faceta “ativista” do arquivo da Web:

No âmbito desta sessão o Arquivo.pt está a realizar uma coleção temática acerca da migração e das PRCT, (do inglês Comparative analysis of conspiracy theories in Europe), com base nos 150 termos de pesquisa utilizados na investigação de Erik Bran Marino.

Materiais da sessão

III Seminário Internacional “Limitações invisíveis? Inclusão da diferença”

Nos dias 13, 14 e 15 de maio realizou-se o terceiro seminário Limitações invisíveis? Inclusão da diferença através da arte, cultura e mundo digital, dedicado ao tema da inclusão de grupos intergeracionais, os idosos, as pessoas desfavorecidas, pessoas com deficiência e com neuro divergências (TDAH/ADHD, TEA).

O Arquivo.pt participou na sessão online com um especialista convidado,  José Miguel Nogueira, Professor, membro do CIES-iscte e Investigador Principal do Self-Determination & Inclusion by Theater-Project SDIT.  José Miguel Nogueira falou deste projeto europeu no qual o teatro contribuiu de forma excecional para a integração de pessoas com autismo. Por fim, desafiou a audiência de mentalidade na forma como se relaciona com as pessoas com autismo.

Como contributo especial para esta sessão, curador digital do Arquivo.pt identificou e publicou uma lista de websites das ONGs das pessoas com deficiência com registo no Instituto Nacional para a Reabilitação, onde se pode ver o histórico preservado.

O tema da acessibilidade e os benefícios que traz para toda a sociedade foi especialmente abordado durante a apresentação.

 

Recolha especial de conteúdos Web sobre as Eleições Presidenciais. Precisamos da sua ajuda!

Presidenciais 2026 -logo-PR2026-thumbnail

Última atualização em 13 de Março de 2026 às 11:28

A Eleição para o Presidente da República em 2026 realizou-se entre 18 de janeiro e 15 de fevereiro. O Arquivo.pt recolheu 2.3 Terabytes de conteúdos eleitorais e, agora, disponibiliza os dados relativos a todo o processo, tais como termos de pesquisa, conteúdos identificados e conteúdos arquivados.

As Eleições Presidenciais de 2026 tiveram dois sufrágios, o primeiro a 18 de janeiro, o segundo a 8 de fevereiro, e ainda um turno em 20 freguesias, a 15 de fevereiro, na sequência das tempestades que assolaram o país.  Assim,  é expectável encontrar-se na coleção notícias sobre as zonas afetadas bem como as intervenções políticas dos candidatos presidenciais.

Apelo à participação da comunidade na identificação e arquivo de conteúdos eleitorais

No dia 15 de janeiro o Arquivo.pt convidou a comunidade a participar na recolha acerca das eleições com a seguinte mensagem: “Websites dos candidatos, notícias, colunas de opinião ou publicações nas redes sociais, tudo é útil para uma representação da nossa vida em democracia. Encontrou um conteúdo eleitoral interessante? Participe na identificação e arquivo de conteúdos eleitorais.”

Duas modalidades foram sugeridas:

Metodologia do Arquivo.pt para a cobertura temática das eleições

Seguindo a prática adotada em eleições anteriores, o procedimento teve estes passos:

  • definição de termos de pesquisa
  • identificação de páginas de resultados em motor de busca (SERP)
  • gravação faseada das seeds (endereços de partida para uso do crawler)
  • integração no Arquivo.pt
  • disponibilização de conjunto de dados

Por termo de pesquisa entende-se uma combinação de palavras para usar num motor de busca. Por exemplo: nome_do_candidato+presidenciais 2026+Portugal.

Para identificar conteúdos eleitorais utilizou-se o Google e para extrair os resultados serviu ainda a ferramenta Google Rank Checker,Keyword SERP Ranking Tool. As limitações colocadas recentemente pelo motor de busca à simples pesquisa manual de resultados por um utilizador (10 de cada vez) tornaram menos eficiente o uso deste método.

A gravação foi faseada da seguinte forma: antes e depois da primeira volta, a 12 e 23 de janeiro, antes e depois da segunda volta a 5 e 12 de fevereiro e ainda gravação final de todas as seeds, a 18 de fevereiro.

Resultaram 2.3 Terabytes de informação, 11,4 milhões de ficheiros, obtidos a partir de cerca de 34 mil seeds, usando o Heritrix e o Browsertrix-crawler.

Os conteúdos encontram-se arquivados no coleção EAWP51 e ficarão acessíveis na interface do Arquivo.pt passado 1 ano. Por agora disponibiliza-se informação acerca da pesquisa e identificação de conteúdos.

Conjunto de dados das Eleições Presidenciais 2026

Disponível na plataforma Dados.gov:

Saiba mais sobre as recolhas eleitorais de anos anteriores

Coleções temáticas para descobrir nas sessões online “Café com o Arquivo.pt”

imagem quadrada sessoes cafe pt

Última atualização em 31 de Março de 2026 às 13:03

“Café com o Arquivo.pt” são sessões online curtas para permitir a qualquer pessoa assistir em horário laboral. Tem por objetivo dar a conhecer o Arquivo.pt e trazer contributos da comunidade sobre temas relacionados com a preservação da Web.

Em dezembro de 2025, iniciou-se uma nova série dedicada às coleções temáticas que o Arquivo.pt publica sob a forma de conjuntos de dados na plataforma Dados.Gov. Por exemplo, websites relacionados com o teatro, a música, as escolas, as freguesias, as eleições e outros temas, encontram-se preservados no Arquivo.pt. Pretendemos dar visibilidade a conjuntos de websites cujo histórico se encontra no arquivo da Web e melhorar a sua preservação.

Próxima sessão

15 de abril – em substituição do “Café com o Arquivo.pt”, sessão online em colaboração com o projeto Ponte Cultural, CIDEHUS, Universidade de Évora, dedicada ao tema da “Imigração”.

Será apresentado o trabalho Narrative Monitoring: Análise de Teorias Conspirativas de Substituição Populacional no Arquivo Web Português (1996-2021), 3º classificado do Prémio Arquivo.pt 2025, da autoria de Erik Bran Marino, Rafael Prezado, Ana Sofia Ribeiro, Renata Vieira. O Arquivo.pt contribui para esta sessão apresentando uma coleção especial, realizada este mês, sobre o tema.

Oradores convidados: Erik Bran Marino, Rafael Prezado

Sessões realizadas

24/03/2026 – Ativismo feminista e memória digital – Práticas arquivísticas e dados frágeis

Materiais

Resumo:

As sessões online “Café com o Arquivo.pt” têm por objetivo dar a conhecer o que se faz em Portugal no domínio da preservação de conteúdos publicados na Internet e promover a participação dos investigadores e cidadãos. O destaque desta sessão é para o projeto “FEMglocal – Movimentos Feministas glocais: interações e contradições”. Será feito um enquadramento teórico, seguido da apresentação e comentário de resultados e atividades desenvolvidas. Por exemplo, a identificação de websites e de outros canais digitais utilizados pelos movimentos feministas resultou num conjunto de dados úteis para o estudo do tema. Aqui, coloca-se a questão: como arquivar todos esses conteúdos digitais, frágeis, que circulam na Internet? Como contributo do Arquivo.pt, mostrar-se-á brevemente como funciona a recolha de milhares de conteúdos publicados na Web sobre um tema, por exemplo, sobre o feminismo.

“FEMglocal – Movimentos Feministas glocais: interações e contradições” (PTDC/COM-CSS/4049/2021 / DOI 10.54499/PTDC/COM-CSS/4049/2021), projeto financiado por fundos nacionais através da FCT — Fundação para a Ciência e a Tecnologia, I.P. Com a participação do DivIntLab (CICANT). Com a participação do Projeto Exploratório DigiPlArt  (2024.13064.PEX), também financiado através da FCT.

Saber mais acerca do projeto: https://www.femglocal.pt/

03/12/2025 – Eleições Autárquicas: como arquivamos websites e programas eleitorais

  • Convidados: Mário Rui André e Gonçalo Pereira Costa – Jornal LPP / Lisboa Para Pessoas
  • Data: 3 de dezembro de 2025
  • Inscrição (gratuita). Finalizada.

Materiais

Resumo:

Os convidados, Mário Rui André e Gonçalo Pereira Costa, do jornal LPP / Lisboa Para Pessoas, falaram-nos do Portal das Autárquicas da Lisboa Metropolitana que criaram, onde se encontra informação sobre os candidatos e os seus programas eleitorais. O Arquivo.pt recolheu milhares de páginas e websites eleitorais, mais de 3 terabytes de informação, e explicou brevemente a metodologia utilizada.

Ao percorrer o vídeo da sessão vai saber:

  • Como foram as autárquicas na Área Metropolitana de Lisboa numa perspetiva jornalística;
  • Qual foi a metodologia seguida para recolher conteúdos eleitorais na Internet;
  • Como usar o arquivo da web para obter informação do passado.

Temporadas anteriores

Conferência RESAW na Alemanha teve presença do Arquivo.pt

O Arquivo.pt esteve presente na 6a Conferência RESAW para investigadores das Humanidades Digitais, Media e Comunicação e outras áreas, subordinado ao tema “The Datafied Web”, que teve lugar na Universidade de Siegen, Alemanha, de 4 a 6 de junho de 2025.

RESAW (Research Infrastructure for the Study of Archived Web Materials) é uma iniciativa informal que reúne investigadores que utilizam arquivos da Web na sua investigação. A primeira conferência do RESAW foi em 2015, passando a realizar-se a cada dois anos.

Inicialmente, o RESAW reunia investigadores europeus, mas agora congrega investigadores de todo o mundo, tendo-se tornado num fórum único no seu género.  Em 2025, contou com mais de 100 participantes. Ali se encontra o que de melhor se faz no domínio utilização de arquivos da Web em contexto de investigação.

Niels Brügger, Professor de Media e Comunicação da Universidade de Aahrus, Dinamarca, tem sido o principal impulsionador do RESAW, ao longo de 10 anos.

Destacam-se ainda nomes de investigadores de referência com estudos desenvolvidos no âmbito dos arquivos da Web: :  Valerie Schafer, da Universidade do Luxumburgo, Jane Winters, da Universidade de Londres, Anne Helmond, da Universidade de Utrecht, Susan Aasman da Universidade de Groningen, Sophie Gebeil, da Universidade de Aix-Marseille e Ian Millingan da Universidade de Waterloo.

O tema deste ano The Datafied Web abordou a questão da datificação da Web, desde os seus inícios na década de 1990 à atualidade, marcada pelo processamento massivo de dados e pelo uso da Inteligência Artificial.

Porquê a participação de um arquivo da Web num encontro de cariz académico?

O Arquivo.pt participa regulamente no RESAW desde 2019, pois quer dar-se a conhecer cada vez mais como um serviço destinado aos investigadores nacionais e internacionais.

Graças à participação em eventos internacionais como o RESAW, surgiram várias publicações que usam e referem o Arquivo.pt. Qualquer investigador com acesso à Internet pode pesquisar a informação preservada no Arquivo.pt, usar as APIs, processar informação ou treinar os seus modelos.

Convidamos os investigadores portugueses a participarem neste encontro, pois temos sido a única presença portuguesa em várias edições. Temos um arquivo da Web acessível, pronto a utilizar, o que não acontece em outros países. Gostaríamos de ter investigadores de áreas das Humanidades Digitais e Media e Comunicação em Portugal a usarem mais frequentemente o Arquivo.pt e a participarem ativamente em encontros como o RESAW.

Contributo do Arquivo.pt no RESAW 2025

O Arquivo.pt contribuiu com duas apresentações na edição de 2025 de encontro RESAW, realizado na Universidade de Siegen. A primeira acerca das APIs do Arquivo.pt e da sua aplicação em contexto de investigação, por Vasco Rato. A segunda sobre os conjuntos de dados abertos e listas de sites sobre temas e eventos que o Arquivo.pt preparou para ajudar os investigadores a iniciarem uma exploração mais profunda da informação arquivada.

Galeria de imagens

RESAW 2025 na Universidade de Siegen

20250606_134603
20250605_140131
20250605_140216
20250605_144614
20250605_140143
resaw-2025-06-06-16-34-12-9fabff72
resaw-2025-06-06-16-34-12-52bc46d9
20250605_192107
20250605_192321
20250605_193728
20250606_160211
20250606_091245
20250605_174918
20250604_175309
20250605_105228
20250606_134603 20250605_140131 20250605_140216 20250605_144614 20250605_140143 resaw-2025-06-06-16-34-12-9fabff72 resaw-2025-06-06-16-34-12-52bc46d9 20250605_192107 20250605_192321 20250605_193728 20250606_160211 20250606_091245 20250605_174918 20250604_175309 20250605_105228

Formação do Arquivo.pt com a APDSI. Inscreva-se!

Ciclo de Webinars do Arquivo.pt com a APSDI

Última atualização em 5 de Abril de 2025 às 13:07

Ciclo de Webinars do Arquivo.pt com a APSDI

A APDSI – Associação para a Promoção e Desenvolvimento da Sociedade da Informação promoveu um Ciclo de Webinars sobre o Arquivo.pt, realizado entre o dia 20 de março e o dia 1 de abril de 2025

Este Ciclo de Webinars, dedicado à preservação da memória cultural publicada na Web, é uma colaboração entre a APDSI e o Arquivo.pt, FCCN serviços digitais da Fundação para a Ciência e a Tecnologia I.P..

Luís Vidigal, Sócio Fundador da APDSI, Filipa Fixe e João Tavares, Vogais da Direção,  introduziram o tema de cada sessão e a equipa do Arquivo.pt mostrou como funciona a preservação de conteúdos Web que permite às organizações e aos cidadãos acederem à web do passado.

As quatro sessões tiveram um total de 121 participantes.

Programa

  • Webinar 1 – 20 de março – Arquivo.pt: uma nova ferramenta para pesquisar o
    passado. Daniel Gomes, Gestor do Arquivo.pt – Vídeo, slides
  • Webinar 2 – 25 de março – Bem publicar para bem preservar. Pedro Gomes,
    Encarregado pelas recolhas do Arquivo.pt – Vídeo, slides
  • Webinar 3 – 27 de março – Acesso e processamento automático de informação
    preservada da Web através de APIs. Vasco Rato, Web developer do Arquivo.pt – Vídeo, slides
  • Webinar 4 – 1 de abril – Arquivar a Web: faça-você-mesmo!. Ricardo Basílio, Vídeo, slides
    Curador digital do Arquivo.pt

Inscrição (gratuita mas necessária)

Saber mais

Iniciativa eArchiving organizou workshop e Arquivo.pt esteve presente

José Borbinha, workshop eArchiving, a 25 de Fevereiro no IST (Sala José Tribolet)

Última atualização em 11 de Março de 2025 às 16:21

José Borbinha, Workshop eArchiving, a 25 de Fevereiro no IST (Sala José Tribolet)
Professor Doutor José Borbinha, workshop eArchiving, a 25 de Fevereiro  de 2025, no Instituto Superior Técnico em Lisboa (Sala José Tribolet)

O Arquivo.pt participou no workshop eArchiving Portugal , que se realizou no Instituto Superior Técnico, no dia 25 de fevereiro de 2025, a convite do Professor Doutor José Borbinha, uma das primeiras pessoas a fazer arquivo da web em Portugal quando, na década de 1990, estava na Biblioteca Nacional.

O Professor José Borbinha, melhor que ninguém, sabe contar na primeira pessoa os pequenos episódios, quase épicos, as ações dos primeiros “heróis” que levaram à criação de um arquivo da Web em Portugal. Vê o Arquivo.pt como um serviço imprescindível quando se fala de preservação digital e de salvaguarda do património comunicacional das organizações.

O evento teve um formato hibrido com 50 participantes presencias e 270 online e foi aberto a todas as entidades públicas ou privadas com preocupações ao nível da preservação digital e gestão da informação em qualquer tipo ou formato. Aqui se incluem os conteúdos dos websites e redes sociais!

Os responsáveis dos Municípios, entidades da Administração Local,  tiveram uma grande participação, respondendo ao apelo da Direção-Geral do Livro, dos Arquivos e das Bibliotecas (DGLAB). Este convite à participação de pessoas de todo o país foi uma oportunidade para o Arquivo.pt mostrar como pode ajudar na preservação dos sites institucionais e no cumprimento da Portaria n.º 112/2023, de 27 de abril.

eArchiving, uma iniciativa europeia nascida em Portugal

A iniciativa eArchiving ou Iniciativa de Arquivo Eletrónico tem por objetivo principal o património cultural digital e foi criada numa reunião de parceiros europeus em Lisboa.

“Foi precisamente nesta (sala José Tribolet no Instituto Superior Técnico) que teve início o eArchiving há onze atrás, a 29 de maio de 2014” recordou  José Borbinha (INESC-ID), anfitrião e organizador do workshop.

A iniciativa eArchiving, é gerida, em nome da Comissão Europeia, pelo Consórcio E-ARK, onde se incluem os parceiros portugueses KEEP Solutions LDA e INESC-ID. No consórcio estão ainda o AIT Austrian Institute of Technology GmbH, parceiro principal, e o DLM Forum MTÜ.

Janet Anderson, gestora do eArchiving, mostrou os progressos alcançados em onze anos no domínio da preservação digital. Os projetos financiados pela União Europeia no âmbito do consórcio resultaram no desenvolvimento de especificações, software, formação e conhecimento sobre preservação digital.

Seguiu-se a apresentação de contributos para a preservação digital em Portugal: DGLAB, por Pedro Penteado, Centro Hospitalar São João, por Fernanda Gonçalves, Ministério da Justiça, por Alexandra Lourenço e Cristina Soares, Arquivo.pt, pelo curador digital Ricardo Basílio.

Para terminar, Miguel Ferreira fez a sua intervenção em representação do DLM Forum MTÜ, comunidade onde a KEEP Solutions LDA participa com o desenvolvimento de software. Numa abordagem mais técnica mostrou como estão estruturados os metadados na especificação de empacotamento E-Ark de modo a cumprirem os requisitos da preservação digital.

Como usar o Arquivo.pt para preservação os websites institucionais

Presentation of Arquivo.pt at the eArchiving Workshop, by Ricardo Basílio, digital curator. Photo by Pedro Penteado
Apresentação do Arquivo.pt no Workshop eArchiving por Ricardo Basílio, curador digital. Foto por Pedro Penteado

A preservação digital exige colaboração, tanto ao nível interno como externo entre organizações, e este workshop serviu esse propósito, pois foi ocasião para  partilha de boas práticas, divulgação de ferramentas e serviços e contacto entre pessoas.

Da parte do Arquivo.pt destacou-se três serviços do seu catálogo para a preservação dos conteúdos publicados na web:

Os serviços do Arquivo.pt podem ser utilizados, por exemplo, pelos Municípios para a preservação dos conteúdos publicados nos websites institucionais.

A formação do Arquivo.pt, tais como webinars ou sessões presenciais, são úteis para dar capacidade às entidades para cuidarem dos conteúdos institucionais, incluindo os conteúdos das redes sociais que exigem uma estratégia alternativa.

Slides da apresentação

Saber mais

Vídeos de todas as apresentações, em breve no canal Youtube do E-ARK

Portugueses nos Jogos Olímpicos e Paralímpicos 2024 em coleção internacional de websites do IIPC

print-replay-comiteolimpicoportugal

Última atualização em 11 de Setembro de 2024 às 16:40

print-noticia-rtp-rececao-atletas-paralimpicos-paris-2021
Jogos Paralímpicos. Miguel Monteiro, medalha de ouro, regressa a Lisboa (Notícia no site da RTP, dia 2 de setembro, selecionada para coleção internacional)

O Arquivo.pt contribuiu para a coleção internacional de páginas Web sobre os Jogos Olímpicos, que decorreram em Paris de 26 de julho a 11 de agosto de 2024, e os Jogos Paralímpicos que se realizaram de 28 de agosto a 8 de setembro.

A iniciativa de criar a coleção “Jogos Olímpicos e Paralímpicos 2024” é da responsabilidade do International Internet Preservation Consortium (IIPC), a principal entidade mundial no domínio da preservação da Internet, através do seu grupo de trabalho Content Development Working Group.

As coleções colaborativas do IIPC têm por objetivo promover a criação de coleções temáticas e coleções baseadas em eventos internacionais. As páginas da Web são gravadas e depois disponibilizadas no serviço Archive-it.

No Arquivo.pt também ficarão disponíveis, passado um ano, as páginas desta coleção para quem quiser realizar estudos sobre desporto e olimpismo.

Como foram selecionadas as páginas sobre os atletas portugueses

Nos Jogos Olímpícos representaram Portugal 73 atletas em 15 modalidades, e nos Jogos Paralímpicos 27 atletas,  em 10 modalidades.

O critério de seleção de páginas para a coleção internacional foram notícias sobre os atletas. Para cada atleta selecionou-se páginas referentes às suas expectativas antes dos jogos, à sua prestação na prova e aos seus comentários durante e após a competição.

Há atletas que têm mais notícias selecionadas do que outros e o mesmo acontece com os sites de onde provêm as notícias. A seleção de páginas não se limitou aos primeiros resultados apresentados pelo motor de busca. Procurou-se variedade de canais e notícias de sites regionais e locais, alguns da região ou cidade de onde vieram os atletas.

Mais de 500 páginas para recordar a presença portuguesa em Paris

O contributo do Arquivo.pt, como poderá ver na tabela, já tem mais de 500 paginas Web.

print-tabela-seeds-ilustrativa-jogosolimpicos
Portuguese Seeds – 2024 Summer Olympics and Paralímpics, International Internet Preservation Consortium – Content Development Working Group (IIPC CDG)

Colabore na coleção através do formulário do IIPC

Helena Byrne, curadora dos arquivos da web na British Library e curadora principal desta coleção, convida todas a pessoas a enviarem páginas interessantes para gravar: And we’re off – Get Involved in Web Archiving the Summer Games – Paris 2024.

Para contribuir está disponível o seguinte formulário público:

2024 Summer Olympics & Paralympics

Programa de mobilidade das Bibliotecas do Ensino Superior levou profissionais ao Arquivo.pt

FCCN_A Minha Biblioteca_24 maio 2024_2

Última atualização em 30 de Maio de 2024 às 14:02

Arquivo.pt operado pela FCCN FCT e localizado no Campus do LNEC
Arquivo.pt operado pela FCCN FCT, localizado no Campus do LNEC, na Avenida do Brasil, em Lisboa.

No dia 24 de maio, a FCCN recebeu pela primeira vez profissionais de Bibliotecas do Ensino Superior (BES) no âmbito do programa dinamizado pelo Grupo Trabalho das Bibliotecas do Ensino Superior (GT-BES) da Associação Portuguesa de Bibliotecários, Arquivistas, Documentalistas e Profissionais da Informação (BAD), A minha biblioteca é a tua biblioteca.

Trata-se de um programa de mobilidade que tem como objetivo a realização de visitas de curta duração tendo em vista a troca de experiências e o contacto, in loco e hands on, com boas práticas, fomentando a colaboração e o conhecimento das BES portuguesas entre os profissionais da área.

Serviços avançados para o conhecimento

Nesta primeira edição do programa na FCCN, foi proposto às colegas participantes (3 profissionais da Universidade de Lisboa e 1 da Universidade Católica do Porto) um percurso pelos serviços digitais de apoio às instituições do ensino superior que são operados pela FCCN- FCT

Alguns serviços são conhecidos dos profissionais da informação, como por exemplo, a B-On e o RCAAP. Outros são serviços de backoffice e, por isso,  menos visíveis, mas fundamentais para as instituições de ensino superior. Por exemplo, o Eduroam que garante o acesso à Internet, o RCTSaai para a autenticação ou o RCTS CERT para responder a incidentes de segurança.

Destaque para os serviços Arquivo.pt e NAU

No decorrer dia, estiveram em destaque o Arquivo.pt e a Plataforma NAU, dois serviços da área do conhecimento que estão disponíveis para as Instituições do Ensino Superior e também para a sociedade.

A equipa do Arquivo.pt mostrou o backoffice deste serviço de preservação da Internet em Portugal e realizou um exercício prático de gravação e integração de conteúdos no arquivo da Web.

A Plataforma NAU,  é uma plataforma de MOOCs (Massive Open Online Courses) criada com o propósito de democratizar o conhecimento, promover a literacia digital, possibilitar o ensino e formação a comunidades alargadas de utilizadores, em particular à população portuguesa e lusófona.

Mais recentemente, com a sua integração na plataforma norte-americana edx.org, também a todos os potenciais formandos falantes de língua portuguesa dispersos pelo mundo. Às participantes no programa foi explicado e exemplificado como construir cum curso MOOC na plataforma edx.

O programa incluiu, ainda, uma visita ao Data Center e ao Estúdio de televisão profissional existente na FCCN.

Visita dos participantes no programa de mobilidade das Bibliotecas do Ensino Superior ao Estúdio da FCCN
Visita dos participantes no programa de mobilidade das Bibliotecas do Ensino Superior, da BAD, ao Estúdio da FCCN.

Para saber mais

Semana de estágio Erasmus+ no Arquivo.pt de Praga a Lisboa

Visit to FCCN tv studio

Por: Marie Haškovcová and Luboš Svoboda, Webarchiv, National Library of the Czech Republic, 13 a  17 de maio de 2024.

Visita no âmbito do Erasmus+

Graças ao programa europeu Erasmus+ da UE, centrado na educação de adultos – mobilidade de pessoal, tivemos a oportunidade de passar uma semana a acompanhar o Arquivo.pt e comparar as estratégias do arquivo Web checo – Webarchiv – com as abordagens dos nossos colegas portugueses.

Em ambos os casos, trata-se de arquivos centrados em conteúdos nacionais (checos e portugueses) na Internet.

O Arquivo.pt

Enquanto o arquivo web checo faz parte da Biblioteca Nacional da República Checa, o arquivo português faz parte da FCCN, no âmbito da FCT – Fundação para a Ciência e a Tecnologia, que tem como objetivo contribuir para o desenvolvimento da ciência, da tecnologia e do conhecimento.

A FCT presta serviços de IT ao sistema de ensino superior e de Investigação português, bem como conetividade de alta velocidade à Internet. O contexto institucional de ambos os arquivos reflecte-se também nas especificidades dos seus conceitos.

A visita incluiu uma apresentação da equipa e dos espaços do campus e dos departamentos, uma apresentação das actividades de ambos os arquivos e uma discussão sobre os diferentes aspectos do nosso trabalho – ferramentas técnicas e curatoriais, tecnologias e processos, ambiente legislativo e questões éticas, armazenamento de dados, alguns serviços, actividades de investigação, perspectivas e planos futuros.

O arquivo da Web checo

O arquivo web checo foi fundado em 2000, as cópias de arquivo mais antigas datam de 2001 e tem atualmente mais de 580 TB de dados. Tal como o Arquivo.pt, recolhe conteúdos num domínio nacional com base numa lista de endereços URL obtida junto do seu fornecedor. Na sua estratégia de aquisição, complementa estas recolhas, ditas abrangentes, com recolhas temáticas e selectivas.

As colecções temáticas referem-se a um tópico ou evento específico, podem ser pontuais ou de construção contínua, e combinam recursos seleccionados manualmente e recursos extraídos automaticamente. As colecções selectivas destinam-se a ser recolhidas a longo prazo, têm registos de catalogação detalhados que fazem parte da bibliografia nacional checa e são licenciadas – as cópias de arquivo estão, portanto, disponíveis gratuitamente através do catálogo.

No âmbito das actividades de investigação em arquivos da Web, apresentámos o nosso projeto destinado a detetar as chamada web morta através da aplicação Extinct Websites e a criar uma base de dados que sirva de base para monitorizar mudanças mais amplas na web checa, bem como o projeto WACloud destinado a extrair grandes volumes de dados do arquivo da web.

Troca de conhecimentos e experiências

Entre os projectos portugueses, interessou-nos, por exemplo, o CitationSaver, e também discutimos o projeto Memorial, a recolha da Wikipédia portuguesa, e as actividades do arquivo português relacionadas com a formação sobre a preservação da Web (módulos de formação).

A reunião foi enriquecida pela discussão de colecções temáticas específicas.

  • A coleção de Net Art checa documenta a arte digital e a sua transformação no espaço em linha, proporcionando uma perspetiva histórica da arte única.
  • Outra coleção importante é a coleção “Redes sociais dos Membros do Parlamento da República Checa 2021-2025”, que preserva as comunicações e interacções em linha dos deputados checos, de valor inestimável para o estudo do marketing político e da vida política pública.
  • A coleção GitHub arquiva repositórios importantes desta popular plataforma para programadores, preservando os principais projectos de software nacionais e o seu código para as gerações futuras.
  • Por último, a coleção Crypto, NFT, Blockchain, Web3, Metaverse traça o crescimento e o impacto da tecnologia no espaço dos bens digitais. Estas colecções são recursos fundamentais para a investigação e análise da cultura, política e tecnologia digitais, e a discussão destas colecções em reuniões de arquivistas da Web contribui para o desenvolvimento de métodos de arquivo e inovação tecnológica.

Concentrámo-nos na troca de conhecimentos e experiências na identificação de endereços para gravar (seeds), na otimização do fluxo de trabalho e na partilha de dicas e aspectos técnicos.

Partilha de boas práticas

Discutimos as melhores práticas para identificar e recolher os principais recursos da Web, um passo fundamental para garantir um arquivo abrangente e representativo. Partilhámos várias estratégias para automatizar e simplificar os fluxos de trabalho, incluindo a utilização de ferramentas de raspagem da Web e filtragem avançada de conteúdos.

As conversas técnicas incluíram soluções para problemas comuns, como a recolha de páginas Web dinâmicas e a superação de restrições de acesso. A reunião constituiu uma plataforma valiosa para a partilha de métodos inovadores e para a promoção da colaboração entre peritos, promovendo o desenvolvimento de um arquivo digital eficaz e sustentável.

Erasmus+ visti to FCCN TV studio
Luboš Svoboda, curador digital, Marie Haškovcová,coordenadora do Webarchiv e Ricardo Basílio, curador digital do Arquivo.pt em visita ao Estúdio da FCCN, FCT.