Participação na Web Archiving Conference em Bruxelas

thumbnail-iipc-wac-2026

A equipa do Arquivo.pt participou na Web Archiving Conference (WAC) e na Assembleia Geral do International Internet Preservation Consortium (IIPC), em Bruxelas, entre 20 e 23 de abril de 2026.

A Web Archiving Conference é o maior evento dedicado à preservação da Internet. Tem a participação de iniciativas de todo o mundo, como por exemplo, o Internet Archive, bibliotecas nacionais  e centros de investigação que desenvolvem metodologias para usar conteúdos históricos da Web.

O IIPC (International Internet Preservation Consortium)  é a entidade que procura reunir as diversas iniciativas de arquivo da Web, coordenando esforços para a manutenção e desenvolvimento de normas, ferramentas, coleções e formação.

O estado atual do arquivo da Web belga

A KBR (De Koninklijke Bibliotheek van België), biblioteca nacional belga, situada no coração de Bruxelas, foi a anfitriã da Web Archiving Conference, que teve cerca de 250 participantes. A sessão de abertura da conferência foi a de apresentação de resultados e do fecho do projeto piloto para o arquivo da Web belga.

Em 2017,  a Bélgica iniciou um projeto denominado PROMISE ((PReserving Online Multiple Information: towards a Belgian Strategy) para o arquivo da Web nacional. A partir de 2019, com o financiamento do Belgian Science Policy Office (BELSPO), houve um período de cinco anos de experimentação que terminou com a apresentação de um protótipo de arquivo da Web em 2026. Foram parceiros deste projeto a entidade dos arquivos nacionais, o State Archives of Belgium (AGR) e, da parte da investigação, a Ghent University.

A recolha de conteúdos da Web belga foi feita no quadro do depósito legal existente para materiais impressos, adaptado em dezembro de 2016 para os conteúdos digitais da Web.

O projeto PROMISE utilizou as ferramentas abertas, partilhadas pela comunidade do IIPC (para a recolha, o Browsertrix-crawler, ferramenta do Webrecorder.net; para a reprodução, o software pywb). O acesso aos conteúdos é restrito e limitado ao sistema da biblioteca e a coleção foi enriquecida com metadados e informação no catálogo.

Apresentações do Arquivo.pt

Para mostrar o que o Arquivo.pt tem feito para promover o acesso e demonstrar o valor do seu serviço, contribuímos com três apresentações.

Galeria de imagens

IIPC WAC 2026

Abertura da WAC 2026 na KBR
Equipa do Arquivo.pt no IIPC WAC
Apresentação de Vasco Rato
Apresentação de Pedro Gomes
wac-iipc-memorial-cabon-footprint-1
Abertura da WAC 2026 na KBR Equipa do Arquivo.pt no IIPC WAC Apresentação de Vasco Rato Apresentação de Pedro Gomes wac-iipc-memorial-cabon-footprint-1

FCCN apresenta Arquivo.pt no evento “File Not Found” em Lisboa

 

goethe-institut-file-evento-file-not-found

Lisboa recebeu, entre 23 e 26 de março, o evento File Not Found, organizado pelo Goethe-Institut. Ao longo de quatro dias, a iniciativa reuniu especialistas nacionais e internacionais, promovendo uma reflexão sobre o papel dos arquivos na era digital, nomeadamente sobre o seu valor cultural, social e político, num mundo digital em permanente transformação. Foram destacadas práticas, desafios e responsabilidades associadas à preservação do património informacional, neste contexto de crescente digitalização.

No último dia do encontro, 26 de março, João Gomes, diretor de área da FCCN, unidade de serviços digitais da FCT, participou no painel “Archiving Online: Power, Risk, and Digital Care Practices”. A sua intervenção centrou-se no Arquivo.pt, o serviço público de preservação de conteúdos da web portuguesa, desenvolvido pela FCCN.

João Gomes apresentou a missão e os avanços do Arquivo.pt, sublinhando a importância de garantir que a informação publicada online possa ser preservada e reutilizada por investigadores, jornalistas, entidades públicas e cidadãos. Destacou ainda o papel do serviço na promoção da literacia digital e na defesa do acesso aberto à informação.

Saber mais sobre colaborações do Arquivo.pt

Arquivo.pt participou no IDCC 2026 em Zagreb

IDCC 2026 Zagreb

Última atualização em 16 de Março de 2026 às 12:35

IDCC 2026 Zagreb

O Arquivo.pt participou no evento International Digital Curation Conference com a apresentação intitulada How Arquivo.pt is preserving scientific research project websites and promoting data reuse (Como o Arquivo.pt está a preservar sites de projetos de investigação científica e a promover a reutilização de dados), tendo sido representado por Ricardo Basílio, curador digital.

O IDDC 2026 realizou-se em Zagreb, Croácia, entre os dias 16 e 18 de fevereiro. O organizador deste evento anual é o Digital Curation Center, consórcio de referência no âmbito da gestão e curadoria dos dados para a investigação científica. Este evento teve 219 participantes de 30 países, 5 de Portugal.

No mesmo painel, moderado por Mikala Narclock, da Indiana University, houve as seguintes apresentações: Organizing a community to survive research ecosystem instability, por Lauren Phegley, da University of Pennsylvania, What should be saved? The impact of austerity on data rescue, por Shona Jane Fergusonm do UK Centre for Ecology and Hydrology, e How do you calculate the carbon footprint of your digital preservation activities?, por Jenny Mitcham do Digital Preservation Coalition.

Desafios contemporâneos na curadoria digital

O tema da conferência deste ano foi AI, austerity, and authoritarianism: contemporary challenges in digital curation (IA, austeridade e autoritarismo: desafios contemporâneos na curadoria digital).

Na abertura, a keynote Antica Čulinam, cientista do Instituto Ruder Boskovic, abordou a questão da fiabilidade da Ciência, a qual necessita de processos transparentes, escrutinados, e de dados não falseados, bem documentados.

Em sessões paralelas, foram tratados outros desafios atuais, tais como, a pegada carbónica, o uso de IA, casos bem sucedidos de gestão de dados e de envolvimento da comunidade.

Na sessão de encerramento, o tema da preservação da Web esteve em destaque com a apresentação de Mikala Narclock, da Indiana University, e Linda Kellam, da Universidade de Pennsylvania, sobre a iniciativa Data Rescue Project.

A urgência é um critério determinante na preservação da Web, sobretudo quando estão em causa resultados de investigação científica.

Homenagem a Kevin Ashley

O momento final da conferência foi para homenagear Kevin Ashley, diretor do DCC desde abril de 2010.  Desde a década de 1990, trabalhou no desenvolvimento e provisão de serviços de preservação digital, enquanto chefe de arquivos digitais no Centro de Computação da Universidade de Londres (ULCC). Como líder do DCC e grande comunicador, tem desempenhado um papel carismático no desenvolvimento da planificação da gestão de dados, aconselhamento, orientação e formação.

Em Portugal, temos registo de duas intervenções de Kevin Ashley  na 5ª Conferência Luso-Brasileira sobre Acesso Aberto (CONFOA), na Universidade de Coimbra, em 2014, que aqui recordamos:

Contributo do Arquivo.pt para preservação dos resultados da investigação científica

O Arquivo.pt, serviço digital da FCT, tem entre as suas prioridades a preservação de todos os tipos de informação publicada na Web relacionada com projetos de investigação, tais como Websites de projetos, resumos de publicações científicas, notícias nos meios de comunicação social relacionadas com projetos e, em geral, toda a informação da Web referenciada em publicações científicas.

Por exemplo, e esse foi o caso apresentado aos participantes da conferência, em 2021, o Arquivo.pt identificou e recolheu 17 Terabytes de informação relacionada com projetos financiados pela Comissão Europeia do H2020. Até então, 46% dos projetos H2020 não referiam os seus Websites ou páginas de projeto nos dados publicados no portal europeu Cordis.

A partir desta iniciativa bem sucedida, o Arquivo.pt tem realizado recolhas sistemáticas de conteúdos relacionados com os projetos, em colaboração com o RCAAP, PTCRIS e Ciência Vitae, de onde se obtém URLs de publicações disponíveis na Web.

Uso do Arquivo.pt pelos investigadores

Ao mesmo tempo que o Arquivo.pt tomou a iniciativa de gravar conteúdos Web produzidos pelos investigadores, aumentaram nos últimos anos os casos de uso sobre o seu acervo. Ou seja, temos mais investigadores a fazer uso dos dados e a testar metodologias. Encontramos alguns exemplos nos LLMs para a língua portuguesa, como o GlórIA e o AmálIA, e nos trabalhos trabalhos concorrentes ao Prémio Arquivo.pt.

Por exemplo, um grupo de investigadores do CIDEHUS – Centro Interdisciplinar de História, Culturas e Sociedades da Universidade de Évora, em 2025, usou o Arquivo.pt para criar o trabalho Narrative Monitoring: Análise de Teorias Conspirativas de Substituição Populacional no Arquivo Web Português (1996-2021).

Assim, pretendeu-se mostrar à audiência que a preservação dos resultados da investigação científica tem de ter o envolvimento dos próprios investigadores. A partir do momento em que estes conhecem e usam o Arquivo.pt estão também mais preparados para cuidarem da preservação das suas publicações.

Saber mais

 

Ciclo “Arquivos do Saber” realiza sessão presencial sobre o Arquivo.pt na FCCN

Última atualização em 16 de Dezembro de 2025 às 20:12

No dia 19 de novembro realizou-se a última sessão de 2025 do ciclo Arquivos do Saber: Ciência, História e Memória, uma iniciativa do Arquivo de Ciência e Tecnologia da FCT.

O evento decorreu no pequeno auditório das instalações da FCCN, unidade de serviços digitais da FCT, Avenida do Brasil, 101, em Lisboa.

Estiveram presentes mais de 30 participantes e foi ocasião para os mais de 30 participantes conhecerem o Arquivo.pt mais de perto.

Programa do evento

Esta sessão contou na abertura, com as intervenções de Maria Paula Diogo, vogal do Conselho Diretivo da Fundação para a Ciência e a Tecnologia (FCT), Paula Meireles, coordenadora do Arquivo de Ciência e Tecnologia, e João Nuno Ferreira, vice-presidente da FCT e coordenador-geral da unidade de serviços digitais, FCCN.

Os oradores convidados foram Rúben Almeida, do INESC TECFEUP, que fez uma apresentação intitulada Minha Região – O Teu Portal Autárquico, e Joaquim José, do Instituto Politécnico da Guarda, que falou sobre Memor.pt – Explore a Memória Digital Portuguesa, ambos vencedores do Prémio Arquivo.pt 2025, 1.º e 2.º lugares, respetivamente. A sessão foi moderada por João Gomes, diretor de área da FCCN, unidade de serviços digitais da FCT.

Programa_19NOV_Arquivos-do-Saber_2025_page-0001

Programa de 19 de novembro – ciclo “Arquivos do Saber”

O Arquivo de Ciência e Tecnologia da FCT e a divulgação do seu acervo

O ciclo Arquivos do Saber: Ciência, História e Memória, organizado pela FCT, está a decorrer desde fevereiro deste ano, com o objetivo de divulgar o acervo documental do seu Arquivo de Ciência e Tecnologia, bem como outros relevantes para a história e memória da Ciência e da Tecnologia em Portugal. As sessões são de curta duração e decorrem num ambiente informal e de partilha.

O Arquivo de Ciência e Tecnologia (ACT) é único na história da atividade científica em Portugal, com a função de preservar e gerir a memória documental da produção científica nacional, traduzida em milhares de processos de apoio a bolsas, instituições e projetos de investigação. Aberto ao público desde 16 de dezembro de 2011, possui um significativo acervo documental que inclui, além do próprio arquivo da FCT a partir de 1997, o espólio da Junta Nacional de Investigação Científica e Tecnológica (JNICT), de 1967 a 1997, e de outros organismos públicos e privados, essencialmente na área das políticas e financiamento da ciência em Portugal.

Galeria de imagens

5ª sessão do ciclo Arquivos do Saber: Ciência, História e Memória, na FCCN

20251119-sessao-arquivos-do-saber-fccn-11
20251119-sessao-arquivos-do-saber-fccn-10
20251119-sessao-arquivos-do-saber-fccn-1
20251119-sessao-arquivos-do-saber-fccn-8
20251119-sessao-arquivos-do-saber-fccn-12
20251119-sessao-arquivos-do-saber-fccn-13
20251119-sessao-arquivos-do-saber-fccn-14
20251119-sessao-arquivos-do-saber-fccn-18
20251119-sessao-arquivos-do-saber-fccn-17
20251119-sessao-arquivos-do-saber-fccn-21
20251119-sessao-arquivos-do-saber-fccn-20
20251119-sessao-arquivos-do-saber-fccn-19
20251119-sessao-arquivos-do-saber-fccn-22
20251119-sessao-arquivos-do-saber-fccn-11 20251119-sessao-arquivos-do-saber-fccn-10 20251119-sessao-arquivos-do-saber-fccn-1 20251119-sessao-arquivos-do-saber-fccn-8 20251119-sessao-arquivos-do-saber-fccn-12 20251119-sessao-arquivos-do-saber-fccn-13 20251119-sessao-arquivos-do-saber-fccn-14 20251119-sessao-arquivos-do-saber-fccn-18 20251119-sessao-arquivos-do-saber-fccn-17 20251119-sessao-arquivos-do-saber-fccn-21 20251119-sessao-arquivos-do-saber-fccn-20 20251119-sessao-arquivos-do-saber-fccn-19 20251119-sessao-arquivos-do-saber-fccn-22

Fotos por Leonor Arrimar, FCT

Vídeo da sessão

Vídeo com os slides

Anotação de resultados de pesquisa no Arquivo.pt

Anotação de resultados de pesquisa no Arquivo.pt

Última atualização em 7 de Novembro de 2025 às 15:55

Anotação de resultados de pesquisa no Arquivo.pt

No Dia Mundial da Preservação Digital, o Arquivo.pt promoveu uma sessão em linha dedicada à anotação de resultados de pesquisa no Arquivo.pt, no dia 6 de novembro, das 15h às 16 horas.

Foram abordados os seguintes tópicos:

i) O acesso como prioridade – pesquisa por texto como um motor de busca para o passado
ii) Como são processados os conteúdos arquivados
iii) Anotações como verificação de qualidade – demonstração

Importância da anotação de resultados

A equipa do Arquivo.pt tem vindo a reimplementar a pesquisa por texto no Arquivo.pt, mas precisa de medir a qualidade da nova implementação comparando-a com a anterior. Para isso apela à colaboração da comunidade.

Como anotar resultados no Arquivo.pt

1. Ir a: https://anota.arquivo.pt

2. Surgirá uma pesquisa aleatória.

Ex: “cavalo lusitano” “Associação Portuguesa do Cavalo Puro Sangue Lusitano” Entre 6 de agosto de 1991 e 1 de janeiro de 2010

3. Indicar a relevância do resultado escolhendo um dos botões:

Botões de anotação: Muito relevante, Parcialmente relevante, Não relevante, Conteúdo inacessível.

4. Depois de terminar a sua sessão de anotação deverá “Exportar” (no botão para o efeito, irá descarregar um ficheiro annotations.json).

5. Envie, carregando no botão “Enviar”, submetendo o ficheiro annotations.json. Ou, em alternativa, pode enviar pelo mail contacto@arquivo.pt

Poderá consultar o Guia de anotação de resultados de pesquisa para uma lista completa de instruções.

Vídeo tutorial de anotação de resultados

Workshop sobre Preservação digital na Universidade de Coimbra

Última atualização em 22 de Maio de 2025 às 18:45

O Arquivo.pt participou no workshop intitulado “Preservação digital: ferramentas e práticas”, promovido pela Faculdade de Letras da Universidade de Coimbra, na tarde do dia 7 de maio de 2025. Com a moderação de Inês Santos, destacamos o painel inicial com excelentes intervenções de Moisés Rockembach (Universidade de Coimbra), Humberto Innarelli (Unicamp) e Daniel Gomes (Arquivo.pt, serviço digital da FCCN-FCT).

O encontro teve por objetivo oferecer à comunidade uma reflexão crítica acerca das novas tendências nas ferramentas e nas práticas de preservação digital.

A preservação digital é um tema transversal às organizações, pois todas produzem e geram informação em suporte digital. É cada vez maior a oferta de ferramentas, soluções que prometem maior eficiência no processamento de informação. Muitas são colocadas sob a designação de Inteligência Artificial. Tal abundância de produtos e enquadramentos exige uma maior discussão e abordagem crítica. E isso foi alcançado de forma brilhante pelo painel de oradores.

Três abordagens sobre Inteligência Artificial e Preservação Digital

Este encontro reuniu no Anfiteatro III da Faculdade de Letras da Universidade de Coimbra três autores de obras sobre preservação digital e trouxe à discussão abordagens diferentes.

Moisés Rockembach, co-autor com Caterina Pavão de Arquivamento da Web e preservação digital, a primeira obra em português sobre arquivos da Web, centrou a sua apresentação no impacto da Inteligência Artificial nos sistemas de preservação digital, nomeadamente na pesquisa e no acesso à informação, em processos de classificação indexação, por exemplo. A esse propósito do impacto das novas ferramentas que a tecnologia digital nos oferece, fez referência a uma frase de Demi Gretscko: “O processo de busca e captura da informação descrito no texto certamente poderá sofrer aportes futuros, especialmente ao se considerar o aporte de ferramentas novas, como as da Inteligência Artificial”.

Há ferramentas de Inteligência Artificial que permitem um acesso interessante à informação pela novidade e pelo formato. A arquivística deve ter em conta essa realidade e testar até que ponto isso pode transformar o modo como se opera a divulgação e o acesso a muitos conteúdos. Um exemplo para ilustrar esta ideia, foi a apresentação de um Podcast gerado por Inteligência Artificial, baseado no capítulo 2 do livro sobre Arquivos da Web, que versa sobre as políticas de preservação digital.

Humberto Innarelli, autor de Criptex da preservação digital, autor de Criptex da preservação digital, coordenador do Arquivo Edgard Leuenroth (AEL) e investigador especialista em arquivística na Unicamp, São Paulo e professor Doutor do Centro Paula Souza, São Paulo, colocou a questão do futuro da preservação digital. Até agora, a prática para preservar conteúdos digitais dinâmicos é convertê-los em documentos estáticos. Por outro lado, cada vez a informação é-nos dada de forma dinâmica, a partir de bases de dados ou de algoritmos e Inteligência Artificial. Qual é o próximo passo? A prática arquivística tem de olhar não apenas para os metadados (metadata), como tem feito nos últimos anos, mas também para aquilo que explica como a informação foi gerada (o que podemos chamar paradata). Só assim é possível colocar a arquivística e a preservação digital na perspetiva do longo termo. Daqui a cem ou duzentos anos deveríamos ser capazes de continuar a aceder à informação digital produzida atualmente.

Daniel Gomes, editor principal do livro The Past Web, fundador do Arquivo.pt, discutiu a questão da Inteligência Artificial na sua relação com os conteúdos de produção não artificial e humana. Que valor acrescentado trazem as ferramentas geradoras de texto, imagem,  áudio ou vídeo? Se considerarmos por exemplo que um Podcast sobre preservação digital utilizou como base um livro escrito por um autor humano, que conhecimento novo gerou? Pouco ou nenhum. Assim, o que se convencionou chamar Inteligência Artificial pode considerar-se como uma forma de apresentar o conhecimento humano e de modo nenhum dispensa a humanidade de continuar a pensar, a investigar e a produzir novo conhecimento.

O Arquivo.pt preserva conteúdos que foram publicados por pessoas e organizações e nesse sentido é uma fonte única no seu género. A informação publicada na Web é importante para relatar e compreender melhor a história recente, desde a década de 1990. Qualquer ferramenta de Inteligência Artificial terá de voltar ao ponto onde a informação foi criada por pessoas. A origem humana dos conteúdos preservados pelo Arquivo.pt, e o mesmo se pode dizer dos arquivos tradicionais, faz com que estes tenham um enorme valor, até considerando-o do ponto de vista do valor económico. Quanto vale a informação preservada por um arquivo da Web?

Estreia do MOOC ou curso online do Arquivo.pt

Daniel Gomes, Gestor do Arquivo.pt anunciou em primeira mão o curso online na plataforma NAU: A Web do passado: preservação e pesquisa.

O curso online ou MOOC (Massivo Online Open Course) está disponível para quem pretende aprofundar os seus conhecimentos sobre preservação da Web.

O link curto para divulgação é arquivo.pt/mooc

Os dados preservados do Arquivo.pt e o seu processamento automático por APIs

Vasco Rato, desenvolvedor do Arquivo.pt, mostrou como funcionam as interfaces de processamento automático, Application Programming Interfaces (APIs).

Os dados do Arquivo.pt podem ser processados por Inteligência Artificial. Os trabalhos concorrentes ao Prémio Arquivo.pt já o demonstraram, assim como alguns projetos como o GlórIA, um Large Language Model, desenvolvido na NOVA-FCT.

Para terminar, Ricardo Basílio, curador digital do Arquivo.pt, mostrou como qualquer pessoa pode gravar uma página ou um website inteiro no seu próprio computador num formato normalizado, compatível com os arquivos da Web. Usou-se para isso o ArchiveWeb.page e browsertrix-crawler como ferramentas de treino e formação. Esta prática permite que a comunidade seja cada vez mais ativa na preservação de informação institucional publicada na Web.

Agenda do evento

14h30 Painel – Moderadora: Inês Santos, Universidade de Coimbra

  • Preservação digital e Inteligência Artificial – Moisés Rockembach, Universidade de Coimbra – Slides
  • Cryptex da Preservação Digital: O próximo passo – Humberto Innarelli, Unicamp – Slides
  • Arquivo.pt e a preservação da Web – Daniel Gomes, FCCN-FCT – Slides

16h00 Intervalo

17h00 – Final

Galeria de imagens

Imagens nos canais da Faculdade de Letras da Universidade de Coimbra

Vídeo com momentos do evento (publicado no Facebook)

Workshop na Faculdade de Letras da Universidade de Coimbra

20250507_152044x
20250507_145930x
20250507_154949x
20250507_152127x
20250507_150752x
20250507_150208x
20250507_144524x
20250507_144759x
20250507_154140x
20250507_162955x
20250507_150929x
20250507_162127x
20250507_155227x
20250507_161631x
20250507_162035x
20250507_153213x
20250507_155105x
20250507_155139x
20250507_155346x
20250507_162018x
20250507_161603x
1747431004343-coimbra
20250507_152044x 20250507_145930x 20250507_154949x 20250507_152127x 20250507_150752x 20250507_150208x 20250507_144524x 20250507_144759x 20250507_154140x 20250507_162955x 20250507_150929x 20250507_162127x 20250507_155227x 20250507_161631x 20250507_162035x 20250507_153213x 20250507_155105x 20250507_155139x 20250507_155346x 20250507_162018x 20250507_161603x 1747431004343-coimbra

 

Arquivo.pt em Coimbra nas Jornadas da FCCN

Última atualização em 17 de Maio de 2025 às 12:33

A equipa do Arquivo.pt esteve em Coimbra, entre os dias 6 e 8 de maio, nas Jornadas FCCN para promover a preservação da Internet portuguesa, pois a divulgação e a promoção constituem uma vertente importante da sua missão.

Na terça-feira, de manhã, Pedro Gomes apresentou os destaques na sessão Zapping FCCN e à tarde, das 16h30 às 18 horas, realizou-se a sessão do Arquivo.pt, Mãos na massa para arquivar a Web.

Na quarta-feira, dia 7, às 14h30, a equipa do Arquivo.pt deslocou-se à Universidade de Coimbra para participar no encontro promovido pela Faculdade de Letras (FCUL),  intitulado Preservação digital: ferramentas e práticas (Anfiteatro III, Piso 4).

Ao fim da tarde de quarta-feira, Daniel Gomes, participou na sessão Democratizar a IA: tornar a Inteligência Artifícial acessível a todos sobre o contributo do Arquivo.pt para o LLM AMÁLIA.

Destaques do Arquivo.pt na sessão Zapping da FCCN

Pedro Gomes, encarregado das recolhas do Arquivo.pt, mostrou a imagem mais antiga arquivada no Arquivo.pt que se encontra precisamente no antigo site da Universidade de Coimbra. Destacou a nova funcionalidade que permite reproduzir conteúdos em Flash, os dados estatísticos do Arquivo.pt, os prémios e os conjuntos de dados.

Mão na massa para arquivar a Web

Nesta sessão, orientada por Ricardo Basílio, curador digital do Arquivo.pt, mostrou-se como gravar páginas web em formato normalizado utilizando o seu próprio computador.

Esta ação, com o formato “mão na massa” ou “faça-você-mesmo!”, enquadra-se na missão do Arquivo.pt de promoção da preservação da Internet (Decreto-Lei nº 55/2013). Ao mostrar como funciona a gravação de websites estamos a fortalecer também a ligação da comunidade ao Arquivo.pt.

Para quem precisa de guardar cópias de alta qualidade de websites esta sessão é uma ajuda. Os participantes foram desafiados a gravar páginas estáticas e outras com conteúdos interativos, vídeos e redes sociais. A partir das questões que surgiram durante os exercícios práticos, esclarecemos dúvidas e mostrámos que arquivar conteúdos Web é muito fácil.

Usámos a extensão ArchiveWeb.page, ferramenta do Webercorder.net, que os participantes puderam obter gratuitamente e instalar nos próprios computadores.

Se é informático ou utilizador avançado de IT

Para quem tem a expectativa e a necessidade de gravar sites inteiros automaticamente, fizemos uma breve referência ao Browsertrix-crawler, uma ferramenta avançada que corre num Docker, em Linux. Informáticos e utilizadores avançados de IT  foram desafiados a tentar a gravação e arquivo de Websites.

As demonstrações e exercícios que propusemos usando o ArchiveWeb.page ou Browsertrix-crawler aplicam-se também a casos de uso avançado e respondem a necessidades de arquivo da Web no dia-a-dia das organizações.

Materiais da sessão “mãos na massa”

Democratizar a IA: tornar a Inteligência Artifícial acessível a todos

No segundo dia das Jornadas da FCCN, 8 de maio de 2025, na sessão dedicada à Inteligência Artificial, Daniel Gomes, por parte da FCNN-FCT, e João Magalhães, por parte da NOVA-FCT, apresentaram o “AMÁLIA: Assistente Multimodal automático de Linguagem com IA”.

Daniel Gomes explicou como o Arquivo.pt é utilizado para processamento em larga escala, concretamente através das Application Programming Interfaces do Arquivo.pt (APIs).

As APIs permitem que os investigadores acedam à informação do Arquivo.pt de forma automática e desenvolvem diversas aplicações em projetos de investigação. Por exemplo, usaram APIs projetos como o Conta-me Histórias, o modelo para língua portuguesa LLM GlórIA e, presentemente, o LLM AMÁLIA.

Galeria de imagens

Jornadas FCCN

imagem-01
imagem-02
imagem-3
20250507_115920
20250507_120040
imagem-01 imagem-02 imagem-3 20250507_115920 20250507_120040

Arquivo.pt participou na IIPC Web Archiving Conference em Oslo

Última atualização em 4 de Julho de 2025 às 8:32

Quatro membros da equipa do Arquivo.pt estiveram em Oslo, na Noruega, para participar na Assembleia Geral do International Internet Preservation Consortium e na Web Archiving Conference, entre os dias 8 e de abril de 2025.

A Biblioteca Nacional da Noruega foi a instituição de acolhimento deste evento internacional. O Arquivo da Web da Noruega é parte da missão da Biblioteca e é realizado numa segunda localização especializada em preservação digital, na cidade de Mo i Rana, no centro do país.

O IIPC WAC, o maior no domínio da preservação da Internet, foi como sempre uma ocasião excecional para a partilha de conhecimento e  para o fortalecimento de colaboração entre os arquivos da Web.

O primeiro dia, 8 de abril, foi dedicado à Assembleia Geral, exclusivo para os membros do consórcio, e aos grupos de trabalho onde o Arquivo.pt tem um papel ativo. O Content Working Group é dedicado à criação de coleções temáticas e tem a participação do Arquivo,pt na coleção “Street Art”. O Training Working Group cria conteúdos formativos e ações de formação, tais como webinars do IIPC e workshops presenciais.

Nos dias  9 e 10 de abril realizou-se a Web Archiving Conference, evento que é aberto a todas as entidades e iniciativas relacionadas com a preservação e arquivo da Web.

Contributo do Arquivo.pt

O Arquivo.pt apresentou os seus serviços e iniciativas de interação com a comunidade, como por exemplo a colaboração com o Arquivo Municipal de Sines na preservação de conteúdos de interesse local. A preocupação com o acesso aos conteúdos, tanto para os investigadores como para os cidadãos em geral, é um aspeto muito apreciado pela comunidade do IIPC.

  • Arquivo.pt toolkit for web archiving – Lightning talk session 1 – Daniel Gomes – Slides, vídeo
  • Arquivo.pt Query Logs – Lightning talk session 3 – Pedro Gomes – Slides, vídeo
  • Collaborative collections at Arquivo.pt: four years of recordings from the city of Sines (Portugal) – Lightning talk session 4 – Ricardo Basílio – Slides, notas, vídeo
  • API/Bulk access and its usage – Poster slam – Vasco Rato – Poster
  • Arquivo.pt annual awards: a glimpse since 2018 – Poster slam – Daniel Gomes – Slides

Galeria de imagens

IIPC Web Archiving Conference 2025, Oslo

oslo4
oslo3
oslo6
oslo2
oslo1
oslo8
oslo5
oslo9
oslo10
oslo11
oslo12
oslo4 oslo3 oslo6 oslo2 oslo1 oslo8 oslo5 oslo9 oslo10 oslo11 oslo12

Formação do Arquivo.pt com a APDSI. Inscreva-se!

Ciclo de Webinars do Arquivo.pt com a APSDI

Última atualização em 5 de Abril de 2025 às 13:07

Ciclo de Webinars do Arquivo.pt com a APSDI

A APDSI – Associação para a Promoção e Desenvolvimento da Sociedade da Informação promoveu um Ciclo de Webinars sobre o Arquivo.pt, realizado entre o dia 20 de março e o dia 1 de abril de 2025

Este Ciclo de Webinars, dedicado à preservação da memória cultural publicada na Web, é uma colaboração entre a APDSI e o Arquivo.pt, FCCN serviços digitais da Fundação para a Ciência e a Tecnologia I.P..

Luís Vidigal, Sócio Fundador da APDSI, Filipa Fixe e João Tavares, Vogais da Direção,  introduziram o tema de cada sessão e a equipa do Arquivo.pt mostrou como funciona a preservação de conteúdos Web que permite às organizações e aos cidadãos acederem à web do passado.

As quatro sessões tiveram um total de 121 participantes.

Programa

  • Webinar 1 – 20 de março – Arquivo.pt: uma nova ferramenta para pesquisar o
    passado. Daniel Gomes, Gestor do Arquivo.pt – Vídeo, slides
  • Webinar 2 – 25 de março – Bem publicar para bem preservar. Pedro Gomes,
    Encarregado pelas recolhas do Arquivo.pt – Vídeo, slides
  • Webinar 3 – 27 de março – Acesso e processamento automático de informação
    preservada da Web através de APIs. Vasco Rato, Web developer do Arquivo.pt – Vídeo, slides
  • Webinar 4 – 1 de abril – Arquivar a Web: faça-você-mesmo!. Ricardo Basílio, Vídeo, slides
    Curador digital do Arquivo.pt

Inscrição (gratuita mas necessária)

Saber mais

Iniciativa eArchiving organizou workshop e Arquivo.pt esteve presente

José Borbinha, workshop eArchiving, a 25 de Fevereiro no IST (Sala José Tribolet)

Última atualização em 11 de Março de 2025 às 16:21

José Borbinha, Workshop eArchiving, a 25 de Fevereiro no IST (Sala José Tribolet)
Professor Doutor José Borbinha, workshop eArchiving, a 25 de Fevereiro  de 2025, no Instituto Superior Técnico em Lisboa (Sala José Tribolet)

O Arquivo.pt participou no workshop eArchiving Portugal , que se realizou no Instituto Superior Técnico, no dia 25 de fevereiro de 2025, a convite do Professor Doutor José Borbinha, uma das primeiras pessoas a fazer arquivo da web em Portugal quando, na década de 1990, estava na Biblioteca Nacional.

O Professor José Borbinha, melhor que ninguém, sabe contar na primeira pessoa os pequenos episódios, quase épicos, as ações dos primeiros “heróis” que levaram à criação de um arquivo da Web em Portugal. Vê o Arquivo.pt como um serviço imprescindível quando se fala de preservação digital e de salvaguarda do património comunicacional das organizações.

O evento teve um formato hibrido com 50 participantes presencias e 270 online e foi aberto a todas as entidades públicas ou privadas com preocupações ao nível da preservação digital e gestão da informação em qualquer tipo ou formato. Aqui se incluem os conteúdos dos websites e redes sociais!

Os responsáveis dos Municípios, entidades da Administração Local,  tiveram uma grande participação, respondendo ao apelo da Direção-Geral do Livro, dos Arquivos e das Bibliotecas (DGLAB). Este convite à participação de pessoas de todo o país foi uma oportunidade para o Arquivo.pt mostrar como pode ajudar na preservação dos sites institucionais e no cumprimento da Portaria n.º 112/2023, de 27 de abril.

eArchiving, uma iniciativa europeia nascida em Portugal

A iniciativa eArchiving ou Iniciativa de Arquivo Eletrónico tem por objetivo principal o património cultural digital e foi criada numa reunião de parceiros europeus em Lisboa.

“Foi precisamente nesta (sala José Tribolet no Instituto Superior Técnico) que teve início o eArchiving há onze atrás, a 29 de maio de 2014” recordou  José Borbinha (INESC-ID), anfitrião e organizador do workshop.

A iniciativa eArchiving, é gerida, em nome da Comissão Europeia, pelo Consórcio E-ARK, onde se incluem os parceiros portugueses KEEP Solutions LDA e INESC-ID. No consórcio estão ainda o AIT Austrian Institute of Technology GmbH, parceiro principal, e o DLM Forum MTÜ.

Janet Anderson, gestora do eArchiving, mostrou os progressos alcançados em onze anos no domínio da preservação digital. Os projetos financiados pela União Europeia no âmbito do consórcio resultaram no desenvolvimento de especificações, software, formação e conhecimento sobre preservação digital.

Seguiu-se a apresentação de contributos para a preservação digital em Portugal: DGLAB, por Pedro Penteado, Centro Hospitalar São João, por Fernanda Gonçalves, Ministério da Justiça, por Alexandra Lourenço e Cristina Soares, Arquivo.pt, pelo curador digital Ricardo Basílio.

Para terminar, Miguel Ferreira fez a sua intervenção em representação do DLM Forum MTÜ, comunidade onde a KEEP Solutions LDA participa com o desenvolvimento de software. Numa abordagem mais técnica mostrou como estão estruturados os metadados na especificação de empacotamento E-Ark de modo a cumprirem os requisitos da preservação digital.

Como usar o Arquivo.pt para preservação os websites institucionais

Presentation of Arquivo.pt at the eArchiving Workshop, by Ricardo Basílio, digital curator. Photo by Pedro Penteado
Apresentação do Arquivo.pt no Workshop eArchiving por Ricardo Basílio, curador digital. Foto por Pedro Penteado

A preservação digital exige colaboração, tanto ao nível interno como externo entre organizações, e este workshop serviu esse propósito, pois foi ocasião para  partilha de boas práticas, divulgação de ferramentas e serviços e contacto entre pessoas.

Da parte do Arquivo.pt destacou-se três serviços do seu catálogo para a preservação dos conteúdos publicados na web:

Os serviços do Arquivo.pt podem ser utilizados, por exemplo, pelos Municípios para a preservação dos conteúdos publicados nos websites institucionais.

A formação do Arquivo.pt, tais como webinars ou sessões presenciais, são úteis para dar capacidade às entidades para cuidarem dos conteúdos institucionais, incluindo os conteúdos das redes sociais que exigem uma estratégia alternativa.

Slides da apresentação

Saber mais

Vídeos de todas as apresentações, em breve no canal Youtube do E-ARK