Ricardo Basílio – sobre.arquivo.pt

Projeto Bridges “Ponte cultural” da Universidade de Évora colabora com o Arquivo.pt

Abril 18, 2026Abril 17, 2026 por Ricardo Basílio

O Arquivo.pt está a colaborar com o projeto Bridges “Ponte Cultural”, do CIDEHUS – Centro Interdisciplinar de História, Culturas e Sociedades, da Universidade de Évora.

O contributo do Arquivo.pt consiste em apresentar conteúdos formativos acerca da preservação de conteúdos publicados na Internet e realizar coleções especiais no âmbito temático do projeto, como por exemplo, a mulher, a imigração e os conteúdos regionais do Alentejo na blogosfera.

O projeto BRIDGES, dirigido pela Investigadora Principal María Zozaya, é um trabalho resultante do concurso Science for Policy, (PLANAPP-FCT, S4P25-LT 24) “desenvolvido no âmbito do concurso Estudos de Ciência para as Políticas Públicas, uma iniciativa do Centro de Planeamento e de Avaliação de Políticas Públicas em parceria com a Fundação para a Ciência e a Tecnologia, I.P. e financiada pelo Plano de Recuperação e Resiliência”.

Seminário Internacional “Mulheres em Foco”

Nos dias 17 e 18 de março, realizou-se o Seminário Internacional intitulado “Mulheres em Foco: da narrativa à representação na linguagem, arte, património e mundo digital”.

O Arquivo.pt participou na sessão online com a apresentação “Visibilidade das mulheres na Web: reflexo da nossa sociedade desde a década de 1990”. Mostrou-se como o arquivo contém informação da Web do passado, útil para o estudo da temática da mulher. Destacou-se três trabalhos que utilizaram o Arquivo.pt, nomeadamente:

Existo.pt. Representatividade das mulheres artistas na imprensa nacional, da autoria de Cláudia Sevivas e Miguel Boavida, 2º classificado do Prémio Arquivo.pt 2023
Discursos públicos sobre violência em privado, trabalho de Zélia de Macedo Teixeira, 3º classificado do Prémio Arquivo.pt 2019
Feminicído à vista, da autoria de Paula Fortuna, disponível no repositório do GitHub

No âmbito deste tema, o Arquivo.pt está a realizar uma coleção temática sobre as mulheres portuguesas que se evidenciaram no âmbito da cultura, arte e ciência. A lista de URLs ficará acessível no portal Dados.gov.

Materiais da sessão

Programa
Slides
Vídeo da sessão (em breve)

II Seminário Internacional “I have a dream”

Nos dias 15 a 17 de abril, realizou-se o II Seminário Internacional do Projeto BRIDGES, intitulado: «I have a dream. À luz da diversidade: arte, cultura, políticas públicas e mundo digital».

Erik Bran Marino e Rafael Prezado, alunos doutorandos da Universidade de Évora, apresentaram o “Narrative Monitoring: Análise de Teorias Conspirativas de Substituição Populacional no Arquivo Web Português (1996-2021)“.

No website Narrative Monitor é possível visualizar os resultados e fazer um quiz.

O trabalho Narrative Monitoring, é um dos vencedores do Prémio Arquivo.pt 2025, classificado em 3º lugar. Foi desenvolvido pela equipa de investigadores do CIDEHUS, constituída por Erik Bran Marino, Rafael Prezado, Ana Sofia Ribeiro, Renata Vieira. É um excelente exemplo de utilização do Arquivo.pt em contexto de investigação.

O curador digital do Arquivo.pt, abordou o tema “Os dados da diversidade multiracial no Arquivo.pt” mostrando como a Web tem sido um espaço de liberdade de expressão, de afirmação e reivindicação.

A atividade de arquivar a Web e preservar a memória, por sua vez, é algo que implica iniciativa e participação da comunidade. Foram dados alguns exemplos internacionais e nacionais dessa faceta “ativista” do arquivo da Web:

Documenting the Now (USA)
Archiving the Black Web (USA)
SUCHO – Saving Ukrainian Cultural Heritage Online (Ucrânia)
Coleção sobre Israel e Palestina (Israel)
The Frisian web archived (Países Baixos)
Blogs Sapo (Portugal)

No âmbito desta sessão o Arquivo.pt está a realizar uma coleção temática acerca da migração e das PRCT, (do inglês Comparative analysis of conspiracy theories in Europe), com base nos 150 termos de pesquisa utilizados na investigação de Erik Bran Marino.

Materiais da sessão

Programa
Slides
Vídeo da sessão (em breve)

FCCN apresenta Arquivo.pt no evento “File Not Found” em Lisboa

Março 30, 2026Março 30, 2026 por Ricardo Basílio

Lisboa recebeu, entre 23 e 26 de março, o evento File Not Found, organizado pelo Goethe-Institut. Ao longo de quatro dias, a iniciativa reuniu especialistas nacionais e internacionais, promovendo uma reflexão sobre o papel dos arquivos na era digital, nomeadamente sobre o seu valor cultural, social e político, num mundo digital em permanente transformação. Foram destacadas práticas, desafios e responsabilidades associadas à preservação do património informacional, neste contexto de crescente digitalização.

No último dia do encontro, 26 de março, João Gomes, diretor de área da FCCN, unidade de serviços digitais da FCT, participou no painel “Archiving Online: Power, Risk, and Digital Care Practices”. A sua intervenção centrou-se no Arquivo.pt, o serviço público de preservação de conteúdos da web portuguesa, desenvolvido pela FCCN.

João Gomes apresentou a missão e os avanços do Arquivo.pt, sublinhando a importância de garantir que a informação publicada online possa ser preservada e reutilizada por investigadores, jornalistas, entidades públicas e cidadãos. Destacou ainda o papel do serviço na promoção da literacia digital e na defesa do acesso aberto à informação.

Saber mais sobre colaborações do Arquivo.pt

Arquivo.pt participou no IDCC 2026 em Zagreb

Março 16, 2026Março 5, 2026 por Ricardo Basílio

Última atualização em 16 de Março de 2026 às 12:35

O Arquivo.pt participou no evento International Digital Curation Conference com a apresentação intitulada How Arquivo.pt is preserving scientific research project websites and promoting data reuse (Como o Arquivo.pt está a preservar sites de projetos de investigação científica e a promover a reutilização de dados), tendo sido representado por Ricardo Basílio, curador digital.

O IDDC 2026 realizou-se em Zagreb, Croácia, entre os dias 16 e 18 de fevereiro. O organizador deste evento anual é o Digital Curation Center, consórcio de referência no âmbito da gestão e curadoria dos dados para a investigação científica. Este evento teve 219 participantes de 30 países, 5 de Portugal.

No mesmo painel, moderado por Mikala Narclock, da Indiana University, houve as seguintes apresentações: Organizing a community to survive research ecosystem instability, por Lauren Phegley, da University of Pennsylvania, What should be saved? The impact of austerity on data rescue, por Shona Jane Fergusonm do UK Centre for Ecology and Hydrology, e How do you calculate the carbon footprint of your digital preservation activities?, por Jenny Mitcham do Digital Preservation Coalition.

Desafios contemporâneos na curadoria digital

O tema da conferência deste ano foi AI, austerity, and authoritarianism: contemporary challenges in digital curation (IA, austeridade e autoritarismo: desafios contemporâneos na curadoria digital).

Na abertura, a keynote Antica Čulinam, cientista do Instituto Ruder Boskovic, abordou a questão da fiabilidade da Ciência, a qual necessita de processos transparentes, escrutinados, e de dados não falseados, bem documentados.

Em sessões paralelas, foram tratados outros desafios atuais, tais como, a pegada carbónica, o uso de IA, casos bem sucedidos de gestão de dados e de envolvimento da comunidade.

Na sessão de encerramento, o tema da preservação da Web esteve em destaque com a apresentação de Mikala Narclock, da Indiana University, e Linda Kellam, da Universidade de Pennsylvania, sobre a iniciativa Data Rescue Project.

A urgência é um critério determinante na preservação da Web, sobretudo quando estão em causa resultados de investigação científica.

Homenagem a Kevin Ashley

O momento final da conferência foi para homenagear Kevin Ashley, diretor do DCC desde abril de 2010. Desde a década de 1990, trabalhou no desenvolvimento e provisão de serviços de preservação digital, enquanto chefe de arquivos digitais no Centro de Computação da Universidade de Londres (ULCC). Como líder do DCC e grande comunicador, tem desempenhado um papel carismático no desenvolvimento da planificação da gestão de dados, aconselhamento, orientação e formação.

Em Portugal, temos registo de duas intervenções de Kevin Ashley na 5ª Conferência Luso-Brasileira sobre Acesso Aberto (CONFOA), na Universidade de Coimbra, em 2014, que aqui recordamos:

Contributo do Arquivo.pt para preservação dos resultados da investigação científica

O Arquivo.pt, serviço digital da FCT, tem entre as suas prioridades a preservação de todos os tipos de informação publicada na Web relacionada com projetos de investigação, tais como Websites de projetos, resumos de publicações científicas, notícias nos meios de comunicação social relacionadas com projetos e, em geral, toda a informação da Web referenciada em publicações científicas.

Por exemplo, e esse foi o caso apresentado aos participantes da conferência, em 2021, o Arquivo.pt identificou e recolheu 17 Terabytes de informação relacionada com projetos financiados pela Comissão Europeia do H2020. Até então, 46% dos projetos H2020 não referiam os seus Websites ou páginas de projeto nos dados publicados no portal europeu Cordis.

A partir desta iniciativa bem sucedida, o Arquivo.pt tem realizado recolhas sistemáticas de conteúdos relacionados com os projetos, em colaboração com o RCAAP, PTCRIS e Ciência Vitae, de onde se obtém URLs de publicações disponíveis na Web.

Uso do Arquivo.pt pelos investigadores

Ao mesmo tempo que o Arquivo.pt tomou a iniciativa de gravar conteúdos Web produzidos pelos investigadores, aumentaram nos últimos anos os casos de uso sobre o seu acervo. Ou seja, temos mais investigadores a fazer uso dos dados e a testar metodologias. Encontramos alguns exemplos nos LLMs para a língua portuguesa, como o GlórIA e o AmálIA, e nos trabalhos trabalhos concorrentes ao Prémio Arquivo.pt.

Por exemplo, um grupo de investigadores do CIDEHUS – Centro Interdisciplinar de História, Culturas e Sociedades da Universidade de Évora, em 2025, usou o Arquivo.pt para criar o trabalho Narrative Monitoring: Análise de Teorias Conspirativas de Substituição Populacional no Arquivo Web Português (1996-2021).

Assim, pretendeu-se mostrar à audiência que a preservação dos resultados da investigação científica tem de ter o envolvimento dos próprios investigadores. A partir do momento em que estes conhecem e usam o Arquivo.pt estão também mais preparados para cuidarem da preservação das suas publicações.

Saber mais

Recolha especial de conteúdos Web sobre as Eleições Presidenciais. Precisamos da sua ajuda!

Março 13, 2026Janeiro 15, 2026 por Ricardo Basílio

Última atualização em 13 de Março de 2026 às 11:28

A Eleição para o Presidente da República em 2026 realizou-se entre 18 de janeiro e 15 de fevereiro. O Arquivo.pt recolheu 2.3 Terabytes de conteúdos eleitorais e, agora, disponibiliza os dados relativos a todo o processo, tais como termos de pesquisa, conteúdos identificados e conteúdos arquivados.

As Eleições Presidenciais de 2026 tiveram dois sufrágios, o primeiro a 18 de janeiro, o segundo a 8 de fevereiro, e ainda um turno em 20 freguesias, a 15 de fevereiro, na sequência das tempestades que assolaram o país. Assim, é expectável encontrar-se na coleção notícias sobre as zonas afetadas bem como as intervenções políticas dos candidatos presidenciais.

Apelo à participação da comunidade na identificação e arquivo de conteúdos eleitorais

No dia 15 de janeiro o Arquivo.pt convidou a comunidade a participar na recolha acerca das eleições com a seguinte mensagem: “Websites dos candidatos, notícias, colunas de opinião ou publicações nas redes sociais, tudo é útil para uma representação da nossa vida em democracia. Encontrou um conteúdo eleitoral interessante? Participe na identificação e arquivo de conteúdos eleitorais.”

Duas modalidades foram sugeridas:

Metodologia do Arquivo.pt para a cobertura temática das eleições

Seguindo a prática adotada em eleições anteriores, o procedimento teve estes passos:

definição de termos de pesquisa
identificação de páginas de resultados em motor de busca (SERP)
gravação faseada das seeds (endereços de partida para uso do crawler)
integração no Arquivo.pt
disponibilização de conjunto de dados

Por termo de pesquisa entende-se uma combinação de palavras para usar num motor de busca. Por exemplo: nome_do_candidato+presidenciais 2026+Portugal.

Para identificar conteúdos eleitorais utilizou-se o Google e para extrair os resultados serviu ainda a ferramenta Google Rank Checker,Keyword SERP Ranking Tool. As limitações colocadas recentemente pelo motor de busca à simples pesquisa manual de resultados por um utilizador (10 de cada vez) tornaram menos eficiente o uso deste método.

A gravação foi faseada da seguinte forma: antes e depois da primeira volta, a 12 e 23 de janeiro, antes e depois da segunda volta a 5 e 12 de fevereiro e ainda gravação final de todas as seeds, a 18 de fevereiro.

Resultaram 2.3 Terabytes de informação, 11,4 milhões de ficheiros, obtidos a partir de cerca de 34 mil seeds, usando o Heritrix e o Browsertrix-crawler.

Os conteúdos encontram-se arquivados no coleção EAWP51 e ficarão acessíveis na interface do Arquivo.pt passado 1 ano. Por agora disponibiliza-se informação acerca da pesquisa e identificação de conteúdos.

Conjunto de dados das Eleições Presidenciais 2026

Disponível na plataforma Dados.gov:

Saiba mais sobre as recolhas eleitorais de anos anteriores

Coleções temáticas para descobrir nas sessões online “Café com o Arquivo.pt”

Março 31, 2026Novembro 27, 2025 por Ricardo Basílio

Última atualização em 31 de Março de 2026 às 13:03

“Café com o Arquivo.pt” são sessões online curtas para permitir a qualquer pessoa assistir em horário laboral. Tem por objetivo dar a conhecer o Arquivo.pt e trazer contributos da comunidade sobre temas relacionados com a preservação da Web.

Em dezembro de 2025, iniciou-se uma nova série dedicada às coleções temáticas que o Arquivo.pt publica sob a forma de conjuntos de dados na plataforma Dados.Gov. Por exemplo, websites relacionados com o teatro, a música, as escolas, as freguesias, as eleições e outros temas, encontram-se preservados no Arquivo.pt. Pretendemos dar visibilidade a conjuntos de websites cujo histórico se encontra no arquivo da Web e melhorar a sua preservação.

Próxima sessão

15 de abril – em substituição do “Café com o Arquivo.pt”, sessão online em colaboração com o projeto Ponte Cultural, CIDEHUS, Universidade de Évora, dedicada ao tema da “Imigração”.

Será apresentado o trabalho Narrative Monitoring: Análise de Teorias Conspirativas de Substituição Populacional no Arquivo Web Português (1996-2021), 3º classificado do Prémio Arquivo.pt 2025, da autoria de Erik Bran Marino, Rafael Prezado, Ana Sofia Ribeiro, Renata Vieira. O Arquivo.pt contribui para esta sessão apresentando uma coleção especial, realizada este mês, sobre o tema.

Oradores convidados: Erik Bran Marino, Rafael Prezado

Sessões realizadas

24/03/2026 – Ativismo feminista e memória digital – Práticas arquivísticas e dados frágeis

Convidados: Carla Cerqueira, Universidade Lusófona, CICANT e Daniel Cardoso, Universidade Lusófona e NOVA-FCSH
Data: 24 de março de 2026, das 15 às 16 horas
Inscrição (gratuita). Finalizada.
Inquérito de satisfação – Dê a sua opinião acerca das sessões do Arquivo.pt (anónimo, 1 minuto)

Materiais

Resumo:

As sessões online “Café com o Arquivo.pt” têm por objetivo dar a conhecer o que se faz em Portugal no domínio da preservação de conteúdos publicados na Internet e promover a participação dos investigadores e cidadãos. O destaque desta sessão é para o projeto “FEMglocal – Movimentos Feministas glocais: interações e contradições”. Será feito um enquadramento teórico, seguido da apresentação e comentário de resultados e atividades desenvolvidas. Por exemplo, a identificação de websites e de outros canais digitais utilizados pelos movimentos feministas resultou num conjunto de dados úteis para o estudo do tema. Aqui, coloca-se a questão: como arquivar todos esses conteúdos digitais, frágeis, que circulam na Internet? Como contributo do Arquivo.pt, mostrar-se-á brevemente como funciona a recolha de milhares de conteúdos publicados na Web sobre um tema, por exemplo, sobre o feminismo.

“FEMglocal – Movimentos Feministas glocais: interações e contradições” (PTDC/COM-CSS/4049/2021 / DOI 10.54499/PTDC/COM-CSS/4049/2021), projeto financiado por fundos nacionais através da FCT — Fundação para a Ciência e a Tecnologia, I.P. Com a participação do DivIntLab (CICANT). Com a participação do Projeto Exploratório DigiPlArt (2024.13064.PEX), também financiado através da FCT.

Saber mais acerca do projeto: https://www.femglocal.pt/

03/12/2025 – Eleições Autárquicas: como arquivamos websites e programas eleitorais

Convidados: Mário Rui André e Gonçalo Pereira Costa – Jornal LPP / Lisboa Para Pessoas
Data: 3 de dezembro de 2025
Inscrição (gratuita). Finalizada.

Materiais

Resumo:

Os convidados, Mário Rui André e Gonçalo Pereira Costa, do jornal LPP / Lisboa Para Pessoas, falaram-nos do Portal das Autárquicas da Lisboa Metropolitana que criaram, onde se encontra informação sobre os candidatos e os seus programas eleitorais. O Arquivo.pt recolheu milhares de páginas e websites eleitorais, mais de 3 terabytes de informação, e explicou brevemente a metodologia utilizada.

Ao percorrer o vídeo da sessão vai saber:

Como foram as autárquicas na Área Metropolitana de Lisboa numa perspetiva jornalística;
Qual foi a metodologia seguida para recolher conteúdos eleitorais na Internet;
Como usar o arquivo da web para obter informação do passado.

Temporadas anteriores

Ciclo “Arquivos do Saber” realiza sessão presencial sobre o Arquivo.pt na FCCN

Dezembro 16, 2025Novembro 7, 2025 por Ricardo Basílio

Última atualização em 16 de Dezembro de 2025 às 20:12

No dia 19 de novembro realizou-se a última sessão de 2025 do ciclo Arquivos do Saber: Ciência, História e Memória, uma iniciativa do Arquivo de Ciência e Tecnologia da FCT.

O evento decorreu no pequeno auditório das instalações da FCCN, unidade de serviços digitais da FCT, Avenida do Brasil, 101, em Lisboa.

Estiveram presentes mais de 30 participantes e foi ocasião para os mais de 30 participantes conhecerem o Arquivo.pt mais de perto.

Programa do evento

Esta sessão contou na abertura, com as intervenções de Maria Paula Diogo, vogal do Conselho Diretivo da Fundação para a Ciência e a Tecnologia (FCT), Paula Meireles, coordenadora do Arquivo de Ciência e Tecnologia, e João Nuno Ferreira, vice-presidente da FCT e coordenador-geral da unidade de serviços digitais, FCCN.

Os oradores convidados foram Rúben Almeida, do INESC TEC – FEUP, que fez uma apresentação intitulada Minha Região – O Teu Portal Autárquico, e Joaquim José, do Instituto Politécnico da Guarda, que falou sobre Memor.pt – Explore a Memória Digital Portuguesa, ambos vencedores do Prémio Arquivo.pt 2025, 1.º e 2.º lugares, respetivamente. A sessão foi moderada por João Gomes, diretor de área da FCCN, unidade de serviços digitais da FCT.

Programa de 19 de novembro – ciclo “Arquivos do Saber”

O Arquivo de Ciência e Tecnologia da FCT e a divulgação do seu acervo

O ciclo Arquivos do Saber: Ciência, História e Memória, organizado pela FCT, está a decorrer desde fevereiro deste ano, com o objetivo de divulgar o acervo documental do seu Arquivo de Ciência e Tecnologia, bem como outros relevantes para a história e memória da Ciência e da Tecnologia em Portugal. As sessões são de curta duração e decorrem num ambiente informal e de partilha.

O Arquivo de Ciência e Tecnologia (ACT) é único na história da atividade científica em Portugal, com a função de preservar e gerir a memória documental da produção científica nacional, traduzida em milhares de processos de apoio a bolsas, instituições e projetos de investigação. Aberto ao público desde 16 de dezembro de 2011, possui um significativo acervo documental que inclui, além do próprio arquivo da FCT a partir de 1997, o espólio da Junta Nacional de Investigação Científica e Tecnológica (JNICT), de 1967 a 1997, e de outros organismos públicos e privados, essencialmente na área das políticas e financiamento da ciência em Portugal.

Galeria de imagens

5ª sessão do ciclo Arquivos do Saber: Ciência, História e Memória, na FCCN

20251119-sessao-arquivos-do-saber-fccn-11

20251119-sessao-arquivos-do-saber-fccn-10

20251119-sessao-arquivos-do-saber-fccn-1

20251119-sessao-arquivos-do-saber-fccn-8

20251119-sessao-arquivos-do-saber-fccn-12

20251119-sessao-arquivos-do-saber-fccn-13

20251119-sessao-arquivos-do-saber-fccn-14

20251119-sessao-arquivos-do-saber-fccn-18

20251119-sessao-arquivos-do-saber-fccn-17

20251119-sessao-arquivos-do-saber-fccn-21

20251119-sessao-arquivos-do-saber-fccn-20

20251119-sessao-arquivos-do-saber-fccn-19

20251119-sessao-arquivos-do-saber-fccn-22

Fotos por Leonor Arrimar, FCT

Vídeo da sessão

Vídeo com os slides

Anotação de resultados de pesquisa no Arquivo.pt

Novembro 7, 2025Novembro 3, 2025 por Ricardo Basílio

Última atualização em 7 de Novembro de 2025 às 15:55

No Dia Mundial da Preservação Digital, o Arquivo.pt promoveu uma sessão em linha dedicada à anotação de resultados de pesquisa no Arquivo.pt, no dia 6 de novembro, das 15h às 16 horas.

Foram abordados os seguintes tópicos:

i) O acesso como prioridade – pesquisa por texto como um motor de busca para o passado
ii) Como são processados os conteúdos arquivados
iii) Anotações como verificação de qualidade – demonstração

Importância da anotação de resultados

A equipa do Arquivo.pt tem vindo a reimplementar a pesquisa por texto no Arquivo.pt, mas precisa de medir a qualidade da nova implementação comparando-a com a anterior. Para isso apela à colaboração da comunidade.

Como anotar resultados no Arquivo.pt

1. Ir a: https://anota.arquivo.pt

2. Surgirá uma pesquisa aleatória.

Ex: “cavalo lusitano” “Associação Portuguesa do Cavalo Puro Sangue Lusitano” Entre 6 de agosto de 1991 e 1 de janeiro de 2010

3. Indicar a relevância do resultado escolhendo um dos botões:

Botões de anotação: Muito relevante, Parcialmente relevante, Não relevante, Conteúdo inacessível.

4. Depois de terminar a sua sessão de anotação deverá “Exportar” (no botão para o efeito, irá descarregar um ficheiro annotations.json).

5. Envie, carregando no botão “Enviar”, submetendo o ficheiro annotations.json. Ou, em alternativa, pode enviar pelo mail contacto@arquivo.pt

Poderá consultar o Guia de anotação de resultados de pesquisa para uma lista completa de instruções.

Vídeo tutorial de anotação de resultados

Conjunto de dados sobre as Eleições Autárquicas no Arquivo.pt

Dezembro 3, 2025Novembro 3, 2025 por Ricardo Basílio

Última atualização em 3 de Dezembro de 2025 às 12:55

As Eleições Autárquicas realizaram-se, em Portugal, a 12 de outubro de 2025 e o Arquivo.pt fez uma recolha especial de conteúdos eleitorais publicados na Web, de que resultaram 3.5 terabytes de informação para a investigação e a realização de trabalhos.

Foram utilizados 440 termos de pesquisa para obter 45 000 endereços de páginas, juntamente com os websites das freguesias, municípios e partidos.

Aqui se explica os diversos passos desta recolha sobre as eleições:

preparação de lista de termos de pesquisa
pesquisa usando o Google e a extensão Google Rank Checker
gravação usando o Heritrix e o Browsertrix-crawler
integração no Arquivo.pt
disponibilização de conjuntos de dados para investigação

Como se identificam os conteúdos eleitorais na Web

Para identificar conteúdos relacionados com as eleições utilizamos uma lista de termos de pesquisa como, por exemplo, “eleições autárquicas 2025″, “habitação autárquicas 2025″, “promessas “autárquicas 2025”. Depois das eleições completou-se com outros termos como “vitória autárquicas 2025”, “resultados autárquicas 2025”, etc.

Os termos de pesquisa são palavras que pretendem incluir diversos tópicos relacionados com as eleições, tais como política, sociedade, economia, entre outros, meios de comunicação, nomes de candidatos, regiões do país.

Na recolha sobre as Autárquicas, utilizou-se o motor de busca Google para fazer cada uma das pesquisas. Recorreu-se a alguns parâmetros da pesquisa avançada: o número de resultados (&num=100), resultados de nótícias (&tbm=nws), resultados de imagens (&udm=2). Depois das eleições, restringiu-se os resultados com o filtro “última semana”.

Em cada pesquisa extraiu-se os endereços das páginas de resultados do motor de busca (SERP, Search Engine Results Page) utilizando a ferramenta Google Rank Checker,Keyword SERP Ranking Tool. Esta ferramenta funciona como uma extensão do browser que exporta a lista de resultados no formato JSON.

No total, foram realizadas 1400 pesquisas ou queries no Google (800 em pré-eleições, 600 em pós-eleições). No final, os resultados de todas as pesquisas (ficheiros .json) foram reunidos num documento e convertidos em tabela. Cada resultado tem vários dados, tais como a relevância, o domínio de onde foi extraído, o link ou URL, o título da publicação, a data da pesquisa e a query.

Deve ter-se em conta que a lista obtida representa apenas uma pequena parcela de tudo o que foi publicado na Web acerca das eleições. Além disso, a mesma lista contém resultados não relacionados com o objetivo da recolha (falsos positivos) e algumas repetições. Por economia de tempo, nenhuma linha foi eliminada.

Deste processo de identificação resultaram 43 000 páginas (seeds) com notícias, artigos e publicações relacionadas com as eleições para serem usadas no processo de recolha pelo Arquivo.pt. Este conjunto de dados “Eleições Autárquicas 2025” está disponível na plataforma de dados abertos Dados.Gov.

Adicionou-se ainda a lista das Juntas de Freguesia, Câmaras Municipais e Partidos com os seus respectivos websites.

Como foram gravados os conteúdos e limitações a ter em conta

Os endereços obtidos, antes e depois das eleições, foram colocados a gravar em dois web crawlers ou rastreadores da Web, o Heritrix e o Browsertrix-crawler. O que estas ferramentas fazem é gravar páginas a partir de um endereço inicial que é dado (seed), seguindo depois as ligações aí existentes, até um certo limite, neste caso até um máximo de 5 vezes (5 saltos ou hops).

O Heritrix foi utilizado para uma primeira recolha genérica de páginas, pois é capaz de processar listas com milhares de endereços com rapidez: 25 858 URLs antes das eleições e 17 258 URLs depois das eleições. Gerou 541 Gigabytes de informação.

O Browsertix-crawler foi utilizado como segunda ferramenta para melhorar a recolha de conteúdos dinâmicos. Neste crawler a gravação é baseada em browser, ou seja, cada página é lida por um browser e depois é gravada. A gravação é mais demorada, mas captura conteúdos que de outro modo escapariam à recolha.

A recolha correu no Browsertrix-crawler de modo faseado, primeiro com a gravação dos websites das freguesias em agosto e setembro e, depois, entre 9 de outubro e 5 de novembro, com a gravação de notícias sobre as eleições e 8.850 publicações nas redes sociais. Gerou 2.9 Tetabytes de informação.

Quanto aos limites da recolha, identificou-se alguns, tais como: bloqueio do acesso por parte de alguns sites que se defendem contra acessos automáticos, apesar de o agente do Arquivo.pt estar identificado; conteúdos de redes sociais, atrás de login que não se consegue reproduzir no Arquivo.pt; vídeos que pelo seu formato também não se consegue reproduzir.

Como e quando aceder ao dados para investigar e criar de trabalhos

EAWP48 é o nome identificador da coleção que vai reunir os conteúdos sobre as Eleições Autárquicas de 12 de outubro de 2025. Uma descrição, assim como o seu estado (disponível ou não) pode ser consultado na lista de coleções do Arquivo.pt.

Nos próximos meses, o conteúdo será indexado e os índices CDXJ ficarão disponíveis para os investigadores na lista de datasets do Arquivo.pt.

Passado um ano, os conteúdos recolhidos ficarão acessíveis na pesquisa do Arquivo.pt . Qualquer pessoa poderá então pesquisar páginas eleitorais por texto ou por imagem.

Para mais informação contacte-nos.

Dados da recolha Eleições Autárquicas 2025

Saiba mais sobre as recolhas eleitorais de anos anteriores

Eleições autárquicas 2025 têm recolha especial no Arquivo.pt

Setembro 5, 2025Setembro 5, 2025 por Ricardo Basílio

As eleições autárquicas realizam-se, em Portugal, a 12 de outubro de 2025 e o Arquivo.pt vai lançar uma recolha especial de conteúdos eleitorais.

Sempre que há eleições são criados websites e canais nas redes sociais com fins eleitorais, muitos dos quais são desativados pouco depois.

Por vezes, as publicações feitas durante a campanha eleitoral desaparecem e não é possível aos cidadãos voltar a vê-las ou aos investigadores utilizá-las para estudo e análise.

O Arquivo.pt convida todos os cidadãos a arquivarem páginas acerca das eleições autárquicas. É simples: copie e cole um endereço e arquive. Aqui:

Em alternativa, envie-nos o link e nós gravamos.

Conheça os vencedores do Prémio Arquivo.pt 2025!

Outubro 6, 2025Junho 28, 2025 por Ricardo Basílio

Última atualização em 6 de Outubro de 2025 às 10:28

Os vencedores do Prémio Arquivo.pt 2025 foram anunciados pelo Jornal Público, parceiro oficial de comunicação, no dia 28 de junho de 2025.

Foram recebidos e validados 36 trabalhos candidatos.

A cerimónia de entrega de prémios decorreu na sessão de encerramento do Encontro Ciência, no Campus da NOVA SBE, em Carcavelos, a 11 de julho de 2025.

Prepare já um trabalho para 2026!

O Regulamento da 9ª edição do Prémio Arquivo.pt foi publicado no Diário da República, a 29 de setembro de 2025. Outra informação será publicada em breve. Os formulários para a submissão de trabalhos serão abertos na primeira semana de janeiro e fechados a 6 de maio de 2026.

Veja os trabalhos vencedores e concorra com um trabalho inovador.

1º classificado – “Minha Região – O Teu Portal Autárquico”

O vencedor do prémio no valor de 10 000 euros foi o trabalho “Minha Região – O Teu Portal Autárquico” desenvolvido por Rúben Almeida, Ricardo Campos e Sérgio Nunes.

O resultado deste trabalho é uma plataforma disponível na web que reúne informação eleitoral autárquica, entre 1976 e 2021. Através do website minharegiao.pt, qualquer pessoa pode encontrar informação por distrito, município e freguesia.

Por exemplo, uma pesquisa ao distrito de Braga mostra a subida do número de eleitores ao longo do tempo. Permite-nos verificar também que 2013 foi ano em que se registou mais elevada a taxa de abstenção.

Notícias:

2º classificado – “Memor.pt – Explore a Memória Digital Portuguesa”

O 2º prémio no valor de 3 000 euros foi atribuído ao trabalho “Memor.pt – Explore a Memória Digital Portuguesa”, da autoria de Joaquim Matoso.

O memor.pt é uma plataforma interativa que utiliza conteúdos preservados pelo Arquivo.pt para tornar acessível a memória digital de Portugal. Através de uma IA conversacional, um quiz temático e um artigo diário, os utilizadores podem explorar milhares de páginas arquivadas sobre temas como habitação, democracia, cultura e mercado de trabalho.

Por exemplo, se optar por “jogar”, terá cinco temas à escolha para testar os seus conhecimentos através de um quiz. Responda então, qual o ano da aprovação da nova Constituição Democrática após o 25 de Abril?

3º classificado – “Narrative Monitoring”

O 3º classificado recebeu um prémio no valor de 2 000 euros e foi atribuído ao trabalho “Narrative Monitoring: Análise de Teorias Conspirativas de Substituição Populacional no Arquivo Web Português (1996-2021)“, desenvolvido por Erik Bran Marino, Rafael Prezado, Ana Sofia Ribeiro, Renata Vieira.

O trabalho “Narrative Monitoring” constitui uma análise sistemática e abrangente da emergência e evolução das teorias conspirativas de substituição populacional (PRCT, do inglês Comparative analysis of conspiracy theories in Europe), no espaço digital português, entre 1996 e 2021. Utilizando o Arquivo.pt como fonte primária, desenvolve uma metodologia que combina técnicas de web archiving, processamento de linguagem natural e análise estatística para identificar, classificar e analisar 36.621 documentos relacionados com temáticas migratórias e demográficas.

O website apresenta os resultados através de visualizações interativas, uma linha cronológica dinâmica e um quiz educativo sobre as palavras-chave mais associadas a discursos conspiratórios. Por exemplo, “Multiculturais”, “Plano Kalergi”, “Refugiado”. Qual destas palavras-chave está mais associada a conteúdos de teor conspiratório populacional?

Menção Honrosa AMCC – Aveiro Media Competence Center: “Estudos Arquivados”

O Aveiro Media Competence Center (AMCC), atribuiu a sua Menção Honrosa ao trabalho “Estudos Arquivados”, realizado por Filipe Oliveira João e Paulo Cabrita.

“Estudos Arquivados” é uma plataforma para uso do Arquivo.pt em contexto pedagógico e de ensino. Organiza as pesquisas de um utilizador por disciplina e ano escolar, podendo o utilizador registar-se e guardar as suas próprias pesquisas para uso posterior. Em contextos em que as escolas usam tecnologias para o ensino, o “Estudos Arquivados” por ser baseado num acervo público e aberto, visa promover o estudo e a inclusão digital.

Por exemplo, um pesquisa sobre o “25 de Abril” para alunos do 8º ano, na disciplina de História, devolve páginas web datadas, preservadas no Arquivo.pt, treinando os alunos para a utilização deste novo tipo de material.

Menção Honrosa .PT: “ArchiveChain”

A Associação DNS.PT atribuiu uma Menção Honrosa . PT ao Professor que incentivou a submissão da “ArchiveChain”. Este trabalho foi desenvolvido como parte da dissertação de Mestrado em Engenharia Informática de Bruno Cotrim, pela Faculdade de Ciências da Universidade de Lisboa, com orientação científica dos professores Bernardo Ferreira (Faculdade de Ciências) e Miguel Matos (Instituto Superior Técnico).

O conceito é assim explicado pelos seus autores: “ArchiveChain” é uma blockchain que vem democratizar a missão de arquivar a web histórica portuguesa. Na ArchiveChain, todos os cidadãos são convidados a guardar páginas do Arquivo.pt, e quem guardar mais páginas recebe mais recompensas sobe a forma de cripto-moedas. Simultaneamente, as páginas guardadas pelos participantes são utilizadas como “combustível” no seu funcionamento interno, permitindo implementar contratos inteligentes de forma sustentável e evitando o consumo energético maciço de outras blockchains como o Bitcoin.

Comece a explorar a plataforma ArchiveChain e contribua para a melhor preservação da web portuguesa.

Notícias:

Menção Honrosa 25 de Abril e a Democracia: “Arquivo 25 de Abril”

A Comissão Comemorativa 50 anos 25 de Abril atribuiu uma Menção Honrosa “25 de Abril e a Democracia” ao trabalho intitulado “Arquivo 25 de Abril”, desenvolvido por Miguel Garcia.

O website Arquivo 25 de Abril disponibiliza um arquivo online de artigos jornalísticos sobre várias personalidades, eventos e movimentos que tiveram relevância no antes e durante o 25 de Abril de 1974. Para cada um destes elementos foram recolhidos artigos de vários órgãos de comunicação social de referência, com publicação online, tendo em conta este contexto histórico.

Por exemplo, ao escolher “artistas” relacionados com o 25 de Abril, um utilizador obtém o nome e uma foto do cantor Adriano Correia de Oliveira, o primeiro de uma lista, e em seguida notícias relacionadas, publicadas nos media e preservadas pelo Arquivo.pt.