Recolha especial de conteúdos Web sobre as Eleições Presidenciais. Precisamos da sua ajuda!

Presidenciais 2026 -logo-PR2026-thumbnail

Última atualização em 13 de Março de 2026 às 11:28

A Eleição para o Presidente da República em 2026 realizou-se entre 18 de janeiro e 15 de fevereiro. O Arquivo.pt recolheu 2.3 Terabytes de conteúdos eleitorais e, agora, disponibiliza os dados relativos a todo o processo, tais como termos de pesquisa, conteúdos identificados e conteúdos arquivados.

As Eleições Presidenciais de 2026 tiveram dois sufrágios, o primeiro a 18 de janeiro, o segundo a 8 de fevereiro, e ainda um turno em 20 freguesias, a 15 de fevereiro, na sequência das tempestades que assolaram o país.  Assim,  é expectável encontrar-se na coleção notícias sobre as zonas afetadas bem como as intervenções políticas dos candidatos presidenciais.

Apelo à participação da comunidade na identificação e arquivo de conteúdos eleitorais

No dia 15 de janeiro o Arquivo.pt convidou a comunidade a participar na recolha acerca das eleições com a seguinte mensagem: “Websites dos candidatos, notícias, colunas de opinião ou publicações nas redes sociais, tudo é útil para uma representação da nossa vida em democracia. Encontrou um conteúdo eleitoral interessante? Participe na identificação e arquivo de conteúdos eleitorais.”

Duas modalidades foram sugeridas:

Metodologia do Arquivo.pt para a cobertura temática das eleições

Seguindo a prática adotada em eleições anteriores, o procedimento teve estes passos:

  • definição de termos de pesquisa
  • identificação de páginas de resultados em motor de busca (SERP)
  • gravação faseada das seeds (endereços de partida para uso do crawler)
  • integração no Arquivo.pt
  • disponibilização de conjunto de dados

Por termo de pesquisa entende-se uma combinação de palavras para usar num motor de busca. Por exemplo: nome_do_candidato+presidenciais 2026+Portugal.

Para identificar conteúdos eleitorais utilizou-se o Google e para extrair os resultados serviu ainda a ferramenta Google Rank Checker,Keyword SERP Ranking Tool. As limitações colocadas recentemente pelo motor de busca à simples pesquisa manual de resultados por um utilizador (10 de cada vez) tornaram menos eficiente o uso deste método.

A gravação foi faseada da seguinte forma: antes e depois da primeira volta, a 12 e 23 de janeiro, antes e depois da segunda volta a 5 e 12 de fevereiro e ainda gravação final de todas as seeds, a 18 de fevereiro.

Resultaram 2.3 Terabytes de informação, 11,4 milhões de ficheiros, obtidos a partir de cerca de 34 mil seeds, usando o Heritrix e o Browsertrix-crawler.

Os conteúdos encontram-se arquivados no coleção EAWP51 e ficarão acessíveis na interface do Arquivo.pt passado 1 ano. Por agora disponibiliza-se informação acerca da pesquisa e identificação de conteúdos.

Conjunto de dados das Eleições Presidenciais 2026

Disponível na plataforma Dados.gov:

Saiba mais sobre as recolhas eleitorais de anos anteriores