Recolhemos os sites das Eleições Legislativas de 2015!

Última atualização em 30 de Agosto de 2022 às 10:54

O Arquivo.pt realizou 4 recolhas de sites relacionados com as Eleições Legislativas de 2015.

Apelámos à comunidade para contribuir sugerindo de sites relacionados com as Eleições Legislativas de 2015 para que os arquivássemos.

Realizaram-se 4 recolhas, durante e após o período de campanha eleitoral, que partiram da lista de 127 sites sugeridos pela comunidade, resultando no arquivo de 2 802 407 ficheiros recolhidos da Web, que ocupam 274 GB.

Recolhemos sites tais como os das campanhas oficiais dos partidos candidatos, notícias na comunicação social, blogs, artigos de opinião ou satíricos.

O Arquivo.pt respeita um período de embargo de 1 ano, pelo que esta coleção só estará disponível para consulta no final de 2016.

Contudo, pode consultar já alguns sites das Eleições Legislativas anteriores, tais como:

Agradecemos sinceramente a todos os voluntários que colaboraram com esta iniciativa.

Agora precisamos da sua colaboração para sugerir sites sobre as presidenciais portuguesas de 2016.

Contamos consigo?

Saber mais

Conjunto de dados abertos (Dados.gov)

Uma primeira tentativa de arquivar o .EU.

Última atualização em 1 de Outubro de 2021 às 9:12

Notícia actualizada em Agosto 1, 2019

O Arquivo.pt realizou uma experiência para tentar preservar sítios alojados sob o domínio .EU.

O domínio .EU é utilizado frequentemente para referenciar sítios web relacionados com a Europa. A estratégia de preservação da Web tem sido delegar a responsabilidade de arquivar cada domínio nacional às entidades nacionais respetivas. Contudo, o domínio .EU é internacional e a sua preservação ainda não foi atribuída a nenhuma instituição.

RESAW (Research Infrastructure for the Study of Archived Web Materials) é uma rede europeia que tem como objetivo a criação de uma infraestrutura para o estudo de materiais arquivados da web.

No âmbito das atividades do RESAW, o Arquivo.pt realizou uma primeira tentativa de recolher e arquivar sítios alojados sob o domínio .EU. Esta primeira recolha decorreu entre os dias 21 de Novembro e 16 de Dezembro de 2014.

Foram realizadas mais 2 recolhas experimentais de sites do .EU que passado 1 ano passaram a estar pesquisáveis em Arquivo.pt. Além disso, disponibilizámos um protótipo de pesquisa focada nas recolhas do .EU que demonstra a facilidade de criar motores de busca focados em determinadas colecções através da utilização do operador de pesquisa “collection”

Colaborações com investigadores interessados em estudar os materiais recolhidos são bem-vindas.

Para saber mais

Recomendações para autores

Última atualização em 29 de Setembro de 2017 às 15:35

O Arquivo da Web Portuguesa publicou um conjunto de recomendações para a criação de conteúdos na Web que possam ser arquivados e preservados ao longo do tempo.

Os autores ao seguirem estas recomendações, estão a contribuir para que os conteúdos publicados nos seus sítios web possam ser correctamente arquivadas e acedidos no futuro.

É impossível preservar a web portuguesa sem a colaboração dos autores.

Ver as recomendações.

Prémio 2.º melhor artigo no LA-Web

Última atualização em 12 de Agosto de 2024 às 13:10

O artigo “Trends in Web characteristics” da autoria de 2 membros do Arquivo da Web Portuguesa recebeu um prémio durante a conferência LA-Web 2009.

O artigo Trends in Web characteristics da autoria de João Miranda e Daniel Gomes, foi distinguido como o segundo melhor artigo apresentado na conferência científica internacional 7th Latin American Web Congress, que teve lugar no México em Novembro.

O trabalho apresenta resultados acerca da evolução das características estruturais da Web portuguesa, derivados da comparação entre uma recolha realizada pelo Arquivo da Web Portuguesa em 2008 e estudos publicados anteriormente.

Versão do rARC para Linux já disponível

Última atualização em 20 de Dezembro de 2019 às 14:56

rARC permite que qualquer pessoa colabore na preservação da web portuguesa, contribuindo com um pouco de espaço do seu computador para guardar uma pequena cópia da informação arquivada.

Esta versão foi testada com sucesso nas seguintes distribuições:

  • Fedora 10, 11 (Gnome)
  • Ubuntu 9.04, 9.10 (Gnome)

Por favor, informe-nos se verificar que o software é compatível com outras distribuições ou detectar algum problema.

Versão do rARC para Windows 7 já disponível

Última atualização em 6 de Agosto de 2024 às 13:07

A versão do rARC para Windows 7 já está disponível.

rARC permite que qualquer pessoa colabore na preservação da web portuguesa, contribuindo com um pouco de espaço do seu computador para guardar uma pequena cópia da informação arquivada.

Por favor, informe-nos se detectar algum problema.

Cópia da Web Portuguesa salvaguardada por voluntários

Última atualização em 20 de Dezembro de 2019 às 15:08

Voluntariamente, os contribuidores do rARC já cederam espaço suficiente para salvaguardar uma cópia da Web portuguesa.

rARC conta já com mais de 130 contribuidores que disponibilizam um total de 2 700 gigabytes.

espaço oferecido pelos colaboradores corresponde ao total necessário para salvaguardar uma cópia arquivada da Web portuguesa

Duas novas propostas de colaboração

Última atualização em 6 de Agosto de 2024 às 14:07

O Arquivo da Web Portuguesa publicou duas novas propostas de projectos de colaboração com entidades de Investigação e Desenvolvimento

Estas propostas apresentam projectos com a duração estimada de 1 ano, que poderiam fazer parte de um trabalho de mestrado ou de iniciação à investigação.

Proposta de projecto de colaboração com o Arquivo da Web Portuguesa para criar um sistema automático de reconhecimento de siglas em conteúdos arquivados.
Proposta de projecto de colaboração com o Arquivo da Web Portuguesa para prospecção de texto suportada em colecções de n-gramas.

Consulte a lista completa.

Pesquisa sobre o passado disponível

Última atualização em 6 de Agosto de 2024 às 13:42

O Arquivo da Web Portuguesa disponibilizou um serviço que permite pesquisar e aceder a páginas do passado que já não se encontram disponíveis na Web actual.

Arquivo da Web Portuguesa

Esta versão experimental do serviço inclui 130 milhões de conteúdos arquivados entre 1996 e 2007.

Poderá usar funções de pesquisa avançada, tais como restringir o intervalo de tempo da pesquisa para obter resultados mais relevantes.

Agradecemos os seus comentários, críticas ou sugestões.

Pesquisar no passado já!

Conteúdos de 2005 fornecidos pela Biblioteca Nacional já podem ser pesquisados

Última atualização em 20 de Dezembro de 2019 às 15:39

Os conteúdos fornecidos pela Biblioteca Nacional de Portugal foram integrados com sucesso e já podem ser pesquisados através do nosso sistema experimental de pesquisa.

Em 2005, a Biblioteca Nacional de Portugal em colaboração com o INESC realizou um série de recolhas da Web portuguesa para obter informação relacionada com as eleições nacionais.

Este projecto teve o nome de RECOLHA e originou o arquivo de 14 milhões de conteúdos (165 GB) que foram fornecidos ao Arquivo da Web Portuguesa em 2009.

Após ter sido integrada com sucesso, esta informação pode agora ser pesquisada através do nosso sistema experimental.

Note-se que não é possível distinguir os conteúdos pertencentes ao RECOLHA dos restantes.