Última atualização em 20 de Dezembro de 2019 às 14:27
O Arquivo.pt tem uma vaga para um Informático Java/Linux com interesse pelas áreas de Information Retrieval ou Machine Learning.
Agradecemos divulgação por potenciais interessados!
Última atualização em 20 de Dezembro de 2019 às 14:27
O Arquivo.pt tem uma vaga para um Informático Java/Linux com interesse pelas áreas de Information Retrieval ou Machine Learning.
Agradecemos divulgação por potenciais interessados!
Ofertas de bolsas para incentivo à investigação utilizando o Arquivo.pt: candidaturas até 31 de outubro de 2016.
O Arquivo.pt é uma infraestrutura de investigação inovadora que permite pesquisar e aceder a páginas da web preservadas desde 1996 representando uma referência mundial com uma significativa produção científica.
Os principais objectivos da atribuição de bolsas no âmbito do projecto Investiga XXI são:
Lançámos uma nova versão do Arquivo.pt no dia 6 de junho de 2016!
Melhorámos a navegação entre páginas arquivadas, com a criação de um menu lateral nas páginas de reprodução.
Foram também incluídas novas funcionalidades na reprodução de páginas arquivadas tais como:
Última atualização em 26 de Setembro de 2017 às 13:01
A equipa do Arquivo.pt esteve presente na maior conferência internacional de arquivos Web.
A conferência, organizada pelo International Internet Preservation Consortium (IIPC), decorreu de 11 a 15 de Abril de 2016 em Reiquiavique, na Islândia.
O Arquivo.pt demarcou a sua posição internacional nos arquivos da Web, ao contribuír com 5 apresentações na conferência.
Os slides das apresentações estão disponíveis nos seguintes links:
Última atualização em 28 de Setembro de 2017 às 9:48
O Arquivo.pt realizou 2 recolhas de sites relacionados com as Eleições Presidenciais de 2016.
Apelámos à comunidade para contribuir sugerindo sites relacionados com as eleições presidenciais de 2016, para que os arquivássemos.
Realizaram-se 2 recolhas, durante e após o período de campanha eleitoral, que partiram da lista de 284 sites sugeridos pela comunidade, resultando no arquivo de 551 672 ficheiros recolhidos da Web, que ocupam 7 GB.
Recolhemos sites tais como os oficiais dos candidatos, sites dos partidos dos candidatos, notícias na comunicação social, blogs e artigos de opinião.
O Arquivo.pt respeita um período de embargo de 1 ano, pelo que esta coleção só estará disponível para consulta no final de 2016.
Contudo, pode consultar já alguns sites das Eleições Presidenciais anteriores, tais como:
Agradecemos sinceramente a todos os voluntários que colaboraram com esta iniciativa.
Última atualização em 3 de Abril de 2019 às 14:53
No dia 12 de Janeiro foi emitida uma nota de imprensa sobre o Arquivo.pt, onde se explica o serviço, a sua história, o seu presente, colaborações e desafios futuros.
O serviço do Arquivo.pt permite a pesquisa, de forma gratuita, sobre dados arquivados da Web desde 1996. A infraestrutura de investigação do Arquivo.pt é focada na preservação de conteúdos de interesse para a comunidade portuguesa.
O Arquivo.pt teve origem no projeto “TUMBA!”, realizado na FCUL entre 2001 e 2006, de onde surge o primeiro protótipo de arquivo da Web portuguesa. Em 2007 é lançado pela FCCN o projeto “Arquivo da Web Portuguesa”.
Encontram-se neste momento arquivados cerca de 2700 milhões de ficheiros, que correspondem a 95 TB de informação, sendo que qualquer pessoa pode sugerir endereços interessantes através da página arquivo.pt/sugerir.
Em 2015, o Arquivo.pt recolheu para preservação cerca de 580 milhões de ficheiros e o serviço de pesquisa registou, em média, 3 692 utilizadores por mês (90% novos utilizadores). Foi também produzido um vídeo a explicar como funciona o Arquivo.pt
Para 2016 o Arquivo.pt pretende disponibilizar o acesso a sites arquivados do domínio .eu, assim como efetuar um esforço adicional para recolha de sites relacionados com as Eleições Presidenciais de 2016. Será também realizado um primeiro protótipo de pesquisa de imagens arquivadas, visto que esta é uma das funcionalidades mais desejadas pelos utilizadores.
Produzimos os seguintes materiais de divulgação:
A sua colaboração na divulgação do Arquivo.pt é fundamental para que este serviço possa ser útil cada vez a mais pessoas.
Solicite-nos materiais para divulgar o Arquivo.pt na sua instituição ou evento. Enviaremos sem custos.
Obrigado.
O nome dado a esta versão foi oportunamente Fénix. Foram resolvidos 20 casos que se originaram as seguintes melhorias:
Aproveitamos para informar que migrámos o nosso projeto de código-aberto para o GitHub: pwa_technologies onde poderão encontrar mais detalhes acerca da versão Fénix.
Comentários e sugestões são bem-vindos!
Última atualização em 30 de Agosto de 2022 às 10:54
O Arquivo.pt realizou 4 recolhas de sites relacionados com as Eleições Legislativas de 2015.
Apelámos à comunidade para contribuir sugerindo de sites relacionados com as Eleições Legislativas de 2015 para que os arquivássemos.
Realizaram-se 4 recolhas, durante e após o período de campanha eleitoral, que partiram da lista de 127 sites sugeridos pela comunidade, resultando no arquivo de 2 802 407 ficheiros recolhidos da Web, que ocupam 274 GB.
Recolhemos sites tais como os das campanhas oficiais dos partidos candidatos, notícias na comunicação social, blogs, artigos de opinião ou satíricos.
O Arquivo.pt respeita um período de embargo de 1 ano, pelo que esta coleção só estará disponível para consulta no final de 2016.
Contudo, pode consultar já alguns sites das Eleições Legislativas anteriores, tais como:
Agradecemos sinceramente a todos os voluntários que colaboraram com esta iniciativa.
Agora precisamos da sua colaboração para sugerir sites sobre as presidenciais portuguesas de 2016.
Contamos consigo?
Última atualização em 1 de Outubro de 2021 às 9:12
Notícia actualizada em Agosto 1, 2019
O domínio .EU é utilizado frequentemente para referenciar sítios web relacionados com a Europa. A estratégia de preservação da Web tem sido delegar a responsabilidade de arquivar cada domínio nacional às entidades nacionais respetivas. Contudo, o domínio .EU é internacional e a sua preservação ainda não foi atribuída a nenhuma instituição.
O RESAW (Research Infrastructure for the Study of Archived Web Materials) é uma rede europeia que tem como objetivo a criação de uma infraestrutura para o estudo de materiais arquivados da web.
No âmbito das atividades do RESAW, o Arquivo.pt realizou uma primeira tentativa de recolher e arquivar sítios alojados sob o domínio .EU. Esta primeira recolha decorreu entre os dias 21 de Novembro e 16 de Dezembro de 2014.
Foram realizadas mais 2 recolhas experimentais de sites do .EU que passado 1 ano passaram a estar pesquisáveis em Arquivo.pt. Além disso, disponibilizámos um protótipo de pesquisa focada nas recolhas do .EU que demonstra a facilidade de criar motores de busca focados em determinadas colecções através da utilização do operador de pesquisa “collection”
Colaborações com investigadores interessados em estudar os materiais recolhidos são bem-vindas.