Última atualização em 1 de Outubro de 2021 às 9:12
Notícia actualizada em Agosto 1, 2019
O domínio .EU é utilizado frequentemente para referenciar sítios web relacionados com a Europa. A estratégia de preservação da Web tem sido delegar a responsabilidade de arquivar cada domínio nacional às entidades nacionais respetivas. Contudo, o domínio .EU é internacional e a sua preservação ainda não foi atribuída a nenhuma instituição.
O RESAW (Research Infrastructure for the Study of Archived Web Materials) é uma rede europeia que tem como objetivo a criação de uma infraestrutura para o estudo de materiais arquivados da web.
No âmbito das atividades do RESAW, o Arquivo.pt realizou uma primeira tentativa de recolher e arquivar sítios alojados sob o domínio .EU. Esta primeira recolha decorreu entre os dias 21 de Novembro e 16 de Dezembro de 2014.
Foram realizadas mais 2 recolhas experimentais de sites do .EU que passado 1 ano passaram a estar pesquisáveis em Arquivo.pt. Além disso, disponibilizámos um protótipo de pesquisa focada nas recolhas do .EU que demonstra a facilidade de criar motores de busca focados em determinadas colecções através da utilização do operador de pesquisa “collection”
Colaborações com investigadores interessados em estudar os materiais recolhidos são bem-vindas.
Para saber mais
- Protótipo de pesquisa focada nas recolhas do .EU através da utilização do operador de pesquisa “collection”
- The Curious Case of Archiving .eu, capítulo do livro The Historical Web and Digital Humanities: The Case of National Web Domains
- Opportunities and challenges in collecting and studying national webs, (video, PDF)
- A first attempt to archive the .EU domain, relatório técnico
- Heritrix original crawl log (19,6 GB)
- Heritrix generated reports (21,5 MB)
- Analysis sheet generated using the Notebook Python library