Última atualização em 21 de Setembro de 2021 às 10:52
A informação recolhida da Web durante 2019 está acessível através do Arquivo.pt, depois do embargo de 1 ano que precede a disponibilização de conteúdos.
Relembre e investigue os acontecimentos históricos de 2019, tais com:
O Arquivo.pt recolheu 1700 milhões de ficheiros, a partir de 2 milhões de sites visitados, num total de 131 terabytes que agora estão disponíveis para que possa aceder a eventos passados.
Em 2021, o Arquivo.pt disponibiliza acesso aberto a mais de 10 000 milhões de ficheiros (721 terabytes) oriundos de 27 milhões de websites.
formação em preservação dos dados abertos publicados online.
A AMA é a organização pública responsável pela promoção dos meios digitais na Administração Pública e tem por objetivo modernizar e simplificar o acesso dos cidadãos aos serviços do Estado.
O Arquivo.pt é um serviço operado pela Fundação para a Ciência e a Tecnologia I.P. (unidade FCCN) que preserva dados publicados na Web entre 1996 e a atualidade, tornando-os acessíveis a qualquer cidadão para fins de memória e investigação.
Diretiva da União Europeia para dados abertos inclui documentos nos sítios na Internet
“(30) A presente diretiva prevê a definição do termo «documento» e essa definição deverá designar também qualquer parte do documento. O termo «documento» deverá abranger qualquer representação de atos, factos ou informações – e qualquer compilação destes –, seja qual for o seu meio (papel, suporte eletrónico, registo sonoro, visual ou audiovisual).
…
(34) A fim de facilitar a reutilização, os organismos do setor público deverão, se possível e adequado, disponibilizar os documentos, incluindo os que são publicados em sítios na Internet, num formato aberto e compatível com a leitura por máquina, juntamente com os respetivos metadados, ao melhor nível de precisão e granularidade, num formato que garanta a interoperabilidade
…
(35) Deverá considerar-se que um documento se apresenta em formato legível por máquina se tiver um formato de ficheiro estruturado de modo a ser facilmente possível, por meio de aplicações de software, identificar, reconhecer e extrair dados específicos. Os dados codificados em ficheiros estruturados num formato legível por máquina deverão ser considerados dados legíveis por máquina. Os formatos legíveis por máquina podem ser abertos ou sujeitos a direitos de propriedade; podem ser normas formais ou não.
…
(60) A Comissão deverá facilitar a cooperação entre Estados-Membros e apoiar a conceção, o ensaio, a aplicação e a implantação de interfaces eletrónicas interoperáveis que permitam dispor de serviços públicos mais eficazes e seguros.”
O serviço público Arquivo.pt tem a missão de preservar os documentos publicados nos sítios da Internet para viabilizar o seu acesso aberto a longo prazo e disponibiliza interfaces eletrónicas interoperáveis (APIs) para o seu processamento automático.
Qualquer cidadão pode aceder aos dados abertos resultantes destes arquivos históricos, podendo por exemplo, pesquisar informação oficial publicada em websites dos sucessivos Governos.
Em 2021, o Arquivo.pt disponibilizava acesso aberto a mais de 10 000 milhões de ficheiros (721 TB) oriundos de 27 milhões de websites. Os dados abertos preservados pelo Arquivo.pt podem ser explorados através da interface de pesquisa, automaticamente através de API (https://arquivo.pt/api) ou reutilizando os conjuntos de dados derivados.
Conjuntos de dados derivados disponíveis no Portal de Dados Abertos
Além dos artefactos web originais preservados no Arquivo.pt, este serviço tem gerado conjuntos de dados abertos derivados das suas atividades, que estão agora disponíveis em acesso aberto para que possam ser reutilizados:
Web Archiving Conference 2021 – o encontro aberto mais importante no domínio da preservação da Web, onde os especialistas partilham novos conhecimentos e experiências;
RESAW Conference – encontro da rede europeia RESAW (Research Infrastructure for the Study of Archived Web Materials), dirigido sobretudo à comunidade de investigadores como as Ciências Sociais, as Artes e Humanidades Digitais.
Contributos do Arquivo.pt para a comunidade internacional
O Arquivo.pt apresentou resultados do trabalho desenvolvido durante o último ano, com destaque para as funcionalidades que melhoraram a reprodução dos conteúdos arquivados, como é o caso da função “Completar a página”.
Foram apresentadas as novas coleções históricas do Geocities e do Internet Memory Foundation, que foram integradas no Arquivo.pt e as recolhas especiais sobre as Eleições Europeias de 2019 e Covid-19.
O Arquivo.pt é uma infraestrutura de investigação de âmbito internacional porque os seus serviços e conteúdos históricos preservados estão acessíveis a qualquer investigador do mundo.
Apresentações realizadas
“Arquivo.pt updates 2021”: presentation at the IIPC – General Assembly, Daniel Gomes (Vídeo)
“Complete the page!”. 1 minute drop in (demonstração da funcionalidade “completar a página”), Daniel Gomes (Slide, Video)
“A transnational and cross-lingual crawl of the European Parliamentary Elections 2019, Ivo Branco (Slides, Vídeo)
“Enhancing access to research the Geocities historical collection”, Pedro Gomes (Slides, Vídeo)
Os sites eleitorais são de manifesta importância histórica. Contudo, são difíceis de identificar porque aparecem e desaparecem rapidamente, e muitas vezes são apenas referenciados em meios impressos (ex. cartazes).
Por isso, a sua colaboração é fundamental!
Para ajudar, basta adicionar endereços de páginas ou sites relacionados com as Eleições Autárquicas de 2021 através do seguinte link:
O 2º prémio no valor de 3 000 euros foi atribuído ao trabalho “Politiquices”, desenvolvido por David Batista.
“Politquices” é uma aplicação Web que permite pesquisar relações de apoio ou oposição entre personalidades e partidos políticos expressas em títulos de notícias preservadas no Arquivo.pt.
Esta interface permite analisar a relação de apoio ou oposição entre duas personalidades ou organizações políticas.
3º classificado – “Primeiras páginas de jornais online portugueses”
O 3º classificado recebeu um prémio no valor de 2 000 euros e foi atribuído ao trabalho “Primeiras páginas de jornais online portugueses”, realizado por Susana Parreira, sob orientação de Ana Sabino, Ana Boavida e Penousal Machado.
“Primeiras páginas de jornais online portugueses” apresenta uma análise gráfica interativa das primeiras páginas de jornais online portugueses. Para este estudo foram analisados itens específicos dentro do desenho de jornais, permitindo assim observar tendências ao longo do tempo.
Como resultado temos uma interface Web que permite de forma interativa visualizar, por exemplo, o espaço ocupado pelas imagens na primeira página do Público.
O Jornal Público, parceiro oficial da 4ª edição do Prémio Arquivo.pt atribuiu a sua Menção Honrosa ao trabalho “Primeiras páginas de jornais online portugueses”, realizado por Susana Parreira, sob orientação de Ana Sabino, Ana Boavida e Penousal Machado.
Última atualização em 9 de Agosto de 2024 às 16:16
A coleção histórica de conteúdos da Web gerada ao longo da atividade da Internet Memory Foundation (IMF) foi doada ao Arquivo.pt e pode agora ser pesquisada!
A IMF foi uma organização europeia dedicada a preservar conteúdos da web que foi extinta em 2018.
Em 2010, Julien Masanès, o “pai” dos arquivos da Web na Europa criou a IMF.
Exemplos de páginas da coleção doada pelo IMF
A coleção doada pelo IMF foi agora integrada no acervo do Arquivo.pt para ser preservada para a posteridade.
Esta coleção é composta por 142 milhões de ficheiros que totalizam 6,3 TB de informação histórica cujos textos ou imagens podem agora ser pesquisados através do Arquivo.pt.
Última atualização em 12 de Outubro de 2021 às 14:44
Colectiva de Artistas. 2008.04.19 a 2008.06.07. Galeria Quadrado Azul. Porto. Ilustração retirada a partir da página preservada no Arquivo.pt: www.quadradoazul.pt, 22 de outubro de 2008.
O Arquivo.pt e a Biblioteca de Arte da Fundação Calouste Gulbenkian irão oferecer gratuitamente um ciclo de webinars acerca da preservação da memória da Arte na Web, especialmente dedicados à comunidade de artistas, curadores, galeristas e produtores de eventos.
Ao longo destas sessões, os participantes ficarão a conhecer:
funcionalidades do Arquivo.pt para tirarem proveito deste serviço público de preservação da Web;
recomendações e boas práticas para criarem websites preserváveis para o futuro;
ferramentas gratuitas disponíveis para arquivarem os seus próprios websites num formato normalizado para que os seus conteúdos nunca se percam.
Este ciclo de webinars é uma iniciativa do Projeto “Para sempre” no âmbito da Infraestrutura ROSSIO.
Última atualização em 6 de Agosto de 2024 às 17:25
Estão abertas as candidaturas ao Prémio Arquivo.pt 2021!
Nesta 4ª edição do Prémio anual Arquivo.pt serão atribuídos 15 000 € aos três melhores trabalhos (1º classificado: 10 000 €).
O prazo para submissão de trabalhos termina no dia 4 de maio de 2021.
Podem concorrer trabalhos realizados individualmente ou em grupo sobre qualquer tema, desde que o Arquivo.pt seja a fonte principal de informação.
O Jornal Público, um dos primeiros jornais a marcar presença na Internet, é parceiro oficial do Prémio Arquivo.pt 2021 e atribuirá uma Menção Honrosa para os trabalhos realizados com base nos conteúdos do Público guardados no Arquivo.pt.