Websites do Afeganistão e a queda do regime em agosto de 2021

thumbnail_Karima Faryabi

Última atualização em 26 de Setembro de 2022 às 15:55

afghan-ministry-of-economy-17-08-2021

Website do Ministério da Economia do Afeganistão com Karima Faryabi (gravado a 17 de agosto de 2021)

No dia 15 de agosto de 2021 o palácio presidencial em Cabul foi tomado pelos Talibãs, consumando a queda do regime que vigorava há 20 anos, após os atentados do 11 de Setembro nos Estados Unidos.

A comunidade dos arquivistas da Web, através do Content Development Working Group do International Internet Preservation Consortium, lançou o desafio da gravação dos sites afegãos, face ao risco de estes virem a desaparecer com o novo regime.

Não há tempo a perder quando se trata de preservar a Web

O Arquivo.pt reagiu rapidamente lançando uma pesquisa automática de conteúdos focada em sites do domínio .af e em notícias dos media internacionais sobre os eventos em curso.

No dia 17 de agosto os websites começaram a ser gravados.

Foram utilizados 1800 endereços de sites do Afeganistão (terminados em .af) e 500 notícias dos meios de comunicação social de todo o mundo.

Os endereços, URLs ou “seeds” foram obtidos através de pesquisa automática, utilizando o Bing Search API, e colocados imediatamente em gravação.

Conteúdos disponíveis para conhecer a história do Afeganistão

Como resultado da recolha realizada passaram a estar disponíveis no Arquivo.pt mais de 400 Gigabytes de informação que qualquer pessoa pode utilizar para investigação nas mais diversas áreas.

O principal contributo do Arquivo.pt para a comunidade dos arquivistas da Web foi a demonstração da pesquisa automática que permite uma reação rápida na gravação de conteúdos Web em risco iminente de se perderem.

Mais informação

Conjunto de dados abertos do Arquivo.pt (Dados.gov)

Conteúdos recolhidos pelo Content Development Working Group do International Internet Preservation Consortium disponíveis no serviço Archive-it

Participação do Arquivo.pt no encontro do International Internet Preservation Consortium

thumbnail_GA_WAC2022

Última atualização em 29 de Julho de 2022 às 12:34

Encontro com a comunidade dos arquivos da Web

O Internacional Internet Preservation Consortium (IIPC), consórcio que reune inicitivas de preservação da Web de todo o mundo, realizou a Assembleia Geral com os seus associados entre os dias 17 e 19 de maio de 2022.

Na semana seguinte, nos dias 24 e 25 de maio, realizou-se a IIPC Web Archiving Conference (IIPC WAC), via online tal como no ano anterior devido às contingências da pandemia da Covid-19.

O acolhimento dos dois eventos foi feito pela Library of Congress.

Recursos e iniciativas do Arquivo.pt na Web Archiving Conference

A IIPC Web Archiving Conference (IIPC WAC) é uma iniciativa aberta à comunidade, onde podem participar pessoas ou entidades não associodas ao IIPC e interessadas no domínio da preservação da Web.

O Arquivo.pt contribuiu em duas sessões Ligthtning Talks  (sessão 5 e sessão 13).

As apresentações do Arquivo.pt centraram-se nos recursos e iniciativas que este serviço tem ultimamente oferecido à comunidade.

Livro “The Past Web: Exploring Web Archives”: versão em acesso aberto

thumb-the-past-web

Última atualização em 13 de Setembro de 2022 às 16:15

Desde 2006 que não era publicado um livro que refletisse o estado-da-arte na área da preservação da web e da investigação que tem sido conduzida sobre os arquivos da web.

O principal objetivo do novo livro The Past Web: exploring web archives foi criar um novo recurso atualizado que permitisse formar mais pessoas na área de preservação da web e dar a conhecer os arquivos da web aos investigadores e académicos.

Assim sendo, o livro dirige-se principalmente à comunidade académica e científica, e apresenta os métodos mais inovadores para a exploração de informação do passado preservada pelos arquivos da web.

Daniel Gomes, gestor do Arquivo.pt liderou a equipa de editores do livro, composta também pelos especialistas Elena Demidova, Jane Winters e Thomas Risse. No total, o livro contou com as contribuições de 40 autores especialistas na área de arquivo da web, oriundos de todo o mundo.

A obra divide-se em 6 partes onde encontramos variados recursos para explorar páginas arquivadas da Internet desde a década de 1990.

Podemos também aprender como preservar a nossa memória coletiva na Era Digital, que estratégias utilizar na seleção de conteúdos online e qual o impacto dos arquivos web na preservação de informação histórica.

O livro pretende apoiar os professores na sua missão de transmitir conhecimento inovador e adequado para a literacia digital necessária para formar profissionais para o século XXI.

O gestor do Arquivo.pt alerta para a necessidade de incluir os arquivos da web nos planos letivos e destaca que este conhecimento traz uma grande vantagem competitiva principalmente para os estudantes de Ciências Sociais e Humanidades.

Um detalhe inovador deste livro é que todos os links citados foram preservados pelo Arquivo.pt por forma a assegurar que as referências se mantenham válidas ao longo do tempo.

O livro esteve disponível gratuitamente para ser descarregado a partir de instituições do ensino superior (entidades aderentes à b-On) até dia 6 de março de 2022.

Porém, pode descarregar uma versão não final do livro (pre-print).

Ligações

Apresentação do livro “The Past Web” no Museu de Leiria durante as Jornadas FCCN

Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro

Arquivo.pt nos eventos internacionais de 2021

Thumbnail IIPC WAC 2021

Última atualização em 17 de Agosto de 2021 às 19:36

Em junho de 2021, ocorreram 3 eventos internacionais relacionados com arquivos da web que contaram com os contributos do Arquivo.pt:

Contributos do Arquivo.pt para a comunidade internacional

O Arquivo.pt apresentou resultados do trabalho desenvolvido durante o último ano, com destaque para as funcionalidades que melhoraram a reprodução dos conteúdos arquivados, como é o caso da função “Completar a página”.

Foram apresentadas as novas coleções históricas do Geocities e do Internet Memory Foundation, que foram integradas no Arquivo.pt e as recolhas especiais sobre as Eleições Europeias de 2019 e Covid-19.

O Arquivo.pt é uma infraestrutura de investigação de âmbito internacional porque os seus serviços e conteúdos históricos preservados estão acessíveis a qualquer investigador do mundo.

Apresentações realizadas

  • “Arquivo.pt updates 2021”: presentation at the IIPC – General Assembly, Daniel Gomes (Vídeo)
  • “Complete the page!”. 1 minute drop in (demonstração da funcionalidade “completar a página”), Daniel Gomes (Slide)
  • “A transnational and cross-lingual crawl of the European Parliamentary Elections 2019, Ivo Branco (Slides, Vídeo)
  • “Enhancing access to research the Geocities historical collection”, Pedro Gomes (Slides, Vídeo)

 

Complete the page - demo
Complete the page – demo. Slide used in the IIPC 1 minute presentation, at the IIPC General Assembly 2021

Coleção do 1º arquivo da web europeu pesquisável no Arquivo.pt

logo Internet Memory Foundation - website

Última atualização em 1 de Outubro de 2021 às 9:10

A coleção histórica de conteúdos da Web gerada ao longo da atividade da Internet Memory Foundation (IMF) foi doada ao Arquivo.pt e pode agora ser pesquisada!

A IMF foi uma organização europeia dedicada a preservar conteúdos da web que foi extinta em 2018.

O 1º projeto de arquivo da Web na Europa (2004-2010) foi liderado por Julien Masanès (que foi convidado de honra na celebração dos 10 anos do Arquivo.pt) e denominava-se European Archive Foundation.

Em 2010, Julien Masanès, o “pai” dos arquivos da Web na Europa criou a IMF.

Exemplos de páginas da coleção doada pelo IMF

A coleção doada pelo IMF foi agora integrada no acervo do Arquivo.pt para ser preservada para a posteridade.

Esta coleção é composta por 142 milhões de ficheiros que totalizam 6,3 TB de informação histórica cujos textos ou imagens podem agora ser pesquisados através do Arquivo.pt.

print homepage www.limes.fp6-limes.eu

Página do projeto LIMES (Land and Sea Monitoring for Environment and Security), 2009.

print homepage intelligence-territoriale.eu

Página do projeto Intelligence-territoriale, 2009.

Página sobre as Eleições Europeias de 2009 (www.elections2009-results.eu).

Página da agência noticiosa Reuters acerda do WikiLeaks, 2011

Print da página do Internet Memory Research em 2014

Página do Internet Memory Foundation, 2014.

Pesquise esta nova coleção!

Esta nova coleção recebeu foi nomeada “InternetMemory” na lista de coleções do Arquivo.pt.

Podem ser realizadas pesquisas sobre esta coleção utilizando o parâmetro de pesquisa collection ou através da página de pesquisa customizada disponível em arquivo.pt/InternetMemory.

printscreen da custom-search para a coleção InternetMemory

 

 

 

 

Eleições Presidenciais 2021: precisamos da sua ajuda!

thumbnail_presidenciais
banner_presidenciais_v
Formulário de sugestão de endereços de páginas, sites e outros conteúdos Web

O Arquivo.pt convida todos os cidadãos a sugerirem páginas da Web relacionadas com as Eleições Presidenciais de 2021 para serem preservadas para o futuro.

As Eleições Presidenciais ocorrerão em Portugal no dia 24 de janeiro de 2021.

As suas sugestões são importantes para que o Arquivo.pt consiga guardar uma memória mais completa deste importante evento eleitoral.

Para sugerir páginas utilize este formulário (https://tinyurl.com/presidenciais-sugerir)

 

Vencedor do Prémio no Dia Mundial da Preservação Digital

WDPD2020-Portuguese-Portrait-RGB

Última atualização em 23 de Novembro de 2020 às 18:19

WDPD2020-Portuguese-Landscape-RGB

No mês de novembro comemora-se o Dia Mundial da Preservação Digital e, para assinalar esta iniciativa internacional, o Arquivo.pt realizou uma sessão online aberta à comunidade.

Formulário de inscrição (gratuita mas necessária)

O convidado especial desta sessão foi o 1º classificado do Prémio Arquivo.pt 2020, Miguel Ramalho, que nos falou do seu trabalho intitulado “Desarquivo”.

Tal como em 2017, 2018 e 2019, convidámos todas as pessoas a conhecerem o Arquivo.pt, e a utilizarem-no na investigação e na preservação da memória.

O Dia Mundial da Preservação Digital é promovido pelo Digital Preservation Coalitium (UK) e é motivo para iniciativas em todo o mundo, partilhadas nas redes sociais com a hashtag WDPD2020.

Agenda

15h00 – Boas vindas (slides, 1 MB, PDF)
15h05 – Novidades do Arquivo.pt, Daniel Gomes (slides, 2.6 MB, PDF)
15h15 – Desarquivo, 1º classificado do Prémio Arquivo.pt 2020, Miguel Ramalho (slides, 3 MB, PDF)
15h45 – Questões dos participantes
16h00 – Fim

Vídeo da sessão

Inquérito de satistação (1 minuto)

Coleção histórica do Geocities disponível no Arquivo.pt

thumbnail research_geocities

Última atualização em 23 de Setembro de 2021 às 15:30

O Geocities.com foi a primeira grande “rede social” que permitia a qualquer pessoa criar o seu website e difundir informação através da Internet. Foi criado em 1994, adquirido pela Yahoo! em 1999 e encerrado em 2009.

Surgiram iniciativas para preservar os conteúdos do Geocities, tais como o projecto do Archive Team que reuniu 641 GB de informação em 2009, o oOCities ou o Geocities.ws.

Dada a relevância histórica do Geocities, o Arquivo.pt também integrou os seus conteúdos que prevaleceram até aos dias de hoje.

Agora, qualquer pessoa pode facilmente explorar os conteúdos históricos do Geocities utilizando as ferramentas inovadoras de pesquisa disponibilizadas pelo Arquivo.pt como a pesquisa de páginas, pesquisa de imagens ou via API.

Com esta iniciativa, o Arquivo.pt pretende contribuir para o surgimento de estudos inovadores em áreas como Artes, Humanidades ou Sociologia (ver sumário do projecto).

Pesquise agora o Geocities em: arquivo.pt/searchGeocities

Exemplos de sites Geocities preservados no Arquivo.pt

Video Enhancing access to research the Geocities historical collection

Enhancing access to research the Geocities historical collection, Pedro Gomes, RESAW 2021 (slides)

 

Coleção internacional acerca das Eleições Europeias 2019 está disponível

thumbnail print_eleicoes-europeias_eu

Última atualização em 30 de Agosto de 2022 às 10:45

Print www.eleicoes.europeias .eu
Excerto de www.european.elections.eu, preservado pelo Arquivo.pt em maio de 2019

A coleção especial de páginas Web acerca das Eleições Europeias de 2019 está disponível para pesquisa no Arquivo.pt.

Para compilar esta coleção, foram identificadas páginas escritas em 24 línguas europeias, através de pesquisas automáticas no motor de busca Bing e sugestões oriundas de 17 países europeus.

Destaca-se a colaboração do Publications Office of the European Union que reviu a lista dos termos de pesquisa nas diversas línguas da União Europeia.

Entre maio e julho de 2019, o Arquivo.pt recolheu de forma exaustiva páginas relacionadas com as Eleições Europeias em vários países.

A coleção resultante denominada “Eleições Europeias 2019” reúne 99 milhões de ficheiros que totalizam 4,8 TeraBytes de informação.

O relatório técnico “A transnational crawl of the European Parliamentary Elections 2019” detalha a metodologia aplicada. Esta metodologia tem sido aplicada para gerar outras coleções temáticas como por exemplo acerca do Covid-19.

Convidam-se todos os cidadãos, especialmente os investigadores, a explorarem os conteúdos da Web do passado e a incluí-los nos seus trabalhos através deste serviço criado especialmente para pesquisar a coleção multi-lingue Eleições Europeias de 2019: https://arquivo.pt/ee2019

Vídeo “A transnational and cross-lingual crawl of the European Parliamentary Elections 2019”

A transnational and cross-lingual crawl of the European Parliamentary Elections 2019, Ivo Branco, IIPC Web Archiving Conference and RESAW 2021 (slides)

Para saber mais

Formação gratuita no Dia Mundial da Preservação Digital

wdpd_logo_2019

Última atualização em 25 de Novembro de 2019 às 10:36

No dia 7 de novembro celebrou-se o Dia Mundial da Preservação Digital (#WDPD2019).

O Arquivo.pt associou-se a esta iniciativa e, tal como em 2017 e 2018, ofereceu uma das suas formações gratuitas acerca de Preservação da Web. O objetivo foi maximizar a produtividade dos seus utilizadores na exploração do serviço e transmitir boas práticas sobre a preservação da Web.

O evento teve início às 13h30, no Pequeno Auditório localizado nas instalações da FCT-FCCN em Lisboa (Avenida do Brasil, 101) e terminou cerca das 17h30 com o fim da visita do último grupo ao centro de dados.

Agenda

Principais destinatários

  • Profissionais da informação (ex. bibliotecários, arquivistas e documentalistas)
  • Responsáveis por websites (ex. gabinetes de comunicação e imagem)
  • Autores de conteúdos para a Web (ex. bloggers)
  • Professores, estudantes e investigadores interessados em pesquisa histórica sobre informação proveniente da Web e preservação digital

Galeria de fotos

Dia Mundial da Preservação Digital 2019

IMG_7144
IMG_7128
IMG_7116_1
IMG_7157_1
IMG_7180
IMG_7171
IMG_7189
IMG_7487
IMG_7477
IMG_7493
IMG_7452
Dia Mundial da Preservação Digital 2019
IMG_7233
IMG_7246
IMG_7279
IMG_7324
IMG_7125
IMG_7123
IMG_7119
IMG_7261
20191107_173137
IMG_7372
IMG_7375
IMG_7392
IMG_7414
IMG_7144 IMG_7128 IMG_7116_1 IMG_7157_1 IMG_7180 IMG_7171 IMG_7189 IMG_7487 IMG_7477 IMG_7493 IMG_7452 Dia Mundial da Preservação Digital 2019 IMG_7233 IMG_7246 IMG_7279 IMG_7324 IMG_7125 IMG_7123 IMG_7119 IMG_7261 20191107_173137 IMG_7372 IMG_7375 IMG_7392 IMG_7414

Fotografias por: Valter Gouveia, FCT

Resultados

A formação contou com 43 participantes que avaliaram como muito positiva a tarde passada no Arquivo.pt.

Para não perder a próxima formação, inscreva-se na mailing list do Arquivo.pt.