Coleção do 1º arquivo da web europeu pesquisável no Arquivo.pt

logo Internet Memory Foundation - website

Última atualização em 9 de Agosto de 2024 às 16:16

A coleção histórica de conteúdos da Web gerada ao longo da atividade da Internet Memory Foundation (IMF) foi doada ao Arquivo.pt e pode agora ser pesquisada!

A IMF foi uma organização europeia dedicada a preservar conteúdos da web que foi extinta em 2018.

O 1º projeto de arquivo da Web na Europa (2004-2010) foi liderado por Julien Masanès (que foi convidado de honra na celebração dos 10 anos do Arquivo.pt) e denominava-se European Archive Foundation.

Em 2010, Julien Masanès, o “pai” dos arquivos da Web na Europa criou a IMF.

Exemplos de páginas da coleção doada pelo IMF

A coleção doada pelo IMF foi agora integrada no acervo do Arquivo.pt para ser preservada para a posteridade.

Esta coleção é composta por 142 milhões de ficheiros que totalizam 6,3 TB de informação histórica cujos textos ou imagens podem agora ser pesquisados através do Arquivo.pt.

print homepage www.limes.fp6-limes.eu

Página do projeto LIMES (Land and Sea Monitoring for Environment and Security), 2009.

print homepage intelligence-territoriale.eu

Página do projeto Intelligence-territoriale, 2009.

Página sobre as Eleições Europeias de 2009 (www.elections2009-results.eu).

Página da agência noticiosa Reuters acerda do WikiLeaks, 2011

Print da página do Internet Memory Research em 2014

Página do Internet Memory Foundation, 2014.

Pesquise esta nova coleção!

Esta nova coleção recebeu foi nomeada “InternetMemory” na lista de coleções do Arquivo.pt.

Podem ser realizadas pesquisas sobre esta coleção utilizando o parâmetro de pesquisa collection ou através da página de pesquisa customizada disponível em arquivo.pt/InternetMemory.

printscreen da custom-search para a coleção InternetMemory

 

 

 

 

“Arte para sempre na Web”: ciclo de Webinars

composicao sobre Colectiva de Artistas 2008 Quadrado Azul

Última atualização em 12 de Outubro de 2021 às 14:44

composicao sobre Colectiva de Artistas 2008 Quadrado Azul

Colectiva de Artistas. 2008.04.19 a 2008.06.07. Galeria Quadrado Azul. Porto. Ilustração retirada a partir da página preservada no Arquivo.pt: www.quadradoazul.pt, 22 de outubro de 2008.

O Arquivo.pt e a Biblioteca de Arte da Fundação Calouste Gulbenkian irão oferecer gratuitamente um ciclo de webinars acerca da preservação da memória da Arte na Web, especialmente dedicados à comunidade de artistas, curadores, galeristas e produtores de eventos.

Ao longo destas sessões, os participantes ficarão a conhecer:

  • funcionalidades do Arquivo.pt para tirarem proveito deste serviço público de preservação da Web;
  • recomendações e boas práticas para criarem websites preserváveis para o futuro;
  • ferramentas gratuitas disponíveis para arquivarem os seus próprios websites num formato normalizado para que os seus conteúdos nunca se percam.

Este ciclo de webinars é uma iniciativa do Projeto “Para sempre” no âmbito da Infraestrutura ROSSIO.

Para mais detalhes consulte o programa (PDF).

Inscreva-se!

Milhões de imagens sobre o passado!

thumbnail_pesquisa_imagens

Última atualização em 23 de Agosto de 2022 às 16:19

O Arquivo.pt lançou uma nova versão denominada Dionisius, no dia 24 de março de 2021.

1 800 milhões de imagens do passado da Web passaram a estar pesquisáveis no Arquivo.pt!

A pesquisa sobre este volume de imagens arquivadas da Web é uma inovação à escala mundial.

Para assistir a uma apresentação acerca da criação deste sistema inovador, veja a gravação da 21ª sessão do Café com o Arquivo.pt intitulada “Milhões de imagens sobre o passado – como foram indexadas no Arquivo.pt”.

Veja por exemplo, como uma pesquisa de imagens sobre a “Seleção Nacional” apresenta imagens oriundas dos websites arquivados.

print_image_search

Página de resultados de uma pesquisa acerca da “Seleção Nacional” no Arquivo.pt.

A nova API de pesquisa de imagens permite também criar novos trabalhos para se candidatar aos Prémios Arquivo.pt.

Ajude-nos a melhorar!

Se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais

“Será que quis dizer” – nova versão do Arquivo.pt

Thumnail query_suggest_print

Última atualização em 24 de Março de 2021 às 13:32

O Arquivo.pt lançou uma nova versão, denominada Caronte, no dia 19 de janeiro de 2021.

Nesta versão destaca-se a nova sugestão de pesquisas (Será que quis dizer:).

Sempre que um utilizador introduz uma expressão de pesquisa contendo um potencial erro, o Arquivo.pt apresenta uma sugestão de pesquisa alternativa.

Por exemplo, ao pesquisar “lixboa” recebe a sugestão “Será que quis dizer: lisboa”.

query_suggest_print

Figura 1: Exemplo de funcionamento da sugestão de pesquisas ao utilizar, por exemplo, o termo “lixboa”

A abertura de candidaturas ao Prémio Arquivo.pt 2021 até 4 de maio também passou a estar em destaque no Arquivo.pt!

Ajude-nos a melhorar!

Se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais

Ver a lista dos 16 problemas resolvidos

Candidaturas abertas ao Prémio Arquivo.pt 2021!

Prémio Arquivo.pt 2021 - Imagem de destaque

Última atualização em 6 de Agosto de 2024 às 17:25

Estão abertas as candidaturas ao Prémio Arquivo.pt 2021!

Nesta 4ª edição do Prémio anual Arquivo.pt serão atribuídos 15 000 € aos três melhores trabalhos (1º classificado: 10 000 €).

O prazo para submissão de trabalhos termina no dia 4 de maio de 2021.

Podem concorrer trabalhos realizados individualmente ou em grupo sobre qualquer tema, desde que o Arquivo.pt seja a fonte principal de informação.

O Jornal Público, um dos primeiros jornais a marcar presença na Internet, é parceiro oficial do Prémio Arquivo.pt 2021 e atribuirá uma Menção Honrosa para os trabalhos realizados com base nos conteúdos do Público guardados no Arquivo.pt.

Todos os detalhes acerca das candidaturas estão disponíveis em:
https://arquivo.pt/premio2021.

O Prémio Arquivo.pt promove a visibilidade de quem concorre e das suas instituições.

Contamos consigo para nos ajudar a divulgar.

Eleições Presidenciais 2021: precisamos da sua ajuda!

thumbnail_presidenciais
banner_presidenciais_v
Formulário de sugestão de endereços de páginas, sites e outros conteúdos Web

O Arquivo.pt convida todos os cidadãos a sugerirem páginas da Web relacionadas com as Eleições Presidenciais de 2021 para serem preservadas para o futuro.

As Eleições Presidenciais ocorrerão em Portugal no dia 24 de janeiro de 2021.

As suas sugestões são importantes para que o Arquivo.pt consiga guardar uma memória mais completa deste importante evento eleitoral.

Para sugerir páginas utilize este formulário (https://tinyurl.com/presidenciais-sugerir)

 

Arquivo.pt preserva websites de projectos científicos nacionais

thumbnail_memoriafct

Última atualização em 26 de Fevereiro de 2021 às 13:06

Preservar os websites de projectos científicos é importante

Os conteúdos dos websites tendem a desaparecer quando os projetos científicos terminam.

A preservação dos websites de projetos científicos é importante porque:

  • documenta o desenvolvimento dos projetos;
  • assegura o acesso a conteúdos técnicos e científicos únicos que os investigadores publicaram nos websites dos projetos (ex. apresentações, fotografias, conjuntos de dados);
  • reforça a visibilidade dos resultados dos projetos financiados pela FCT.

Recolha experimental dos websites dos projetos de científicos em 2016

O Arquivo.pt recolheu websites de projetos financiados pela FCT em 2016 de forma automática.

A informação acerca destes websites estava dispersa pois não era registada durante o processo administrativo.

Durante cerca 20 anos a FCT financiou projetos científicos, por isso o número de sites poderia ser demasiado elevado para serem identificados manualmente.

Foi então adoptada uma metodologia automática de identificação destes websites desenvolvida pelo Arquivo.pt.

A base de dados da FCT tinha um total de 11 996 entradas de projetos mas não incluía referências a endereços web. Aplicando a metodologia automática foram identificados 7 956 URLs relacionados com os projectos científicos financiados.

A recolha dos conteúdos referenciados por estes endereços resultaram na preservação de 600 721 ficheiros (72 GB), incluindo conteúdos tais como páginas da web de grupos de pesquisa, páginas pessoais de investigadores ou blogs relacionados com os projetos.

Referências online em relatórios de projectos científicos passaram a ser preservadas a partir de 2020

A partir de junho de 2020, os endereços dos websites dos projetos financiados pela FCT passaram obrigatoriamente a ser registados nos relatórios de progresso e final submetidos à FCT.

O Arquivo.pt passou a utilizar estes endereços para preservar o conteúdos de websites de projetos científicos nacionais de forma sistemática.

1ª recolha oficial de websites de projectos científicos

Em junho de 2020, o Arquivo.pt obteve 263 endereços relacionados com 100 projetos científicos a partir dos relatórios financiados pela FCT. Grande parte dos endereços (67%) não tinha qualquer versão anteriormente preservada no Arquivo.pt.

Os endereços obtidos apontam para recursos online tais como os websites dos projetos, unidades de I&D, notícias nos media, artigos em revistas científicas ou repositórios, base de dados, vídeos no Youtube ou páginas do Facebook.

Em julho de 2020, lançou-se uma recolha especial a partir deste conjunto de endereços que resultou em 6,9 GB de informação obtidos a partir da visita a 31 606 URLs.

Exposição acerca de projetos de Investigação & Desenvolvimento

A Memória da Investigação Científica é uma exposição online dedicada aos websites de projetos científicos financiados pela Fundação para a Ciência e a Tecnologia (FCT) que o Arquivo.pt tem preservado.

Encontram-se também websites das Unidades de Investigação & Desenvolvimento financiadas pela FCT.

Memorial do Arquivo.pt preserva gratuitamente websites científicos

O serviço Memorial do Arquivo.pt tem preservado websites históricos da FCT que foram desativados. Estes foram criados para eventos ou iniciativas que terminaram e por isso os seus conteúdos deixaram de ser actualizados.

Para incluir um website no Memorial, o Arquivo.pt começa por fazer uma recolha de alta qualidade dos seus conteúdos.

Em seguida, os conteúdos recolhidos são validados em colaboração com os responsáveis pelo website.

Finalmente, o endereço do website é redireccionado para os conteúdos que passaram a ser preservados pelo Arquivo.pt.

Por exemplo, se alguém quiser aceder a qualquer página do site do Encontro Arquivos Científicos realizado em 2014, será redirecionado para o Arquivo.pt.

Assim, os conteúdos permanecem acessíveis ao longo do tempo e os links, as referências em comunicações científicas que possam existir não se quebram.

O serviço de preservação digital Memorial do Arquivo.pt não tem custos para websites da comunidade académica e científica, bastando enviar um pedido para contacto@arquivo.pt.

Para saber mais

Arquivos online ou do online?

thumbnail_tendencias

No final de 2020, recomendamos alguns textos que colocam o futuro em perspetiva.

Destacamos o tema da preservação dos conteúdos online, apresentado no livro   “Tendências 2021”, mais precisamente no capítulo intitulado “Arquivos online ou do online?” da autoria de Daniel Gomes, Gestor do Arquivo.pt.

Fui convidado para escrever acerca dos desafios e ameaças aos arquivos online. A primeira questão que me surgiu foi o que se entende por um “arquivo online”?

A minha preocupação reside nos “arquivos do online” porque ainda nem existe uma consciência instituída acerca da sua necessidade, seja a nível académico, governamental ou individual.

É tecnologicamente impossível preservar toda a informação online. Mas é um absurdo não ter a consciência, e consequentemente a acção, de que temos de preservar alguma da informação online para acesso a curto, médio e longo prazo.

Leia o texto na íntegra nas páginas 23 a 26 do livro em acesso-aberto “Tendências 2021”.

O desafio é cultivar a consciência da importância de preservar conteúdos online aprendendo como fazê-lo na prática.

Votos de Bom Ano!

Regressaram as sessões online Café com o Arquivo.pt

Café com o Arquivo.pt

Última atualização em 2 de Agosto de 2024 às 14:02

Café com o Arquivo.pt

Partilhe esta página: arquivo.pt/cafe

Bem vindo à 2ª temporada do Café com o Arquivo.pt

Quinzenalmente, o Arquivo.pt regressa às sessões on line para tratar um tópico relacionado com a Web e sua preservação. Venha ouvir os convidados e converse directamente com a equipa do Arquivo.pt para saber como tirar maior partido do serviço e concorrer ao Prémio Arquivo.pt.

Sessões realizadas durante a 2ª temporada

21ª sessão – 23 de abril  de 2021 – Milhões de imagens sobre o passado –  como foram indexadas no Arquivo.pt

Em março de 2021 o Arquivo.pt lançou uma nova versão com 1800 milhões de imagens disponíveis. A pesquisa de imagens em arquivos da Web a esta escala é única no mundo e inovadora. O processo utilizado para a indexação foi explicado detalhadamente, nesta sessão, assim como a melhor forma de tirar partido destes recursos usando a API para criar novos trabalhos baseados em imagens.

André Mourão, orador desta sessão, doutorado em Ciência da Computação, é responsável pela indexação e pelo desenvolvimento da pesquisa de imagens no Arquivo.pt. A sua investigação foca-se na pesquisa e interpretação de dados multimédia em larga escala. É co-criador do Revisionista.PT, com Flávio Martins, e Membro Associado do Centro de Investigação NOVA LINCS.

20ª sessão – 26 de março – O Centenário da 1ª Grande Guerra na Web

A historiadora Daniela Major foi a oradora convidada da 20ª sessão do Café com o Arquivo.pt, um ano depois de se terem iniciado estes encontros abertos à comunidade.

A comemoração do Centenário da 1ª Guerra Mundial gerou diversas estratégias de cooperação internacional no século 21 e tal diversidade está presente na informação publicada em websites comemorativos. Nesta sessão, Daniela Major mostrará como utilizou os arquivos da Web para iniciar um estudo no âmbito da História Contemporânea, assim como as implicações metodológicas no seu trabalho.

Daniela Major  é doutoranda em Humanidades Digitais na School of Advanced Study, University of London. Em 2019, no âmbito da Infraestrutura ROSSIO, iniciou no Arquivo.pt um estudo sobre as comemorações da I Guerra Mundial com base nos conteúdos preservados da Web. Presentemente, o seu doutoramento foca-se no impacto mediático da ideia da Europa ao longo dos últimos 15 anos, num esforço de combinar história intelectual com humanidades digitais.

19ª sessão – especial – 2 de março – Prémio Arquivo.pt e esclarecimento de dúvidas

Em 2018, foi criado o Prémio Arquivo.pt com o intuito de promover a realização de trabalhos sobre os conteúdos preservados pelo Arquivo.pt. Quantos candidatos concorreram desde então? Sobre que áreas incidiram os trabalhos? Qual a relação entre Estudos e Aplicações Informáticas? Quem foram os premiados e quais os seus principais contributos? Estas questões serviram de guião desta sessão dedicada ao Prémio que este ano está na 4ª edição. Foram esclarecidas algumas questões sobre o Prémio de 2021. A equipa do Arquivo.pt continua disponível, sobretudo aqueles que pretendem submeter as suas candidaturas até 4 de maio.

Apresentação: Daniel Gomes

18ª sessão – 19 de fevereiro – Os jornais e os arquivos da Web

A 18ª sessão do Café com o Arquivo.pt teve por orador convidado Diogo Silva da Cunha, doutorando no Instituto de Ciências Sociais da Universidade de Lisboa e colaborando com o Centro de Filosofia das Ciências da mesma universidade. Recentemente publicou um estudo sobre a preservação das páginas Web dos jornais no livro “O Choque Tecno-liberal, os media e o jornalismo”. Em 2017, participou no projeto de Humanidades Digitais Investiga XXI no Arquivo.pt.

Esta sessão foi dedicada aos websites dos jornais portugueses. Diogo Cunha falou do seu primeiro contacto com o Arquivo.pt e da sua abordagem, concretizada numa “Rota de Investação” como forma de delimitar o âmbito da sua análise. Apresentou também os resultados da sua investigação sobre as versões preservadas no Arquivo.pt do Correio da Manhã, Diário de Notícias, Expresso e Público.

Conheça o que o existe no Arquivo.pt sobre a imprensa portuguesa visitando a exposição online Memória da Imprensa Portuguesa.

17ª sessão – 15 de janeiro – Como fazer uma exposição de páginas Web antigas sem ser informático (tutorial)

Nesta sessão foram falou-se de aspetos práticos sobre a construção de uma exposição de páginas antigas, desde o uso dos links, típicos dos arquivos da Web, aspetos gráficos a ter em conta e percursos de navegação entre páginas. Utilizou-se o WordPress e mostra-se como fazer rapidamente uma exposição em versão gratuita. Os aspetos tratados têm aplicação em outras plataformas.

  • Conteúdos da sessão – vídeo e apresentação
  • Sessão apresentada por Ricardo Basílio, curador digital do Arquivo.pt

16ª sessão – 11 de dezembro – Arquivo Económico .pt

Arquivo Económico .PT, da autoria do Nuno Bragança, 3º classificado do Prémio Arquivo.pt 2020, é uma WebApp que permite descobrir preços nas páginas Web do passado em produtos de uso frequente e compará-los com os preços atuais. A partir da obtenção automática a partir do Arquivo.pt os dados são tratados e apresentados de forma intuitiva para o utilizador comum. A possibilidade de comparar o presente com o passado baseando-se informação da Web arquivada mostra como pode ser útil não só para satisfazer a curiosidade mas também para apoiar estudos em diversas áreas.

15ª sessão – 24 de novembro – Extensão Arquivo.pt

A Extensão Arquivo.pt é um trabalho da autoria de Rodrigo Marques e Hugo Silva, 2ºs classificados do Prémio Arquivo.pt 2020, que permite pesquisar diretamente no seu browser conteúdos preservados. Vamos ouvi-los falar do seu trabalho e ver casos de uso da Extensão Arquivo.pt.

Sessão especial – Dia Mundial da Preservação Digital 2020 – 5 de novembro

No mês de novembro comemora-se o Dia Mundial da Preservação Digital e, para assinalar esta iniciativa internacional, o Arquivo.pt realizou uma sessão online aberta à comunidade. O convidado especial desta sessão foi o 1º classificado do Prémio Arquivo.pt 2020, Miguel Ramalho, que nos falou do seu trabalho intitulado “Desarquivo”.

Sessões da 1ª temporada realizadas entre março e julho de 2020

Melhorámos a interface do Arquivo.pt

Thumbnail feature basileus version

Última atualização em 16 de Novembro de 2020 às 16:05

O Arquivo.pt lançou uma nova versão, denominada Basileus, no dia 11 de novembro de 2020.

O objetivo desta versão foi melhorar a experiência do utilizador ao navegar pelas diversas interfaces do Arquivo.pt.

Foram feitos ajustes ao nível do Web design dos quais resultaram uma maior coerência na estrutura do código, nos aspetos gráficos e nas interações, como por exemplo cores, tipo de letra e botões.

Print 2 Arquivo.pt versão Basileus

Figura 1: Interface de pesquisa e reprodução de páginas Web. Na imagem, a reprodução de uma página da coleção histórica Geocities.

Ajude-nos a melhorar!

Se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais