Acabe com as “Páginas não encontradas” no seu website

Última atualização em 17 de Agosto de 2022 às 9:05

O seu website apresenta mensagens de “Erro 404 – Página não encontrada” aos seus utilizadores?

O Arquivo.pt oferece uma solução para este problema através do arquivo404.

Basta inserir uma única linha de código na página que gera a mensagem de erro 404 no seu site.

Como funciona o arquivo404?

example-fccn-arquivo404_pt

Quando um utilizador tenta aceder a uma página que já não se encontra disponível num website, o arquivo404 verifica automaticamente se existe uma versão dessa página preservada no Arquivo.pt.

Se a página existir no Arquivo.pt, é apresentado um link para que o utilizador para que possa visitar esta versão.
Se não existir, é apresentada a página de erro normal.

Veja o Arquivo404 em funcionamento neste exemplo de página de erro que apresenta um link gerado automaticamente pelo arquivo404

Como instalar o arquivo404 no seu website?

A implementação mais simples do arquivo404 consiste em inserir a seguinte linha de código Javascript na página de erro 404:

<script type="text/javascript" src="//arquivo.pt/arquivo404.js" async defer onload="ARQUIVO_NOT_FOUND_404.call();"></script>

O código do arquivo404 pode ser adaptado facilmente.  Pode por exemplo, criar uma mensagem de erro personalizada.

Saber mais

Grave páginas no Arquivo.pt com o SavePageNow

Thumb save page now

Última atualização em 17 de Agosto de 2022 às 9:17

O Arquivo.pt lançou uma nova versão, denominada Francisco, no dia 19 de janeiro de 2022.

Nesta versão, destaca-se o novo serviço SavePageNow que permite a qualquer pessoa gravar uma página Web para ser preservada pelo Arquivo.pt. Basta colocar o endereço de uma página e navegar pelos conteúdos.

O SavePageNow do Arquivo.pt foi inspirado no Internet Archive Save Page Now e implementado utilizando o webrecorder pywb.

Por exemplo, uma publicação no blog da FCCN que assinalou os 30 anos da Internet em Portugal, foi gravada com o SavePageNow e ficou preservada no Arquivo.pt.

Ao utilizar o SavePageNow está a contribuir para que informações importantes publicadas na Internet não se percam.

Ajude-nos a melhorar: avise-nos de problemas!

As interfaces de utilização foram recodificadas nesta nova versão e necessitamos da sua ajuda para testá-las em diferentes dispositivos (ex. telemóveis, tablets, portáteis).

Por isso, se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais

 

Como preservar as referências na Wikipédia?

thumbnail-wikimedia

Última atualização em 19 de Maio de 2022 às 19:05

A Wikimedia Portugal iniciou uma colaboração com o Arquivo.pt que visa captar a atenção da comunidade para a preservação dos conteúdos publicados na Wikipédia.

Oitenta por cento das páginas publicadas na Web desaparecem ou são alteradas, apenas 1 ano após a sua publicação. Simultaneamente, a informação na Wikipédia baseia-se em informação maioritariamente publicada na Web. O desaparecimento da informação de referência prejudica a confiabilidade dos artigos da Wikipédia.

Ciclo de webinars “Património Cultural na Web: como preservar as referências na Wikipédia?”

O ciclo de Webinars promovido pela Wikimedia Portugal inclui conteúdos pedagógicos que enriquecem a formação dos profissionais da informação e comunicação mas também a literacia digital de qualquer cidadão.

O Arquivo.pt e a preservação da memória digital (1º Webinar)

Gonçalo Themudo, Presidente da Wikimedia Portugal, introduziu o 1º webinar do ciclo intitulado “Património cultural na Web: como preservar as referências na Wikipédia?”. Salientou a importância de preservar as referências (URLs) utilizadas pelos autores, quando publicam artigos na Wikipédia. Daniel Gomes, Gestor do Arquivo.pt, mostrou como o Arquivo.pt preserva os conteúdos Web e como a comunidade de autores da Wikipédia pode contribuir para que esses conteúdos fiquem efetivamente preservados.

  • Data: Realizado em 22 de fevereiro de 2022
  • Formador: Daniel Gomes, Arquivo.pt
  • Slides
  • Vídeo

Acesso e processamento automático de informação preservada da Web através de APIs (2º Webinar)

Webinar que apresenta as APIs (Application Programming Interface) do Arquivo.pt que possibilitam o processamento automático da informação histórica preservada da Web para desenvolver aplicações inovadores e úteis às organizações. Este Webinar destina-se principalmente a profissionais de informática (ex. Web developers, Web designers, Web marketers).

  • Data: 22 Mar. 2022 15:00 – 16:30
  • Formador: Vasco Rato, Arquivo.pt/ROSSIO
  • Slides
  • Vídeo

Arquivar a Web: faça-você-mesmo! (3º Webinar)

Webinar que apresenta como é preservada a informação cultural de índole municipal e nacional publicada na Web. Demonstra através de casos práticos como qualquer pessoa pode arquivar informação publicada na web num formato adequado que permitirá a sua preservação para o futuro utilizando ferramentas gratuitas. Este Webinar destina-se a qualquer utilizador da Internet mas é particularmente útil para responsáveis pela comunicação e gestão de informação em organizações.

  • Data: 19 Abr. 2022 15:00 – 16:30
  • Formador: Daniel Gomes, Arquivo.pt
  • Slides
  • Vídeo

Continuam as sessões online Café com o Arquivo.pt

banner-cafe-com-o-arquivo-pt

Última atualização em 17 de Agosto de 2022 às 9:36

banner-cafe-com-o-arquivo-pt

Partilhe esta página: arquivo.pt/cafe

Bem vindos à 3ª temporada do Café com o Arquivo.pt

O Arquivo.pt continua a oferecer à comunidade sessões online que endereçam tópicos relacionados com a preservação da informação publicada na web.

Ouça os convidados e converse directamente com a equipa do Arquivo.pt para saber como tirar maior partido do serviço e concorrer a mais uma edição anual do Prémio Arquivo.pt.

Sessões da 3ª temporada

Sessão especial Dia Mundial da Preservação Digital 2021 – 5 de novembro – Major Minors

No mês de novembro comemora-se o Dia Mundial da Preservação Digital e para assinalar esta iniciativa internacional, o Arquivo.pt realizou uma sessão online aberta à comunidade.

O trabalho dos convidados especiais desta sessão, Leandro Costa, Paulo Martins e José Carlos Ramalho (orientador), foi o 1º classificado do Prémio Arquivo.pt 2021.

22ª sessão – 20 de janeiro de 2022 – Politiquices

O Politiquices.pt permite pesquisar relações de apoio ou oposição entre personalidades e partidos políticos expressas em títulos de notícias. Esta aplicação utiliza informação preservada no Arquivo.pt para criar uma ontologia de relações, recorrendo a tecnologia de processamento de linguagem natural.

David Batista, 2º classificado do Prémio Arquivo.pt 2021, explica como desenvolveu o seu trabalho e demonstra as aplicações para os investigadores e cidadãos em geral.

21ª sessão – 17 de fevereiro de 2022 – Primeiras páginas de jornais online portugueses

Primeiras páginas de jornais online portugueses” apresenta uma análise gráfica interativa das primeiras páginas de jornais online portugueses. Para este estudo foram analisados itens específicos dentro do desenho de jornais, permitindo assim observar tendências ao longo do tempo.

Susana Parreira, explica como desenvolveu este trabalho no âmbito do seu mestrado, com a colaboração e orientação de Ana Boavida (Universidade de Coimbra) Ana Sabino (Instituto Politécnico de Castelo Branco e Penousal Machado.

Temporadas anteriores

Apresentação na IIPC Web Archiving Conference

Eleições Autárquicas 2021 preservadas pelo Arquivo.pt

thumbnail_eleicoes_autarquicas

Última atualização em 14 de Julho de 2022 às 17:10

Milhares páginas eleitorais a preservar antes que desapareçam

No dia 26 de setembro de 2021 realizaram-se as eleições autárquicas em Portugal, evento marcado pela pandemia da Covid-19. A comunicação dos candidatos foi baseada sobretudo nos meios de comunicação social e nas redes sociais.

A informação online que documenta processos eleitorais é de manifesta importância histórica. Contudo, é difícil de identificar porque aparecem e desaparecem rapidamente. No caso das eleições autárquicas, a quantidade de candidatos e a variedade de canais utilizados torna a tarefa ainda mais desafiante.

O Arquivo.pt, tal como em eleições anteriores, lançou uma recolha especial para preservar conteúdos relativos às Autárquicas 2021.

Como foram identificados os conteúdos eleitorais publicados na Web

Começou-se por fazer a identificação manual de conteúdos relacionados com eleições, por concelho e freguesia. Para isso pediu-se ajuda a pessoas e organizações com as seguintes iniciativas:

  • campanha de recolha de endereços Eleições Autárquicas de 2021: precisamos da sua ajuda!
  • pedido de colaboração aos serviços de arquivo dos 308 municípios na identificação de sites eleitorais e candidatos do respetivo concelho
  • pedido aos Partidos para enviarem os nomes dos candidatos cabeças de lista

Destaca-se a utilização do site Eyedata – Social Data Lab que disponibilizou na Web nomes de candidatos de todo o país.  A página da Wikipedia Eleições autárquicas portuguesas de 2021 também foi utilizada como fonte de informação.

A lista com nomes de candidatos por concelho, partido ou coligação serviram para criar pesquisas automáticas no Bing que identificaram os conteúdos eleitorais mais relevantes.

Por exemplo, ao combinar o termo “autárquicas 2021” com o nome de um candidato e do respetivo concelho, obtém-se resultados relacionados com esse candidato, tais como notícias, iniciativas da sua campanha ou a página oficial da sua campanha eleitoral.

Esta metodologia foi aplicada nas Eleições Presidenciais 2021 e nas Eleições Europeias de 2019. O relatório técnico A transnational crawl of the European Parliamentary Elections 2019 detalha a metodologia aplicada.

Recolha de conteúdos e disponibilização no Arquivo.pt

Entre 22 de agosto e 8 de outubro de 2021, o Arquivo.pt recolheu de forma exaustiva páginas relacionadas com as Autárquicas 2021.

A coleção resultante denominada Eleições Autárquicas 2021” (EAWP39) reúne 31 milhões de ficheiros que totalizam 2.7 TeraBytes de informação e estará disponível a partir de outubro de 2022, por respeito ao período de embargo de 1 ano.

Investigadores que queiram realizar estudos acerca das Autárquicas 2021 e necessitem de obter acesso mais cedo aos conteúdos recolhidos podem contactar o Arquivo.pt.

Para saber mais

Memória de festivais e eventos de arte: PARA SEMPRE

Thumbnail-projeto-para-sempre

Última atualização em 8 de Fevereiro de 2022 às 10:56

A Exposição Memória de festivais e eventos de arte propõe um percurso pela cena artística portuguesa presente na Web e inclui uma cronologia destes acontecimentos.

Este produto de informação online é uma apresentação dos resultados de forma sistemática e estruturada do projeto PARA SEMPRE.

cartao-expo-memoria-festivais-e-eventos-de-arte
Exposição online “memória de festivais e eventos de arte” (arteparasempre.wordpress.com)

O segundo produto online do projeto será um diretório de referências de artistas, galerias e projetos na área da arte contemporânea portuguesa a ser disponibilizado durante o ano de 2022, em gulbenkian.pt/biblioteca-arte.

Ciclo de Webinars intitulado Arte para sempre na web

Entre abril e julho de 2021, realizou-se o Ciclo de Webinars intitulado Arte para sempre na web, orientados a uma comunidade de artistas, curadores, galeristas e produtores de eventos, entre outros.

A média de participantes foi de 58 por sessão, os quais avaliaram a sua satisfação, numa escala de 1 a 5, com uma pontuação média de 4,6.

As três sessões tiveram por objetivo a difusão do conhecimento sobre a preservação digital de informação na web e requisitos para a publicação de informação preservável.

Identificação de artistas, galerias e projetos

Começou-se por identificar artistas, galerias e projectos relevantes no panorama artístico português contemporâneo. Partiu-se de um conjunto inicial de 63 agentes (artistas, galerias e projetos), aos quais foram adicionados 573 artistas pertencentes à Colecção Moderna da FCG e à Colecção de Livros de Artista e Edição Independente da BAA – FCG.

Ao longo destes meses foram assim identificados 636 elementos (redes sociais e sítios web ativos em 2020), que foram posteriormente analisados.

As conclusões da análise realizada no âmbito do projeto PARA SEMPRE foram apresentadas no webinar realizado a 1 de julho de 2021, intitulado Arquivar a Web: faça-você-mesmo! 

Para mais informações:

Recolha especial sobre websites e blogues de arte

Em Abril de 2021, 0 Arquivo.pt fez uma recolha especial com base na identificação inicial de artistas, galerias e projetos e obteve 2.8 terabytes de informação preservada.

Gravaram-se novos conteúdos sobre websites de arte, utilizando ferramentas que permitem recolhas com maior qualidade, tais como Brozzler e Webrecorder.

Um projeto colaborativo de curadoria digital

PARA SEMPRE é um projeto de curadoria digital aplicada à informação disponibilizada na web pelos diversos agentes da cena artística portuguesa contemporânea (artistas, galerias e locais híbridos).

Este tem como finalidade principal contribuir para a preservação/reutilização das páginas do passado e do futuro, assegurar a preservação da memória digital da arte portuguesa actual disponível no Arquivo.pt e promover o conhecimento sobre esta temática, apresentando-a de forma sistematizada e estruturada.

A sua criação resulta do encontro de missões de duas organizações: uma que pretende assegurar a preservação da web portuguesa, o Arquivo.pt, e outra que se assume como um agente no desenvolvimento do conhecimento e do saber sobre a arte portuguesa contemporânea, a Biblioteca de Arte da Fundação Calouste Gulbenkian. Este inscreve-se no âmbito da plataforma ROSSIO (Infraestrutura de Investigação na área das Ciências Sociais, Artes e Humanidades).

Webinários com a Câmara Municipal de Lisboa: vídeos disponíveis!

Thumbnail_passaporte-competencias-digitais-arquivopt

print_passaporte-competencias-digitais

Entre outubro e dezembro de 2021, realizou-se um ciclo de webinários organizado pelo Departamento de Desenvolvimento e Formação da Câmara Municipal de Lisboa, no âmbito do programa para a literacia digital Passaporte Competências Digitais da Câmara Municipal de Lisboa, em colaboração com o Centro Qualifica +ValorLx, a Infraestrutura ROSSIO e o Arquivo.pt  da Fundação para a Ciência e a Tecnologia I.P.

Os objetivos desta iniciativa foram apresentar os serviços do Arquivo.pt e disseminar a sua utilização para que o património histórico publicado na web possa ser preservado e explorado por qualquer cidadão.

As sessões foram abertas mediante inscrição e tiveram um total de 126 participantes (média de  31  por sessão).

As apresentações dos oradores foram gravadas e podem agora ser acedidas, juntamente com os slides de cada sessão.

Sessões realizadas

15/10 – O Arquivo.pt: O que é? Para que serve?

Daniel Gomes, gestor do Arquivo.pt, explica como qualquer cidadão pode utilizar este serviço para consultar páginas Web do passado nos mais diversos casos e fala da importância da preservação da memória digital.

11/11 – API Arquivo.pt : acesso automático a informação preservada da Web

Vasco Rato, web developer do Arquivo.pt, apresentou as APIs (Application Programming Interfaces) do Arquivo.pt. Estas possibilitam o desenvolvimento de aplicações inovadores e úteis às organizações através do processamento automático da informação histórica preservada da Web.

25/11 – Arquivar a Web: faça-você-mesmo!

Ricardo Basílio, curador digital do Arquivo.pt, apresentou um tutorial sobre a utilização das ferramentas do projeto Webrecorder.net para arquivar páginas da Web. Estas ferramentas permitem que qualquer pessoa ou organização possa criar o seu próprio arquivo da Web utilizando formatos normalizados adequados para a sua preservação.

9/12 – Publicar na Web: boas práticas Arquivo.pt

Pedro Gomes, engenheiro responsável pelas recolhas de websites no Arquivo.pt, abordou boas práticas de publicação de informação na Web para que esta possa vir a ser preservada. Várias situações foram ilustradas com casos práticos e respetivas recomendações acerca de como bem publicar para bem preservar.

Saber mais sobre as formações do Arquivo.pt

O Arquivo.pt está aberto a colaborações tendo em vista a formação de profissionais em organizações ou cidadãos individuais acerca de preservação da Web.

Conheça os módulos de formação e contacte-nos.

Arquivo.pt preservou informação online acerca de projectos europeus financiados pelo H2020

Thumbnail H2020 projectos

A principal missão do Arquivo.pt é preservar informação online para fins de investigação e educação.

Anteriormente, o Arquivo.pt identificou e preservou websites de projectos de investigação e desenvolvimento financiados pela União Europeia durante os programas FP4, FP5, FP6 e FP7 (1994-2013).

Agora, o Arquivo.pt contribuiu para a preservação da informação científica publicada online que documenta projetos de investigação e desenvolvimento financiados pela União Europeia durante o programa Horizonte 2020 (2014-2021). Foram preservados 197 milhões de ficheiros (17 TB) relacionados com ciência para acesso futuro.

Projectos H2020 publicam informação online valiosa que está a ser perdida

O recurso a websites para documentar as atividades de projetos de investigação e desenvolvimento tem vindo sempre a aumentar, sendo utilizados para disponibilizar informação científica relevante que completa a literatura publicada, como por exemplo conjuntos de dados abertos, apresentações em eventos ou software desenvolvido.

Contudo, após o fim dos projetos, os respetivos websites normalmente desaparecem causando uma perda irrecuperável de informação científica única e valiosa.

Arquivo.pt identificou automaticamente os endereços que documentam projetos de investigação e desenvolvimento H2020

O portal de dados abertos da União Europeia publicou um conjunto de dados do Community Research and Development Information Service (CORDIS) que documenta projetos de investigação financiados durante o programa H2020. Porém, dos 31 129 projetos listados, apenas 46% apresentavam o URL do projecto (coluna projectURL).

O Arquivo.pt desenvolveu uma metodologia de baixo custo que identifica automaticamente os URLs relacionados com projetos de investigação e desenvolvimento para serem preservados de forma sistemática. Esta identificação automática é alcançada através da combinação do recurso a conjuntos de dados abertos com serviços de pesquisa na web. Esta metodologia é detalhada no artigo científico publicado na conferência International Conference on Digital Preservation 2016.

Em suma, extraímos 270 650 URLs únicos dos seguintes conjuntos de dados abertos:

Em seguida, extraímos o acrónimo e o título dos projetos documentados nos conjuntos de dados e pesquisámos automaticamente na web usando a API do Bing para encontrar URLs adicionais.

Todos os conjuntos de dados e ferramentas desenvolvidas foram disponibilizados publicamente em acesso aberto para que possam ser reutilizados e complementados de forma colaborativa, incluindo o software desenvolvido para identificar automaticamente URLs adicionais sobre os projetos H2020.

197 milhões de ficheiros da web acerca de Ciência foram preservados

O Arquivo.pt identificou e preservou 197 milhões de ficheiros da web (17 TB) de informação que documentam projetos de investigação e desenvolvimento financiados pelo programa europeu Horizonte 2020.

Em 2021, podemos testemunhar que alguns sites dos projetos já não estão disponíveis online, como o website do projeto Extended Model of Organic Semiconductors (EXTMOS) (http://extmos.eu/). No entanto, a informação deste website foi preservada e pode ser acedida no Arquivo.pt:

Archived version at Arquivo.pt (https://arquivo.pt/wayback/20170427182603/http://extmos.eu/) of the home page of the EXTMOS Research and Development project (http://extmos.eu/)funded by H2020.

Versão arquivada no Arquivo.pt da página inicial do projeto EXTMOS de Investigação e Desenvolvimento financiado pelo H2020.

Contribuições para complementar os conjuntos de dados abertos da União Europeia

Todos os conjuntos de dados resultantes foram tornados públicos para que possam ser melhorados e reutilizados por outras organizações também interessadas na preservação deste património digital:

Se quiser saber mais informações sobre esta coleção, assista ao vídeo Preservation of web content related to Horizon 2020.

Referências

É investigador?

“Major Minors” no Dia Mundial da Preservação Digital 2021

Última atualização em 1 de Fevereiro de 2022 às 15:52

Os vencedores do Prémio Arquivo.pt 2021 foram os convidados da sessão online do Arquivo.pt no Dia Mundial da Preservação Digital, 4 de novembro de 2021.

Tal como em anos anteriores, o Arquivo.pt associou-se a esta iniciativa internacional realizando uma sessão aberta, onde se partilham conhecimentos úteis à comunidade.

Paulo Martins, Leandro Costa e Jose Carlos Ramalho, que orientou este trabalho, falaram do projeto “Major Minors” e da forma como utilizaram os conteúdos preservados pelo Arquivo.pt.

O projeto “Major Minors” é uma ontologia de recortes de imprensa de jornais portugueses com referência a minorias sociais.  Tem por objetivo mapear e estudar a representação de minorias em contexto jornalístico português ao longo das duas primeiras décadas do século XXI.

Divulgue e partilhe o conteúdos da sessão que aqui disponibilizamos.

Agenda

4 de novembro

15:00 h – Boas vindas e novidades, Daniel Gomes (slides PDF, 3MB)
15:10 h – Major Minors, Paulo Martins, Leandro Costa e José Carlos Ramalho (Slides PDF, 5MB)
15:40 h – Perguntas e respostas
16:00 h – Fim

Vídeo da sessão

Crie narrativas automáticas sobre qualquer tema!

thumnail-exemplo-conta-me-historias-q3

O Arquivo.pt disponibiliza uma nova função que permite criar automaticamente narrativas temporais sobre qualquer tema.

A funcionalidade “Narrativa”, integrada no Arquivo.pt em setembro de 2021, é o resultado da colaboração entre o “Conta-me Histórias”, vencedor do Prémio Arquivo.pt 2018 e o Arquivo.pt.

O projeto “Conta-me Histórias” foi desenvolvido por investigadores do Laboratório de Inteligência Artificial e Apoio a Decisão (LIAADINESCTEC) e afiliados às instituições Instituto Politécnico de TomarCentro de Investigação em Cidades Inteligentes (CI2); Universidade do Porto e Universidade de Innsbruck.

Como funciona?

Quando um utilizador insere um conjunto de palavras acerca de um tema na caixa de pesquisa do Arquivo.pt e clica no botão “Narrativa”, é direcionado para o serviço “Conta-me Histórias”, que por sua vez analisa automaticamente as notícias de 25 websites arquivados pelo Arquivo.pt ao longo do tempo e apresenta ao utilizador uma cronologia de notícias relacionadas com o tema pesquisado.

Por exemplo, se pesquisarmos por “Jorge Sampaio” e carregarmos no botão “Narrativa” (Figura 1), seremos direcionados para o “Conta-me Histórias”, onde obteremos automaticamente uma narrativa de notícias arquivadas (Figura 2).

exemplo-conta-me-historias-narrativa

Figura 1: Resultados da pesquisa de páginas sobre “Jorge Sampaio”.

exemplo-conta-me-historias-2

Figura 2: Narrativa de notícias sobre “Jorge Sampaio” gerada pelo serviço “Conta-me Histórias”.

Crie agora a sua narrativa!

O “Conta-me Histórias” pesquisa, analisa e agrega milhares de resultados para gerar cada narrativa acerca de um tema. Recomenda-se a escolha de palavras descritivas sobre temas bem definidos, personalidades ou eventos para obter boas narrativas.

A criação de uma narrativa é útil para investigadores, jornalistas ou cidadãos que pretendam obter rapidamente uma visão geral acerca da evolução de um tema ao longo do tempo, poupando-lhes assim imenso tempo e trabalho.

Aceda ao Arquivo.pt e experimente criar uma narrativa sobre um tema à sua escolha.

Diga-nos como foi a sua experiência para melhorarmos o serviço!