Arquivo404 mais poderoso!

Última atualização em 9 de Agosto de 2024 às 12:58

O Arquivo.pt tem lançado serviços complementares inovadores úteis para as organizações optimizarem o seu funcionamento.

A nova versão do Arquivo.pt denominada Helios foi lançada no dia 13 de novembro de 2023 e inclui desenvolvimentos no Arquivo404 e CitationSaver.

Arquivo404 com novos métodos para definir intervalos temporais

O Arquivo404 é um serviço que apresenta aos utilizadores de um website, ligações para versões arquivadas, em vez de lacónicas mensagens de erro “Página não encontrada”.

Porém, por vezes é necessário especificar qual é a versão correcta de uma página arquivada que deve ser apresentada. Por exemplo, o domínio de um website pode ter pertencido a outra entidade no passado e pretende-se que sejam mostradas apenas as versões arquivadas desde que o website passou a pertencer aos seus donos actuais.

Para este efeito, foram lançados 3 novos métodos para configurar o Arquivo404:

  • setMinimumDate(minDate : Date) – especifica a data mais antiga da versão arquivada do URL que pode ser apresentada.
  • setMaximumDate(maxDate : Date) – especifica a data mais recente da versão arquivada do URL que pode ser apresentada.
  • setMostRelevantMemento(criterion : ‘oldest’ | ‘most-recent’) – especifica a ordem dos resultados das versões arquivadas que foram recuperadas do arquivo da web. Por omissão, é apresentada a mais antiga  (‘oldest’).

Em suma, o Arquivo404 passou a permitir definir se apresenta ao utilizador a página arquivada mais antiga ou a mais recente, dentro de um determinado intervalo de tempo.

CitationSaver processa documentos HTML

O CitationSaver é um serviço que extrai citações em documentos para recursos online e arquiva-os. Este serviço é particularmente útil para manter a integridade dos artigos científicos e a reproducibilidade das experiências e estudos neles descritos.

Muitos artigos em acesso-aberto são publicados em formato de hipertexto (HMTL). O CitationSaver passou a processar documentos em formato HTML, além dos formatos PDF e TXT.

Por exemplo, se um utilizador encontrar um artigo na Web que contenha citações para recursos online, apenas terá de inserir o endereço da página do artigo no CitationSaver. Os endereços (URLs) serão extraídos e arquivados para que não se percam.

Exemplo de artigo da Revista de Gestão Costeira Integrada, disponiblizado no SciELO

Saber mais

Use os serviços do Arquivo.pt e se detetar algum problema, por favor contacte-nos.

Grave páginas no Arquivo.pt com o SavePageNow

Thumb save page now

Última atualização em 17 de Agosto de 2023 às 15:50

O Arquivo.pt lançou uma nova versão, denominada Francisco, no dia 19 de janeiro de 2022.

Nesta versão, destaca-se o novo serviço SavePageNow que permite a qualquer pessoa gravar uma página Web para ser preservada pelo Arquivo.pt. Basta colocar o endereço de uma página e navegar pelos conteúdos.

O SavePageNow do Arquivo.pt foi inspirado no Internet Archive Save Page Now e implementado utilizando o webrecorder pywb.

Por exemplo, uma publicação no blog da FCCN que assinalou os 30 anos da Internet em Portugal, foi gravada com o SavePageNow e ficou preservada no Arquivo.pt.

Ao utilizar o SavePageNow está a contribuir para que informações importantes publicadas na Internet não se percam.

Ajude-nos a melhorar: avise-nos de problemas!

As interfaces de utilização foram recodificadas nesta nova versão e necessitamos da sua ajuda para testá-las em diferentes dispositivos (ex. telemóveis, tablets, portáteis).

Por isso, se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais

 

Milhões de imagens sobre o passado!

thumbnail_pesquisa_imagens

Última atualização em 23 de Agosto de 2022 às 16:19

O Arquivo.pt lançou uma nova versão denominada Dionisius, no dia 24 de março de 2021.

1 800 milhões de imagens do passado da Web passaram a estar pesquisáveis no Arquivo.pt!

A pesquisa sobre este volume de imagens arquivadas da Web é uma inovação à escala mundial.

Para assistir a uma apresentação acerca da criação deste sistema inovador, veja a gravação da 21ª sessão do Café com o Arquivo.pt intitulada “Milhões de imagens sobre o passado – como foram indexadas no Arquivo.pt”.

Veja por exemplo, como uma pesquisa de imagens sobre a “Seleção Nacional” apresenta imagens oriundas dos websites arquivados.

print_image_search

Página de resultados de uma pesquisa acerca da “Seleção Nacional” no Arquivo.pt.

A nova API de pesquisa de imagens permite também criar novos trabalhos para se candidatar aos Prémios Arquivo.pt.

Ajude-nos a melhorar!

Se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais

“Será que quis dizer” – nova versão do Arquivo.pt

Thumnail query_suggest_print

Última atualização em 24 de Março de 2021 às 13:32

O Arquivo.pt lançou uma nova versão, denominada Caronte, no dia 19 de janeiro de 2021.

Nesta versão destaca-se a nova sugestão de pesquisas (Será que quis dizer:).

Sempre que um utilizador introduz uma expressão de pesquisa contendo um potencial erro, o Arquivo.pt apresenta uma sugestão de pesquisa alternativa.

Por exemplo, ao pesquisar “lixboa” recebe a sugestão “Será que quis dizer: lisboa”.

query_suggest_print

Figura 1: Exemplo de funcionamento da sugestão de pesquisas ao utilizar, por exemplo, o termo “lixboa”

A abertura de candidaturas ao Prémio Arquivo.pt 2021 até 4 de maio também passou a estar em destaque no Arquivo.pt!

Ajude-nos a melhorar!

Se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais

Ver a lista dos 16 problemas resolvidos

Melhorámos a interface do Arquivo.pt

Thumbnail feature basileus version

Última atualização em 16 de Novembro de 2020 às 16:05

O Arquivo.pt lançou uma nova versão, denominada Basileus, no dia 11 de novembro de 2020.

O objetivo desta versão foi melhorar a experiência do utilizador ao navegar pelas diversas interfaces do Arquivo.pt.

Foram feitos ajustes ao nível do Web design dos quais resultaram uma maior coerência na estrutura do código, nos aspetos gráficos e nas interações, como por exemplo cores, tipo de letra e botões.

Print 2 Arquivo.pt versão Basileus

Figura 1: Interface de pesquisa e reprodução de páginas Web. Na imagem, a reprodução de uma página da coleção histórica Geocities.

Ajude-nos a melhorar!

Se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais

Use browsers do passado e exporte resultados com a nova versão do Arquivo.pt

Exportação de resultados do Arquivo.pt em Excel

O Arquivo.pt lançou uma nova versão do seu serviço no dia 1 de julho de 2020 denominada Responsive.

O objetivo desta versão foi melhorar a experiência de utilização entre diferentes dispositivos e adicionar novas funcionalidades.

Experimente “Ver com browser antigo”!

Adicionámos uma opção para ver a página preservada utilizando também um browser do passado. Nas Opções escolha Ver com browser antigo e será redirecionado para o serviço oldweb.today que emula browsers do passado como por exemplo o Netscape Navigator, Microsoft Internet Explorer ou o NSCA Mosaic.

Este serviço é útil para investigação, em áreas como o Web design, Arte, Comunicação ou História, em que é necessário aceder da forma o mais fidedigna possível ao aspeto visual original de uma página do passado.

Página da Expo 98 vista no Internet Explorer através do serviço Oldweb.Today (printscreen)
Página da Expo 98 vista no Internet Explorer 4.0 através do serviço Oldweb.Today (printscreen)

Faça a sua experiência para ver a página da Expo’98  com um browser antigo ou outra página antiga à sua escolha. Poderá ter de aguardar um pouco para o processamento do seu pedido mas sempre é mais rápido do que conseguir instalar um browser do passado no seu computador.

Exportar resultados de uma pesquisa

Esta nova função permite guardar os resultados da sua pesquisa para posterior tratamento e análise. Isto é especialmente útil para realizar investigações exaustivas acerca de um determinado tópico.

Após uma pesquisa, nas Opções basta escolher um dos formato disponíveis para exportação dos resultados obtidos: XLSX, CSV ou TXT.

 

Exportação de resultados do Arquivo.pt em Excel
Exportação de resultados do Arquivo.pt em Excel de uma pesquisa simples ao termo “universidade” com limite de 10 resultados

Mais novidades da versão Responsive

Nova versão do Arquivo.pt (Webapp Release)

Webapp release view on mobile

Última atualização em 12 de Outubro de 2020 às 11:37

O Arquivo.pt lançou uma nova versão do seu serviço no dia 15 de abril de 2020 denominada WebApp.

O objetivo desta versão foi uniformizar a experiência de utilização entre diferentes dispositivos e reduzir custos de manutenção através da remoção de componentes com funções redundantes.

Esta nova versão tem como principal novidade a junção das interfaces desktop e móvel numa única interface de utilização.

A antiga versão desktop foi desactivada e a versão móvel evoluiu para funcionar em vários tipos de dispositivo e tamanhos de ecrã.

Webapp release desktop e mobile

Novo design da página de entrada

Experimente a pesquisa de páginas e imagens

Webapp release pesquisa Camões

Novas interfaces de pesquisa de páginas e imagens

Ajude-nos a melhorar!

Para nos ajudar, basta pesquisar no Arquivo.pt utilizando qualquer dispositivo (ex. laptop, telemóvel, tablet).

Se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Mais novidades da versão WebApp

 

Nova versão do Arquivo.pt (WARC release)

Logótipo do Arquivo.pt - quadrado 288px

O Arquivo.pt lançou uma nova versão do seu serviço no dia 16 de Outubro denominada WARC Release.

Esta nova versão tem como principal novidade o suporte de indexação textual de conteúdos da web armazenados no formato WARC.

Foi também atualizada a biblioteca de parsing de documentos para utilizar o Apache-Tika.

Detalhes técnicos

O Arquivo.pt tem uma nova funcionalidade na reprodução de páginas preservadas que permite aceder aos Detalhes Técnicos acerca de uma página arquivada.

Ferramentas replay arquivo.pt

Para tal basta clicar no ícone circular com um “i”. Irão ser apresentados metadados acerca da página tais como o título, o tipo ou a codificação de caracteres. Experimente!

Detalhes técnicos Arquivo.pt

Reportar problema

O Arquivo.pt adicionou a função de Reportar Problema às suas interfaces para facilitar a identificação de problemas com a ajuda dos utilizadores.

Para tal, basta carregar no ícone da barata, que o irá reencaminhar para um formulário de contacto já preenchido com a ligação para a página onde ocorreu o erro.

Nova funcionalidade reportar problema
Função Reportar Problema disponível através do “ícone da barata”.

Caso encontre algum erro, no Arquivo.pt por favor contacte-nos.

Mais novidades

  • O Arquivo.pt é agora servido através de ligação segura, seguindo o protocolo HTTPS (https://arquivo.pt).
  • Novo logótipo do Arquivo.pt.
  • Passou a ser possível inserir vários sites na pesquisa avançada.
  • Corrigidas vulnerabilidades de segurança, de Cross Site Scripting.
  • Corrigidos problemas na indexação para a reprodução de páginas preservadas (índices CDXJ inválidos).
  • Corrigidos problemas nos logs aplicacionais nos servidores do Arquivo.pt.