Acesso em bloco a conteúdos arquivados

Um grupo de investigadores olham para um bastidor de servidores

A comunidade académica e de investigação tem solicitado a possibilidade de descarregar automaticamente seleções de conteúdos arquivados e ficheiros de índice (CDXJ), por exemplo, para alimentar modelos de aprendizagem automática de Inteligência Artificial ou recuperar informação de sítios web selecionados (ex. notícias ou websites que foram atacados).

O Arquivo.pt passou a disponibilizar publicamente os seus ficheiros de índice CDXJ em tempo real, para facilitar o acesso automático a grandes volumes de conteúdos arquivados da web. Saiba como em:

A sua opinião é muito importante para nós, contacte-nos enviando comentários ou sugestões de melhoria!

Agradecemos também que divulgue esta informação por potenciais interessados.

Formação gratuita em media digital – ciclo de webinars AMCC

thumbnail-ciclo-webinars-amcc

Última atualização em 2 de Junho de 2023 às 5:35

O Aveiro Media Competence Center (AMCC) é uma plataforma de apoio e promoção ao setor dos News Media Locais da União Europeia (UE) na implementação de projetos de transição digital. Do consórcio fazem parte o PCI Creative Science Park da Região de Aveiro, a Associação Portuguesa de Imprensa  e a Universidade de Aveiro.

O Arquivo.pt é um serviço público e gratuito que permite pesquisar e aceder a páginas da Web preservadas desde a década de 1990, como por exemplo, ver uma notícia antiga ou aceder a uma versão antiga de um website.

A colaboração entre o AMCC e o Arquivo.pt concretiza-se num programa de formação intitulado Arquivo.pt: Competências Digitais para os Media, desenvolvido em quatro webinars, e na atribuição da Menção Honrosa AMCC a trabalhos realizados sobre jornais centenários portugueses para o Prémio Arquivo.pt 2023.

Ciclo de webinars “Arquivo.pt: Competências Digitais para os Media”

O ciclo de webinars visa dotar os formandos de competências digitais que lhes permitam resolver problemas originados pelo desaparecimento de informação digital e ganhar vantagem competitiva na produção de conteúdos únicos e exclusivos.

  • Webinar 1: Arquivo.pt: uma ferramenta para pesquisar rapidamente o passado
    • Data: 24 de março de 2023 Hora: 14h00-15h30 (PT), Língua: Portuguesa
  • Webinar 2: Bem publicar para bem preservar 
    • Data: 06 de abril de 2023, Hora: 14h00-15h30 (PT), Língua: Portuguesa
  • Webinar 3: Acesso e processamento automático de informação preservada da Web através de APIs
    • Data: 04 de maio de 2023, Hora: 14h00-15h30 (PT), Língua: Portuguesa
  • Webinar 4: Arquivar a Web: faça-você-mesmo!
    • Data: 01 de junho de 2023, Hora: 14h00-15h30 (PT), Língua: Portuguesa

Milhões de imagens sobre o passado!

thumbnail_pesquisa_imagens

Última atualização em 23 de Agosto de 2022 às 16:19

O Arquivo.pt lançou uma nova versão denominada Dionisius, no dia 24 de março de 2021.

1 800 milhões de imagens do passado da Web passaram a estar pesquisáveis no Arquivo.pt!

A pesquisa sobre este volume de imagens arquivadas da Web é uma inovação à escala mundial.

Para assistir a uma apresentação acerca da criação deste sistema inovador, veja a gravação da 21ª sessão do Café com o Arquivo.pt intitulada “Milhões de imagens sobre o passado – como foram indexadas no Arquivo.pt”.

Veja por exemplo, como uma pesquisa de imagens sobre a “Seleção Nacional” apresenta imagens oriundas dos websites arquivados.

print_image_search

Página de resultados de uma pesquisa acerca da “Seleção Nacional” no Arquivo.pt.

A nova API de pesquisa de imagens permite também criar novos trabalhos para se candidatar aos Prémios Arquivo.pt.

Ajude-nos a melhorar!

Se detectar algum problema, por favor contacte-nos!

Lembre-se de enviar sempre o endereço da página onde detectou o problema.

Para saber mais

Evento Arquivo.pt no dia 8 de novembro: Inscreva-se!

Última atualização em 20 de Dezembro de 2019 às 12:38

No dia 8 de novembro vamos realizar o 1º Evento do Arquivo.pt no Pavilhão do Conhecimento em Lisboa e gostaríamos de convidá-lo a celebrar connosco os 10 anos do início do projecto!

Palestras: porquê e como preservar a Web?

Antes do almoço fique a conhecer em primeira mão o Concurso ao Prémio Arquivo.pt 2018, que terá como objectivo fomentar trabalhos de investigação inovadores utilizando recursos preservados da Web.

Durante o almoço, que temos o prazer de oferecer, pode aproveitar para conversar com os palestrantes e a equipa do Arquivo.pt.

Workshops: casos de investigação e formação

Investiga utilizando o Arquivo.pt

Conheça os trabalhos de investigação em várias áreas já realizados utilizando o Arquivo.pt.

Preservação e acesso à memória da Web

Aprenda a tirar o máximo proveito dos serviços do Arquivo.pt e a publicar a sua informação por forma a que possa prevalecer para o futuro.

Inscreva-se já!

A inscrição é gratuita mas o número de lugares é limitado.

O mundo online é maravilhoso mas também gostaríamos muito de vos ver ao vivo.
Venha celebrar connosco!