Continuam as sessões online Café com o Arquivo.pt

banner-cafe-com-o-arquivo-pt

Última atualização em 6 de Agosto de 2024 às 14:10

banner-cafe-com-o-arquivo-pt

Partilhe esta página: arquivo.pt/cafe

Bem vindos à 3ª temporada do Café com o Arquivo.pt

O Arquivo.pt continua a oferecer à comunidade sessões online que endereçam tópicos relacionados com a preservação da informação publicada na web.

Ouça os convidados e converse directamente com a equipa do Arquivo.pt para saber como tirar maior partido do serviço e concorrer a mais uma edição anual do Prémio Arquivo.pt.

Sessões da 3ª temporada

Sessão especial Dia Mundial da Preservação Digital 2021 – 5 de novembro – Major Minors

No mês de novembro comemora-se o Dia Mundial da Preservação Digital e para assinalar esta iniciativa internacional, o Arquivo.pt realizou uma sessão online aberta à comunidade.

O trabalho dos convidados especiais desta sessão, Leandro Costa, Paulo Martins e José Carlos Ramalho (orientador), foi o 1º classificado do Prémio Arquivo.pt 2021.

22ª sessão – 20 de janeiro de 2022 – Politiquices

O Politiquices.pt permite pesquisar relações de apoio ou oposição entre personalidades e partidos políticos expressas em títulos de notícias. Esta aplicação utiliza informação preservada no Arquivo.pt para criar uma ontologia de relações, recorrendo a tecnologia de processamento de linguagem natural.

David Batista, 2º classificado do Prémio Arquivo.pt 2021, explica como desenvolveu o seu trabalho e demonstra as aplicações para os investigadores e cidadãos em geral.

21ª sessão – 17 de fevereiro de 2022 – Primeiras páginas de jornais online portugueses

Primeiras páginas de jornais online portugueses” apresenta uma análise gráfica interativa das primeiras páginas de jornais online portugueses. Para este estudo foram analisados itens específicos dentro do desenho de jornais, permitindo assim observar tendências ao longo do tempo.

Susana Parreira, explica como desenvolveu este trabalho no âmbito do seu mestrado, com a colaboração e orientação de Ana Boavida (Universidade de Coimbra) Ana Sabino (Instituto Politécnico de Castelo Branco e Penousal Machado.

Temporadas anteriores

Apresentação na IIPC Web Archiving Conference

Eleições Autárquicas 2021 preservadas pelo Arquivo.pt

thumbnail_eleicoes_autarquicas

Última atualização em 8 de Maio de 2023 às 17:09

Milhares páginas eleitorais a preservar antes que desapareçam

No dia 26 de setembro de 2021 realizaram-se as eleições autárquicas em Portugal, evento marcado pela pandemia da Covid-19. A comunicação dos candidatos foi baseada sobretudo nos meios de comunicação social e nas redes sociais.

A informação online que documenta processos eleitorais é de manifesta importância histórica. Contudo, é difícil de identificar porque aparecem e desaparecem rapidamente. No caso das eleições autárquicas, a quantidade de candidatos e a variedade de canais utilizados torna a tarefa ainda mais desafiante.

O Arquivo.pt, tal como em eleições anteriores, lançou uma recolha especial para preservar conteúdos relativos às Autárquicas 2021.

Como foram identificados os conteúdos eleitorais publicados na Web

Começou-se por fazer a identificação manual de conteúdos relacionados com eleições, por concelho e freguesia. Para isso pediu-se ajuda a pessoas e organizações com as seguintes iniciativas:

  • campanha de recolha de endereços Eleições Autárquicas de 2021: precisamos da sua ajuda!
  • pedido de colaboração aos serviços de arquivo dos 308 municípios na identificação de sites eleitorais e candidatos do respetivo concelho
  • pedido aos Partidos para enviarem os nomes dos candidatos cabeças de lista

Destaca-se a utilização do site Eyedata – Social Data Lab que disponibilizou na Web nomes de candidatos de todo o país.  A página da Wikipedia Eleições autárquicas portuguesas de 2021 também foi utilizada como fonte de informação.

Este processo de identificação manual originou uma lista de 255 endereços que documentavam as candidaturas às Eleições Autárquicas de 2021. Note-se que 61% dos endereços identificados apontavam para plataformas privadas de redes sociais: 54% facebook.com, 5% instagram.com e 2% twitter.com).

Grande parte destes conteúdos de interesse nacional não puderam ser preservados porque estas empresas privadas estrangeiras não o permitem.

A lista com nomes de candidatos por concelho, partido ou coligação serviram para criar pesquisas automáticas no Bing que identificaram os conteúdos eleitorais mais relevantes.

Por exemplo, ao combinar o termo “autárquicas 2021” com o nome de um candidato e do respetivo concelho, obtém-se resultados relacionados com esse candidato, tais como notícias, iniciativas da sua campanha ou a página oficial da sua campanha eleitoral.

Esta metodologia foi aplicada nas Eleições Presidenciais 2021 e nas Eleições Europeias de 2019. O relatório técnico A transnational crawl of the European Parliamentary Elections 2019 detalha a metodologia aplicada.

Recolha de conteúdos e disponibilização no Arquivo.pt

Entre 22 de agosto e 8 de outubro de 2021, o Arquivo.pt recolheu de forma exaustiva páginas relacionadas com as Autárquicas 2021.

A coleção resultante denominada Eleições Autárquicas 2021” (EAWP39) reúne 31 milhões de ficheiros que totalizam 2.7 TeraBytes de informação e estará disponível a partir de outubro de 2022, por respeito ao período de embargo de 1 ano.

Investigadores que queiram realizar estudos acerca das Autárquicas 2021 e necessitem de obter acesso mais cedo aos conteúdos recolhidos podem contactar o Arquivo.pt.

Para saber mais

Memória de festivais e eventos de arte: PARA SEMPRE

Thumbnail-projeto-para-sempre

Última atualização em 6 de Agosto de 2024 às 13:52

A Exposição Memória de festivais e eventos de arte propõe um percurso pela cena artística portuguesa presente na Web e inclui uma cronologia destes acontecimentos.

Este produto de informação online é uma apresentação dos resultados de forma sistemática e estruturada do projeto PARA SEMPRE.

cartao-expo-memoria-festivais-e-eventos-de-arte
Exposição online “memória de festivais e eventos de arte” (arteparasempre.wordpress.com)

O segundo produto online do projeto será um diretório de referências de artistas, galerias e projetos na área da arte contemporânea portuguesa a ser disponibilizado durante o ano de 2022, em gulbenkian.pt/biblioteca-arte.

Ciclo de Webinars intitulado Arte para sempre na web

Entre abril e julho de 2021, realizou-se o Ciclo de Webinars intitulado Arte para sempre na web, orientados a uma comunidade de artistas, curadores, galeristas e produtores de eventos, entre outros.

A média de participantes foi de 58 por sessão, os quais avaliaram a sua satisfação, numa escala de 1 a 5, com uma pontuação média de 4,6.

As três sessões tiveram por objetivo a difusão do conhecimento sobre a preservação digital de informação na web e requisitos para a publicação de informação preservável.

Identificação de artistas, galerias e projetos

Começou-se por identificar artistas, galerias e projectos relevantes no panorama artístico português contemporâneo. Partiu-se de um conjunto inicial de 63 agentes (artistas, galerias e projetos), aos quais foram adicionados 573 artistas pertencentes à Colecção Moderna da FCG e à Colecção de Livros de Artista e Edição Independente da BAA – FCG.

Ao longo destes meses foram assim identificados 636 elementos (redes sociais e sítios web ativos em 2020), que foram posteriormente analisados.

As conclusões da análise realizada no âmbito do projeto PARA SEMPRE foram apresentadas no webinar realizado a 1 de julho de 2021, intitulado Arquivar a Web: faça-você-mesmo! 

Para mais informações:

Recolha especial sobre websites e blogues de arte

Em Abril de 2021, 0 Arquivo.pt fez uma recolha especial com base na identificação inicial de artistas, galerias e projetos e obteve 2.8 terabytes de informação preservada.

Gravaram-se novos conteúdos sobre websites de arte, utilizando ferramentas que permitem recolhas com maior qualidade, tais como Brozzler e Webrecorder.

Um projeto colaborativo de curadoria digital

PARA SEMPRE é um projeto de curadoria digital aplicada à informação disponibilizada na web pelos diversos agentes da cena artística portuguesa contemporânea (artistas, galerias e locais híbridos).

Este tem como finalidade principal contribuir para a preservação/reutilização das páginas do passado e do futuro, assegurar a preservação da memória digital da arte portuguesa actual disponível no Arquivo.pt e promover o conhecimento sobre esta temática, apresentando-a de forma sistematizada e estruturada.

A sua criação resulta do encontro de missões de duas organizações: uma que pretende assegurar a preservação da web portuguesa, o Arquivo.pt, e outra que se assume como um agente no desenvolvimento do conhecimento e do saber sobre a arte portuguesa contemporânea, a Biblioteca de Arte da Fundação Calouste Gulbenkian. Este inscreve-se no âmbito da plataforma ROSSIO (Infraestrutura de Investigação na área das Ciências Sociais, Artes e Humanidades).

Webinários com a Câmara Municipal de Lisboa: vídeos disponíveis!

Thumbnail_passaporte-competencias-digitais-arquivopt

print_passaporte-competencias-digitais

Entre outubro e dezembro de 2021, realizou-se um ciclo de webinários organizado pelo Departamento de Desenvolvimento e Formação da Câmara Municipal de Lisboa, no âmbito do programa para a literacia digital Passaporte Competências Digitais da Câmara Municipal de Lisboa, em colaboração com o Centro Qualifica +ValorLx, a Infraestrutura ROSSIO e o Arquivo.pt  da Fundação para a Ciência e a Tecnologia I.P.

Os objetivos desta iniciativa foram apresentar os serviços do Arquivo.pt e disseminar a sua utilização para que o património histórico publicado na web possa ser preservado e explorado por qualquer cidadão.

As sessões foram abertas mediante inscrição e tiveram um total de 126 participantes (média de  31  por sessão).

As apresentações dos oradores foram gravadas e podem agora ser acedidas, juntamente com os slides de cada sessão.

Sessões realizadas

15/10 – O Arquivo.pt: O que é? Para que serve?

Daniel Gomes, gestor do Arquivo.pt, explica como qualquer cidadão pode utilizar este serviço para consultar páginas Web do passado nos mais diversos casos e fala da importância da preservação da memória digital.

11/11 – API Arquivo.pt : acesso automático a informação preservada da Web

Vasco Rato, web developer do Arquivo.pt, apresentou as APIs (Application Programming Interfaces) do Arquivo.pt. Estas possibilitam o desenvolvimento de aplicações inovadores e úteis às organizações através do processamento automático da informação histórica preservada da Web.

25/11 – Arquivar a Web: faça-você-mesmo!

Ricardo Basílio, curador digital do Arquivo.pt, apresentou um tutorial sobre a utilização das ferramentas do projeto Webrecorder.net para arquivar páginas da Web. Estas ferramentas permitem que qualquer pessoa ou organização possa criar o seu próprio arquivo da Web utilizando formatos normalizados adequados para a sua preservação.

9/12 – Publicar na Web: boas práticas Arquivo.pt

Pedro Gomes, engenheiro responsável pelas recolhas de websites no Arquivo.pt, abordou boas práticas de publicação de informação na Web para que esta possa vir a ser preservada. Várias situações foram ilustradas com casos práticos e respetivas recomendações acerca de como bem publicar para bem preservar.

Saber mais sobre as formações do Arquivo.pt

O Arquivo.pt está aberto a colaborações tendo em vista a formação de profissionais em organizações ou cidadãos individuais acerca de preservação da Web.

Conheça os módulos de formação e contacte-nos.

“Major Minors” no Dia Mundial da Preservação Digital 2021

Última atualização em 2 de Agosto de 2024 às 12:37

Os vencedores do Prémio Arquivo.pt 2021 foram os convidados da sessão online do Arquivo.pt no Dia Mundial da Preservação Digital, 4 de novembro de 2021.

Tal como em anos anteriores, o Arquivo.pt associou-se a esta iniciativa internacional realizando uma sessão aberta, onde se partilham conhecimentos úteis à comunidade.

Paulo Martins, Leandro Costa e Jose Carlos Ramalho, que orientou este trabalho, falaram do projeto “Major Minors” e da forma como utilizaram os conteúdos preservados pelo Arquivo.pt.

O projeto “Major Minors” é uma ontologia de recortes de imprensa de jornais portugueses com referência a minorias sociais.  Tem por objetivo mapear e estudar a representação de minorias em contexto jornalístico português ao longo das duas primeiras décadas do século XXI.

Divulgue e partilhe o conteúdos da sessão que aqui disponibilizamos.

Agenda

4 de novembro

15:00 h – Boas vindas e novidades, Daniel Gomes (slides PDF, 3MB)
15:10 h – Major Minors, Paulo Martins, Leandro Costa e José Carlos Ramalho (Slides PDF, 5MB)
15:40 h – Perguntas e respostas
16:00 h – Fim

Vídeo da sessão

Crie narrativas automáticas sobre qualquer tema!

thumnail-exemplo-conta-me-historias-q3

O Arquivo.pt disponibiliza uma nova função que permite criar automaticamente narrativas temporais sobre qualquer tema.

A funcionalidade “Narrativa”, integrada no Arquivo.pt em setembro de 2021, é o resultado da colaboração entre o “Conta-me Histórias”, vencedor do Prémio Arquivo.pt 2018 e o Arquivo.pt.

O projeto “Conta-me Histórias” foi desenvolvido por investigadores do Laboratório de Inteligência Artificial e Apoio a Decisão (LIAADINESCTEC) e afiliados às instituições Instituto Politécnico de TomarCentro de Investigação em Cidades Inteligentes (CI2); Universidade do Porto e Universidade de Innsbruck.

Como funciona?

Quando um utilizador insere um conjunto de palavras acerca de um tema na caixa de pesquisa do Arquivo.pt e clica no botão “Narrativa”, é direcionado para o serviço “Conta-me Histórias”, que por sua vez analisa automaticamente as notícias de 25 websites arquivados pelo Arquivo.pt ao longo do tempo e apresenta ao utilizador uma cronologia de notícias relacionadas com o tema pesquisado.

Por exemplo, se pesquisarmos por “Jorge Sampaio” e carregarmos no botão “Narrativa” (Figura 1), seremos direcionados para o “Conta-me Histórias”, onde obteremos automaticamente uma narrativa de notícias arquivadas (Figura 2).

exemplo-conta-me-historias-narrativa

Figura 1: Resultados da pesquisa de páginas sobre “Jorge Sampaio”.

exemplo-conta-me-historias-2

Figura 2: Narrativa de notícias sobre “Jorge Sampaio” gerada pelo serviço “Conta-me Histórias”.

Crie agora a sua narrativa!

O “Conta-me Histórias” pesquisa, analisa e agrega milhares de resultados para gerar cada narrativa acerca de um tema. Recomenda-se a escolha de palavras descritivas sobre temas bem definidos, personalidades ou eventos para obter boas narrativas.

A criação de uma narrativa é útil para investigadores, jornalistas ou cidadãos que pretendam obter rapidamente uma visão geral acerca da evolução de um tema ao longo do tempo, poupando-lhes assim imenso tempo e trabalho.

Aceda ao Arquivo.pt e experimente criar uma narrativa sobre um tema à sua escolha.

Diga-nos como foi a sua experiência para melhorarmos o serviço!

Livro “The Past Web: Exploring Web Archives”: versão em acesso aberto

thumb-the-past-web

Última atualização em 23 de Setembro de 2024 às 15:12

Desde 2006 que não era publicado um livro que refletisse o estado-da-arte na área da preservação da web e da investigação que tem sido conduzida sobre os arquivos da web.

O principal objetivo do novo livro The Past Web: exploring web archives foi criar um novo recurso atualizado que permitisse formar mais pessoas na área de preservação da web e dar a conhecer os arquivos da web aos investigadores e académicos.

Assim sendo, o livro dirige-se principalmente à comunidade académica e científica, e apresenta os métodos mais inovadores para a exploração de informação do passado preservada pelos arquivos da web.

Daniel Gomes, gestor do Arquivo.pt liderou a equipa de editores do livro, composta também pelos especialistas Elena Demidova, Jane Winters e Thomas Risse. No total, o livro contou com as contribuições de 40 autores especialistas na área de arquivo da web, oriundos de todo o mundo.

A obra divide-se em 6 partes onde encontramos variados recursos para explorar páginas arquivadas da Internet desde a década de 1990.

Podemos também aprender como preservar a nossa memória coletiva na Era Digital, que estratégias utilizar na seleção de conteúdos online e qual o impacto dos arquivos web na preservação de informação histórica.

O livro pretende apoiar os professores na sua missão de transmitir conhecimento inovador e adequado para a literacia digital necessária para formar profissionais para o século XXI.

O gestor do Arquivo.pt alerta para a necessidade de incluir os arquivos da web nos planos letivos e destaca que este conhecimento traz uma grande vantagem competitiva principalmente para os estudantes de Ciências Sociais e Humanidades.

Um detalhe inovador deste livro é que todos os links citados foram preservados pelo Arquivo.pt por forma a assegurar que as referências se mantenham válidas ao longo do tempo.

O livro esteve disponível gratuitamente para ser descarregado a partir de instituições do ensino superior (entidades aderentes à b-On) até dia 6 de março de 2022.

Porém, pode descarregar uma versão não final do livro (pre-print).

Ligações

Apresentação do livro “The Past Web” no Museu de Leiria durante as Jornadas FCCN

Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro
Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro Apresentação do livro

Sites de 2019 disponíveis e o Arquivo.pt ultrapassa os 10 000 milhões de ficheiros

thumb_notre-dame-paris

Última atualização em 21 de Setembro de 2021 às 10:52

A informação recolhida da Web durante 2019 está acessível através do Arquivo.pt, depois do embargo de 1 ano que precede a disponibilização de conteúdos.

As imagens do incêndio na Catedral de Notre Dame, printscreen de página do Jornal I, 17-04-29, preservada pelo Arquivo.pt
As imagens do incêndio na Catedral de Notre Dame, printscreen de página do Jornal I, 17-04-29, preservada pelo Arquivo.pt

Relembre e investigue os acontecimentos históricos de 2019, tais com:

O Arquivo.pt recolheu 1700 milhões de ficheiros, a partir de 2 milhões de sites visitados, num total de 131 terabytes que agora estão disponíveis para que possa aceder a eventos passados.

Em 2021, o Arquivo.pt disponibiliza acesso aberto a mais de 10 000 milhões de ficheiros (721 terabytes) oriundos de 27 milhões de websites.

Arquivo.pt certificado como fornecedor de dados abertos

selo-dados-gov

Última atualização em 17 de Agosto de 2022 às 8:40

O Arquivo.pt tem colaborado com a Agência para a Modernização Administrativa (AMA) com o objetivo de melhorar a preservação dos websites da Administração Pública.

A colaboração assenta em 3 pontos de ação:

  • identificação e recolha de todos os websites da Administração Pública;
  • preservação dos dados publicados em websites da Administração Pública que já não são atualizados no Memorial do Arquivo.pt (ex. “Tenho uma criança”);
  • formação em preservação dos dados abertos publicados online.

A AMA é a organização pública responsável pela promoção dos meios digitais na Administração Pública e tem por objetivo modernizar e simplificar o acesso dos cidadãos aos serviços do Estado.

O Arquivo.pt é um serviço operado pela Fundação para a Ciência e a Tecnologia I.P. (unidade FCCN) que preserva dados publicados na Web entre 1996 e a atualidade, tornando-os acessíveis a qualquer cidadão para fins de memória e investigação.

Diretiva da União Europeia para dados abertos inclui documentos nos sítios na Internet

A Diretiva (UE) 2019/1024 do Parlamento Europeu e do Conselho, relativa aos dados abertos e à reutilização de informações do setor público de 20 de junho de 2019, estipula o seguinte:

“(30) A presente diretiva prevê a definição do termo «documento» e essa definição deverá designar também qualquer parte do documento. O termo «documento» deverá abranger qualquer representação de atos, factos ou informações – e qualquer compilação destes –, seja qual for o seu meio (papel, suporte eletrónico, registo sonoro, visual ou audiovisual).

(34) A fim de facilitar a reutilização, os organismos do setor público deverão, se possível e adequado, disponibilizar os documentos, incluindo os que são publicados em sítios na Internet, num formato aberto e compatível com a leitura por máquina, juntamente com os respetivos metadados, ao melhor nível de precisão e granularidade, num formato que garanta a interoperabilidade

(35) Deverá considerar-se que um documento se apresenta em formato legível por máquina se tiver um formato de ficheiro estruturado de modo a ser facilmente possível, por meio de aplicações de software, identificar, reconhecer e extrair dados específicos. Os dados codificados em ficheiros estruturados num formato legível por máquina deverão ser considerados dados legíveis por máquina. Os formatos legíveis por máquina podem ser abertos ou sujeitos a direitos de propriedade; podem ser normas formais ou não.

(60) A Comissão deverá facilitar a cooperação entre Estados-Membros e apoiar a conceção, o ensaio, a aplicação e a implantação de interfaces eletrónicas interoperáveis que permitam dispor de serviços públicos mais eficazes e seguros.

O serviço público Arquivo.pt tem a missão de preservar os documentos publicados nos sítios da Internet para viabilizar o seu acesso aberto a longo prazo e disponibiliza interfaces eletrónicas interoperáveis (APIs) para o seu processamento automático.

A Lei portuguesa n.º 68/2021 de 2021-08-26 aprova os princípios gerais em matéria de dados abertos e transpõe a Diretiva europeia.

Arquivo.pt certificado como fornecedor de dados abertos da Administração Pública

A AMA reconheceu o Arquivo.pt como serviço público e fornecedor de dados abertos e atribuiu o seu selo de certificação no Portal de Dados Abertos.

O Arquivo.pt faz a recolha genérica de informação publicada na Web de interesse para a comunidade portuguesa. Porém, tem a seu cargo a preservação de websites da Administração Pública como o Portal do Governo em colaboração com o Centro de Gestão da Rede Informática do Governo (CEGER).

Qualquer cidadão pode aceder aos dados abertos resultantes destes arquivos históricos, podendo por exemplo, pesquisar informação oficial publicada em websites dos sucessivos Governos.

Em 2021, o Arquivo.pt disponibilizava acesso aberto a mais de 10 000 milhões de ficheiros (721 TB) oriundos de 27 milhões de websites. Os dados abertos preservados pelo Arquivo.pt podem ser explorados através da interface de pesquisa, automaticamente através de API (https://arquivo.pt/api) ou reutilizando os conjuntos de dados derivados.

Conjuntos de dados derivados disponíveis no Portal de Dados Abertos

Além dos artefactos web originais preservados no Arquivo.pt, este serviço tem gerado conjuntos de dados abertos derivados das suas atividades, que estão agora disponíveis em acesso aberto para que possam ser reutilizados:

Lista de recursos

Apresentação no IIPC Web Archiving Conference 2022

Arquivo.pt nos eventos internacionais de 2021

Thumbnail IIPC WAC 2021

Última atualização em 17 de Novembro de 2022 às 17:38

Em junho de 2021, ocorreram 3 eventos internacionais relacionados com arquivos da web que contaram com os contributos do Arquivo.pt:

Contributos do Arquivo.pt para a comunidade internacional

O Arquivo.pt apresentou resultados do trabalho desenvolvido durante o último ano, com destaque para as funcionalidades que melhoraram a reprodução dos conteúdos arquivados, como é o caso da função “Completar a página”.

Foram apresentadas as novas coleções históricas do Geocities e do Internet Memory Foundation, que foram integradas no Arquivo.pt e as recolhas especiais sobre as Eleições Europeias de 2019 e Covid-19.

O Arquivo.pt é uma infraestrutura de investigação de âmbito internacional porque os seus serviços e conteúdos históricos preservados estão acessíveis a qualquer investigador do mundo.

Apresentações realizadas

  • “Arquivo.pt updates 2021”: presentation at the IIPC – General Assembly, Daniel Gomes (Vídeo)
  • “Complete the page!”. 1 minute drop in (demonstração da funcionalidade “completar a página”), Daniel Gomes (Slide, Video)
  • “A transnational and cross-lingual crawl of the European Parliamentary Elections 2019, Ivo Branco (Slides, Vídeo)
  • “Enhancing access to research the Geocities historical collection”, Pedro Gomes (Slides, Vídeo)

 

Complete the page - demo
Complete the page – demo. Slide used in the IIPC 1 minute presentation, at the IIPC General Assembly 2021