Arquivo.pt recebe prémio de Melhor Projeto Digital da Administração Pública Central

thumbnail-acepi-arquivopt-awarded2

Última atualização em 28 de Outubro de 2024 às 16:23

premio-acepi-2024-atribuido-a-arquivo-pt

O Arquivo.pt, serviço digital da Fundação para a Ciência e a Tecnologia (FCT)-Unidade FCCN foi um dos vencedores dos Prémios Navegantes XXI, edição de 2024.

O Arquivo.pt arrecadou o galardão na categoria de “Melhor Projeto Digital da Administração Pública Central”.

Esta categoria reconhece, anualmente, um projeto que tenha contribuído “de forma inequívoca para o desenvolvimento do setor Público Central através do meio digital, assim como da Economia Digital em Portugal”.

O gestor do Arquivo.pt Daniel Gomes, a Coordenadora Geral Adjunta da FCCN Salomé Branco e o vice-presidente da FCT Francisco Santos estiveram presentes na cerimónia que se realizou no dia 24 de outubro no Técnico Innovation Center em Lisboa e receberam o galardão.

Arquivo.pt receives Award for Best Governmental service

WhatsApp Arquivo.pt vence Prémio Navegantes XXI2024-10-25 at 14.30.42
Arquivo.pt vence Prémio Navegantes XXI
Arquivo.pt receives Award for Best Governmental service
WhatsApp Arquivo.pt vence Prémio Navegantes XXI2024-10-25 at 14.30.42 Arquivo.pt vence Prémio Navegantes XXI Arquivo.pt receives Award for Best Governmental service

Prémios Navegantes XXI

Os Prémios Navegantes XXI são uma iniciativa anual da ACEPI – Associação da Economia Digital, criada com a missão “Promover e Desenvolver a Economia Digital em Portugal”.

O concurso premia o melhor da Economia e Sociedade Digital em Portugal nas suas mais diversas vertentes. Atualmente, é composto por 20 categorias que premeiam os projetos, ideias e instituições portuguesas mais inovadoras na transformação digital. São ainda entregues 3 Prémios para Categorias Especiais extra-concurso.

Conheça todos os vencedores.

Grave sites antes que desapareçam com a ferramenta Browsertrix Crawler

Última atualização em 19 de Setembro de 2024 às 14:08

O mês de setembro marca o início de um ano de trabalho e também o fim de muitos sites que se perdem sem remédio. Remodelados ou desligados sem se ter feito uma boa cópia dos seus conteúdos, é assim que se perdem muitos sites sem necessidade.

Há ferramentas que permitem a gravação imediata dos sites pelas próprias organizações que os gerem. Além disso, há o serviço arquivo a-pedido em alta qualidade que o Arquivo.pt presta a entidades parceiras ou no contexto de colaborações pontuais.

Neste artigo pretende-se destacar o Browsertrix Crawler que é utilizado pelo Arquivo.pt, sem excluir outras ferramentas, e que pode ser útil aos gestores de informação e departamentos de informática.

Uso do Browsertrix-crawler pelo Arquivo.pt para recolhas de alta qualidade

O Browsertrix Crawler é uma ferramenta que permite gravar websites inteiros e listas de páginas web de forma automática e num formato compatível com os arquivos da Web.

O Arquivo.pt utiliza o Browsertrix Crawler para fazer recolhas de alta qualidade de sites (RAQs), a pedido da comunidade. Por exemplo, quando um site está para ser desligado, quando vai sofrer uma remodelação ou, periodicamente, para manter um bom histórico de sites importantes.

Um caso ilustrativo é o site da Câmara Municipal de Almada, gravado em abril de 2021, a pedido do Arquivo Municipal. Outro caso é o site do jornal  Notícias de Leiria que foi gravado antes do seu encerramento, em dezembro de 2023.

Os pedidos de recolha de alta qualidade (RAQs) ao Arquivo.pt são cada vez vez mais frequentes: 77 pedidos, de janeiro a setembro de 2024. É sinal  de que há uma maior preocupação com a preservação dos conteúdos Web.

O que é preciso para usar locamente o Browsertrix-crawler

O grupo que o desenvolveu o Browsertrix Crawler, o Webrecorder.net  liderado por Ilya Kreymer, tem como mote “web archiving for all”.  As suas ferramentas permitem a gravação da Internet de forma descentralizada e em pequena escala.

O Browsertrix Crawler está disponível e pode ser instalado no próprio computador para pequenas recolhas.

A versão linha de comandos aqui recomendada é a mesma que o Arquivo.pt está a utilizar.

Pela experiência da equipa do Arquivo.pt, pode dizer-se que usar o Browsertrix Crawler é fácil em equipas multidisciplinares, onde há sempre alguém com conhecimentos mínimos para usar comandos Linux e dar algum apoio pontual.

Demonstração de gravação de sites inteiros no próprio computador

Neste vídeo apresenta-se um caso de utilização do Browsertrix Crawler num simples computador de secretária. É útil para quem quer aprofundar conhecimentos e práticas de gravação de sites em ambiente local e destina-se a não especialistas.

Outras ferramenta utilizadas pelo Arquivo.pt para gravar conteúdos

Brozzler: ferramenta para uma melhorar o histórico dos sites de recolha diária e mensal

O Brozzler é uma ferramenta semelhante ao Browsertrix Crawler, pois também baseia a sua gravação num browser. É utilizado e mantido pelo Internet Archive.

O Arquivo.pt utiliza o Brozzler, pelo menos desde 2018, para gravar páginas web com conteúdos interativos presentes nas páginas web e para recolhas de alta qualidade (RAQs).

Listas até 200 sites são gravadas com sucesso pelo Brozzler. Por exemplo, os 125 sites de recolha diária (FAWPs) são gravados com o Brozzler no início de cada mês. Ao longo do mês, outros 75 sites de recolha mensal (MAWPs) são gravados usando o Brozzler.

No final de 2023, o Arquivo.pt comparou o Brozzler e o Browsertrix Crawler e optou por manter estas duas ferramentas.

Heritrix, pywb e ArchiveWeb.page: ferramentas para milhares de sites ou para uma página

O Heritrix crawler é a principal ferramenta de gravação do Arquivo.pt. É utilizado em enormes listas de websites, como por exemplo os sites do domínio .PT a que se juntam outros sites portugueses, ultrapassando meio milhão de endereços.

No lado oposto, está a extensão ArchiveWeb.page que o Arquivo.pt utiliza para pequenas gravações página a página e também para a formação Arquivar a Web: faça-você-mesmo!.

Para completar a lista de ferramentas de gravação utilizadas pelo Arquivo.pt, deve referir-se o pywb que entra em ação, por exemplo, quando um utilizador do Arquivo.pt usa a funcionalidade “Completar a página” ou o serviço de gravação na hora SavePageNow.

Eleições de 2024 em Portugal tiveram recolhas especiais no Arquivo.pt

Eleicões Europeias

Última atualização em 9 de Outubro de 2024 às 17:33

O Arquivo.pt fez recolhas especiais sobre as três eleições que se realizaram este ano: as Legislativas de 10 de março, as eleições na Madeira de 26 de maio e as Europeias de 9 de junho.

Foram identificadas mais de 70 mil páginas com conteúdos relacionados com as eleições e a vida política em Portugal e na Europa e recolhidos cerca de 4 Terabytes de informação.

Agradece-se às pessoas que contribuiram com a seleção de endereços. Desafia-se os professores e estudantes a fazerem trabalhos que utilizem as coleções especiais sobre as eleições que o Arquivo.pt tem feito ao longo dos anos.

Saiba mais detalhes sobre o procedimento da recolha e sobre os resultados obtidos.

Eleições Legislativas 2024

As Eleições Legislativas tiveram lugar no dia 10 de março de 2024 para eleger os membros da Assembleia da República para a 16.ª Legislatura da Terceira República Portuguesa.

Destacamos nesta recolha o contributo da comunidade com uma seleção manual de 827 páginas, o que contribuiu para melhorar a qualidade da coleção.

Utilizou-se cerca de 500 termos compostos ou palavras-chave para procurar conteúdos publicados na Web acerca das eleições. O serviço utilizado para pesquisa automática foi o Bing Search API. Os resultados foram limitados ao top 20.

Por exemplo, o termo composto “frente-a-frente legislativas 2024″ encontrou páginas relativas aos debates entre candidatos. O termo “habitação legislativas 2024″ obteve páginas relativas às propostas partidárias para a habitação. O termo “legislativas 2024 site:expresso.pt” identificou páginas do Expresso sobre as eleições. Foram utilizados também os nomes dos candidatos.

Após as eleições foram usados termos de pesquisa próprios para esse período, tais como “vitória legislativas 2024”, “derrota legislativas 2024” ou “resultados legislativas 2024”, entre outros.

A pesquisa automática no Bing Search API resultou em 34.120 endereços obtidos antes das eleições e em 5.803 após as eleições.

Os sites dos partidos políticos, incluindo os partidos sem assento parlamentar, também foram recolhidos durante o período eleitoral.

Nem todos os conteúdos identificados puderam ser efetivamente gravados, devido às limitações das ferramentas de gravação e às restrições dos próprios sites.

Para a gravação foram utilizadas as ferramentas Heritrix, Brozzler e Browsertrix-cloud (versão beta) cortesia do Webrecorder.net.

A gravação realizou-se entre 6 e 20 de março e resultou em 3.2 Terabytes de informação. Os conteúdos foram incluídos na coleção espeacial EAWP45 e estarão disponíveis passado 1 ano.

Para saber mais, consulte o conjunto de dados:

Eleições para a Assembleia Legislativa da Madeira 2024

As Eleições para a Assembleia Legislativa da Madeira realizaram-se a 26 de maio. O Arquivo.pt fez uma recolha especial de conteúdos publicados na Web.

Começou-se por fazer uma pesquisa automática por notícias, páginas eleitorais e websites relacionados com as eleições na Madeira. Utilizou-se uma lista termos de pesquisa para colocar no Bing Search API.

Pretendeu-se obter o maior número possível endereços de páginas (URLs) relacionados com o evento ou tema em causa, ou seja, as eleições madeirenses. Para isso definiu-se vários limites para os resultados: top 10, top 20, top 50 e top 100. Deixou-se documentado esse processo, o qual mostra que quanto mais alargamos o número de resultados maior é o número de páginas pouco relevantes e por vezes fora do alvo pretendido.

A totalidade dos endereços (12.656) foi colocada a gravar no dia 7 de junho no Heritrix crawler.

Saiba mais consultando o conjunto de dados:

Eleições Europeias 2024 em recolha multilingue

As Eleições Europeias realizaram-se a 9 de junho em Portugal. Em alguns países, como por exemplo, a Estónia, a Chéquia ou a Itália as eleições foram em outras datas.

O Arquivo.pt recolheu páginas relativas às Eleições Europeias nos 27 países da União Europeia e nas 24 línguas oficiais.

Para isso seguiu-se a mesma metodologia usada para a coleção acerca das Eleições Europeias de 2019, ou seja, uma pesquisa multilingue e semiautomática.

Utilizou-se uma lista de 40 termos compostos que foram traduzidos para as 24 línguas oficiais da UE. A tradução dos termos para as diversas línguas foi feita em 2019 pelo pelo EU Publications Office. Dessa colaboração resultou uma lista multilingue com 960 de termos para colocar no Bing Search API.

Antes das eleições, a 3 de junho, foi realizada a primeira pesquisa da qual resultaram 8.986 endereços únicos, com o número de resultado limitado ao top 20.

Depois das eleições, adicionou-se novos termos de pesquisa com os nomes dos principais candidadatos ao Parlamento Europeu em cada país da União Europeia. Desta segunda pesquisa pós-eleitoral foram obtidos 15.371 endereços únicos.

A ferramenta utilizada para esta recolha foi o Heritrix. A recolha foi limitada a três “saltos” (“hops”). O crawler seguiu ligações, neste caso, até três vezes. Quer isto dizer que se optou por uma certa contenção na profundidade da gravação. Três “saltos” ou “hops” no Heritrix crawler é o suficiente para a recolha de uma página (em outras aplicações também denominada por gravação “page” ou “single page”).

Os conteúdos foram gravados entre 7 e 20 de junho e incluídos na recolha especial EAWP46. Estará disponível passado 1 ano.

Saiba mais consultando o conjunto de dados:

Saiba mais sobre as recolhas eleitorais de anos anteriores

Portugueses nos Jogos Olímpicos e Paralímpicos 2024 em coleção internacional de websites do IIPC

print-replay-comiteolimpicoportugal

Última atualização em 11 de Setembro de 2024 às 16:40

print-noticia-rtp-rececao-atletas-paralimpicos-paris-2021
Jogos Paralímpicos. Miguel Monteiro, medalha de ouro, regressa a Lisboa (Notícia no site da RTP, dia 2 de setembro, selecionada para coleção internacional)

O Arquivo.pt contribuiu para a coleção internacional de páginas Web sobre os Jogos Olímpicos, que decorreram em Paris de 26 de julho a 11 de agosto de 2024, e os Jogos Paralímpicos que se realizaram de 28 de agosto a 8 de setembro.

A iniciativa de criar a coleção “Jogos Olímpicos e Paralímpicos 2024” é da responsabilidade do International Internet Preservation Consortium (IIPC), a principal entidade mundial no domínio da preservação da Internet, através do seu grupo de trabalho Content Development Working Group.

As coleções colaborativas do IIPC têm por objetivo promover a criação de coleções temáticas e coleções baseadas em eventos internacionais. As páginas da Web são gravadas e depois disponibilizadas no serviço Archive-it.

No Arquivo.pt também ficarão disponíveis, passado um ano, as páginas desta coleção para quem quiser realizar estudos sobre desporto e olimpismo.

Como foram selecionadas as páginas sobre os atletas portugueses

Nos Jogos Olímpícos representaram Portugal 73 atletas em 15 modalidades, e nos Jogos Paralímpicos 27 atletas,  em 10 modalidades.

O critério de seleção de páginas para a coleção internacional foram notícias sobre os atletas. Para cada atleta selecionou-se páginas referentes às suas expectativas antes dos jogos, à sua prestação na prova e aos seus comentários durante e após a competição.

Há atletas que têm mais notícias selecionadas do que outros e o mesmo acontece com os sites de onde provêm as notícias. A seleção de páginas não se limitou aos primeiros resultados apresentados pelo motor de busca. Procurou-se variedade de canais e notícias de sites regionais e locais, alguns da região ou cidade de onde vieram os atletas.

Mais de 500 páginas para recordar a presença portuguesa em Paris

O contributo do Arquivo.pt, como poderá ver na tabela, já tem mais de 500 paginas Web.

print-tabela-seeds-ilustrativa-jogosolimpicos
Portuguese Seeds – 2024 Summer Olympics and Paralímpics, International Internet Preservation Consortium – Content Development Working Group (IIPC CDG)

Colabore na coleção através do formulário do IIPC

Helena Byrne, curadora dos arquivos da web na British Library e curadora principal desta coleção, convida todas a pessoas a enviarem páginas interessantes para gravar: And we’re off – Get Involved in Web Archiving the Summer Games – Paris 2024.

Para contribuir está disponível o seguinte formulário público:

2024 Summer Olympics & Paralympics

Instituto Politécnico de Lisboa promoveu ciclo de webinars com o Arquivo.pt

thumbnail-ciclo-de-webinars-ipl

O Instituto Politécnico de Lisboa (IPL), através do Grupo de Ensino à Distância (EaD@IPL), promoveu um ciclo de webinars para a sua comunidade dedicado ao Arquivo.pt e à preservação dos conteúdos publicados na Internet.

Esta iniciativa teve a participação de docentes e investigadores do IPL, bem como pessoas ligadas à comunicação da mesma instituição.

O ciclo de webinars realizou-se em três sessões, entre maio e julho de 2024, e seguiu o programa de formação que o Arquivo.pt disponibiliza há vários anos.

Materiais das apresentações

  • 1º webinar – Arquivo.pt: uma nova ferramenta para pesquisar o passado. Bem publicar, para bem preservar. 5 de junho.
  • 2º webinar – Acesso e processamento automático de informação preservada da Web através de APIs. 19 de julho.
  • 3º webinar – Arquivar a Web: faça-você-mesmo!. 3 de julho

Porque é importante fazer ações de formação acerca da preservação da Web

Arquivar conteúdos publicados na web e usar um arquivo da Web no dia-a-dia é uma prática pouco habitual, em grande parte devido ao desconhecimento por parte da comunidade da existência e do funcionamento do Arquivo.pt.

As sessões de formação do Arquivo.pt são um espaço de motivação para que as pessoas e as instituições passem a cuidar melhor dos seus websites e dos conteúdos que publicam na Web.

Por exemplo, neste ciclo de webinars com o IPL foram dadas ferramentas que permitem aos participantes uma utilização imediata e criativa do arquivo da Web, tais como o serviço de gravação na hora SavePageNow, o serviço de pesquisa de conteúdos históricos e, para uso em equipas interdisciplinares, as Application Programming Interfaces (APIs).

Como resultado deste ciclo de webinars reforçou-se a colaboração entre o Instituto Politécnico de Lisboa e o Arquivo.pt, tendo em vista a preservação dos seus sítios web institucionais e de outros conteúdos de interesse que estão em diversos meios on-line (notícias, eventos, referências a docentes investigadores e alunos).

Conheça os vencedores do Prémio Arquivo.pt 2024!

thumbnail-video-vencedores

Última atualização em 26 de Setembro de 2024 às 18:12

Os vencedores do Prémio Arquivo.pt 2024 foram anunciados pelo Jornal Público, parceiro oficial de comunicação desta edição.

Foram recebidos 27 trabalhos candidatos.

A cerimónia de entrega de prémios decorreu na sessão de encerramento do Encontro Ciência, a 5 de julho, na Alfândega do Porto.

1º classificado – “Noticioso – Desafiar percepções”

O vencedor do prémio no valor de 10 000 euros foi o trabalho “Noticioso – Desafiar percepções” desenvolvido por Carmen Fonseca e António Ramiro (Equipa Cubbo).

“Noticioso” é uma plataforma em que o utilizador pode comparar a cobertura mediática sobre diversos temas através de um jogo (Quiz). Permite ainda explorar tendências ao longo do tempo através de uma ferramenta analítica. Acha que conhece bem as notícias portuguesas? Venha descobrir.

Por exemplo, qual o tópico com mais notícias entre 2000 e 2020: Aquecimento global ou Sporting? Os dados do Arquivo.pt dizem que foi o Sporting.

2º classificado – “Habitação.NET: Uma visão do Mercado de Habitação em Portugal”

O 2º prémio no valor de 3 000 euros foi atribuído ao trabalho “Habitação.NET: Uma visão do Mercado de Habitação em Portugal”, da autoria de Diogo Gonçalves.

“Habitação.NET: Uma visão do Mercado de Habitação em Portugal” é uma ferramenta que permite ao utilizador explorar, de forma interativa, a evolução do valor médio do mercado habitacional e arrendatário português, contextualizado com notícias publicadas sobre o tema e as políticas de habitação.

Por exemplo, no ano 2009, em Lisboa o preço é cerca de 1600 €/m2, tendo subido para 4800 €/m2  em 2023. A subida de preços na habitação é contextualizados por notícias ao longo do tempo.

3º classificado – “Pegada Lusa”

O 3º classificado recebeu um prémio no valor de 2 000 euros e foi atribuído ao trabalho “Pegada Lusa”, desenvolvido por Diana Costa e Sérgio Teixeira.

“Pegada Lusa” é um trabalho que mostra a evolução das políticas e iniciativas sustentáveis nas diversas regiões do país, a partir da análise  dos projetos e boas práticas dos Objetivos de Desenvolvimento Sustentável (ODS).

Por exemplo, a região do Porto tem um índice de sustentabilidade (“Green Score”) de 57%, baseado no teor das notícias analisadas.

Menção Honrosa do Público: “Uma viagem no tempo com o Público e o Expresso”

O jornal Público, parceiro oficial da 7ª edição do Prémio Arquivo.pt, atribuiu a sua Menção Honrosa ao trabalho “Uma viagem no tempo com o Público e o Expresso“, realizado por Rita Marques Costa e Beatriz Malveiro.

Uma viagem no tempo com o Público e o Expresso” analisa e compara as páginas web do Público e o Expresso, desde 1998, mostrando ao utilizador do website como evoluíram as versões digitais destes meios.

Por exemplo, em 2014, tanto o Público como o Expresso passam a dar maior destaque às manchetes nas suas homepages e o Expresso passa a ter edição digital diária.

Menção Honrosa AMCC – Aveiro Media Competence Center: “discordAR: a Proximidade dos Partidos na Assembleia da República”

O Aveiro Media Competence Center (AMCC), atribuiu a sua Menção Honrosa ao trabalho “discordAR: a Proximidade dos Partidos na Assembleia da República”, realizado por Miguel Salema e Sebastião Fonte.

“discordAR: a Proximidade dos Partidos na Assembleia da República” é uma App que mostra a proximidade entre partidos políticos, usando votos na Assembleia da República Portuguesa.

Por exemplo, podemos ver a percentagem de votos na mesma direção entre os Partidos no período relativo à XII Legislatura (2012 a 2015).

Menção Honrosa .PT: “ArquivoNC – arquivo web do Jornal de Notícias da Covilhã”

A Associação DNS.PT atribuiu uma Menção Honrosa ao Professor que incentivou a submissão do trabalho “ArquivoNC – o arquivo web do Jornal de Notícias da Covilhã”, promovendo assim a utilização do Arquivo.pt como ferramenta de treino e aprendizagem em contexto de aula. A autoria do trabalho é do aluno Rodrigo Dias da Silva, orientado pelo Professor Ricardo Campos, da Universidade da Beira Interior (UBI).

“ArquivoNC – o arquivo web do Jornal de Notícias da Covilhã” é um trabalho no âmbito do projeto de final de curso em Engenharia da Universidade da Beira Interior (UBI) que disponibiliza o acesso a dez anos de páginas web do jornal Notícias da Covilhã a partir das notícias preservadas pelo Arquivo.pt entre 2009 e 2019.

Cerimónia de entrega de prémios

Galeria de imagens

premio-arquivo--10
premio-arquivo--8
premio-arquivo--7
premio-arquivo--6
premio-arquivo--1
premio-arquivo--3
premio-arquivo--4
premio-arquivo--2
premio-arquivo--9
premio-arquivo--10 premio-arquivo--8 premio-arquivo--7 premio-arquivo--6 premio-arquivo--1 premio-arquivo--3 premio-arquivo--4 premio-arquivo--2 premio-arquivo--9

Vídeo da entrega

Entrevistas

Materiais de divulgação

Imprensa

Saber mais

Programa de mobilidade das Bibliotecas do Ensino Superior levou profissionais ao Arquivo.pt

FCCN_A Minha Biblioteca_24 maio 2024_2

Última atualização em 30 de Maio de 2024 às 14:02

Arquivo.pt operado pela FCCN FCT e localizado no Campus do LNEC
Arquivo.pt operado pela FCCN FCT, localizado no Campus do LNEC, na Avenida do Brasil, em Lisboa.

No dia 24 de maio, a FCCN recebeu pela primeira vez profissionais de Bibliotecas do Ensino Superior (BES) no âmbito do programa dinamizado pelo Grupo Trabalho das Bibliotecas do Ensino Superior (GT-BES) da Associação Portuguesa de Bibliotecários, Arquivistas, Documentalistas e Profissionais da Informação (BAD), A minha biblioteca é a tua biblioteca.

Trata-se de um programa de mobilidade que tem como objetivo a realização de visitas de curta duração tendo em vista a troca de experiências e o contacto, in loco e hands on, com boas práticas, fomentando a colaboração e o conhecimento das BES portuguesas entre os profissionais da área.

Serviços avançados para o conhecimento

Nesta primeira edição do programa na FCCN, foi proposto às colegas participantes (3 profissionais da Universidade de Lisboa e 1 da Universidade Católica do Porto) um percurso pelos serviços digitais de apoio às instituições do ensino superior que são operados pela FCCN- FCT

Alguns serviços são conhecidos dos profissionais da informação, como por exemplo, a B-On e o RCAAP. Outros são serviços de backoffice e, por isso,  menos visíveis, mas fundamentais para as instituições de ensino superior. Por exemplo, o Eduroam que garante o acesso à Internet, o RCTSaai para a autenticação ou o RCTS CERT para responder a incidentes de segurança.

Destaque para os serviços Arquivo.pt e NAU

No decorrer dia, estiveram em destaque o Arquivo.pt e a Plataforma NAU, dois serviços da área do conhecimento que estão disponíveis para as Instituições do Ensino Superior e também para a sociedade.

A equipa do Arquivo.pt mostrou o backoffice deste serviço de preservação da Internet em Portugal e realizou um exercício prático de gravação e integração de conteúdos no arquivo da Web.

A Plataforma NAU,  é uma plataforma de MOOCs (Massive Open Online Courses) criada com o propósito de democratizar o conhecimento, promover a literacia digital, possibilitar o ensino e formação a comunidades alargadas de utilizadores, em particular à população portuguesa e lusófona.

Mais recentemente, com a sua integração na plataforma norte-americana edx.org, também a todos os potenciais formandos falantes de língua portuguesa dispersos pelo mundo. Às participantes no programa foi explicado e exemplificado como construir cum curso MOOC na plataforma edx.

O programa incluiu, ainda, uma visita ao Data Center e ao Estúdio de televisão profissional existente na FCCN.

Visita dos participantes no programa de mobilidade das Bibliotecas do Ensino Superior ao Estúdio da FCCN
Visita dos participantes no programa de mobilidade das Bibliotecas do Ensino Superior, da BAD, ao Estúdio da FCCN.

Para saber mais

Semana de estágio Erasmus+ no Arquivo.pt de Praga a Lisboa

Visit to FCCN tv studio

Por: Marie Haškovcová and Luboš Svoboda, Webarchiv, National Library of the Czech Republic, 13 a  17 de maio de 2024.

Visita no âmbito do Erasmus+

Graças ao programa europeu Erasmus+ da UE, centrado na educação de adultos – mobilidade de pessoal, tivemos a oportunidade de passar uma semana a acompanhar o Arquivo.pt e comparar as estratégias do arquivo Web checo – Webarchiv – com as abordagens dos nossos colegas portugueses.

Em ambos os casos, trata-se de arquivos centrados em conteúdos nacionais (checos e portugueses) na Internet.

O Arquivo.pt

Enquanto o arquivo web checo faz parte da Biblioteca Nacional da República Checa, o arquivo português faz parte da FCCN, no âmbito da FCT – Fundação para a Ciência e a Tecnologia, que tem como objetivo contribuir para o desenvolvimento da ciência, da tecnologia e do conhecimento.

A FCT presta serviços de IT ao sistema de ensino superior e de Investigação português, bem como conetividade de alta velocidade à Internet. O contexto institucional de ambos os arquivos reflecte-se também nas especificidades dos seus conceitos.

A visita incluiu uma apresentação da equipa e dos espaços do campus e dos departamentos, uma apresentação das actividades de ambos os arquivos e uma discussão sobre os diferentes aspectos do nosso trabalho – ferramentas técnicas e curatoriais, tecnologias e processos, ambiente legislativo e questões éticas, armazenamento de dados, alguns serviços, actividades de investigação, perspectivas e planos futuros.

O arquivo da Web checo

O arquivo web checo foi fundado em 2000, as cópias de arquivo mais antigas datam de 2001 e tem atualmente mais de 580 TB de dados. Tal como o Arquivo.pt, recolhe conteúdos num domínio nacional com base numa lista de endereços URL obtida junto do seu fornecedor. Na sua estratégia de aquisição, complementa estas recolhas, ditas abrangentes, com recolhas temáticas e selectivas.

As colecções temáticas referem-se a um tópico ou evento específico, podem ser pontuais ou de construção contínua, e combinam recursos seleccionados manualmente e recursos extraídos automaticamente. As colecções selectivas destinam-se a ser recolhidas a longo prazo, têm registos de catalogação detalhados que fazem parte da bibliografia nacional checa e são licenciadas – as cópias de arquivo estão, portanto, disponíveis gratuitamente através do catálogo.

No âmbito das actividades de investigação em arquivos da Web, apresentámos o nosso projeto destinado a detetar as chamada web morta através da aplicação Extinct Websites e a criar uma base de dados que sirva de base para monitorizar mudanças mais amplas na web checa, bem como o projeto WACloud destinado a extrair grandes volumes de dados do arquivo da web.

Troca de conhecimentos e experiências

Entre os projectos portugueses, interessou-nos, por exemplo, o CitationSaver, e também discutimos o projeto Memorial, a recolha da Wikipédia portuguesa, e as actividades do arquivo português relacionadas com a formação sobre a preservação da Web (módulos de formação).

A reunião foi enriquecida pela discussão de colecções temáticas específicas.

  • A coleção de Net Art checa documenta a arte digital e a sua transformação no espaço em linha, proporcionando uma perspetiva histórica da arte única.
  • Outra coleção importante é a coleção “Redes sociais dos Membros do Parlamento da República Checa 2021-2025”, que preserva as comunicações e interacções em linha dos deputados checos, de valor inestimável para o estudo do marketing político e da vida política pública.
  • A coleção GitHub arquiva repositórios importantes desta popular plataforma para programadores, preservando os principais projectos de software nacionais e o seu código para as gerações futuras.
  • Por último, a coleção Crypto, NFT, Blockchain, Web3, Metaverse traça o crescimento e o impacto da tecnologia no espaço dos bens digitais. Estas colecções são recursos fundamentais para a investigação e análise da cultura, política e tecnologia digitais, e a discussão destas colecções em reuniões de arquivistas da Web contribui para o desenvolvimento de métodos de arquivo e inovação tecnológica.

Concentrámo-nos na troca de conhecimentos e experiências na identificação de endereços para gravar (seeds), na otimização do fluxo de trabalho e na partilha de dicas e aspectos técnicos.

Partilha de boas práticas

Discutimos as melhores práticas para identificar e recolher os principais recursos da Web, um passo fundamental para garantir um arquivo abrangente e representativo. Partilhámos várias estratégias para automatizar e simplificar os fluxos de trabalho, incluindo a utilização de ferramentas de raspagem da Web e filtragem avançada de conteúdos.

As conversas técnicas incluíram soluções para problemas comuns, como a recolha de páginas Web dinâmicas e a superação de restrições de acesso. A reunião constituiu uma plataforma valiosa para a partilha de métodos inovadores e para a promoção da colaboração entre peritos, promovendo o desenvolvimento de um arquivo digital eficaz e sustentável.

Erasmus+ visti to FCCN TV studio
Luboš Svoboda, curador digital, Marie Haškovcová,coordenadora do Webarchiv e Ricardo Basílio, curador digital do Arquivo.pt em visita ao Estúdio da FCCN, FCT.

 

Heritales e Crowd-Recycling mostram websites antigos do Alentejo no Dia Internacional dos Museus

Heritales Crowd-Recycling e Arquivo.pt no Dia Internacional dos Museus

O dia 18 de maio, Dia Internacional dos Museus, foi assinalado por todo o país com entradas gratuitas, visitas guiadas, animação de espaços e exposições relacionadas com a memória e o património.

O Arquivo.pt contribuiu com uma exposição de páginas antigas, intitulada “Memória Digital através da Internet do Passado”, que esteve patente num dos stands no Museu dos Coches, em Lisboa.

As páginas foram selecionadas para mostrar diversos aspetos do Alentejo ao longo do tempo. A partir de 2016, selecionou-se páginas relativas ao projeto Heritales.

Heritales e Crowd-Recycling chamaram a atenção para a preservação da memória da Internet

Heritales é um projeto sediado em Évora que tem por objetivo estudar e divulgar o património em todas as suas manifestações. É conhecido pelo seu evento principal criado em 2016, o HERITALES – International Heritage Film Festival.

Crowd-Recycling é um projeto focado nas boas práticas para a sustentabilidade.

O Heritales, o Crowd-Recycling e o Arquivo.pt concretizaram esta ação em colaboração com o objetivo de dar visibilidade aos conteúdos publicados na Web ao longo do tempo. Preservar e dar acesso aos conteúdos digitais é fundamental para valorizar o património.

Porque é que fazer uma exposição de websites antigos é um boa ideia

Fazer uma exposição de websites ao longo do tempo é relativamente fácil, bastando ter um tema que pode ser também a história de uma instituição e escolher páginas conservadas no Arquivo.pt.

Uma exposição de sites antigos é uma ideia original para o público-alvo. Muitas vezes apresenta textos e imagens que só existiram na Web.

Ao chamar a atenção para os websites damo-nos conta que muitas coisas ficaram por gravar e isso muda a nossa visão sobre os conteúdos que publicamos hoje. Passados a cuidar mais da gravação de páginas importantes, por exemplo, tomando medidas ou gravando-as na hora com o SavePageNow.

Heritales Crowd-Recycling e Arquivo.pt no Dia Internacional dos Museus
Heritales, Crowd-Recycling e Arquivo.pt presentes no Dia Internacional dos Museus no Museu dos Coches

Dia Mundial da Internet foi a 17 de maio

No dia anterior ao Dia Internacional do Museus assinalou-se o Dia Mundial da Internet (17 de maio). A proximidade das duas comemorações vem mesmo a propósito do tema da preservação da memória.

Portugal ligou-se à Internet, pela primeira vez, em 1991, com o projeto da FCCN “Serviço IP da RCCN”.

Para relembrar como tudo aconteceu, deixamos-lhe as três sugestões que a FCCN publicou nas redes sociais para este dia:

Arquivo.pt é finalista dos prémios do Digital Preservation Coalition

dpc-award-thumb

Última atualização em 6 de Agosto de 2024 às 17:21

Os prémios do Digital Preservation Coalition

O Digital Preservation Coalition (DPC) é um consórcio internacional dedicado à promoção da preservação digital e das suas boas práticas.

Os DPC Awards são uma forma de divulgar e promover casos de uso exemplares e inovadores, provenientes de candidaturas de todo o mundo.

Por essa razão, o Arquivo.pt aceitou o desafio para dar a conhecer os seus serviços à comunidade internacional.

A equipa do Arquivo.pt apresentou duas candidaturas aos DPC Awards 2024 nas categorias de “Award for Safeguarding the Digital Legacy” (prémio para a salvaguarda da herança digital) e “Award for Research and Innovation” (prémio para investigação e inovação).

Candidaturas do Arquivo.pt aos Prémios DPC

#1 Catálogo de ferramentas do Arquivo.pt para preservação digital

A informação que rege a vida atual nasce digital e é divulgada online. No entanto, objetos digitais de valor incalculável publicados em linha têm vindo a perder-se irremediavelmente.

O Arquivo.pt é uma infraestrutura pública que preserva objetos digitais publicados em linha para salvaguardar este legado digital para as gerações futuras.

Em outubro de 2023, após 15 anos de investigação e desenvolvimento, o Arquivo.pt lançou um Catálogo de 13 ferramentas inovadoras para apoiar a preservação de conteúdos online em risco, desde a sua aquisição até à sua disseminação (ex. pesquisa e acesso, APIs, formação, conjuntos de dados abertos ou exposições).

O Catálogo de ferramentas do Arquivo.pt para preservação digital foi selecionado como finalista do Award for Safeguarding the Digital Legacy.

#2 Pesquisa de imagens preservadas da Web

As imagens publicadas online são artefactos digitais preciosos que documentam a época contemporânea para as gerações futuras.

Esta iniciativa descreve a investigação e o desenvolvimento de um sistema inovador de pesquisa de imagens que permite a descoberta e acesso a milhares de milhões de imagens preservadas da web desde a década de 1990.

Esta investigação foi aplicada para potenciar o Arquivo.pt com um serviço de pesquisa de imagens único no mundo e disponível publicamente a qualquer utilizador da Internet.

As publicações científicas resultantes estão disponíveis em acesso aberto e o software desenvolvido está disponível através de projetos livres de código aberto para serem reutilizados e melhorados pela comunidade.

Um serviço de Portugal para o mundo

O Arquivo.pt é um serviço de preservação acessível na Internet e são cada vez mais os casos de uso do Arquivo.pt em estudos científicos por investigadores de outros países.

Os motivos para esse uso internacional do Arquivo.pt são o facto de preservar conteúdos em várias línguas, como por exemplo acerca das Eleições Europeias de 2019, e por ser inovador nos serviços que disponibiliza para pesquisa e acesso à informação preservada.

Assim sendo, um investigador de qualquer parte do mundo pode pesquisar textos, imagens ou treinar modelos de Inteligência Artificial com base na informação histórica preservada pelo Arquivo.pt.

Para saber mais