Arquivo.pt venceu o Prémio Transformação Digital 2024

Última atualização em 5 de Dezembro de 2024 às 12:17

O Arquivo.pt, serviço digital da Fundação para a Ciência e a Tecnologia (FCT)-Unidade FCCN foi um dos vencedores do Prémio Transformação Digital da APDSI 2024.

O Arquivo.pt foi reconhecido na categoria “Promoção da Sociedade mais Inovadora e Digital”.

Esta categoria destaca a vertente inovadora na transição digital das organizações.

O gestor do Arquivo.pt, Daniel Gomes, e o encarregado das recolhas do Arquivo.pt, Pedro Gomes, estiveram presentes na cerimónia que decorreu em Oeiras, no dia 3 de dezembro de 2024.

Arquivo.pt, um serviço para a transformação digital

Daniel Gomes, num vídeo preparado para a cerimónia de entrega de prémios, explica como um serviço de preservação da Web contribui para uma sociedade da informação mais sustentável.

Prémio Transformação Digital – APDSI

A Associação para a Promoção e Desenvolvimento da Sociedade da Informação (APDSI) promove o uso da tecnologia em prol dos cidadãos, da sua inclusão e participação no desenvolvimento da sociedade.

O Prémio Transformação Digital (4ª edição em 2024) tem por objetivo “reconhecer e divulgar as melhores práticas de adoção e implementação das tecnologias de informação e comunicação (TIC), com vista a uma sociedade mais digital sustentada por instituições públicas e privadas mais eficiente e mais próximas do cidadão” (website da APDSI).

A edição de 2024 teve 33 candidaturas integradas em três categorias:

  • Eficácia/Eficiência das Organizações
  • Proximidade com o Cidadão e Sociedade mais inclusiva
  • Promoção da Sociedade mais Inovadora e Digital

Conheça todos os projetos finalistas

Galeria de imagens

premio-apdsi_TD24-140
premio-apdsi_TD24-152
premio-apdsi_TD24-155
premio-apdsi_TD24-148
premio-apdsi
premio-apdsi2
premio-apdsi4-
premio-apdsi-3
premio-apdsi_TD24-140 premio-apdsi_TD24-152 premio-apdsi_TD24-155 premio-apdsi_TD24-148 premio-apdsi premio-apdsi2 premio-apdsi4- premio-apdsi-3

Dia Mundial da Preservação Digital celebrado em encontro na Torre do Tombo

Última atualização em 18 de Novembro de 2024 às 11:21

Vamos falar de preservação e acesso!

No passado dia 7 de novembro de 2024, realizou-se o Encontro Novos Caminhos para a Preservação e o Acesso à Informação, organizado conjuntamente pelo Arquivo.pt e pelo Arquivo de Ciência e Tecnologia, o primeiro situado na Avenida do Brasil e o segundo na Avenida D. Carlos I, em Lisboa, ambos serviços da Fundação para a Ciência e a Tecnologia (FCT).

O objetivo desta equipa conjunta da FCT foi precisamente provocar o encontro e a partilha de experiências entre diversas instituições que têm inevitavelmente de gerir informação, quer em formatos tradicionais como o papel, quer em formatos digitais.

O encontro teve 243 participantes e 29 oradores. Nove das 27 apresentações foram submetidas para uma a sessão denominada “Espaço comunidade”.

A sessão de encerramento teve a intervenção de Maria Inácia Rezola, Comissária Executiva da Estrutura de Missão para as Comemorações do 50º aniversário da Revolução de 25 de Abril de 1974.

A BAD – Associação de Portuguesa de Bibliotecários, Arquivistas, Profissionais da Informação e Documentação, deu um contributo importante na divulgação do evento pela comunidade e marcou presença com um stand informativo.

Um dia internacional dedicado à preservação digital

Neste dia, celebrou-se o Dia Mundial da Preservação Digital, uma iniciativa do Digital Preservation Coalition (DPC) a que o Arquivo.pt se associou desde a primeira edição em 2017. Jane Winters, Presidente do DPC, enviou uma mensagem vídeo para associar-se a esta iniciativa em Portugal.

A informação digital foi o fio condutor das intervenções. Na abertura, o Diretor da Direção Geral do Livro, dos Arquivos e das Bibliotecas, Silvestre Lacerda, lembrou que a DGLAB foi pioneira entre as entidades públicas na abordagem à questão da preservação digital. O vice-presidente da FCT, Francisco Santos, sublinhou o valor económico que representam os dados para a investigação científica.

Preservação digital não se trata apenas de tecnologia, como referiu Henrique São Mamede, Professor da Universidade Aberta, INESC TEC na conferência de abertura. Trata-se também das pessoas, do fator humano, do ambiente exterior às organizações e das novas sensibilidades, como a sustentabilidade e a ecologia. Daí a importância de criar pontes, de usar por exemplo, a Inteligência Artificial articulando-a com a ética.

Ao longo do dia, quatro painéis agregaram apresentações sobre diversos contextos da preservação tais como a digitalização de som, imagem e vídeo, dados de investigação, quadros normativos, sistemas de gestão de informação digitalizada ou nascida digital, divulgação e acesso, uso na investigação académica.


Imagem e montagem: Leonor Arrimar (FCT)

Painel 1: Iniciativas e realidades de preservação digital

O primeiro painel foi moderado por João Gomes, Diretor de Serviços Avançados da FCT, e trouxe para a mesa a diversidade de contextos em que se coloca a questão da preservação e do acesso. Destaca-se, aqui, um aspeto de cada apresentação e deixa-se o convite para seguir as ligações e conhecer melhor essas iniciativas.

Moisés Rockemback, Professor da Universidade de Coimbra e co-autor do livro Arquivamento da web e preservação digital, falou das primeiras iniciativas realizadas no Brasil para preservar conteúdos publicados na Web. Os websites dos candaditatos às eleições brasileiras, por exemplo, são por natureza efémeros mas tornaram-se material para a pesquisa historiográfica ao serem preservados num arquivo da Web. Numa perspetiva mais teórica abordou a questão da memória. A preservação da web permite-nos trazer à luz acontecimentos que foram veiculados unicamente em meios digitais como a Web e, nesse sentido, adia o fim da História expresso na metáfora da “Dark Age”, tempo da escuridão, vazio de informação.

Pedro Penteado, Diretor de Serviços de Arquivística e Normalização, apresentou um conjunto de instrumentos que a DGLAB tem desenvolvido, como por exemplo a Macro Estrutura Funcional (MEF), o projeto Avaliação Suprainstitucional da Informação Arquivística (ASIA) e ainda a Lista Consolidada na Plataforma CLAV, que permite às diferentes entidades da Administração Pública cumprir a legislação e normalizar práticas de classificação e avaliação. Recordou que estes intrumentos são flexíveis para atender às especificidades das organizações.

Pedro Príncipe, Chefe da Divisão de Serviços de Documentação da Universidade do Minho, abordou os dados de investigação. A preservação e o acesso aos dados é fundamental para a produção de ciência. Para isso é necessário conjugar iniciativas e trabalhar em rede e criar comunidades de prática. O Fórum GDI é um exemplo de que o encontro entre profissionais é útil.  A certificação é altamente recomendável, como o tem demonstrado a Universidade do Minho que certificou o seu repositório, pois é um motivo extra para criar robustez e para atingir os objetivos FAIR (Findable, Acessible, Interoperable, and Reusable).

Hilário Lopes, Diretor adjunto das Relações Institucionais e Arquivo da RTP, descreveu o caminho para o digital que mudou completamente a forma de acesso ao Arquivo da RTP. Se até de 2001 a digitalização se fazia a pedido, a partir desse ano os conteúdos foram massivamente digitalizados. Desde 2007, os conteúdos são acessíveis em formato digital, o que facilitou o acesso e o uso. A RTP Memória e o Portal RTP são dois exemplos de acesso ao património audiovisual da rádio e televisão pública.

Painel 2: Preservar e reutilizar a informação da Web

O tema do arquivo da Web esteve em destaque no segundo painel, moderado por Daniel Gomes, Gestor do Arquivo.pt e seu iniciador em 8 de de novembro de 2007.

Ricardo Basílio, curador digital do Arquivo.pt, apresentou a exposição online “Memórias do 25 de Abril na Internet, realizada em colaboração com a Comissão Comemorativa 50 Anos 25 de Abril, com base em páginas web preservadas. Destacou  páginas sobre as comemorações do 25 de Abril em todo o país atrvés de uma visita guiada à exposição.

Joana Paulino, historiadora e investigadora da Faculdade de Ciências Sociais e Humanas da Universidade Nova de Lisboa, mostrou como as tecnologias contribuem para o desenvolvimento de estudos em áreas tradicionalmente afastadas das tecnologias, a partir da sua experiência no Laboratório de Humanidades Digitais.

António Campos e Hélder Mestre, do Arquivo da Câmara Municipal de Sines, mostraram como, desde 2020, preservam conteúdos da Web de interesse local em colaboração com o Arquivo.pt. Gravam páginas Web com o ArchiveWeb.page, ferramenta do Webrecorder, enviam uma cópia dos ficheiros para o Arquivo.pt, fazem transcrição textual de imagens e vídeos, e usam também o PDF como formato mais tradicional para arquivar notícias. A questão da acessibilidade aos conteúdos para pessoas com necessidades especiais é fundamental no processo de preservação.

António Ramiro e Carmen Fonseca, vencedores do Prémio Arquivo.pt 2024, apresentaram o seu trabalho Noticioso.pt. É um projeto que reutiliza a informação do Arquivo.pt para desafiar a capacidade crítica dos cidadãos.

Para finalizar, Daniel Gomes, destacou o muito que foi feito nos últimos 17 anos no domínio da preservação da Web, a ponto de termos atualmente um serviço funcional que toda a gente pode usar. Fomos encontrar, como testemunho desses primeiros tempos, uma página do Diário Digital, de novembro de 2006.

Painel 3: Preservar a atualidade e salvaguardar o futuro

O terceiro painel foi moderado por Paula Meireles, Coordenadora do serviço Arquivo, Documentação e InformaçãoFundação para a Ciência e a Tecnologia (FCT) e trouxe à mesa outras quatro realidades.

Filipe Guimarães Silva, Diretor Executivo da Fundação Mário Soares e Maria Barroso e António Coelho, Coordenador de reprodução digital, aprofundaram as questões técnicas relacionadas com a digitalização, a partir do caso do acervo, que também está acessível no portal Casa Comum. O controlo de qualidade é o fator mais importante para obter uma versão digital preservável. Nem sempre são necessárias tecnologias caras para obter bons resultados. É fundamental seguir os standards e cuidar para que sejam gerados metadados de qualidade.

Fernanda Gonçalves, Diretora do Arquivo da Unidade Local de Saúde São João, mostrou como o Repositório Clínico Digital São João está a transformar o acesso aos processos clínicos com vantagens tanto na rapidez como na qualidade da informação. O modelo de gestão da informação nesta enorme instituição traz imensos desafios para a preservação e o acesso continuado, pois trata-se criar interoperabilidade entre múltiplos sistemas. Acresce que se tratam de dados sensíveis com diferentes níveis de acesso. É aqui que surge o arquivo como uma mais valia. O serviço de arquivo deve estar à altura dos desafios em qualquer organização para servir todos os seus “clientes”.

Augusto Ribeiro, responsável pelo Serviço de Gestão da Documentação e Informação na UPdigital, Universidade do Porto, explicou como está ser feita a preservação do acervo universitário. Desde o tratamento dos documentos em papel, à sua digitalização e à inserção no repositório digital, é importante garantir a robustez. Este trabalho tem sido progressivo e sistemático, ou seja, segue um plano onde todas as peças se encaixam, à medida que o trabalho é desenvolvido.

Pedro Penteado (DGLAB) apresentou o projeto “Guía de Preservación Digital” que está a ser desenvolvido em colaboração com a Asociación Latinoamericana de Archivos (ALA). Esta iniciativa vai estruturar conteúdos sobre a preservação digital de forma pragmática. Em breve, os profissionais terão à mão uma base de conhecimento para consultar, sempre que desenvolverem atividades de preservação digital.

Painel 4: Espaço comunidade

O quarto painel, moderado por Paula Carvalho, do Arquivo de Ciência e Tecnologia da FCT,  incluiu 9 apresentações breves submetidas pela comunidade. Em seguida, apresentamos os resumos enviados pelos autores:

Celebrando os 50 anos do 25 de Abril na sessão de encerramento

Maria Inácia Rezola, Comissária Executiva da Estrutura de Missão para as Comemorações do 50º aniversário da Revolução de 25 de Abril de 1974, apresentou uma perspetiva histórica do impacto do 25 de Abril na sociedade portuguesa, nomeadamente através da forma como este é comemorado por todo o país.

Deu a conhecer o trabalho que a Comissão Comemorativa 50 Anos 25 de Abril tem realizado para identificar arquivos, centros de documentação e acervos das mais variadas espécies com material acerca do 25 de Abril. Há acervos públicos praticamente desconhecidos, outros que se encontram-se em acervos privados.  A inventariação e a divulgação é, portanto, o primeiro passo para promover o estudo e o conhecimento sobre o 25 de Abril.

Para terminar, Maria Inácia Rezola, anunciou a atribuição da Menção Honrosa “O 25 de Abril e a Democracia”, juntamente com um prémio de 5.000 euros, na edição Prémio Arquivo.pt 2025, ao melhor trabalho sobre o 25 de Abril que utilize o Arquivo.pt.

Galeria de imagens

Encontro Dia Mundial da Preservação Digital 2024 #WDPD2024

Carmen Fonseca, O Noticioso.pt
Ricardo Basílio, Arquivo.pt -FCT
Hélder Mestre e António Campos, Arquivo Municipal de Sines
Hélder Mestre e António Campos, Arquivo Municipal de Sines
Ricardo Basílio, Arquivo.pt -FCT
Joana Paulino, NOVA-FCSH
António Ramiro, Noticioso.pt
2º Painel - António Ramiro e Carmen Fonseca, Noticioso.pt
António Ramiro e Carmen Fonseca, Noticioso.pt
Encontro Novos Caminhos para a Preservação e o Acesso à Informação
2º painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Encontro Novos Caminhos para a preservação e o aEncontro Novos Caminhos para a Preservação e o Acesso à Informaçãoesso à informação
1º Painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Pedro Príncipe, Universidade do Minho
Moisés Rockemback, Universidade de Coimbra
Hilário Lopes, Arquivo da RTP
Stand do Arquivo.pt - Encontro Novos Caminhos para a Preservação e o Acesso à Informação
1º Painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Pedro Penteado, DGLAB
Encontro Novos Caminhos para a Preservação e o Acesso à Informação
1º Painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Moisés Rockemback, Univ. Coimbra, Ricardo Basílio, Arquivo.pt
Henrique São Mamede, Universidade Aberta, INESC TEC
Stand do Arquivo.pt - Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Stand do Arquivo.pt - Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Moisés Rockemback, Universidade de Coimbra
Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT
3º Painel - Paula Meireles, FCT
Henrique São Mamede, Universidade Aberta, INESC TEC
Sessão de Abertura - João Gomes, Diretor Serviços Avançados da FCT
Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT
Sessão de Abertura - Jane Winters, Digital Preservation Coalition (DPC)
Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT
Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT
Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT
Augusto Ribeiro, Universidade do Porto, UPDigital
3º painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação
Pedro Penteado, DGLAB
wdpd_encontro-preservacao-vasco-rato-arquivo-pt
wdpd_encontro-preservacao-pedro-gomes-citationsaver-fccn-1
wdpd_encontro-preservacao-rita-cepa-nova-fcsh
wdpd_encontro-preservacao-pedro-gomes-citationsaver-fccn
wdpd_encontro-preservacao-joao-pedro-oliveira-nova-fcsh
wdpd_encontro-preservacao-uab-madalena-carvalho
wdpd_encontro-preservacao-suzana-oliveira-act-fct-1
wdpd_encontro-preservacao-susana-torrao-pedro-cavaco-nova-fcsh
wdpd_encontro-preservacao-inacia-rezola
wdpd_encontro-preservacao-inacia-rezola-1
moises-rockembach
arquivamento-da-web-moises-rockembach
paula-meireles-inacia-rezola-sessao-de-encerramento
pedro-principe-uminho
wdpd-paula-meireles
Carmen Fonseca, O Noticioso.pt Ricardo Basílio, Arquivo.pt -FCT Hélder Mestre e António Campos, Arquivo Municipal de Sines Hélder Mestre e António Campos, Arquivo Municipal de Sines Ricardo Basílio, Arquivo.pt -FCT Joana Paulino, NOVA-FCSH António Ramiro, Noticioso.pt 2º Painel - António Ramiro e Carmen Fonseca, Noticioso.pt António Ramiro e Carmen Fonseca, Noticioso.pt Encontro Novos Caminhos para a Preservação e o Acesso à Informação 2º painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação Encontro Novos Caminhos para a preservação e o aEncontro Novos Caminhos para a Preservação e o Acesso à Informaçãoesso à informação 1º Painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação Encontro Novos Caminhos para a Preservação e o Acesso à Informação Encontro Novos Caminhos para a Preservação e o Acesso à Informação Encontro Novos Caminhos para a Preservação e o Acesso à Informação Encontro Novos Caminhos para a Preservação e o Acesso à Informação Pedro Príncipe, Universidade do Minho Moisés Rockemback, Universidade de Coimbra Hilário Lopes, Arquivo da RTP Stand do Arquivo.pt - Encontro Novos Caminhos para a Preservação e o Acesso à Informação 1º Painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação Pedro Penteado, DGLAB Encontro Novos Caminhos para a Preservação e o Acesso à Informação 1º Painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação Moisés Rockemback, Univ. Coimbra, Ricardo Basílio, Arquivo.pt Henrique São Mamede, Universidade Aberta, INESC TEC Stand do Arquivo.pt - Encontro Novos Caminhos para a Preservação e o Acesso à Informação Stand do Arquivo.pt - Encontro Novos Caminhos para a Preservação e o Acesso à Informação Moisés Rockemback, Universidade de Coimbra Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT 3º Painel - Paula Meireles, FCT Henrique São Mamede, Universidade Aberta, INESC TEC Sessão de Abertura - João Gomes, Diretor Serviços Avançados da FCT Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT Sessão de Abertura - Jane Winters, Digital Preservation Coalition (DPC) Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT Sessão de Abertura - Silvestre Lacerda, Diretor da DGLAB e Francisco Santos, Vice-Presidente da FCT Augusto Ribeiro, Universidade do Porto, UPDigital 3º painel - Encontro Novos Caminhos para a Preservação e o Acesso à Informação Pedro Penteado, DGLAB wdpd_encontro-preservacao-vasco-rato-arquivo-pt wdpd_encontro-preservacao-pedro-gomes-citationsaver-fccn-1 wdpd_encontro-preservacao-rita-cepa-nova-fcsh wdpd_encontro-preservacao-pedro-gomes-citationsaver-fccn wdpd_encontro-preservacao-joao-pedro-oliveira-nova-fcsh wdpd_encontro-preservacao-uab-madalena-carvalho wdpd_encontro-preservacao-suzana-oliveira-act-fct-1 wdpd_encontro-preservacao-susana-torrao-pedro-cavaco-nova-fcsh wdpd_encontro-preservacao-inacia-rezola wdpd_encontro-preservacao-inacia-rezola-1 moises-rockembach arquivamento-da-web-moises-rockembach paula-meireles-inacia-rezola-sessao-de-encerramento pedro-principe-uminho wdpd-paula-meireles

Créditos: fotografias por Leonor Arrimar (FCT). Incluídas algumas imagens de dispositivos móveis enviadas por participantes.

Saber mais

Edições anteriores do Dia Mundial da Preservação Digital com o Arquivo.pt

Arquivo.pt recebe prémio de Melhor Projeto Digital da Administração Pública Central

thumbnail-acepi-arquivopt-awarded2

Última atualização em 31 de Outubro de 2024 às 12:32

premio-acepi-2024-atribuido-a-arquivo-pt

O Arquivo.pt, serviço digital da Fundação para a Ciência e a Tecnologia (FCT)-Unidade FCCN foi um dos vencedores dos Prémios Navegantes XXI, edição de 2024.

O Arquivo.pt arrecadou o galardão na categoria de “Melhor Projeto Digital da Administração Pública Central”.

Esta categoria reconhece, anualmente, um projeto que tenha contribuído “de forma inequívoca para o desenvolvimento do setor Público Central através do meio digital, assim como da Economia Digital em Portugal”.

O gestor do Arquivo.pt Daniel Gomes, a Coordenadora Geral Adjunta da FCCN Salomé Branco e o vice-presidente da FCT Francisco Santos estiveram presentes na cerimónia que se realizou no dia 24 de outubro no Técnico Innovation Center em Lisboa e receberam o galardão.

Arquivo.pt receives Award for Best Governmental service

WhatsApp Arquivo.pt vence Prémio Navegantes XXI2024-10-25 at 14.30.42
Arquivo.pt vence Prémio Navegantes XXI
Arquivo.pt receives Award for Best Governmental service
Premios-Navegantes-XXI-Arquivo.pt_
Equipa do Arquivo.pt recebe Prémio Navegantes XXI
WhatsApp Arquivo.pt vence Prémio Navegantes XXI2024-10-25 at 14.30.42 Arquivo.pt vence Prémio Navegantes XXI Arquivo.pt receives Award for Best Governmental service Premios-Navegantes-XXI-Arquivo.pt_ Equipa do Arquivo.pt recebe Prémio Navegantes XXI

Prémios Navegantes XXI

Os Prémios Navegantes XXI são uma iniciativa anual da ACEPI – Associação da Economia Digital, criada com a missão “Promover e Desenvolver a Economia Digital em Portugal”.

O concurso premia o melhor da Economia e Sociedade Digital em Portugal nas suas mais diversas vertentes. Atualmente, é composto por 20 categorias que premeiam os projetos, ideias e instituições portuguesas mais inovadoras na transformação digital. São ainda entregues 3 Prémios para Categorias Especiais extra-concurso.

Conheça todos os vencedores.

Grave sites antes que desapareçam com a ferramenta Browsertrix Crawler

Última atualização em 19 de Setembro de 2024 às 14:08

O mês de setembro marca o início de um ano de trabalho e também o fim de muitos sites que se perdem sem remédio. Remodelados ou desligados sem se ter feito uma boa cópia dos seus conteúdos, é assim que se perdem muitos sites sem necessidade.

Há ferramentas que permitem a gravação imediata dos sites pelas próprias organizações que os gerem. Além disso, há o serviço arquivo a-pedido em alta qualidade que o Arquivo.pt presta a entidades parceiras ou no contexto de colaborações pontuais.

Neste artigo pretende-se destacar o Browsertrix Crawler que é utilizado pelo Arquivo.pt, sem excluir outras ferramentas, e que pode ser útil aos gestores de informação e departamentos de informática.

Uso do Browsertrix-crawler pelo Arquivo.pt para recolhas de alta qualidade

O Browsertrix Crawler é uma ferramenta que permite gravar websites inteiros e listas de páginas web de forma automática e num formato compatível com os arquivos da Web.

O Arquivo.pt utiliza o Browsertrix Crawler para fazer recolhas de alta qualidade de sites (RAQs), a pedido da comunidade. Por exemplo, quando um site está para ser desligado, quando vai sofrer uma remodelação ou, periodicamente, para manter um bom histórico de sites importantes.

Um caso ilustrativo é o site da Câmara Municipal de Almada, gravado em abril de 2021, a pedido do Arquivo Municipal. Outro caso é o site do jornal  Notícias de Leiria que foi gravado antes do seu encerramento, em dezembro de 2023.

Os pedidos de recolha de alta qualidade (RAQs) ao Arquivo.pt são cada vez vez mais frequentes: 77 pedidos, de janeiro a setembro de 2024. É sinal  de que há uma maior preocupação com a preservação dos conteúdos Web.

O que é preciso para usar locamente o Browsertrix-crawler

O grupo que o desenvolveu o Browsertrix Crawler, o Webrecorder.net  liderado por Ilya Kreymer, tem como mote “web archiving for all”.  As suas ferramentas permitem a gravação da Internet de forma descentralizada e em pequena escala.

O Browsertrix Crawler está disponível e pode ser instalado no próprio computador para pequenas recolhas.

A versão linha de comandos aqui recomendada é a mesma que o Arquivo.pt está a utilizar.

Pela experiência da equipa do Arquivo.pt, pode dizer-se que usar o Browsertrix Crawler é fácil em equipas multidisciplinares, onde há sempre alguém com conhecimentos mínimos para usar comandos Linux e dar algum apoio pontual.

Demonstração de gravação de sites inteiros no próprio computador

Neste vídeo apresenta-se um caso de utilização do Browsertrix Crawler num simples computador de secretária. É útil para quem quer aprofundar conhecimentos e práticas de gravação de sites em ambiente local e destina-se a não especialistas.

Outras ferramenta utilizadas pelo Arquivo.pt para gravar conteúdos

Brozzler: ferramenta para uma melhorar o histórico dos sites de recolha diária e mensal

O Brozzler é uma ferramenta semelhante ao Browsertrix Crawler, pois também baseia a sua gravação num browser. É utilizado e mantido pelo Internet Archive.

O Arquivo.pt utiliza o Brozzler, pelo menos desde 2018, para gravar páginas web com conteúdos interativos presentes nas páginas web e para recolhas de alta qualidade (RAQs).

Listas até 200 sites são gravadas com sucesso pelo Brozzler. Por exemplo, os 125 sites de recolha diária (FAWPs) são gravados com o Brozzler no início de cada mês. Ao longo do mês, outros 75 sites de recolha mensal (MAWPs) são gravados usando o Brozzler.

No final de 2023, o Arquivo.pt comparou o Brozzler e o Browsertrix Crawler e optou por manter estas duas ferramentas.

Heritrix, pywb e ArchiveWeb.page: ferramentas para milhares de sites ou para uma página

O Heritrix crawler é a principal ferramenta de gravação do Arquivo.pt. É utilizado em enormes listas de websites, como por exemplo os sites do domínio .PT a que se juntam outros sites portugueses, ultrapassando meio milhão de endereços.

No lado oposto, está a extensão ArchiveWeb.page que o Arquivo.pt utiliza para pequenas gravações página a página e também para a formação Arquivar a Web: faça-você-mesmo!.

Para completar a lista de ferramentas de gravação utilizadas pelo Arquivo.pt, deve referir-se o pywb que entra em ação, por exemplo, quando um utilizador do Arquivo.pt usa a funcionalidade “Completar a página” ou o serviço de gravação na hora SavePageNow.

Eleições de 2024 em Portugal tiveram recolhas especiais no Arquivo.pt

Eleicões Europeias

Última atualização em 9 de Outubro de 2024 às 17:33

O Arquivo.pt fez recolhas especiais sobre as três eleições que se realizaram este ano: as Legislativas de 10 de março, as eleições na Madeira de 26 de maio e as Europeias de 9 de junho.

Foram identificadas mais de 70 mil páginas com conteúdos relacionados com as eleições e a vida política em Portugal e na Europa e recolhidos cerca de 4 Terabytes de informação.

Agradece-se às pessoas que contribuiram com a seleção de endereços. Desafia-se os professores e estudantes a fazerem trabalhos que utilizem as coleções especiais sobre as eleições que o Arquivo.pt tem feito ao longo dos anos.

Saiba mais detalhes sobre o procedimento da recolha e sobre os resultados obtidos.

Eleições Legislativas 2024

As Eleições Legislativas tiveram lugar no dia 10 de março de 2024 para eleger os membros da Assembleia da República para a 16.ª Legislatura da Terceira República Portuguesa.

Destacamos nesta recolha o contributo da comunidade com uma seleção manual de 827 páginas, o que contribuiu para melhorar a qualidade da coleção.

Utilizou-se cerca de 500 termos compostos ou palavras-chave para procurar conteúdos publicados na Web acerca das eleições. O serviço utilizado para pesquisa automática foi o Bing Search API. Os resultados foram limitados ao top 20.

Por exemplo, o termo composto “frente-a-frente legislativas 2024″ encontrou páginas relativas aos debates entre candidatos. O termo “habitação legislativas 2024″ obteve páginas relativas às propostas partidárias para a habitação. O termo “legislativas 2024 site:expresso.pt” identificou páginas do Expresso sobre as eleições. Foram utilizados também os nomes dos candidatos.

Após as eleições foram usados termos de pesquisa próprios para esse período, tais como “vitória legislativas 2024”, “derrota legislativas 2024” ou “resultados legislativas 2024”, entre outros.

A pesquisa automática no Bing Search API resultou em 34.120 endereços obtidos antes das eleições e em 5.803 após as eleições.

Os sites dos partidos políticos, incluindo os partidos sem assento parlamentar, também foram recolhidos durante o período eleitoral.

Nem todos os conteúdos identificados puderam ser efetivamente gravados, devido às limitações das ferramentas de gravação e às restrições dos próprios sites.

Para a gravação foram utilizadas as ferramentas Heritrix, Brozzler e Browsertrix-cloud (versão beta) cortesia do Webrecorder.net.

A gravação realizou-se entre 6 e 20 de março e resultou em 3.2 Terabytes de informação. Os conteúdos foram incluídos na coleção espeacial EAWP45 e estarão disponíveis passado 1 ano.

Para saber mais, consulte o conjunto de dados:

Eleições para a Assembleia Legislativa da Madeira 2024

As Eleições para a Assembleia Legislativa da Madeira realizaram-se a 26 de maio. O Arquivo.pt fez uma recolha especial de conteúdos publicados na Web.

Começou-se por fazer uma pesquisa automática por notícias, páginas eleitorais e websites relacionados com as eleições na Madeira. Utilizou-se uma lista termos de pesquisa para colocar no Bing Search API.

Pretendeu-se obter o maior número possível endereços de páginas (URLs) relacionados com o evento ou tema em causa, ou seja, as eleições madeirenses. Para isso definiu-se vários limites para os resultados: top 10, top 20, top 50 e top 100. Deixou-se documentado esse processo, o qual mostra que quanto mais alargamos o número de resultados maior é o número de páginas pouco relevantes e por vezes fora do alvo pretendido.

A totalidade dos endereços (12.656) foi colocada a gravar no dia 7 de junho no Heritrix crawler.

Saiba mais consultando o conjunto de dados:

Eleições Europeias 2024 em recolha multilingue

As Eleições Europeias realizaram-se a 9 de junho em Portugal. Em alguns países, como por exemplo, a Estónia, a Chéquia ou a Itália as eleições foram em outras datas.

O Arquivo.pt recolheu páginas relativas às Eleições Europeias nos 27 países da União Europeia e nas 24 línguas oficiais.

Para isso seguiu-se a mesma metodologia usada para a coleção acerca das Eleições Europeias de 2019, ou seja, uma pesquisa multilingue e semiautomática.

Utilizou-se uma lista de 40 termos compostos que foram traduzidos para as 24 línguas oficiais da UE. A tradução dos termos para as diversas línguas foi feita em 2019 pelo pelo EU Publications Office. Dessa colaboração resultou uma lista multilingue com 960 de termos para colocar no Bing Search API.

Antes das eleições, a 3 de junho, foi realizada a primeira pesquisa da qual resultaram 8.986 endereços únicos, com o número de resultado limitado ao top 20.

Depois das eleições, adicionou-se novos termos de pesquisa com os nomes dos principais candidadatos ao Parlamento Europeu em cada país da União Europeia. Desta segunda pesquisa pós-eleitoral foram obtidos 15.371 endereços únicos.

A ferramenta utilizada para esta recolha foi o Heritrix. A recolha foi limitada a três “saltos” (“hops”). O crawler seguiu ligações, neste caso, até três vezes. Quer isto dizer que se optou por uma certa contenção na profundidade da gravação. Três “saltos” ou “hops” no Heritrix crawler é o suficiente para a recolha de uma página (em outras aplicações também denominada por gravação “page” ou “single page”).

Os conteúdos foram gravados entre 7 e 20 de junho e incluídos na recolha especial EAWP46. Estará disponível passado 1 ano.

Saiba mais consultando o conjunto de dados:

Saiba mais sobre as recolhas eleitorais de anos anteriores

Portugueses nos Jogos Olímpicos e Paralímpicos 2024 em coleção internacional de websites do IIPC

print-replay-comiteolimpicoportugal

Última atualização em 11 de Setembro de 2024 às 16:40

print-noticia-rtp-rececao-atletas-paralimpicos-paris-2021
Jogos Paralímpicos. Miguel Monteiro, medalha de ouro, regressa a Lisboa (Notícia no site da RTP, dia 2 de setembro, selecionada para coleção internacional)

O Arquivo.pt contribuiu para a coleção internacional de páginas Web sobre os Jogos Olímpicos, que decorreram em Paris de 26 de julho a 11 de agosto de 2024, e os Jogos Paralímpicos que se realizaram de 28 de agosto a 8 de setembro.

A iniciativa de criar a coleção “Jogos Olímpicos e Paralímpicos 2024” é da responsabilidade do International Internet Preservation Consortium (IIPC), a principal entidade mundial no domínio da preservação da Internet, através do seu grupo de trabalho Content Development Working Group.

As coleções colaborativas do IIPC têm por objetivo promover a criação de coleções temáticas e coleções baseadas em eventos internacionais. As páginas da Web são gravadas e depois disponibilizadas no serviço Archive-it.

No Arquivo.pt também ficarão disponíveis, passado um ano, as páginas desta coleção para quem quiser realizar estudos sobre desporto e olimpismo.

Como foram selecionadas as páginas sobre os atletas portugueses

Nos Jogos Olímpícos representaram Portugal 73 atletas em 15 modalidades, e nos Jogos Paralímpicos 27 atletas,  em 10 modalidades.

O critério de seleção de páginas para a coleção internacional foram notícias sobre os atletas. Para cada atleta selecionou-se páginas referentes às suas expectativas antes dos jogos, à sua prestação na prova e aos seus comentários durante e após a competição.

Há atletas que têm mais notícias selecionadas do que outros e o mesmo acontece com os sites de onde provêm as notícias. A seleção de páginas não se limitou aos primeiros resultados apresentados pelo motor de busca. Procurou-se variedade de canais e notícias de sites regionais e locais, alguns da região ou cidade de onde vieram os atletas.

Mais de 500 páginas para recordar a presença portuguesa em Paris

O contributo do Arquivo.pt, como poderá ver na tabela, já tem mais de 500 paginas Web.

print-tabela-seeds-ilustrativa-jogosolimpicos
Portuguese Seeds – 2024 Summer Olympics and Paralímpics, International Internet Preservation Consortium – Content Development Working Group (IIPC CDG)

Colabore na coleção através do formulário do IIPC

Helena Byrne, curadora dos arquivos da web na British Library e curadora principal desta coleção, convida todas a pessoas a enviarem páginas interessantes para gravar: And we’re off – Get Involved in Web Archiving the Summer Games – Paris 2024.

Para contribuir está disponível o seguinte formulário público:

2024 Summer Olympics & Paralympics

Instituto Politécnico de Lisboa promoveu ciclo de webinars com o Arquivo.pt

thumbnail-ciclo-de-webinars-ipl

O Instituto Politécnico de Lisboa (IPL), através do Grupo de Ensino à Distância (EaD@IPL), promoveu um ciclo de webinars para a sua comunidade dedicado ao Arquivo.pt e à preservação dos conteúdos publicados na Internet.

Esta iniciativa teve a participação de docentes e investigadores do IPL, bem como pessoas ligadas à comunicação da mesma instituição.

O ciclo de webinars realizou-se em três sessões, entre maio e julho de 2024, e seguiu o programa de formação que o Arquivo.pt disponibiliza há vários anos.

Materiais das apresentações

  • 1º webinar – Arquivo.pt: uma nova ferramenta para pesquisar o passado. Bem publicar, para bem preservar. 5 de junho.
  • 2º webinar – Acesso e processamento automático de informação preservada da Web através de APIs. 19 de julho.
  • 3º webinar – Arquivar a Web: faça-você-mesmo!. 3 de julho

Porque é importante fazer ações de formação acerca da preservação da Web

Arquivar conteúdos publicados na web e usar um arquivo da Web no dia-a-dia é uma prática pouco habitual, em grande parte devido ao desconhecimento por parte da comunidade da existência e do funcionamento do Arquivo.pt.

As sessões de formação do Arquivo.pt são um espaço de motivação para que as pessoas e as instituições passem a cuidar melhor dos seus websites e dos conteúdos que publicam na Web.

Por exemplo, neste ciclo de webinars com o IPL foram dadas ferramentas que permitem aos participantes uma utilização imediata e criativa do arquivo da Web, tais como o serviço de gravação na hora SavePageNow, o serviço de pesquisa de conteúdos históricos e, para uso em equipas interdisciplinares, as Application Programming Interfaces (APIs).

Como resultado deste ciclo de webinars reforçou-se a colaboração entre o Instituto Politécnico de Lisboa e o Arquivo.pt, tendo em vista a preservação dos seus sítios web institucionais e de outros conteúdos de interesse que estão em diversos meios on-line (notícias, eventos, referências a docentes investigadores e alunos).

Conheça os vencedores do Prémio Arquivo.pt 2024!

thumbnail-video-vencedores

Última atualização em 26 de Setembro de 2024 às 18:12

Os vencedores do Prémio Arquivo.pt 2024 foram anunciados pelo Jornal Público, parceiro oficial de comunicação desta edição.

Foram recebidos 27 trabalhos candidatos.

A cerimónia de entrega de prémios decorreu na sessão de encerramento do Encontro Ciência, a 5 de julho, na Alfândega do Porto.

1º classificado – “Noticioso – Desafiar percepções”

O vencedor do prémio no valor de 10 000 euros foi o trabalho “Noticioso – Desafiar percepções” desenvolvido por Carmen Fonseca e António Ramiro (Equipa Cubbo).

“Noticioso” é uma plataforma em que o utilizador pode comparar a cobertura mediática sobre diversos temas através de um jogo (Quiz). Permite ainda explorar tendências ao longo do tempo através de uma ferramenta analítica. Acha que conhece bem as notícias portuguesas? Venha descobrir.

Por exemplo, qual o tópico com mais notícias entre 2000 e 2020: Aquecimento global ou Sporting? Os dados do Arquivo.pt dizem que foi o Sporting.

2º classificado – “Habitação.NET: Uma visão do Mercado de Habitação em Portugal”

O 2º prémio no valor de 3 000 euros foi atribuído ao trabalho “Habitação.NET: Uma visão do Mercado de Habitação em Portugal”, da autoria de Diogo Gonçalves.

“Habitação.NET: Uma visão do Mercado de Habitação em Portugal” é uma ferramenta que permite ao utilizador explorar, de forma interativa, a evolução do valor médio do mercado habitacional e arrendatário português, contextualizado com notícias publicadas sobre o tema e as políticas de habitação.

Por exemplo, no ano 2009, em Lisboa o preço é cerca de 1600 €/m2, tendo subido para 4800 €/m2  em 2023. A subida de preços na habitação é contextualizados por notícias ao longo do tempo.

3º classificado – “Pegada Lusa”

O 3º classificado recebeu um prémio no valor de 2 000 euros e foi atribuído ao trabalho “Pegada Lusa”, desenvolvido por Diana Costa e Sérgio Teixeira.

“Pegada Lusa” é um trabalho que mostra a evolução das políticas e iniciativas sustentáveis nas diversas regiões do país, a partir da análise  dos projetos e boas práticas dos Objetivos de Desenvolvimento Sustentável (ODS).

Por exemplo, a região do Porto tem um índice de sustentabilidade (“Green Score”) de 57%, baseado no teor das notícias analisadas.

Menção Honrosa do Público: “Uma viagem no tempo com o Público e o Expresso”

O jornal Público, parceiro oficial da 7ª edição do Prémio Arquivo.pt, atribuiu a sua Menção Honrosa ao trabalho “Uma viagem no tempo com o Público e o Expresso“, realizado por Rita Marques Costa e Beatriz Malveiro.

Uma viagem no tempo com o Público e o Expresso” analisa e compara as páginas web do Público e o Expresso, desde 1998, mostrando ao utilizador do website como evoluíram as versões digitais destes meios.

Por exemplo, em 2014, tanto o Público como o Expresso passam a dar maior destaque às manchetes nas suas homepages e o Expresso passa a ter edição digital diária.

Menção Honrosa AMCC – Aveiro Media Competence Center: “discordAR: a Proximidade dos Partidos na Assembleia da República”

O Aveiro Media Competence Center (AMCC), atribuiu a sua Menção Honrosa ao trabalho “discordAR: a Proximidade dos Partidos na Assembleia da República”, realizado por Miguel Salema e Sebastião Fonte.

“discordAR: a Proximidade dos Partidos na Assembleia da República” é uma App que mostra a proximidade entre partidos políticos, usando votos na Assembleia da República Portuguesa.

Por exemplo, podemos ver a percentagem de votos na mesma direção entre os Partidos no período relativo à XII Legislatura (2012 a 2015).

Menção Honrosa .PT: “ArquivoNC – arquivo web do Jornal de Notícias da Covilhã”

A Associação DNS.PT atribuiu uma Menção Honrosa ao Professor que incentivou a submissão do trabalho “ArquivoNC – o arquivo web do Jornal de Notícias da Covilhã”, promovendo assim a utilização do Arquivo.pt como ferramenta de treino e aprendizagem em contexto de aula. A autoria do trabalho é do aluno Rodrigo Dias da Silva, orientado pelo Professor Ricardo Campos, da Universidade da Beira Interior (UBI).

“ArquivoNC – o arquivo web do Jornal de Notícias da Covilhã” é um trabalho no âmbito do projeto de final de curso em Engenharia da Universidade da Beira Interior (UBI) que disponibiliza o acesso a dez anos de páginas web do jornal Notícias da Covilhã a partir das notícias preservadas pelo Arquivo.pt entre 2009 e 2019.

Cerimónia de entrega de prémios

Galeria de imagens

premio-arquivo--10
premio-arquivo--8
premio-arquivo--7
premio-arquivo--6
premio-arquivo--1
premio-arquivo--3
premio-arquivo--4
premio-arquivo--2
premio-arquivo--9
premio-arquivo--10 premio-arquivo--8 premio-arquivo--7 premio-arquivo--6 premio-arquivo--1 premio-arquivo--3 premio-arquivo--4 premio-arquivo--2 premio-arquivo--9

Vídeo da entrega

Entrevistas

Materiais de divulgação

Imprensa

Saber mais

Programa de mobilidade das Bibliotecas do Ensino Superior levou profissionais ao Arquivo.pt

FCCN_A Minha Biblioteca_24 maio 2024_2

Última atualização em 30 de Maio de 2024 às 14:02

Arquivo.pt operado pela FCCN FCT e localizado no Campus do LNEC
Arquivo.pt operado pela FCCN FCT, localizado no Campus do LNEC, na Avenida do Brasil, em Lisboa.

No dia 24 de maio, a FCCN recebeu pela primeira vez profissionais de Bibliotecas do Ensino Superior (BES) no âmbito do programa dinamizado pelo Grupo Trabalho das Bibliotecas do Ensino Superior (GT-BES) da Associação Portuguesa de Bibliotecários, Arquivistas, Documentalistas e Profissionais da Informação (BAD), A minha biblioteca é a tua biblioteca.

Trata-se de um programa de mobilidade que tem como objetivo a realização de visitas de curta duração tendo em vista a troca de experiências e o contacto, in loco e hands on, com boas práticas, fomentando a colaboração e o conhecimento das BES portuguesas entre os profissionais da área.

Serviços avançados para o conhecimento

Nesta primeira edição do programa na FCCN, foi proposto às colegas participantes (3 profissionais da Universidade de Lisboa e 1 da Universidade Católica do Porto) um percurso pelos serviços digitais de apoio às instituições do ensino superior que são operados pela FCCN- FCT

Alguns serviços são conhecidos dos profissionais da informação, como por exemplo, a B-On e o RCAAP. Outros são serviços de backoffice e, por isso,  menos visíveis, mas fundamentais para as instituições de ensino superior. Por exemplo, o Eduroam que garante o acesso à Internet, o RCTSaai para a autenticação ou o RCTS CERT para responder a incidentes de segurança.

Destaque para os serviços Arquivo.pt e NAU

No decorrer dia, estiveram em destaque o Arquivo.pt e a Plataforma NAU, dois serviços da área do conhecimento que estão disponíveis para as Instituições do Ensino Superior e também para a sociedade.

A equipa do Arquivo.pt mostrou o backoffice deste serviço de preservação da Internet em Portugal e realizou um exercício prático de gravação e integração de conteúdos no arquivo da Web.

A Plataforma NAU,  é uma plataforma de MOOCs (Massive Open Online Courses) criada com o propósito de democratizar o conhecimento, promover a literacia digital, possibilitar o ensino e formação a comunidades alargadas de utilizadores, em particular à população portuguesa e lusófona.

Mais recentemente, com a sua integração na plataforma norte-americana edx.org, também a todos os potenciais formandos falantes de língua portuguesa dispersos pelo mundo. Às participantes no programa foi explicado e exemplificado como construir cum curso MOOC na plataforma edx.

O programa incluiu, ainda, uma visita ao Data Center e ao Estúdio de televisão profissional existente na FCCN.

Visita dos participantes no programa de mobilidade das Bibliotecas do Ensino Superior ao Estúdio da FCCN
Visita dos participantes no programa de mobilidade das Bibliotecas do Ensino Superior, da BAD, ao Estúdio da FCCN.

Para saber mais

Semana de estágio Erasmus+ no Arquivo.pt de Praga a Lisboa

Visit to FCCN tv studio

Por: Marie Haškovcová and Luboš Svoboda, Webarchiv, National Library of the Czech Republic, 13 a  17 de maio de 2024.

Visita no âmbito do Erasmus+

Graças ao programa europeu Erasmus+ da UE, centrado na educação de adultos – mobilidade de pessoal, tivemos a oportunidade de passar uma semana a acompanhar o Arquivo.pt e comparar as estratégias do arquivo Web checo – Webarchiv – com as abordagens dos nossos colegas portugueses.

Em ambos os casos, trata-se de arquivos centrados em conteúdos nacionais (checos e portugueses) na Internet.

O Arquivo.pt

Enquanto o arquivo web checo faz parte da Biblioteca Nacional da República Checa, o arquivo português faz parte da FCCN, no âmbito da FCT – Fundação para a Ciência e a Tecnologia, que tem como objetivo contribuir para o desenvolvimento da ciência, da tecnologia e do conhecimento.

A FCT presta serviços de IT ao sistema de ensino superior e de Investigação português, bem como conetividade de alta velocidade à Internet. O contexto institucional de ambos os arquivos reflecte-se também nas especificidades dos seus conceitos.

A visita incluiu uma apresentação da equipa e dos espaços do campus e dos departamentos, uma apresentação das actividades de ambos os arquivos e uma discussão sobre os diferentes aspectos do nosso trabalho – ferramentas técnicas e curatoriais, tecnologias e processos, ambiente legislativo e questões éticas, armazenamento de dados, alguns serviços, actividades de investigação, perspectivas e planos futuros.

O arquivo da Web checo

O arquivo web checo foi fundado em 2000, as cópias de arquivo mais antigas datam de 2001 e tem atualmente mais de 580 TB de dados. Tal como o Arquivo.pt, recolhe conteúdos num domínio nacional com base numa lista de endereços URL obtida junto do seu fornecedor. Na sua estratégia de aquisição, complementa estas recolhas, ditas abrangentes, com recolhas temáticas e selectivas.

As colecções temáticas referem-se a um tópico ou evento específico, podem ser pontuais ou de construção contínua, e combinam recursos seleccionados manualmente e recursos extraídos automaticamente. As colecções selectivas destinam-se a ser recolhidas a longo prazo, têm registos de catalogação detalhados que fazem parte da bibliografia nacional checa e são licenciadas – as cópias de arquivo estão, portanto, disponíveis gratuitamente através do catálogo.

No âmbito das actividades de investigação em arquivos da Web, apresentámos o nosso projeto destinado a detetar as chamada web morta através da aplicação Extinct Websites e a criar uma base de dados que sirva de base para monitorizar mudanças mais amplas na web checa, bem como o projeto WACloud destinado a extrair grandes volumes de dados do arquivo da web.

Troca de conhecimentos e experiências

Entre os projectos portugueses, interessou-nos, por exemplo, o CitationSaver, e também discutimos o projeto Memorial, a recolha da Wikipédia portuguesa, e as actividades do arquivo português relacionadas com a formação sobre a preservação da Web (módulos de formação).

A reunião foi enriquecida pela discussão de colecções temáticas específicas.

  • A coleção de Net Art checa documenta a arte digital e a sua transformação no espaço em linha, proporcionando uma perspetiva histórica da arte única.
  • Outra coleção importante é a coleção “Redes sociais dos Membros do Parlamento da República Checa 2021-2025”, que preserva as comunicações e interacções em linha dos deputados checos, de valor inestimável para o estudo do marketing político e da vida política pública.
  • A coleção GitHub arquiva repositórios importantes desta popular plataforma para programadores, preservando os principais projectos de software nacionais e o seu código para as gerações futuras.
  • Por último, a coleção Crypto, NFT, Blockchain, Web3, Metaverse traça o crescimento e o impacto da tecnologia no espaço dos bens digitais. Estas colecções são recursos fundamentais para a investigação e análise da cultura, política e tecnologia digitais, e a discussão destas colecções em reuniões de arquivistas da Web contribui para o desenvolvimento de métodos de arquivo e inovação tecnológica.

Concentrámo-nos na troca de conhecimentos e experiências na identificação de endereços para gravar (seeds), na otimização do fluxo de trabalho e na partilha de dicas e aspectos técnicos.

Partilha de boas práticas

Discutimos as melhores práticas para identificar e recolher os principais recursos da Web, um passo fundamental para garantir um arquivo abrangente e representativo. Partilhámos várias estratégias para automatizar e simplificar os fluxos de trabalho, incluindo a utilização de ferramentas de raspagem da Web e filtragem avançada de conteúdos.

As conversas técnicas incluíram soluções para problemas comuns, como a recolha de páginas Web dinâmicas e a superação de restrições de acesso. A reunião constituiu uma plataforma valiosa para a partilha de métodos inovadores e para a promoção da colaboração entre peritos, promovendo o desenvolvimento de um arquivo digital eficaz e sustentável.

Erasmus+ visti to FCCN TV studio
Luboš Svoboda, curador digital, Marie Haškovcová,coordenadora do Webarchiv e Ricardo Basílio, curador digital do Arquivo.pt em visita ao Estúdio da FCCN, FCT.