Apresentações acerca do Arquivo.pt nas Jornadas FCCN 2023

thumbnail jornadas FCCN 2023

Última atualização em 25 de Setembro de 2023 às 14:37

As inscrições para as Jornadas de Computação Científica 2023, que decorreram na Escola Naval em Almada de 27 a 29 de junho de 2023!

Este evento é um encontro para partilha de conhecimento entre as entidades que compõem a comunidade de ensino superior e de investigação nacionais.

O evento conta com a participação de decisores das instituições, responsáveis por serviços técnicos de informática e responsáveis por bibliotecas e serviços de documentação, entre outros.

O Arquivo.pt apresentou duas sessões de 90 minutos, no dia 28 de junho das 14h30 às 18h00, sob o tema “Serviços Arquivo.pt para gerir citações e cibersegurança”.

Agenda da sessões Arquivo.pt

28 de junho 14h30-16h00: Arquivo.pt – serviços disponíveis e arquitetura de sistema

28 de junho 16h30-18h00: Arquivo.pt – uma ferramenta para gerir citações e cibersegurança

Memorial do Arquivo.pt

Museu Virtual do Turismo criou coleção de Websites preservados

Coleção registos no Catálogo do MUVITUR com páginas Web preservadas no Arquivo.pt

Última atualização em 25 de Abril de 2023 às 20:14

O MUVITUR, Museu Virtual do Turismo, é um portal agregador de conteúdos digitais sobre o Turismo em Portugal.

A plataforma é mantida pela Biblioteca Celestino Domingues da Escola Superior de Hotelaria e Turismo do Estoril (ESHTE) e tem a participação de instituições de diversas áreas do património que são provedoras de conteúdos.

Entre os conteúdos digitalizados que podem ser consultados no catálogo e acedidos nas instituições provedoras encontravam-se som, imagem, fotografia, material impresso digitalizado. Contudo, faltavam os Websites.

Assim, surgiu a ideia da nova coleção “Páginas Web” do MUVITUR.

Colaboração entre o MUVITUR e o Arquivo.pt

Em 2019, iniciou-se uma colaboração entre o Arquivo.pt e o MUVITUR com o objetivo de identificar sites relacionados com o Turismo em Portugal e de divulgar o histórico de conteúdos publicados na Web, desde 1996.

Em 2022, estabeleceu-se uma lista com cerca de 400 registos de websites de diversas entidades ligadas ao Turismo, hotéis, agências de viagens, páginas dos sites dos municípios com informação turística e outras.

Dessa informação reunida resultou a primeira coleção de websites preservados sobre Turismo em Portugal.

Catálogo do MUVITUR com páginas Web preservadas no Arquivo.pt

Como foi feita a integração

O MUVITUR utiliza o software Nyron, o qual permite agregar conteúdos de diversas proveniências através do protocolo interoperabilidade OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting), cuja utilização é muito comum entre bibliotecas, arquivos e museus para fornecer conteúdos a portais, como por exemplo o Europeana.

O Arquivo.pt, porém, não disponibiliza informação através do OAI-PMH, pelo que foi necessário encontrar uma forma alternativa de criar um registo no Nyron com informação descritiva de Websites preservados.

O procedimento para a integração foi o seguinte:

  • Exportou-se para uma folha Excel o esquema XML com os campos para os metadados, de acordo com o que funciona no Nyron;
  • A informação foi inserida manualmente na folha Excel, respeitando o formato e a sintaxe, em colaboração com os técnicos responsáveis pelo sistema;
  • O ficheiro XML com os dados inseridos foi validado e importado para o Nyron.

A criação de registos em catálogos é em grande parte manual e exige uma curadoria humana. No entanto, foi possível introduzir informação para ser processada automaticamente nos registos da coleção de Websites. Por exemplo, a miniatura (thumbnail) foi obtida utilizando a API do Arquivo.pt, mais espeicificamento o linkToScreenShot, visível nos detalhes técnicos de uma página preservada (ver em Opções).

Para outros elementos, tais como o título do site, seria possível obtê-los automaticamente através da API do Arquivo.pt, no entanto a qualidade da informação depende do que os produtores do site inseriram e pode não ser a melhor.  As datas para limitar o âmbito temporal também podem ser obtidas de forma automática. Privilegiou-se o método manual para controlar a informação apresentada.

Na continuidade do projeto, a coleção vai ser aumentada com novos registos, pois existem milhares de sites sobre o setor do Turismo.

Descrição de conteúdos Web no catálogo do MUVITUR

Na coleção “Paginas Web” são utilizados os seguintes dados:

  • Denominação – geralmente o título do website
  • Organização – a entidade a quem pertence a publicação
  • Endereço do sítio Web na Internet
  • Endereço para versão no Arquivo.pt
  • Momento(s) para recordar
  • Link para miniatura no Arquivo.pt
  • Descritores
  • Dados geográficos (localização, coordenadas, nome geográfico)

A apresentação da informação foi ajustada para ficar alinhada com a de outros recursos do MUVITUR e contém ligações para o Arquivo.pt.

Por exemplo, no registo do site “Turismo do Algarve”, encontramos uma ligação para um momento a recordar em 2011 e outra a ligação para o histórico no Arquivo.pt em “Consultar objeto”.

Detalhe do registo do site "Turismo do Algarve"
Detalhe do registo do site “Turismo do Algarve”

Organizações podem criar coleções de Websites da sua área

Com este projeto inédito podemos dizer que os Websites preservados ganharam cidadania ou espaço em plataformas digitais dedicadas à memória histórica.

Os Websites raramente são incluídos em catálogos ou expostos em contexto museológico, em Portugal. Em breve, essa realidade pode mudar.

A National Library of Australia, por exemplo, tem registos de Websites preservados no catálogo. Na Tasmania Libraries o catálogo bibliográfico descreve em formato Marc21 mais de 3000 Websites preservados.  Na Library of Congress há coleções de Websites antigos ao lado dos recursos tradicionais.

O MUVITUR abriu caminho para que outras entidades criem coleções de Websites do seu interesse nas suas plataformas.

Outros resultados da colaboração

CitationSaver preserva citações para conteúdos online

Última atualização em 21 de Novembro de 2023 às 16:03

Os documentos citam conteúdos da Web referenciando os seus endereços (URL) para que o leitores possa vir a aceder-lhes.

No caso dos artigos científicos, a importância destas citações é ainda maior para manter a integridade de uma investigação porque muitas vezes referenciam informação fundamental para permitir a reprodutibilidade de uma experiência ou análise.

Por exemplo, as ligações num artigo científico podem citar os conjuntos de dados, software ou notícias da web que suportaram a investigação e que não estão incluídos no texto do artigo científico.

Para responder à necessidade de preservar a integridade dos documentos, o Arquivo.pt criou o CitationSaver.

O CitationSaver automaticamente extrai as ligações citadas num documento e preserva o seu conteúdo (ex. páginas web citadas num livro) para que possam ser recuperadas mais tarde a partir do Arquivo.pt.

infografia-citationsaver-pt

Use o CitationSaver para preservar a integridade dos seus documentos

Carregue um documento e o CitationSaver extrairá os endereços citados, gravando os seus conteúdos e disponibilizando-os no Arquivo.pt passado pouco tempo. Existem 3 métodos para carregar um documento:

  • insira o endereço (URL) do ficheiro PDF ou TXT, se este estiver publicado online
  • carregue o ficheiro em formato PDF ou TXT
  • cole o texto que contem os endereços que pretende preservar (ex. secção de Referências de um artigo ou Bibliografia de um livro)

Mais informação

Projeto Renascer traz de volta websites antigos

Última atualização em 26 de Junho de 2023 às 17:33

As organizações mantêm domínios em sua posse que referenciavam websites apesar de já não os utilizarem, para evitar que sejam comprados ou apenas por esquecimento.

O objetivo do projeto Renascer é trazer de volta websites históricos cujo conteúdo deixou de estar disponível online e cujo domínio continua a ser detido pelos seus autores.

Domínios “esquecidos” podem causar problemas de cibersegurança

Em maio de 2023, o domínio hmsportugal.pt do projeto Harvard Medical School-Portugal apontava apenas para uma página pré-definida de um servidor web ativo e o domínio continuava a ser detido pelo seu autor.

Nesta situação, o conteúdo original do website estava inacessível apesar do domínio continuar a ser detido pelo autor do website.

Além disso, uma vez que o domínio continuava a apontar para um servidor web ativo, se este não estiver a ser atualizado poderão ocorrer problemas de cibersegurança.

O domínio hmsportugal.pt poderia passar a apontar para os conteúdos do website preservados no Arquivo.pt.

Como se dá o Renascer dos websites?

O dono do domínio apenas tem de o redirecionar para o Arquivo.pt, através do serviço Memorial.

Por exemplo, o domínio mctes.pt passou a apontar para os seus conteúdos originais preservados no Arquivo.pt, fazendo assim Renascer este website.

Exemplos de domínios Renascidos

O projeto Renascer identificou domínios ativos geridos pela FCCN que não referenciavam conteúdo, e passou a dar-lhes nova vida com os conteúdos históricos preservados no Arquivo.pt.

Contacte o Arquivo.pt para fazer Renascer os websites históricos da sua organização.

Veja os seguintes exemplos de websites Renascidos:

 

 

Link curto para esta página: arquivo.pt/renascer

Formação gratuita em media digital – ciclo de webinars AMCC

thumbnail-ciclo-webinars-amcc

Última atualização em 2 de Junho de 2023 às 5:35

O Aveiro Media Competence Center (AMCC) é uma plataforma de apoio e promoção ao setor dos News Media Locais da União Europeia (UE) na implementação de projetos de transição digital. Do consórcio fazem parte o PCI Creative Science Park da Região de Aveiro, a Associação Portuguesa de Imprensa  e a Universidade de Aveiro.

O Arquivo.pt é um serviço público e gratuito que permite pesquisar e aceder a páginas da Web preservadas desde a década de 1990, como por exemplo, ver uma notícia antiga ou aceder a uma versão antiga de um website.

A colaboração entre o AMCC e o Arquivo.pt concretiza-se num programa de formação intitulado Arquivo.pt: Competências Digitais para os Media, desenvolvido em quatro webinars, e na atribuição da Menção Honrosa AMCC a trabalhos realizados sobre jornais centenários portugueses para o Prémio Arquivo.pt 2023.

Ciclo de webinars “Arquivo.pt: Competências Digitais para os Media”

O ciclo de webinars visa dotar os formandos de competências digitais que lhes permitam resolver problemas originados pelo desaparecimento de informação digital e ganhar vantagem competitiva na produção de conteúdos únicos e exclusivos.

  • Webinar 1: Arquivo.pt: uma ferramenta para pesquisar rapidamente o passado
    • Data: 24 de março de 2023 Hora: 14h00-15h30 (PT), Língua: Portuguesa
  • Webinar 2: Bem publicar para bem preservar 
    • Data: 06 de abril de 2023, Hora: 14h00-15h30 (PT), Língua: Portuguesa
  • Webinar 3: Acesso e processamento automático de informação preservada da Web através de APIs
    • Data: 04 de maio de 2023, Hora: 14h00-15h30 (PT), Língua: Portuguesa
  • Webinar 4: Arquivar a Web: faça-você-mesmo!
    • Data: 01 de junho de 2023, Hora: 14h00-15h30 (PT), Língua: Portuguesa

Prepare um trabalho e concorra ao Prémio Arquivo.pt 2023!

Última atualização em 26 de Janeiro de 2023 às 12:22

Até dia 4 de maio, o Arquivo.pt lança o desafio de criar um trabalho baseado em informação histórica preservada da Web.

Nesta 6ª edição do Prémio Arquivo.pt serão atribuídos 15 000 € aos três melhores trabalhos (1º classificado: 10 000 €).

Podem concorrer trabalhos realizados individualmente ou em grupo sobre qualquer tema, desde que o Arquivo.pt seja a fonte principal de informação.

O Jornal Público atribuirá uma Menção Honrosa para os trabalhos realizados com base nos conteúdos do Público online guardados no Arquivo.pt.

O Aveiro Media Competence Center (AMCC) atribuirá também uma Menção Honrosa a um dos trabalhos submetidos que se foque no arquivos da versão online de jornais centenários.

Todos os detalhes em: arquivo.pt/premio2023

O Prémio Arquivo.pt promove a visibilidade de quem concorre e das suas instituições.

Ajude-nos a divulgar o Prémio Arquivo.pt 2023 por potenciais candidatos!

Arquivo.pt foi o melhor serviço digital de 2022 segundo a Exame Informática

Thumbnail Selo Os Melhores & As Maiores do Portugal Tecnológico 2022

Última atualização em 13 de Dezembro de 2022 às 12:41

A Exame Informática, revista especializada em Tecnologias da Informação e Comunicação, atribuiu ao Arquivo.pt o prémio de melhor serviço digital do ano.

O prémio foi entregue durante a 16ª gala Os Melhores & As Maiores do Portugal Tecnológico, realizada no dia 29 de novembro de 2022, em Lisboa.

Daniel Gomes, gestor do Arquivo.pt, dedicou o Prémio às diversas equipas que trabalharam no Arquivo.pt ao longo dos anos. No mês em que o Arquivo.pt assinalou 15 anos de existência, esta distinção é um excelente presente de aniversário, concluiu.

Deixou ainda o convite aos presentes para descobrirem as páginas antigas da Exame Informática preservadas no Arquivo.pt.

Fotografias do evento

Selo Os Melhores & As Maiores do Portugal Tecnológico 2022
Prémio Serviço Digital. Os Melhores & As Maiores do Portugal Tecnológico 2022
Prémio Serviço Digital. Os Melhores & As Maiores do Portugal Tecnológico 2022
Prémio Serviço Digital. Os Melhores & As Maiores do Portugal Tecnológico 2022
Selo Os Melhores & As Maiores do Portugal Tecnológico 2022 Prémio Serviço Digital. Os Melhores & As Maiores do Portugal Tecnológico 2022 Prémio Serviço Digital. Os Melhores & As Maiores do Portugal Tecnológico 2022 Prémio Serviço Digital. Os Melhores & As Maiores do Portugal Tecnológico 2022

Vídeos

Cerimónia de entrega do prémio

Entrevista

Extrato do programa Exame Informática transmitido pela SIC Notícias, no dia 11 de dezembro de 2022 (foi obtido por gravação externa do ecrã).

15 anos de Arquivo.pt em encontro promovido pela Wikimedia

thumbnail_15-anos-Arquivopt-Wikimedia

Última atualização em 14 de Novembro de 2022 às 16:25

No dia 8 de novembro de 2007, foi criado oficialmente o Arquivo da Web Portuguesa sendo posteriormente denominado Arquivo.pt.

Para celebrar esta data, a Wikimédia Portugal e o Arquivo.pt associaram-se na organização de um evento online dedicado à preservação do património digital.

Agenda

  • Introdução – André Barbosa, Wikimédia Portugal (Vídeo)
  • 15 anos de Arquivo.pt – Daniel Gomes, Arquivo.pt (Slides, Vídeo)
  • Wikimedia na Universidade: Exploração e Projetos na NOVA FCSH – Rute Correia, Residência WMPT na NOVA FCSH, (Slides; Vídeo)
  • GLAM Wiki. Uma introdução geral – Giovanna Fontenelle, Fundação Wikimédia, Brasil (Slides; Vídeo)
  • Demo dos recursos em acesso livre no Arquivo.pt – Daniel Gomes (Vídeo)

Para saber mais

15-anos-Arquivopt-Wikimedia

Websites do Afeganistão e a queda do regime em agosto de 2021

thumbnail_Karima Faryabi

Última atualização em 26 de Setembro de 2022 às 15:55

afghan-ministry-of-economy-17-08-2021

Website do Ministério da Economia do Afeganistão com Karima Faryabi (gravado a 17 de agosto de 2021)

No dia 15 de agosto de 2021 o palácio presidencial em Cabul foi tomado pelos Talibãs, consumando a queda do regime que vigorava há 20 anos, após os atentados do 11 de Setembro nos Estados Unidos.

A comunidade dos arquivistas da Web, através do Content Development Working Group do International Internet Preservation Consortium, lançou o desafio da gravação dos sites afegãos, face ao risco de estes virem a desaparecer com o novo regime.

Não há tempo a perder quando se trata de preservar a Web

O Arquivo.pt reagiu rapidamente lançando uma pesquisa automática de conteúdos focada em sites do domínio .af e em notícias dos media internacionais sobre os eventos em curso.

No dia 17 de agosto os websites começaram a ser gravados.

Foram utilizados 1800 endereços de sites do Afeganistão (terminados em .af) e 500 notícias dos meios de comunicação social de todo o mundo.

Os endereços, URLs ou “seeds” foram obtidos através de pesquisa automática, utilizando o Bing Search API, e colocados imediatamente em gravação.

Conteúdos disponíveis para conhecer a história do Afeganistão

Como resultado da recolha realizada passaram a estar disponíveis no Arquivo.pt mais de 400 Gigabytes de informação que qualquer pessoa pode utilizar para investigação nas mais diversas áreas.

O principal contributo do Arquivo.pt para a comunidade dos arquivistas da Web foi a demonstração da pesquisa automática que permite uma reação rápida na gravação de conteúdos Web em risco iminente de se perderem.

Mais informação

Conjunto de dados abertos do Arquivo.pt (Dados.gov)

Conteúdos recolhidos pelo Content Development Working Group do International Internet Preservation Consortium disponíveis no serviço Archive-it

Conheça os vencedores do Prémio Arquivo.pt 2022!

thumbnail_pt_vencedores_2022

Última atualização em 28 de Abril de 2023 às 15:42

Os vencedores do Prémio Arquivo.pt 2022 foram anunciados pelo Jornal Público no dia 22 de julho de 2022, parceiro oficial de comunicação desta edição, que atribuiu uma menção honrosa ao melhor trabalho baseado nos conteúdos do jornal.

Foram recebidos 22 trabalhos candidatos.

A cerimónia de entrega de prémios decorreu na Sessão Comemorativa do Dia Mundial da Ciência: a excelência da investigação em Portugal, a 24 de novembro, no Teatro Thalia, em Lisboa.

1º classificado – “Arquivo do Parlamento”

O vencedor do prémio no valor de 10 000 euros foi o trabalho “Arquivo do Parlamento” desenvolvido por Tiago Santos.

“Arquivo do Parlamento” é uma aplicação Web que agrega notícias e artigos de opinião extraídos do Arquivo.pt com base nos dados abertos do Parlamento.pt.

Por exemplo, um utilizador pode pesquisar sobre uma personalidade política e obtém discursos, notícias e outras publicações que o Arquivo.pt preservou.

2º classificado – “Classificação automática de artigos estigmatizantes de doenças mentais”

O 2º prémio no valor de 3 000 euros foi atribuído ao trabalho “Classificação automática de artigos estigmatizantes de doenças mentais”, da autoria de Alina Yanchuk, Alina Trifan, Olga Fajarda e José Luís Oliveira.

Este trabalho desenvolveu uma metodologia para a classificação automática de artigos estigmatizantes de doenças mentais, presentes em jornais de notícias portugueses online, através de Inteligência Artificial.

Por exemplo, uma notícia que utiliza o termo esquizofrenia associado a uma notícia sobre vida política é classificada como estigmatizante. Utilizando processos automáticos este trabalho permite identificar milhares de notícias e chamar a atenção dos media e da sociedade para a estigmatização de doenças mentais.

3º classificado – “Arquivo Público”

O 3º classificado recebeu um prémio no valor de 2 000 euros e foi atribuído ao trabalho “Arquivo Público”, desenvolvido por Diogo Correia e Ricardo Campos.

“Arquivo Público” é uma aplicação Web focada nos conteúdos publicados no sítio Web do Jornal Público ao longo do tempo e preservados pelo Arquivo.pt.

Como resultado, temos uma interface Web que permite a visualização de notícias arquivadas sobre um determinado assunto e ainda a representação do número de notícias, termos mais frequentes e referência geográfica.

Menção Honrosa do Público

O jornal Público, parceiro oficial da 5ª edição do Prémio Arquivo.pt, atribuiu a sua Menção Honrosa ao trabalho “Arquivo Público”, realizado por Diogo Correia e Ricardo Campos.

Cerimónia de entrega

A cerimónia de entrega de prémios decorreu na sessão comemorativa do Dia Nacional da Cultura Científica, no dia 24 de novembro de 2022, no Teatro Thalia, em Lisboa.

Os prémios foram entregues pela Ministra da Ciência, Tecnologia e Ensino Superior, Elvira Fortunato, pela Presidente do Conselho Diretivo da FCT, Madalena Alves e pela representante do media partner, a editora de Ciência do jornal Público, Teresa Firmino.

Galeria de imagens

Ceriminónia de entrega dos prémios 2022
Ceriminónia de entrega dos prémios 2022
Ceriminónia de entrega dos prémios 2022
Ceriminónia de entrega dos prémios 2022
Ceriminónia de entrega dos prémios 2022
Ceriminónia de entrega dos prémios 2022
Ceriminónia de entrega dos prémios 2022
Ceriminónia de entrega dos prémios 2022 Ceriminónia de entrega dos prémios 2022 Ceriminónia de entrega dos prémios 2022 Ceriminónia de entrega dos prémios 2022 Ceriminónia de entrega dos prémios 2022 Ceriminónia de entrega dos prémios 2022 Ceriminónia de entrega dos prémios 2022

Créditos das fotos: Pedro Ferreira – FCT | FCCN | Arquivo.pt

Vídeo da entrega

Vídeos da entrevistas

Materiais de divulgação

Imprensa

Link curto para esta página: arquivo.pt/vencedores2022