Última atualização em 26 de Janeiro de 2023 às 12:22
Até dia 4 de maio, o Arquivo.pt lança o desafio de criar um trabalho baseado em informação histórica preservada da Web.
Nesta 6ª edição do Prémio Arquivo.pt serão atribuídos 15 000 € aos três melhores trabalhos (1º classificado: 10 000 €).
Podem concorrer trabalhos realizados individualmente ou em grupo sobre qualquer tema, desde que o Arquivo.pt seja a fonte principal de informação.
O Jornal Público atribuirá uma Menção Honrosa para os trabalhos realizados com base nos conteúdos do Público online guardados no Arquivo.pt.
O Aveiro Media Competence Center (AMCC) atribuirá também uma Menção Honrosa a um dos trabalhos submetidos que se foque no arquivos da versão online de jornais centenários.
Última atualização em 13 de Dezembro de 2022 às 12:41
A Exame Informática, revista especializada em Tecnologias da Informação e Comunicação, atribuiu ao Arquivo.pt o prémio de melhor serviço digital do ano.
Daniel Gomes, gestor do Arquivo.pt, dedicou o Prémio às diversas equipas que trabalharam no Arquivo.pt ao longo dos anos. No mês em que o Arquivo.pt assinalou 15 anos de existência, esta distinção é um excelente presente de aniversário, concluiu.
Última atualização em 14 de Novembro de 2022 às 16:25
No dia 8 de novembro de 2007, foi criado oficialmente o Arquivo da Web Portuguesa sendo posteriormente denominado Arquivo.pt.
Para celebrar esta data, a Wikimédia Portugal e o Arquivo.pt associaram-se na organização de um evento online dedicado à preservação do património digital.
Agenda
Introdução – André Barbosa, Wikimédia Portugal (Vídeo)
15 anos de Arquivo.pt – Daniel Gomes, Arquivo.pt (Slides, Vídeo)
Wikimedia na Universidade: Exploração e Projetos na NOVA FCSH – Rute Correia, Residência WMPT na NOVA FCSH, (Slides;Vídeo)
GLAM Wiki. Uma introdução geral – Giovanna Fontenelle, Fundação Wikimédia, Brasil (Slides;Vídeo)
Demo dos recursos em acesso livre no Arquivo.pt – Daniel Gomes (Vídeo)
No dia 15 de agosto de 2021 o palácio presidencial em Cabul foi tomado pelos Talibãs, consumando a queda do regime que vigorava há 20 anos, após os atentados do 11 de Setembro nos Estados Unidos.
Não há tempo a perder quando se trata de preservar a Web
O Arquivo.pt reagiu rapidamente lançando uma pesquisa automática de conteúdos focada em sites do domínio .af e em notícias dos media internacionais sobre os eventos em curso.
No dia 17 de agosto os websites começaram a ser gravados.
Foram utilizados 1800 endereços de sites do Afeganistão (terminados em .af) e 500 notícias dos meios de comunicação social de todo o mundo.
Os endereços, URLs ou “seeds” foram obtidos através de pesquisa automática, utilizando o Bing Search API, e colocados imediatamente em gravação.
Conteúdos disponíveis para conhecer a história do Afeganistão
Como resultado da recolha realizada passaram a estar disponíveis no Arquivo.pt mais de 400 Gigabytes de informação que qualquer pessoa pode utilizar para investigação nas mais diversas áreas.
O principal contributo do Arquivo.pt para a comunidade dos arquivistas da Web foi a demonstração da pesquisa automática que permite uma reação rápida na gravação de conteúdos Web em risco iminente de se perderem.
Uma delas foi o tutorial “Sumarização de narrativas acerca de eventos do passado documentados na web utilizando Python: o caso do Arquivo.pt” desenvolvido por Daniel Gomes e Ricardo Campos.
Todos os recursos criados estão disponíveis gratuitamente em acesso aberto.
Recursos de acesso aberto do tutorial “Sumarização de narrativas acerca de eventos do passado documentados na web utilizando Python: o caso do Arquivo.pt”
Projeto Colab que permite editar e executar diretamente os exemplos de código do tutorial (Português, English)
Vídeo apresentado em 5 de maio de 2022 como parte dos webinars e tutoriais do Programming Historian “Computational analysis skills for large-scale humanities data”
Desde 2008, o mercado de criptomoedas revolucionou o mundo inovando e expandindo para outras áreas (por exemplo, finanças e arte). No entanto, com essa rápida expansão, muitos projetos são criados todos os dias, dando origem a uma ampla e variada gama de sites, tecnologias e fraudes. Os mercados seguem fases de financiamento e é durante uma fase inicial de euforia que mais projetos são criados.
Acreditamos que, à medida que o mercado de criptomoedas se estabiliza, projetos/sites vão desaparecendo porque o financiamento diminui ou acaba.
O Arquivo.pt iniciou uma nova coleção de arquivos web que preserva o conteúdo web que documenta as atividades de Criptomoedas.
Este trabalho produziu um novo conjunto de dados aberto com informação documentando cada projeto de criptomoeda, incluindo os seus URLs originais e links para a versão arquivada na web correspondente no Arquivo.pt. As fontes de informação selecionadas para criar este conjunto de dados foram:
Acreditamos que ao criar este novo conjunto de dados relacionado com criptomoedas e ao preservar todo o conteúdo web correspondente, tem potencial para originar contribuições científicas inovadoras em diversas áreas como Economia ou Humanidades Digitais.
Os investigadores que pretendam realizar estudos sobre o conjunto de dados de Criptomoedas e necessitem de acesso antecipado aos conteúdos recolhidos podem contactar o Arquivo.pt.
Apresentação no IIPC Web Archiving Conference 2022
Última atualização em 28 de Abril de 2023 às 15:42
Os vencedores do Prémio Arquivo.pt 2022 foram anunciados pelo Jornal Público no dia 22 de julho de 2022, parceiro oficial de comunicação desta edição, que atribuiu uma menção honrosa ao melhor trabalho baseado nos conteúdos do jornal.
O vencedor do prémio no valor de 10 000 euros foi o trabalho “Arquivo do Parlamento” desenvolvido por Tiago Santos.
“Arquivo do Parlamento” é uma aplicação Web que agrega notícias e artigos de opinião extraídos do Arquivo.pt com base nos dados abertos do Parlamento.pt.
Por exemplo, um utilizador pode pesquisar sobre uma personalidade política e obtém discursos, notícias e outras publicações que o Arquivo.pt preservou.
Este trabalho desenvolveu uma metodologia para a classificação automática de artigos estigmatizantes de doenças mentais, presentes em jornais de notícias portugueses online, através de Inteligência Artificial.
Por exemplo, uma notícia que utiliza o termo esquizofrenia associado a uma notícia sobre vida política é classificada como estigmatizante. Utilizando processos automáticos este trabalho permite identificar milhares de notícias e chamar a atenção dos media e da sociedade para a estigmatização de doenças mentais.
O 3º classificado recebeu um prémio no valor de 2 000 euros e foi atribuído ao trabalho “Arquivo Público”, desenvolvido por Diogo Correia e Ricardo Campos.
“Arquivo Público” é uma aplicação Web focada nos conteúdos publicados no sítio Web do Jornal Público ao longo do tempo e preservados pelo Arquivo.pt.
Como resultado, temos uma interface Web que permite a visualização de notícias arquivadas sobre um determinado assunto e ainda a representação do número de notícias, termos mais frequentes e referência geográfica.
O jornal Público, parceiro oficial da 5ª edição do Prémio Arquivo.pt, atribuiu a sua Menção Honrosa ao trabalho “Arquivo Público”, realizado por Diogo Correia e Ricardo Campos.
Cerimónia de entrega
A cerimónia de entrega de prémios decorreu na sessão comemorativa do Dia Nacional da Cultura Científica, no dia 24 de novembro de 2022, no Teatro Thalia, em Lisboa.
Os prémios foram entregues pela Ministra da Ciência, Tecnologia e Ensino Superior, Elvira Fortunato, pela Presidente do Conselho Diretivo da FCT, Madalena Alves e pela representante do media partner, a editora de Ciência do jornal Público, Teresa Firmino.
Galeria de imagens
Créditos das fotos: Pedro Ferreira – FCT | FCCN | Arquivo.pt
Última atualização em 29 de Julho de 2022 às 12:34
Encontro com a comunidade dos arquivos da Web
O Internacional Internet Preservation Consortium (IIPC), consórcio que reune inicitivas de preservação da Web de todo o mundo, realizou a Assembleia Geral com os seus associados entre os dias 17 e 19 de maio de 2022.
Na semana seguinte, nos dias 24 e 25 de maio, realizou-se a IIPC Web Archiving Conference (IIPC WAC), via online tal como no ano anterior devido às contingências da pandemia da Covid-19.
Recursos e iniciativas do Arquivo.pt na Web Archiving Conference
A IIPC Web Archiving Conference (IIPC WAC) é uma iniciativa aberta à comunidade, onde podem participar pessoas ou entidades não associodas ao IIPC e interessadas no domínio da preservação da Web.
O Arquivo.pt contribuiu em duas sessões Ligthtning Talks (sessão 5 e sessão 13).
As apresentações do Arquivo.pt centraram-se nos recursos e iniciativas que este serviço tem ultimamente oferecido à comunidade.
Exhibiting Web memories from Arquivo.pt with free tools (resumo, slides, vídeo)
A Rede Portuguesa de Museus é a comunidade convidada a participar no ciclo de três webinars intitulado “Património cultural da Web: presença online dos museus”.
Pretende-se sensibilizar os responsáveis e os profissionais dos museus para a importância da preservação dos conteúdos publicados na Web e dar conhecer o Arquivo.pt.
Esta iniciativa é promovida pela Direção Geral do Património Cultural, através do Departamento de Museus, Conservação e Credenciação e da Divisão de Museus e Credenciação, que acolheu e integrou na sua oferta formativa a proposta do Arquivo.pt (FCT, I.P.).
Informação e materiais
21 de junho de 2022 – O Arquivo.pt e a preservação da memória digital (1º webinar)
Nesta sessão, apresenta-se o Arquivo.pt destacando a sua utilidade para os museus, uma vez que este serviço tem por missão a preservação do património cultural digital, especificamente conteúdos Web.
Orador: Ricardo Basílio, curador digital (em subsituição de Daniel Gomes, gestor do Arquivo.pt)
27 de junho de 2022 – Arquivar a Web: faça-você-mesmo! (3º Webinar)
Esta sessão oferece um tutorial para a criação de um arquivo da Web local, gravando os conteúdos num formato normalizado e servindo-se de ferramentas abertas que qualquer pessoa não especializada em tecnologia pode utilizar.
O Arquivo Municipal da Câmara Municipal de Sines e o Arquivo.pt assinalaram o Dia Internacional dos Arquivos, 9 de junho, no Salão Nobre dos Paços do Concelho, com uma Oficina de preservação da memória digital de Sines.
O encontro foi transmitido online com o objetivo de partilhar com a comunidade dos arquivistas o que tem sido uma experiência de curadoria colaborativa dos conteúdos da Web.
Colaboração entre um arquivo municipal e um arquivo da Web
Este encontro deu-se na continuidade de uma colaboração entre as duas equipas, desenvolvida durante o período da pandemia.
O Arquivo Municipal de Sines fez uma recolha seletiva e sistemática de conteúdos Web relacionados com o Concelho de Sines, com a colaboração de meios de comunicação local, como por exemplo a Rádio Miróbriga e a Rádio Sines.
Por sua vez, o Arquivo.pt contribuiu com formação sobre as ferramentas de gravação da Web em formato normalizado (Webrecorder.net) e preparou serviços úteis, como por exemplo o SavePageNow que permite gravar páginas na hora diretamente no Arquivo.pt.
A memória local ficou mais rica com páginas Web preservadas
Desta colaboração resultou a preservação de milhares de páginas Web (cerca de 200 Gigabytes de informação) acerca da vivência da pandemia na área geográfica de Sines e de Santiago do Cacém.
As cópias dos ficheiros de arquivo da Web (WARCs) enviadas ao Arquivo.pt foram integradas para ficarem disponíveis.