Última atualização em 21 de Novembro de 2023 às 16:03
Os documentos citam conteúdos da Web referenciando os seus endereços (URL) para que o leitores possa vir a aceder-lhes.
No caso dos artigos científicos, a importância destas citações é ainda maior para manter a integridade de uma investigação porque muitas vezes referenciam informação fundamental para permitir a reprodutibilidade de uma experiência ou análise.
Por exemplo, as ligações num artigo científico podem citar os conjuntos de dados, software ou notícias da web que suportaram a investigação e que não estão incluídos no texto do artigo científico.
Para responder à necessidade de preservar a integridade dos documentos, o Arquivo.pt criou o CitationSaver.
O CitationSaver automaticamente extrai as ligações citadas num documento e preserva o seu conteúdo (ex. páginas web citadas num livro) para que possam ser recuperadas mais tarde a partir do Arquivo.pt.
Use o CitationSaver para preservar a integridade dos seus documentos
Carregue um documento e o CitationSaver extrairá os endereços citados, gravando os seus conteúdos e disponibilizando-os no Arquivo.pt passado pouco tempo. Existem 3 métodos para carregar um documento:
insira o endereço (URL) do ficheiro PDF ou TXT, se este estiver publicado online
carregue o ficheiro em formato PDF ou TXT
cole o texto que contem os endereços que pretende preservar (ex. secção de Referências de um artigo ou Bibliografia de um livro)
Última atualização em 26 de Junho de 2023 às 17:33
As organizações mantêm domínios em sua posse que referenciavam websites apesar de já não os utilizarem, para evitar que sejam comprados ou apenas por esquecimento.
O objetivo do projeto Renascer é trazer de volta websites históricos cujo conteúdo deixou de estar disponível online e cujo domínio continua a ser detido pelos seus autores.
Domínios “esquecidos” podem causar problemas de cibersegurança
Nesta situação, o conteúdo original do website estava inacessível apesar do domínio continuar a ser detido pelo autor do website.
Além disso, uma vez que o domínio continuava a apontar para um servidor web ativo, se este não estiver a ser atualizado poderão ocorrer problemas de cibersegurança.
O dono do domínio apenas tem de o redirecionar para o Arquivo.pt, através do serviço Memorial.
Por exemplo, o domínio mctes.pt passou a apontar para os seus conteúdos originais preservados no Arquivo.pt, fazendo assim Renascer este website.
Exemplos de domínios Renascidos
O projeto Renascer identificou domínios ativos geridos pela FCCN que não referenciavam conteúdo, e passou a dar-lhes nova vida com os conteúdos históricos preservados no Arquivo.pt.
Contacte o Arquivo.pt para fazer Renascer os websites históricos da sua organização.
Veja os seguintes exemplos de websites Renascidos:
O Arquivo.pt é um serviço público e gratuito que permite pesquisar e aceder a páginas da Web preservadas desde a década de 1990, como por exemplo, ver uma notícia antiga ou aceder a uma versão antiga de um website.
A colaboração entre o AMCC e o Arquivo.pt concretiza-se num programa de formação intitulado Arquivo.pt: Competências Digitais para os Media, desenvolvido em quatro webinars, e na atribuição da Menção Honrosa AMCC a trabalhos realizados sobre jornais centenários portugueses para o Prémio Arquivo.pt 2023.
Ciclo de webinars “Arquivo.pt: Competências Digitais para os Media”
O ciclo de webinars visa dotar os formandos de competências digitais que lhes permitam resolver problemas originados pelo desaparecimento de informação digital e ganhar vantagem competitiva na produção de conteúdos únicos e exclusivos.
Webinar 1: Arquivo.pt: uma ferramenta para pesquisar rapidamente o passado
Data: 24 de março de 2023 Hora: 14h00-15h30 (PT), Língua: Portuguesa
Última atualização em 6 de Agosto de 2024 às 17:24
Até dia 4 de maio, o Arquivo.pt lança o desafio de criar um trabalho baseado em informação histórica preservada da Web.
Nesta 6ª edição do Prémio Arquivo.pt serão atribuídos 15 000 € aos três melhores trabalhos (1º classificado: 10 000 €).
Podem concorrer trabalhos realizados individualmente ou em grupo sobre qualquer tema, desde que o Arquivo.pt seja a fonte principal de informação.
O Jornal Público atribuirá uma Menção Honrosa para os trabalhos realizados com base nos conteúdos do Público online guardados no Arquivo.pt.
O Aveiro Media Competence Center (AMCC) atribuirá também uma Menção Honrosa a um dos trabalhos submetidos que se foque no arquivos da versão online de jornais centenários.
Última atualização em 13 de Dezembro de 2022 às 12:41
A Exame Informática, revista especializada em Tecnologias da Informação e Comunicação, atribuiu ao Arquivo.pt o prémio de melhor serviço digital do ano.
Daniel Gomes, gestor do Arquivo.pt, dedicou o Prémio às diversas equipas que trabalharam no Arquivo.pt ao longo dos anos. No mês em que o Arquivo.pt assinalou 15 anos de existência, esta distinção é um excelente presente de aniversário, concluiu.
Última atualização em 14 de Novembro de 2022 às 16:25
No dia 8 de novembro de 2007, foi criado oficialmente o Arquivo da Web Portuguesa sendo posteriormente denominado Arquivo.pt.
Para celebrar esta data, a Wikimédia Portugal e o Arquivo.pt associaram-se na organização de um evento online dedicado à preservação do património digital.
Agenda
Introdução – André Barbosa, Wikimédia Portugal (Vídeo)
15 anos de Arquivo.pt – Daniel Gomes, Arquivo.pt (Slides, Vídeo)
Wikimedia na Universidade: Exploração e Projetos na NOVA FCSH – Rute Correia, Residência WMPT na NOVA FCSH, (Slides;Vídeo)
GLAM Wiki. Uma introdução geral – Giovanna Fontenelle, Fundação Wikimédia, Brasil (Slides;Vídeo)
Demo dos recursos em acesso livre no Arquivo.pt – Daniel Gomes (Vídeo)
No dia 15 de agosto de 2021 o palácio presidencial em Cabul foi tomado pelos Talibãs, consumando a queda do regime que vigorava há 20 anos, após os atentados do 11 de Setembro nos Estados Unidos.
Não há tempo a perder quando se trata de preservar a Web
O Arquivo.pt reagiu rapidamente lançando uma pesquisa automática de conteúdos focada em sites do domínio .af e em notícias dos media internacionais sobre os eventos em curso.
No dia 17 de agosto os websites começaram a ser gravados.
Foram utilizados 1800 endereços de sites do Afeganistão (terminados em .af) e 500 notícias dos meios de comunicação social de todo o mundo.
Os endereços, URLs ou “seeds” foram obtidos através de pesquisa automática, utilizando o Bing Search API, e colocados imediatamente em gravação.
Conteúdos disponíveis para conhecer a história do Afeganistão
Como resultado da recolha realizada passaram a estar disponíveis no Arquivo.pt mais de 400 Gigabytes de informação que qualquer pessoa pode utilizar para investigação nas mais diversas áreas.
O principal contributo do Arquivo.pt para a comunidade dos arquivistas da Web foi a demonstração da pesquisa automática que permite uma reação rápida na gravação de conteúdos Web em risco iminente de se perderem.
Uma delas foi o tutorial “Sumarização de narrativas acerca de eventos do passado documentados na web utilizando Python: o caso do Arquivo.pt” desenvolvido por Daniel Gomes e Ricardo Campos.
Todos os recursos criados estão disponíveis gratuitamente em acesso aberto.
Recursos de acesso aberto do tutorial “Sumarização de narrativas acerca de eventos do passado documentados na web utilizando Python: o caso do Arquivo.pt”
Projeto Colab que permite editar e executar diretamente os exemplos de código do tutorial (Português, English)
Vídeo apresentado em 5 de maio de 2022 como parte dos webinars e tutoriais do Programming Historian “Computational analysis skills for large-scale humanities data”
Desde 2008, o mercado de criptomoedas revolucionou o mundo inovando e expandindo para outras áreas (por exemplo, finanças e arte). No entanto, com essa rápida expansão, muitos projetos são criados todos os dias, dando origem a uma ampla e variada gama de sites, tecnologias e fraudes. Os mercados seguem fases de financiamento e é durante uma fase inicial de euforia que mais projetos são criados.
Acreditamos que, à medida que o mercado de criptomoedas se estabiliza, projetos/sites vão desaparecendo porque o financiamento diminui ou acaba.
O Arquivo.pt iniciou uma nova coleção de arquivos web que preserva o conteúdo web que documenta as atividades de Criptomoedas.
Este trabalho produziu um novo conjunto de dados aberto com informação documentando cada projeto de criptomoeda, incluindo os seus URLs originais e links para a versão arquivada na web correspondente no Arquivo.pt. As fontes de informação selecionadas para criar este conjunto de dados foram:
Acreditamos que ao criar este novo conjunto de dados relacionado com criptomoedas e ao preservar todo o conteúdo web correspondente, tem potencial para originar contribuições científicas inovadoras em diversas áreas como Economia ou Humanidades Digitais.
Os investigadores que pretendam realizar estudos sobre o conjunto de dados de Criptomoedas e necessitem de acesso antecipado aos conteúdos recolhidos podem contactar o Arquivo.pt.
Apresentação no IIPC Web Archiving Conference 2022
Última atualização em 6 de Agosto de 2024 às 17:24
Os vencedores do Prémio Arquivo.pt 2022 foram anunciados pelo Jornal Público no dia 22 de julho de 2022, parceiro oficial de comunicação desta edição, que atribuiu uma menção honrosa ao melhor trabalho baseado nos conteúdos do jornal.
O vencedor do prémio no valor de 10 000 euros foi o trabalho “Arquivo do Parlamento” desenvolvido por Tiago Santos.
“Arquivo do Parlamento” é uma aplicação Web que agrega notícias e artigos de opinião extraídos do Arquivo.pt com base nos dados abertos do Parlamento.pt.
Por exemplo, um utilizador pode pesquisar sobre uma personalidade política e obtém discursos, notícias e outras publicações que o Arquivo.pt preservou.
Este trabalho desenvolveu uma metodologia para a classificação automática de artigos estigmatizantes de doenças mentais, presentes em jornais de notícias portugueses online, através de Inteligência Artificial.
Por exemplo, uma notícia que utiliza o termo esquizofrenia associado a uma notícia sobre vida política é classificada como estigmatizante. Utilizando processos automáticos este trabalho permite identificar milhares de notícias e chamar a atenção dos media e da sociedade para a estigmatização de doenças mentais.
O 3º classificado recebeu um prémio no valor de 2 000 euros e foi atribuído ao trabalho “Arquivo Público”, desenvolvido por Diogo Correia e Ricardo Campos.
“Arquivo Público” é uma aplicação Web focada nos conteúdos publicados no sítio Web do Jornal Público ao longo do tempo e preservados pelo Arquivo.pt.
Como resultado, temos uma interface Web que permite a visualização de notícias arquivadas sobre um determinado assunto e ainda a representação do número de notícias, termos mais frequentes e referência geográfica.
O jornal Público, parceiro oficial da 5ª edição do Prémio Arquivo.pt, atribuiu a sua Menção Honrosa ao trabalho “Arquivo Público”, realizado por Diogo Correia e Ricardo Campos.
Cerimónia de entrega
A cerimónia de entrega de prémios decorreu na sessão comemorativa do Dia Nacional da Cultura Científica, no dia 24 de novembro de 2022, no Teatro Thalia, em Lisboa.
Os prémios foram entregues pela Ministra da Ciência, Tecnologia e Ensino Superior, Elvira Fortunato, pela Presidente do Conselho Diretivo da FCT, Madalena Alves e pela representante do media partner, a editora de Ciência do jornal Público, Teresa Firmino.
Galeria de imagens
Créditos das fotos: Pedro Ferreira – FCT | FCCN | Arquivo.pt