No dia 23 de Fevereiro de 2018 o Arquivo.pt lançou uma nova versão denominada Zeus.
Esta nova versão inclui uma nova interface de programação (Arquivo.pt API) e melhorias nas interfaces de utilização para telemóveis.
Arquivo.pt API: a API oficial
A nova interface de programação de aplicações, denominada Arquivo.pt API, permite pesquisar e aceder a informação preservada de forma automática.
O objetivo desta nova API foi agregar funções e informações que eram fornecidas através das diversas APIs desenvolvidas anteriormente. A pesquisa pode ser feita por URL ou por termos, e é retornado um objecto JSON com os itens de resposta.
Foram realizadas 2 recolhas, durante e após o período de campanha eleitoral, que partiram da lista de 410 sites sugeridos pela comunidade, e de 13 887 sites relacionados com as eleições encontrados automaticamente através de motores de busca.
O resultado foi um arquivo de 2 265 887 ficheiros recolhidos da Web (360 GB).
Nos sites recolhidos encontram-se por exemplo os sites oficiais das campanhas dos candidatos aos vários concelhos e freguesias, notícias na comunicação social, blogs e artigos de opinião.
O Arquivo.pt respeita um período de embargo de 1 ano, pelo que esta colecção só estará disponível para consulta no final de 2018.
Contudo, pode consultar já alguns sites das Eleições Autárquicas anteriores, tais como:
No dia 28 de Novembro de 2017, o Arquivo.pt lançou uma nova versão do seu serviço denominada Afrodite.
Esta nova versão tem como principal novidade a disponibilização de interfaces de utilização adaptadas para dispositivos móveis.
Por outro lado, permite também aceder às versões móveis dos sites preservados.
O Arquivo.pt passou a preservar também a web móvel!
Versão móvel da página de entrada do Arquivo.pt.
É agora mais fácil utilizar o Arquivo.pt em todo o lado
Utilizando o seu telemóvel, experimente pesquisar por todas as versões que o Arquivo.pt preservou do site da organização onde trabalhou ou estudou.
Lista de versões preservadas de um site ao longo do tempo.
Versão móvel da pesquisa textual.
As versões móveis dos sites preservados também podem ser acedidas.
E ainda…
Foram também feitas alterações nas interface de utilização para computadores, incluindo um novo rodapé responsivo e uma nova barra de seleção de idioma.
E publicada a versão alfa de uma nova API para melhorar o acesso automático à informação preservada pelo Arquivo.pt.
Última atualização em 31 de Julho de 2017 às 13:58
Sessão de trabalho do grupo Investiga XXI
O Arquivo.pt está cada vez mais próximo das Universidades
No passado mês de Abril, três investigadores provenientes de contextos diferentes, começaram a desenvolver os seus projectos com uma condição comum: utilizar intensivamente o Arquivo.pt na sua pesquisa.
Esta iniciativa visa criar uma comunidade de investigadores cada vez mais preparada para utilizar o arquivo da Web. O modelo é bastante próximo do BUDDAH Project (UK). Em Portugal podemos fazer mais e melhor.
O Straight-Edge, os jornais portugueses e a FCSH na Web
Ricardo Diogo Duarte, é antropólogo e historiador e encontrou no Arquivo.pt as fontes que precisava para estudar a cultura Straight-Edge, no contexto do punk-hardcore do final dos anos 90, nos subúrbios de Lisboa. Ver projecto.
Diogo Cunha é das Ciências da Comunicação e está a fazer a análise de sites ao longo do tempo, nos jornais Público, Diário de Notícias, Correio da Manhã e Expresso, para compreender a relação entre a interface online e as mudanças, quer na tecnologia quer nos modelos de produção e de distribuição. Ver projecto.
Ricardo Basílio é das Ciências da Documentação e da Informação e propõe uma exposição online sobre os sites da FCSH dos últimos 20 anos para dar visibilidade ao Arquivo.pt na Faculdade, onde foi bibliotecário. Ver projecto.
Grupo Investiga XXI é um espaço interdisciplinar aberto também aos bibliotecários
A coordenação dos trabalhos é do Doutor Daniel Gomes, gestor do arquivo da Web portuguesa, na FCCN. O novo grupo criado para estes projectos chama-se “Investiga XXI” e integra, actualmente, a equipa de engenheiros do Arquivo.pt e os três investigadores, um deles da área da biblioteconomia. No entanto, a perspectiva é a de receber cada vez mais participantes de diversas áreas. Em Abril, por exemplo, houve uma jornada aberta na FCCN e, em Maio, uma aula aberta na FCSH, a convite do CIC.Digital.
As Bibliotecas do Ensino Superior são a mediação que faz falta
O Arquivo.pt tem grande reconhecimento internacional. Na segunda semana de Junho, teve participação, em Londres, na IIPC Web Archiving Conference, o maior evento do género. Nas Universidades, é fundamental que os investigadores conheçam o que é o arquivo da Web nacional e como funciona. Só assim é que passarão a inclui-lo nos seus processos de pesquisa. Estamos a falar de uma infra-estrutura de big data, criada por engenheiros portugueses. Há um grande potencial por explorar.
As Bibliotecas, especialmente as BES, podem ter um papel mediador importante na aproximação entre os arquivos da Web e os investigadores. Poder-se-ia dizer mais, mas deixamos este aspecto para próximas notícias.
Última atualização em 1 de Outubro de 2021 às 9:12
O Arquivo.pt identificou automaticamente sites de projetos de I&D para preservar o seu conteúdo. Já preservou mais de 52 milhões de ficheiros (7 TB) relacionados com ciência para acesso futuro.
Os sites de I&D são valiosos e estão a ser perdidos
Distribuição de URLs de projetos que referenciavam conteúdo relevante por Programa-Quadro desde o FP4 (1994), oriundos do EU Open Data Portal e validados em novembro de 2015.
Distribuição de URLs de projetos que referenciavam conteúdo relevante por Programa-Quadro desde o FP4 (1994), oriundos do EU Open Data Portal e validados em novembro de 2015.
Arquivo.pt identificou sites de I&D automaticamente
O foco do Arquivo.pt é a preservação de informação publicada na Web para fins científicos e académicos. Assim sendo, desenvolveu um projeto para a identificação automática de endereços relacionados com projetos de I&D para que o seu conteúdo seja preservado de forma sistemática.
Todos os dados e ferramentas desenvolvidas durante esta investigação foram disponibilizados em acesso aberto de modo a que possam ser reutilizados e colaborativamente melhorados.
Já foram preservados 52 milhões de ficheiros da web relacionados com Ciência
A aplicação da metodologia desenvolvida pelo Arquivo.pt já permitiu preservar mais de 52 milhões de ficheiros (7 TB) oriundos de 53 993 sites de projetos de I&D financiados desde o FP4 (1994), tais como o projeto europeu WEZARD financiado com o objetivo de “preparar a futura comunidade de investigação na área da robustez dos sistemas de transporte aéreos quando for deparada com incidentes climáticos”. O site para este projeto (www.wezard.eu) já não se encontra disponível online.Contudo, foi preservado e pode ser acedido no Arquivo.pt.
Todos os sites identificados e preservados no âmbito deste projeto podem ser acedidos através do Arquivo.pt desde março de 2017.
Site do projeto europeu WEZARD (www.wezard.eu), financiado pelo 7º Programa-Quadro da União Europeia entre 2011 e 2013, disponível no Arquivo.pt.
Contributos para complementar os dados do European Open Data Portal
O processo desenvolvido foi aplicado aos conjuntos de dados publicados através do EU Open Data Portal para tentar complementar as informações em falta acerca dos URLs dos projetos. Os resultados obtidos mostraram que a integridade do conjunto de dados do FP7 foi melhorada em 86,6%.
Todos os conjuntos de dados resultantes foram disponibilizados ao público para que possam ser melhorados e reutilizados por outras organizações interessadas na preservação deste património digital (FP4, FP5, FP6, FP7).
Bases de dados do European Open Data Portal completadas pelo Arquivo.pt através da metodologia desenvolvida. Os novos URLs de projeto estão disponíveis na coluna “Identified Websites” dos ficheiros: FP4, FP5, FP6, FP7.
“Como pode o meu blog ficar na História digital de Portugal?” é a pergunta de partida para este encontro dedicado à preservação digital.
blogs que ficam para a história -formação do Arquivo.pt
No dia 23 de Fevereiro de 2017, a unidade FCCN da Fundação para a Ciência e Tecnologia, em Lisboa, responsável pelo Arquivo.pt, foi palco de uma ação de formação gratuita para bloggers das áreas de tecnologia, lifestyle e moda. Sob o mote de trabalhar para deixar os seus blogs para a história da web portuguesa, este conjunto de bloggers uniu-se à infraestrutura de investigação Arquivo.pt assistindo a sessões sobre técnicas de preservação digital.
Objetivos da formação
No final da formação os participantes terão ganho conhecimentos na utilização do Arquivo.pt que lhes permitirão:
Pesquisar e recuperar informação do passado que se julgava perdida
Criar conteúdos inovadores e originais com base em informação preservada da Web
Aumentar a produtividade e eficiência do seu trabalho
Citações e slides do evento
“Ao longo do tempo muita da informação que vai sendo colocada na Web desaparece e ninguém gosta de ser confrontado com o conhecido Erro 404.”
“60% dos sites desaparecem após apenas 2 anos”
“O Arquivo.pt, um serviço que permite pesquisar páginas web portuguesas arquivadas desde 1996. É também uma plataforma em constante atualização, que acompanha as alterações que as páginas web vão sofrendo ao longo dos anos.”
“Recentemente foi apresentada uma nova versão do serviço, que permite a reprodução das páginas preservadas de forma mais completa com o carregamento de imagens e outros conteúdos Web que anteriormente não eram reproduzidos.”
“Conseguirmos chegar aos profissionais da comunicação é um desafio, mas temos total disponibilidade para colaborar não só com a comunidade de bloggers e jornalistas, mas também com alunos, professores, investigadores ou simples curiosos”.
“A informação é Património. A informação publicada nos sites é valiosa e tem de ser preservada”
Gostaria de participar numa ação de formação futura?
Esta ação foi o primeiro passo para um projeto de ações de formação gratuitas relacionadas com o Arquivo.pt e Preservação Digital. Estas ações serão ministradas na FCCN ou em organizações externas que o solicitem desde que garantam uma presença mínima de 10 pessoas.