O Arquivo.pt nas Jornadas de Computação Científica 2018

Última atualização em 2 de Outubro de 2018 às 14:12

No passado mês de abril decorreu em Braga no INL International Iberian Nanotechnology Laboratory, a 9ª edição das Jornadas de Computação Científica.

No evento, a Srª Secretária de Estado da Ciência, Tecnologia e Ensino Superior, Maria Fernanda Rollo, falou também sobre o Futuro Digital

A equipa do Arquivo.pt e alguns convidados tiveram a oportunidade de apresentar as funcionalidades e as aplicações práticas em investigação que o Arquivo.pt proporciona.

Sessão Plenária

Apresentações Arquivo.pt

Nova API para pesquisar o Arquivo.pt

Última atualização em 2 de Março de 2018 às 11:10

No dia 23 de Fevereiro de 2018 o Arquivo.pt lançou uma nova versão denominada Zeus.

Esta nova versão inclui uma nova interface de programação (Arquivo.pt API) e melhorias nas interfaces de utilização para telemóveis.

Arquivo.pt API: a API oficial

A nova interface de programação de aplicações, denominada Arquivo.pt API, permite pesquisar e aceder a informação preservada de forma automática.

O objetivo desta nova API foi agregar funções e informações que eram fornecidas através das diversas APIs desenvolvidas anteriormente. A pesquisa pode ser feita por URL ou por termos, e é retornado um objecto JSON com os itens de resposta.

Esta nova API pode ser útil para concorrer aos Prémios Arquivo.pt.

Para saber mais

Nova versão do Arquivo.pt para telemóveis

página inicial do Arquivo.pt - versão mobile

No dia 28 de Novembro de 2017, o Arquivo.pt lançou uma nova versão do seu serviço denominada Afrodite.

Esta nova versão tem como principal novidade a disponibilização de interfaces de utilização adaptadas para dispositivos móveis.

Por outro lado, permite também aceder às versões móveis dos sites preservados.

O Arquivo.pt passou a preservar também a web móvel!

Versão móvel da página de entrada do Arquivo.pt.

É agora mais fácil utilizar o Arquivo.pt em todo o lado

Utilizando o seu telemóvel, experimente pesquisar por todas as versões que o Arquivo.pt preservou do site da organização onde trabalhou ou estudou.

Lista de versões preservadas de um site ao longo do tempo.

pesquisa por texto- versão para telemóveis

Versão móvel da pesquisa textual.

rtp.pt em 2005- versão para telemóveis

As versões móveis dos sites preservados também podem ser acedidas.

E ainda…

Foram também feitas alterações nas interface de utilização para computadores, incluindo um novo rodapé responsivo e uma nova barra de seleção de idioma.

E publicada a versão alfa de uma nova API para melhorar o acesso automático à informação preservada pelo Arquivo.pt.

Para saber mais, consulte os detalhes técnicos  da nova versão do Arquivo.pt.

É muito importante que nos ajude a testar esta nova versão!

Existem numerosos modelos de dispositivos móveis e não conseguimos realizar testes em todos.

Agradecíamos imenso se gastasse 1 minuto para nos ajudar a testar esta nova versão através do seu telemóvel ou tablet.

Se detectar algum problema, agradecemos imenso que nos avise indicando também o modelo do seu dispositivo e browser utilizado.

Este seu contributo é mesmo muito valioso para garantirmos a qualidade do serviço que prestamos à comunidade.

Novo site informativo do Arquivo.pt!

Novo site sobre.arquivo.pt

No dia 2 de Agosto de 2017 foi lançada uma nova versão do site informativo acerca do Arquivo.pt (disponível em sobre.arquivo.pt).

Esta nova versão consistiu principalmente na adopção da plataforma WordPress em substituição de uma versão obsoleta do Plone.

Destacam-se os seguintes melhoramentos:

Se detectar algum problema ou desejar realizar alguma sugestão de melhoria, por favor contacte-nos!

A sua opinião é valiosa.

Projectos de investigação com o Arquivo.pt

Sessão de trabalho do grupo Investiga XXI

Última atualização em 31 de Julho de 2017 às 13:58

Sessão de trabalho do grupo Investiga XXI
Sessão de trabalho do grupo Investiga XXI

O Arquivo.pt está cada vez mais próximo das Universidades

No passado mês de Abril, três investigadores provenientes de contextos diferentes, começaram a desenvolver os seus projectos com uma condição comum: utilizar intensivamente o Arquivo.pt  na sua pesquisa.

Esta iniciativa visa criar uma comunidade de investigadores cada vez mais preparada para utilizar o arquivo da Web.  O modelo é bastante próximo do BUDDAH Project (UK). Em Portugal podemos fazer mais e melhor.

O Straight-Edge, os jornais portugueses e a FCSH na Web

Ricardo Diogo Duarte, é antropólogo e historiador e encontrou no Arquivo.pt as fontes que precisava para estudar a cultura  Straight-Edge, no contexto do punk-hardcore do final dos anos 90, nos subúrbios de Lisboa. Ver projecto.

Diogo Cunha é das Ciências da Comunicação e está a fazer a análise de sites ao longo do tempo, nos jornais Público, Diário de Notícias, Correio da Manhã e Expresso, para compreender a relação entre a interface online e as mudanças, quer na tecnologia quer nos modelos de produção e de distribuição. Ver projecto.

Ricardo Basílio é das Ciências da Documentação e da Informação e propõe uma exposição online sobre os sites da FCSH dos últimos 20 anos  para dar visibilidade ao Arquivo.pt na Faculdade, onde foi bibliotecário. Ver projecto.

Grupo Investiga XXI é um espaço interdisciplinar aberto também aos bibliotecários

A coordenação dos trabalhos é do Doutor Daniel Gomes, gestor do arquivo da Web portuguesa, na FCCN. O novo grupo criado para estes projectos chama-se “Investiga XXI” e integra, actualmente, a equipa de engenheiros do Arquivo.pt e os três investigadores, um deles da área da biblioteconomia. No entanto, a perspectiva é a de receber cada vez mais participantes de diversas áreas. Em Abril,  por exemplo, houve uma jornada aberta na FCCN e, em Maio, uma aula aberta na FCSH, a convite do CIC.Digital.

As Bibliotecas do Ensino Superior são a mediação que faz falta

O Arquivo.pt tem grande reconhecimento internacional. Na segunda semana de Junho, teve participação, em Londres, na IIPC Web Archiving Conference, o maior evento do género. Nas Universidades, é fundamental que os investigadores conheçam o que é o arquivo da Web nacional e como funciona. Só assim é que passarão a inclui-lo nos  seus processos de pesquisa. Estamos a falar de uma infra-estrutura de big data, criada por engenheiros portugueses. Há um grande potencial por explorar.

As Bibliotecas, especialmente as BES, podem ter um papel mediador importante na aproximação entre os arquivos da Web e os investigadores. Poder-se-ia dizer mais, mas deixamos este aspecto para próximas notícias.

 

Arrancou o projecto Investiga XXI

Última atualização em 25 de Setembro de 2017 às 13:25

O projecto de investigação Investiga XXI torna públicos os seus primeiros contributos para a investigação a partir do Arquivo.pt.

O seu principal objectivo é promover a utilização do Arquivo.pt como ferramenta e fonte de pesquisa científica.

Os projectos desenvolvidos partem da perspectiva das Humanidades Digitais para tratar diferentes objectos de estudo:

Para saber mais

Se quiser colaborar connosco, contacte-nos.

Arquivo.pt melhora pesquisa avançada

Arquivo.pt logo oficial partilha facebook

O Arquivo.pt lançou uma nova versão no dia 23 de junho de 2017 denominada Vénus em que se melhoraram os operadores de Pesquisa Avançada.

Destaca-se a melhoria do funcionamento do operador de pesquisa site que permite restringir as pesquisas a determinados sites preservados. Por exemplo:

A reprodução de páginas preservadas contendo mensagens de erro foi também reduzida.

Saber mais

Investigadores visitam o Arquivo.pt

Um grupo de investigadores olham para um bastidor de servidores

Última atualização em 3 de Abril de 2019 às 14:13

No dia 23 de  Maio um grupo multidisciplinar de investigadores veio conhecer a infraestrutura do Arquivo.pt em Lisboa.

Os investigadores ficaram a conhecer como funciona o Arquivo.pt  e comprovaram que é um serviço útil para a investigação científica.

Consulte as nossas formações gratuitas.

Quer visitar o Arquivo.pt? Contacte-nos

Arquivo.pt preservou sites sobre projetos de Investigação & Desenvolvimento financiados pela Comissão Europeia

EuropeanCommission

Última atualização em 29 de Junho de 2020 às 9:33

O Arquivo.pt identificou automaticamente sites de projetos de I&D para preservar o seu conteúdo. Já preservou mais de 52 milhões de ficheiros (7 TB) relacionados com ciência para acesso futuro.

Os sites de I&D são valiosos e estão a ser perdidos

Os sites dos projetos de Investigação & Desenvolvimento (I&D) são cada vez mais usados para disponibilizar importante informação científica que complementa a literatura publicada (ex. conjuntos de dados ou documentação, software). Contudo, após o término dos projetos, os sites normalmente desaparecem causando uma perda permanente de informação científica única e valiosa.

Distribuição de URLs de projetos que referenciavam conteúdo relevante por Programa-Quadro desde o FP4 (1994), oriundos do EU Open Data Portal e validados em novembro de 2015.

Distribuição de URLs de projetos que referenciavam conteúdo relevante por Programa-Quadro desde o FP4 (1994), oriundos do EU Open Data Portal e validados em novembro de 2015.
Distribuição de URLs de projetos que referenciavam conteúdo relevante por Programa-Quadro desde o FP4 (1994), oriundos do EU Open Data Portal e validados em novembro de 2015.

A informação online relativa a projetos de I&D não está a ser exaustivamente documentada. Por exemplo, a informação referente aos endereços dos sites dos projetos financiados no programa 7º Programa-Quadro (FP7) disponibilizada através do Portal de Dados Abertos da União Europeia (EU Open Data Portal) está omissa para 92% dos projetos.

Arquivo.pt identificou sites de I&D automaticamente

O foco do Arquivo.pt é a preservação de informação publicada na Web para fins científicos e académicos. Assim sendo, desenvolveu um projeto para a identificação automática de endereços relacionados com projetos de I&D para que o seu conteúdo seja preservado de forma sistemática.

A identificação automática é realizada através da combinação de conjuntos de dados abertos com serviços de busca gratuitos, de modo a que possa ser aplicada mesmo em contextos com recursos limitados. Este trabalho está detalhado num artigo publicado na conferência científica International Conference on Digital Preservation 2016.

Todos os dados e ferramentas desenvolvidas durante esta investigação foram disponibilizados em acesso aberto de modo a que possam ser reutilizados e colaborativamente melhorados.

Já foram preservados 52 milhões de ficheiros da web relacionados com Ciência

A aplicação da metodologia desenvolvida pelo Arquivo.pt já permitiu preservar mais de 52 milhões de ficheiros (7 TB) oriundos de 53 993 sites de projetos de I&D financiados desde o FP4 (1994), tais como o projeto europeu WEZARD financiado com o objetivo de “preparar a futura comunidade de investigação na área da robustez dos sistemas de transporte aéreos quando for deparada com incidentes climáticos”. O site para este projeto (www.wezard.eu) já não se encontra disponível online.Contudo, foi preservado e pode ser acedido no Arquivo.pt.

Todos os sites identificados e preservados no âmbito deste projeto podem ser acedidos através do Arquivo.pt desde março de 2017.

Site do projeto europeu WEZARD (www.wezard.eu), financiado pelo 7º Programa-Quadro da União Europeia entre 2011 e 2013, disponível no Arquivo.pt.
Site do projeto europeu WEZARD (www.wezard.eu), financiado pelo 7º Programa-Quadro da União Europeia entre 2011 e 2013, disponível no Arquivo.pt.

 

 

Contributos para complementar os dados do European Open Data Portal

O processo desenvolvido foi aplicado aos conjuntos de dados publicados através do EU Open Data Portal para tentar complementar as informações em falta acerca dos URLs dos projetos. Os resultados obtidos mostraram que a integridade do conjunto de dados do FP7 foi melhorada em 86,6%.

Todos os conjuntos de dados resultantes foram disponibilizados ao público para que possam ser melhorados e reutilizados por outras organizações interessadas na preservação deste património digital (FP4FP5FP6FP7).

Referências

É investigador?

Blogs que ficam para a História: formação oferecida pelo Arquivo.pt

blogs que ficam para a história - Arquivo.pt formação

“Como pode o meu blog ficar na História digital de Portugal?” é a pergunta de partida para este encontro dedicado à preservação digital.

blogs que ficam para a história - Arquivo.pt formação
blogs que ficam para a história -formação do Arquivo.pt

 

No dia 23 de Fevereiro de 2017, a unidade FCCN da Fundação para a Ciência e Tecnologia, em Lisboa, responsável pelo Arquivo.pt, foi palco de uma ação de formação gratuita para bloggers das áreas de tecnologia, lifestyle e moda. Sob o mote de trabalhar para deixar os seus blogs para a história da web portuguesa, este conjunto de bloggers uniu-se à infraestrutura de investigação Arquivo.pt assistindo a sessões sobre técnicas de preservação digital.

Objetivos da formação

No final da formação os participantes terão ganho conhecimentos na utilização do Arquivo.pt que lhes permitirão:

  • Pesquisar e recuperar informação do passado que se julgava perdida
  • Analisar a evolução de um site ao longo do tempo
  • Publicar informação online para que possa ser preservada para o futuro
  • Criar conteúdos inovadores e originais com base em informação preservada da Web
  • Aumentar a produtividade e eficiência do seu trabalho

Citações e slides do evento

“Ao longo do tempo muita da informação que vai sendo colocada na Web desaparece e ninguém gosta de ser confrontado com o conhecido Erro 404.”

“60% dos sites desaparecem após apenas 2 anos”

“O Arquivo.pt, um serviço que permite pesquisar páginas web portuguesas arquivadas desde 1996. É também uma plataforma em constante atualização, que acompanha as alterações que as páginas web vão sofrendo ao longo dos anos.”

“Recentemente foi apresentada uma nova versão do serviço, que permite a reprodução das páginas preservadas de forma mais completa com o carregamento de imagens e outros conteúdos Web que anteriormente não eram reproduzidos.”

“Conseguirmos chegar aos profissionais da comunicação é um desafio, mas temos total disponibilidade para colaborar não só com a comunidade de bloggers e jornalistas, mas também com alunos, professores, investigadores ou simples curiosos”.

“A informação é Património. A informação publicada nos sites é valiosa e tem de ser preservada”

Gostaria de participar numa ação de formação futura?

Esta ação foi o primeiro passo para um projeto de ações de formação gratuitas relacionadas com o Arquivo.pt e Preservação Digital. Estas ações serão ministradas na FCCN ou em organizações externas que o solicitem desde que garantam uma presença mínima de 10 pessoas.

Contacte-nos ou adira à nossa mailing list para se manter atualizado.