Artigo apresentado na conferência EPIA 2009

Artigo “An Updated Portrait of the Portuguese Web” apresentado na conferência EPIA 2009

O artigo An Updated Portrait of the Portuguese Web, de João Miranda e Daniel Gomes, foi apresentado na 14th Portuguese Conference on Artificial Intelligence (EPIA 2009) em Aveiro.

Este artigo apresenta uma caracterização da Web Portuguesa com base numa recolha efectuada pelo Arquivo da Web Portuguesa em Março de 2008, com 48 milhões de documentos recolhidos em 2,5 TB de volume de dados.

Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone

Apresentação de artigo na conferência LA-Web 2009, no dia 11/11/2009

O artigo “Trends in Web characteristics” será apresentado na conferência LA-Web 2009, no dia 11/11/2009.

O artigo Trends in Web Characteristics, de João Miranda e Daniel Gomes, será apresentado no 7th Latin American Web Congress (LA-WEB 2009) em Mérida, no México.

Este artigo apresenta tendências de evolução da Web com base em três caracterizações da Web portuguesa realizadas num intervalo de cinco anos. Foram analisadas diversas métricas relativas às características de conteúdos e sítios da Web.

Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone

Sessão no ISCTE: “O Arquivo.pt como infraestrutura para investigação nas Ciências Sociais e Humanas.”

Sessão exploratória das Jornadas FCCN no ISCTE (Lisboa) no dia 12 de Fevereiro 9:30-11:00.

Perdeu as Jornadas FCCN 2015?

Apresentações relacionadas com o Arquivo.pt:

Público-alvo

•    Professores, investigadores e alunos de Ciências Sociais e Humanas.
•    Bibliotecários, arquivistas e documentalistas.
•    Responsáveis por infraestruturas de investigação.

Âmbito/Objetivos

O Arquivo.pt detém informação arquivada da Internet desde 1996 e disponibiliza um serviço público que permite pesquisar páginas do passado. Esta infraestrutura constitui já um valioso recurso para investigação acerca do passado recente e ganhará cada vez mais importância à medida que a Internet vai penetrando na sociedade e na vida dos seres humanos.

Contudo, é essencial dar a conhecer esta infraestrutura e criar uma comunidade de investigadores com competências científicas que permitam transformar esta vasta fonte de informação em Conhecimento.

O objetivo desta sessão exploratória é partilhar e debater casos de uso para a utilização do Arquivo.pt como infraestrutura de investigação na área das Ciências Sociais e Humanas.

Agenda

•    Arquivo.pt como recurso para a investigação em Ciências Sociais, Rita Espanha – CIES, ISCTE.
•    ROSSIO: Artes, Ciências Sociais e Humanidades, Maria Fernanda Rollo – IHC, FCSH.
•    O Arquivo da web portuguesa e seu papel num futuro museu do web design português, Sandra Valente Antunes  –  Universidade de Aveiro, Universidade do Porto.

Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone

Doutoramento “Information Search in Web Archives”: video e slides

O nosso antigo colega Miguel Costa defendeu a sua tese de doutoramento na Universidade de Lisboa no dia 4 de Novembro de 2014. O video e as projeções estão disponíveis!

Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone

Vaga para administrador de sistemas do Arquivo da Web Portuguesa

O Arquivo da Web Portuguesa (www.arquivo.pt) necessita de contratar um administrador de sistemas distribuídos de larga escala.

O administrador de sistemas que agora procuramos para integrar a nossa equipa terá como responsabilidade desenvolver e manter a qualidade dos resultados fornecidos por um sistema de recolha, pesquisa e acesso distribuído por mais de 60 servidores.

Requisitos

  • Licenciatura pré-Bolonha ou Mestrado em Engenharia Informática.
  • Experiência em desenho, operação e administração de sistemas distribuídos de larga-escala em produção e expostos na Internet.
  • Conhecimentos das tecnologias Apache HTTP Server, Apache Tomcat, Java e Linux.
  • Experiência em tecnologias de monitorização e gestão de sistemas distribuídos (ex. Nagios, Cacti, Ganglia, Rex, Puppet, Chef, SpaceWalk, Jenkins).

Preferências

  • Experiência em tecnologias de processamento distribuído (ex. Hadoop, HBase).
  • Experiência em tecnologias de pesquisa de informação (ex. Apache Solr, Lucene);
  • Experiência em tecnologias de arquivo da web (ex. Heritrix, Wayback Machine, NutchWAX);
  • Experiência em plataformas de gestão de software (ex. Selenium, SonarCube, Ant, Maven, Git, SVN).
  • Sistemas de balanceamento de carga e redundância (ex. LVS).

Agradecemos ajuda na divulgação desta oferta.

Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone

É agora mais fácil descarregar todo o software do AWP.

Todo o código-fonte, binários e documentação podem ser descarregados em ficheiros comprimidos.

O software desenvolvido para criar o Arquivo da Web Portuguesa está disponível como um projecto gratuito de código aberto alojado no Google Code denominado pwa-technologies.

Com o objectivo de facilitar a disseminação e preservação deste software foram gerados ficheiros de exportação (dumps) que estão disponíveis nas seguintes localizações alternativas:

Sintam-se livres de replicar e melhorar este código-fonte para que no futuro exista acesso à nossa memória digital.

Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone

O Arquivo da Web Portuguesa aderiu ao International Internet Preservation Consortium

A Fundação para a Computação Científica Nacional, como mentora do Arquivo da Web Portuguesa, aderiu ao IIPC.

O International Internet Preservation Consortium (IIPC) é um consórcio mundial composto por 44 organizações de 25 países que tem como missão obter, preservar e manter acessível o conhecimento disponível na Internet para as gerações futuras.

Este consórcio tem desenvolvido ferramentas, normas e boas práticas para arquivar a web e promovido os  serviços disponibilizados pelos arquivos da web como recursos para investigação científica e preservação de herança cultural.

O Arquivo da Web Portuguesa é um serviço inovador baseado em tecnologia de ponta que requer investimento permanente em Investigação e Desenvolvimento.

A adesão ao IIPC é fundamental para estabelecer parcerias internacionais e permitir o desenvolvimento colaborativo de ferramentas usadas pelo Arquivo da Web Portuguesa, melhorando assim a qualidade do serviço prestado.

Para saber mais:

Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone

Ipres’2013: Cinco novas comunicações acerca do Arquivo da Web Portuguesa

O Arquivo da Web Portuguesa (AWP) foi divulgado durante a conferência científica internacional na área de preservação digital “Ipres’2013 – 10th International Conference on Preservation of Digital Objects” que decorreu em Lisboa de 2 a 6 de Setembro.

Share on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone