Última atualização em 23 de Novembro de 2020 às 18:19
No mês de novembro comemora-se o Dia Mundial da Preservação Digital e, para assinalar esta iniciativa internacional, o Arquivo.pt realizou uma sessão online aberta à comunidade.
Tal como em 2017, 2018 e 2019, convidámos todas as pessoas a conhecerem o Arquivo.pt, e a utilizarem-no na investigação e na preservação da memória.
O Dia Mundial da Preservação Digital é promovido pelo Digital Preservation Coalitium (UK) e é motivo para iniciativas em todo o mundo, partilhadas nas redes sociais com a hashtagWDPD2020.
Agenda
15h00 – Boas vindas (slides, 1 MB, PDF)
15h05 – Novidades do Arquivo.pt, Daniel Gomes (slides, 2.6 MB, PDF)
15h15 – Desarquivo, 1º classificado do Prémio Arquivo.pt 2020, Miguel Ramalho (slides, 3 MB, PDF)
15h45 – Questões dos participantes
16h00 – Fim
Última atualização em 23 de Setembro de 2021 às 15:30
O Geocities.com foi a primeira grande “rede social” que permitia a qualquer pessoa criar o seu website e difundir informação através da Internet. Foi criado em 1994, adquirido pela Yahoo! em 1999 e encerrado em 2009.
Dada a relevância histórica do Geocities, o Arquivo.pt também integrou os seus conteúdos que prevaleceram até aos dias de hoje.
Agora, qualquer pessoa pode facilmente explorar os conteúdos históricos do Geocities utilizando as ferramentas inovadoras de pesquisa disponibilizadas pelo Arquivo.pt como a pesquisa de páginas, pesquisa de imagens ou via API.
Com esta iniciativa, o Arquivo.pt pretende contribuir para o surgimento de estudos inovadores em áreas como Artes, Humanidades ou Sociologia (ver sumário do projecto).
A coleção especial de páginas Web acerca das Eleições Europeias de 2019 está disponível para pesquisa no Arquivo.pt.
Para compilar esta coleção, foram identificadas páginas escritas em 24 línguas europeias, através de pesquisas automáticas no motor de busca Bing e sugestões oriundas de 17 países europeus.
Convidam-se todos os cidadãos, especialmente os investigadores, a explorarem os conteúdos da Web do passado e a incluí-los nos seus trabalhos através deste serviço criado especialmente para pesquisar a coleção multi-lingue Eleições Europeias de 2019: https://arquivo.pt/ee2019
Vídeo “A transnational and cross-lingual crawl of the European Parliamentary Elections 2019”
A transnational and cross-lingual crawl of the European Parliamentary Elections 2019, Ivo Branco, IIPC Web Archiving Conference and RESAW 2021 (slides)
Milhares de páginas Web para contar a história da pandemia em Portugal
Desde março de 2020, o Arquivo.pt tem feito recolhas especiais de páginas Web relacionadas com a pandemia da Covid-19.
“Futuros académicos, cientistas e jornalistas que estejam a estudar a resposta portuguesa à pandemia da Covid-19 vão querer ler testemunhos em primeira mão de quem foi afectado, registos oficiais do número de vítimas, e recomendações dos médicos, políticos e cientistas da época”, Jornal Público, edição de 1 de maio de 2020.
Diariamente, foram recolhidos conteúdos de um conjunto de 106 sites sobre o tema da Covid-19. Neste conjunto incluem-se, por exemplo, websites da comunicação social, Governo, associações e iniciativas de universidades.
Num outro conjunto estão páginas do Twitter (108 identificadas em maio), vídeos do Youtube (815 identificados em maio) e ainda páginas do Reddit e do Git Hub.
Foram incluídas sugestões da comunidade, tais com as do arquivo municipal de Sines que contribuiu com uma recolha de notícias relacionadas com a Covid-19 no Município de Sines (9 GB), páginas identificadas pelo projeto “Revisionista.pt” e sugestões enviadas através do formulário público.
Colaboração do Arquivo.pt com o IIPC para coleção internacional
O Arquivo.pt foi dos primeiros serviços a responder, tendo contribuído com 1 237 endereços selecionados, principalmente em Língua Portuguesa.
Com os sucessivos contributos de outros países a coleção do IIPC cresceu. Em julho, as sugestões de websites a preservar superaram as 7 000 linhas e em agosto as 8000. Continua disponível um formulário de participação nesta coleção colaborativa.
O Arquivo.pt realizou 3 recolhas à coleção do IIPC, a primeira a 23 de março, a segunda a 15 de junho e a terceira no final de agosto, acrescentando ao seu acervo conteúdos internacionais para servirem a investigadores de todo o mundo.
Metodologia para a seleção de páginas para a coleção Covid-19
Começou-se por identificar termos relacionados com a temática do Coronavírus que incluíram aspetos sanitários, económicos, políticos, geográficos ou organizacionais.
Em seguida, utilizou-se o serviço Bing Azure, para obter automaticamente através de um script, a seguinte informação para os primeiros 10 resultados para cada termo: o endereço da página, o título e a posição na lista de resultados.
Sobre o conjunto de endereços obtido, averiguou-se qual seria o software de recolha a utilizar e respectivas configurações para recolher as páginas com a melhor qualidade possível.
Por exemplo, no caso de uma secção de jornal dedicada à Covid-19, há que decidir se gravamos apenas uma página ou se faz sentido recolher todo o site exaustivamente.
Foram utilizados diversos tipos de software para recolher as páginas. Por exemplo, para as recolhas diárias sobre 106 sites utilizou-se o Heritrix. Para a captura de 108 páginas do Twitter optou-se pelo Brozzler e para os vídeos a captura manual com o Webrecorder e Browsertrix.
O vencedor do prémio no valor de 10 000 euros foi o trabalho “Desarquivo” desenvolvido por Miguel Ramalho.
“Desarquivo” é um website que permite pesquisar por entidades (ex. pessoas, organizações e locais) e identificar relações entre elas, a partir das notícias publicadas em jornais online ao longo do tempo.
Os resultados das pesquisas são apresentados na forma de um grafo ou rede de relações que permitem a um jornalista, investigador ou qualquer outro cidadão explorar dinamicamente as relações entre informação histórica preservada da Web pelo Arquivo.pt.
Por exemplo, um utilizador pode visualizar a maior ou menor proximidade entre partidos políticos ao longo do tempo.
O 2º prémio no valor de 3 000 euros foi atribuído ao trabalho “Extensão Arquivo.pt”, uma extensão para browser desenvolvida por Rodrigo Marques e Hugo Silva.
Esta ferramenta permite realizar pesquisas avançadas no Arquivo.pt diretamente a partir do browser, sem necessitar de abandonar a página que está visualizar no momento.
A “Extensão Arquivo.pt” está disponível para download na Chrome Web Store.
O 3º classificado recebeu um prémio no valor de 2 000 euros e foi atribuído ao trabalho “Arquivo Económico .pt” de Nuno Bragança.
O “Arquivo Económico .pt” organiza e apresenta a informação preservada pelo Arquivo.pt acerca dos preços de produtos desde o tempo do escudo português.
Como resultado temos uma interface Web que permite pesquisar o preço de bens de consumo por diversas categorias, tais como supermercado, transportes e diversos, em determinadas datas.
Por exemplo, o utilizador pode saber quanto custava em 1999 uma viagem de comboio ente Lisboa-Porto ou uma chamada de telemóvel.
O Jornal Público, parceiro oficial da 3ª edição do Prémio Arquivo.pt atribuiu a sua Menção Honrosa ao trabalho “Jornal do Passado”, desenvolvido por Bruno Galhardo.
“Jornal do Passado” é um jogo para todas as idades, desenvolvido para Android, no qual o utilizador põe à prova os seus conhecimentos sobre notícias/eventos tentando adivinhar a data em que ocorreram.
Como resultado temos uma app que nos permite pesquisar a informação histórica preservada pelo Arquivo.pt de uma forma pedagógica e divertida.
O Arquivo.pt lançou uma nova versão do seu serviço no dia 1 de julho de 2020 denominada Responsive.
O objetivo desta versão foi melhorar a experiência de utilização entre diferentes dispositivos e adicionar novas funcionalidades.
Experimente “Ver com browser antigo”!
Adicionámos uma opção para ver a página preservada utilizando também um browser do passado. Nas Opções escolha Ver com browser antigo e será redirecionado para o serviço oldweb.today que emula browsers do passado como por exemplo o Netscape Navigator, Microsoft Internet Explorer ou o NSCA Mosaic.
Este serviço é útil para investigação, em áreas como o Web design, Arte, Comunicação ou História, em que é necessário aceder da forma o mais fidedigna possível ao aspeto visual original de uma página do passado.
Faça a sua experiência para ver a página da Expo’98 com um browser antigo ou outra página antiga à sua escolha. Poderá ter de aguardar um pouco para o processamento do seu pedido mas sempre é mais rápido do que conseguir instalar um browser do passado no seu computador.
Exportar resultados de uma pesquisa
Esta nova função permite guardar os resultados da sua pesquisa para posterior tratamento e análise. Isto é especialmente útil para realizar investigações exaustivas acerca de um determinado tópico.
Após uma pesquisa, nas Opções basta escolher um dos formato disponíveis para exportação dos resultados obtidos: XLSX, CSV ou TXT.
Última atualização em 12 de Outubro de 2020 às 11:37
O Arquivo.pt lançou uma nova versão do seu serviço no dia 15 de abril de 2020 denominada WebApp.
O objetivo desta versão foi uniformizar a experiência de utilização entre diferentes dispositivos e reduzir custos de manutenção através da remoção de componentes com funções redundantes.
Esta nova versão tem como principal novidade a junção das interfaces desktop e móvel numa única interface de utilização.
A antiga versão desktop foi desactivada e a versão móvel evoluiu para funcionar em vários tipos de dispositivo e tamanhos de ecrã.
Última atualização em 6 de Agosto de 2024 às 14:41
No ano em que o Público comemora o 30º aniversário, o Arquivo.pt leva-nos a visitar páginas Web da versão eletrónica do jornal, através de uma Viagem no tempo.
Ao percorrer as páginas, acede-se a páginas da história recente, as quais mantém o aspeto e as funcionalidades que tinham na altura em que foram publicadas.
A seleção das páginas foi feita pelo Público, em colaboração com o Arquivo.pt que tratou da sua edição e apresentação na forma de uma linha temporal.
Na edição de 2020 do Prémio Arquivo.pt, o Público atribuirá uma Menção Honrosa aos trabalhos baseados nas versões preservadas pelo Arquivo.pt.
Última atualização em 6 de Agosto de 2024 às 13:12
Bem vindo aos Cafés com o Arquivo.pt
Semanalmente, o Arquivo.pt abre uma sessão on line para tratar um tópico relacionado com a Web e sua preservação.
Venha ouvir os convidados e converse directamente com a equipa do Arquivo.pt para saber como tirar maior partido do serviço e concorrer ao Prémio Arquivo.pt.
Sessões realizadas durante a 1ª temporada
1ª sessão – 27 de março – Preservação de websites: Faça você mesmo!
Nesta sessão foi apresentado pelo curador digital, Ricardo Basílio, um tutorial de gravação de páginas Web num formato normalizado, utilizando o Webrecorder. Usando esta ferramenta disponível gratuitamente no projeto Rhizome, qualquer pessoa pode gravar páginas Web e assim preservar o seu conteúdo tal como estava num determinado momento.
A App meuParlamento.pt foi a vencedora do Prémio Arquivo.pt 2019 e permite simular uma votação sobre legislação que passou pela Assembleia da República. Muitos conteúdos encontram-se em páginas Web preservadas pelo Arquivo.pt. O assunto principal é pois a questão da cidadania que, neste caso, pode beneficiar da tecnologia para ser dinamizada. A apresentação de Nuno Moniz, da Faculdade de Engenharia da Universidade do Porto, contou também com a presença dos outros dois autores, Arian Pasquali e Tomás Amaro. Seguiu-se um espaço de perguntas relacionadas com esta aplicação e com o desenvolvimento de trabalhos a partir do Arquivo.pt.
3ª sessão – 17 de abril – Prémio Arquivo.pt 2020 e novidades
De regresso, após interrupção da Páscoa, a 3ª sessão do Arquivo.pt foi dedicada ao esclarecimento de questões acerca do Prémio Arquivo.pt 2020 e às novidades. O lançamento da nova interface do Arquivo.pt, denominada Webapp release, foi a grande novidade dada em primeira mão. Daniel Gomes, Gestor do Arquivo.pt, deu a conhecer aos participantes a interface única para desktop e para dispositivos móveis.
A aplicação Revisionista -Des-cobre as notícias, da autoria de Flávio Martins (NOVA-LINCS) e André Mourão (NOVA-LINCS e Arquivo.pt), foi 2ª classificada do Prémio Arquivo.pt 2019. Esta ferramenta utiliza o Arquivo.pt para mostrar as versões das notícias dos jornais no seu processo de publicação. Falou-se da utilidade da tecnologia para reforçar a confiança dos cidadãos nos meios de comunicação social.
5ª sessão – 30 de abril – Discursos públicos sobre violência em privado
Violência doméstica foi o tema desta sessão, que teve por convidada a Zélia Teixeira, Psicóloga e Professora da Universidade Fernando Pessoa. O seu estudo, que baseado em páginas preservadas pelo Arquivo.pt, foi o 3º classsificado do Prémio Arquivo.pt 2019.
6ª sessão – 8 de maio – API do Arquivo.pt – Como processar informação em larga escala?
A API do Arquivo.pt (Application Programming Interface) explicada por André Mourão, Engenheiro I&D do Arquivo.pt, a partir de exemplos concretos, foi a matéria desta sessão. Não é necessário ser informático para compreender as potencialidades desta interface e, a partir daí, construir projetos derivados do Arquivo.pt para a sua instituição ou para a sociedade, em geral.
7ª sessão – 15 de maio – Arquivar um website: Faça você mesmo!
Webrecorder e Browsertrix são duas ferramentas úteis para a recolha de websites localmente e em pequena escala. O Webrecorder é de utilização simples e intuitiva, adequada para um pequeno número de páginas selecionadas. O Browsertrix exige alguns conhecimentos técnicos, mas depois de implementado permite fazer recolhas de um site inteiro ou de listas de páginas. A partir das demonstrações o curador digital do Arquivo.pt, Ricardo Basílio, incentivou a comunidade a experimentá-los e a cuidar da preservação dos seus websites.
8ª sessão – 22 de maio – A história dos videojogos na Web portuguesa
A 8ª sessão foi dedicada ao tema fascinante dos videojogos, apresentada pelo Web developer Miguel Costa. Quem sabe qual foi o primeiro videojogo português? Quem foram as figuras-chave na evolução dos videojogos no contexto nacional? Será que o Arquivo.pt guardou jogos antigos? Essas e outras questões foram tratadas e partilhadas nesta sessão.
9ª sessão – 29 de maio – O Straight Edge na área metropolitana de Lisboa
Nesta sessão conhecemos mais de perto o Straight Edge e a sua presença no meio punk/hardcore da área metropolitana de Lisboa na década de 90. Diogo Duarte, antropólogo e investigador do Instituto de História Contemporânea da Universidade Nova de Lisboa, falou sobre o seu trabalho dedicado ao tema e sobre a importância do Arquivo.pt para estudar este movimento e outras expressões da cultura popular.
Saúde e Internet foi o tema que nos trouxe Rita Espanha, docente e investigadora do ISCTE-IUL e CIES e especialista na área das tecnologias da Comunicação em Saúde. A Internet tornou-se o meio privilegiado onde os cidadãos procuram informação e constroiem o seu próprio saber em todas as áreas da sua vida, entre elas a saúde. Os organismos do Estado por sua vez desenvolveram serviços que usam a Internet. De fora fica parte da população que não acompanhou esta mudança. A outra parte da população que tem facilidade em aceder à informação nem sempre tem o sentido crítico para avaliar a informção e usá-la em seu benefício. Todas estas questões se tornaram mais evidentes durante o recente período de pandemia.
11ª sessão – 19 de junho – Criação e gestão de websites preserváveis
O seu site é preservável? Esta foi a questão principal desta sessão, dedicada à preservabilidade dos conteúdos publicados na Web. A equipa do Arquivo.pt, através do curador digital e do engenheiro de crawling, apresentou um conjunto de recomendações a ter em conta na criação e desenvolvimento de sites para assegurar, tanto quanto possível, a sua preservação.
Conta-me Histórias é um serviço que cria narrativas temporais, a partir dos conteúdos preservados pelo Arquivo.pt. Esta aplicação foi vencedora do Prémio Arquivo.pt 2018. Ricardo Campos (Instituto Politécnico de Tomar e INESC TEC) falou-nos do desenvolvimento do serviço e das novas histórias que o Conta-me Histórias tem para contar.
Os investigadores das áreas de NLP (Natural Language Processing) encontram nesta sessão um excelente caso de uso explicado em pormenor pelo seu autor. Miguel Won, investigador do INESC-ID, falou da importância das seções de opinião dos órgãos de comunicação. Como lêem os comentadores os acontecimentos e de que modo isso reflecte o seu posicionamento político? A partir desta questão, desenvolveu a aplicação Web Arquivo de Opinião, premiada em 2018, a qual apresenta um histórico das colunas de opinião de jornais portugueses, a partir das páginas do Arquivo.pt. Nesta sessão ficámos a saber as novidades do projeto que agora passou a recolher também páginas de redes sociais.
14ª sessão – 10 de julho – Museu do Web design português
Sandra Antunes, Professora na Escola Superior de Tecnologia e Gestão de Viseu (ESTGV), foi a ilustre convidada da 14ª sessão do Café com o Arquivo.pt. Abordou a questão da criação de espaços virtuais para a memória do Web design e mostrar a importância de um museu para colmatar lacunas nas áreas da preservação, exposição e história do Web design português.
Está patente na Biblioteca da Faculdade de Ciências da Universidade de Lisboa (FCUL), até 30 de abril, a exposição do Arquivo.pt.
Oito cartazes com páginas Web antigas convidam alunos, investigadores e professores a explorarem conteúdos preservados pelo Arquivo.pt para utilizarem nos seus trabalhos e concorrem ao Prémio Arquivo.pt 2020. Além da exposição, vai haver sessão de formação aberta à comunidade, 12 de março das 16h30 às 18h00, na sala 1.3.15.
Esta exposição tem vindo a percorrer várias instituições do Ensino Superior, mas no caso da FCUL trata-se de um regresso às origens.
O Arquivo.pt, por sua vez, foi lançado oficialmente na FCCN em novembro de 2007, destinado recolher e a preservar conteúdos da Web portuguesa e utilizando tecnologias específicas, semelhantes às do Internet Archive.
Três investigadores da FCUL integraram a equipa que desenvolveu o serviço do Arquivo.pt nos primeiros anos. Em 2010, apresentaram um protótipo do serviço de pesquisa e acesso, um “Google para o passado”, inovador no contexto dos arquivos da Web.
Memorial do Arquivo.pt é o mais recente serviço, criado para as instituições que querem manter acessíveis os sites antigos, mesmo depois de os desligarem nos seus servidores. Aceda, por exemplo, ao site do projecto Minema, terminado há anos, e veja como funciona este serviço.