Última atualização em 27 de Maio de 2026 às 14:20
A equipa do Arquivo.pt realizou uma sessão aberta à comunidade, no dia 5 de maio, durante as Jornadas FCCN 2026.
A sessão contou com cerca de 80 participantes e incluiu temas que, presentemente, marcam a atividade do Arquivo.pt. Nomeadamente, a utilização do acervo preservado para a investigação, o uso por ferramentas de inteligência artificial (IA) e a participação em projetos de LLMs para a língua portuguesa.
As Jornadas FCCN tiveram lugar na Faculdade de Economia da Universidade do Porto, entre 5 e 7 de maio de 2026. Estiveram presentes cerca de 1000 participantes. Foi uma oportunidade para encontrar muitas pessoas que interagem connosco durante o ano.
Como o arquivo da Web está a ser usado para a investigação, IA e LLMs
Como é que três décadas de história da Web portuguesa podem ser usadas para investigação, inovação tecnológica e para treinar modelos de Inteligência Artificial? Nesta sessão do Arquivo.pt nas Jornadas da FCCN mostrou, de forma prática e acessível, como o acervo preservado está hoje a ganhar nova vida — desde projetos de IA generativa ao desenvolvimento de ferramentas abertas para toda a comunidade académica.
A sessão foi dividida em cinco momentos, cada um focado em novidades concretas e casos de uso reais.
1. Amália AI: IA treinada com dados do Arquivo.pt – inspiração, métodos e resultados
Pedro Gomes, mostrou como os dados históricos do Arquivo.pt foram utilizados no desenvolvimento do Amália, um LLM para a língua portuguesa. Explicou o processo de preparação dos dados, os desafios específicos da Web portuguesa e exemplos do que o modelo consegue gerar quando se apoia em décadas de memória digital nacional.
Foi um apresentação inspiradora para quem quer perceber o impacto real de coleções web arquivadas em projetos de IA.
2. Nova pesquisa de texto com Apache Solr: mais rápida, moderna e escalável
Em 2025 redesenhámos o sistema de pesquisa textual do Arquivo.pt. Nesta parte da sessão, Vasco Rato falou desse trabalho em curso:
- como funciona internamente um motor de pesquisa para páginas antigas;
- que desafios existem quando se indexam biliões de páginas;
- e como a nova arquitetura com Apache Solr abre caminho para pesquisas mais completas, rápidas e flexíveis.
3. Uso de IA para geração de código
Ivo Branco mostrou como a utilização de Inteligência Artificial para gerar código está a acelerar significativamente o desenvolvimento do Arquivo.pt. O que antes começava como uma “melhoria incógnita” passa agora rapidamente a uma tarefa concreta no plano de trabalho, graças à capacidade da IA em propor soluções, estruturar código e apoiar a automação de processos.
O gestor do Arquivo.pt mostrou também as melhorias no sistema de reprodução de páginas (replay), agora baseado em ZipNum, tecnologias que reduzem de forma drástica o tempo de acesso a conteúdos arquivados — mesmo quando se tratam de biliões de registos.
O recurso a IA permite-nos implementar estas otimizações mais rapidamente, aumentar a qualidade do código produzido e libertar tempo da equipa para áreas de maior inovação e investigação.
4. Arquive o seu site na hora
Para terminar, Ricardo Basílio fez uma demonstração prática de como arquivar por iniciativa própria:
- arquivar uma página diretamente para o Arquivo.pt, em segundos com ArchivePageNow;
- gravar conteúdos no próprio computador em formato WARC com Webrecorder;
- compreender como estes ficheiros podem ser reutilizados, analisados ou preservados a longo prazo.
5. Coleções temáticas: preservar a sua memória
Do ambiente às eleições, da ciência à cultura digital, o Arquivo.pt produz regularmente coleções temáticas para preservar momentos importantes da sociedade.
Ficou este ponto por apresentar na sessão (em breve será disponibilizado). No entanto, incluímos um comentário na parte final do vídeo da sessão. Quisemos assim explicar como são definidas, curadas e preservadas estas recolhas especiais e como podem ser exploradas para ensino, investigação ou simples curiosidade histórica.
Patrocinador da sessão
Patrício Cachaço apresentou as soluções do Fortinet Secure LAN: Security-Driven Networking with AIOps.
