Ferramentas Pessoais
  •  
Você está aqui: Entrada Sobre Funcionamento Arquitectura

Arquitectura

Descreve sumariamente a arquitectura e funcionamento do sistema de arquivo.

Funcionamento geral

O funcionamento dos arquivos da web é semelhante ao dos motores de busca como o Google, dividindo-se em 3 etapas principais:

  1. Recolha: a partir de um conjunto inicial de endereços de sítios da Web (raízes), inicia-se um processo automático que consiste em ciclicamente:
    • recolher um conteúdo da Web e armazená-lo em disco;
    • extrair endereços para outras páginas a partir das ligações;
    • inserir os novos endereços descobertos para recolha.
    Os sistemas que executam estas tarefas de recolha chamam-se batedores ou crawlers.
  2. Indexação: terminada a recolha, toda a informação recolhida da Web é processada para construir os índices que permitirão realizar pesquisas rápidas;
  3. Pesquisa e Acesso: após criados os índices, são disponibilizados serviços de pesquisa e acesso à informação recolhida da Web. A principal diferença entre os motores de busca e os arquivos da web é que os arquivos têm a preocupação adicional de preservar a informação para mantê-la acessível ao longo do tempo.

Para saber mais consulte as nossas publicações técnicas e científicas

 

Partilhar | |