- Info
Objectivos
Apresenta os principais objectivos do projecto da FCCN para a criação de um Arquivo da Web Portuguesa.
Objectivos do Arquivo da Web Portuguesa
A criação de um Arquivo da Web Portuguesa
representa um marco histórico e uma aposta de Portugal nas suas gerações
futuras. Com a criação de uma infra-estrutura que suporte
recolhas periódicas da web portuguesa, seu arquivo e acesso a longo prazo,
pretendemos disponibilizar os seguintes serviços:
- Pesquisa histórica por termo: permitirá identificar páginas arquivadas ao longo
dos anos que contenham determinadas palavras;
- Pesquisa histórica por
endereço da web (URL): permitirá identificar
várias páginas arquivadas ao longo dos anos referenciadas por um determinado
URL;
- Novo motor de pesquisa sobre a web
portuguesa: o arquivo irá permitir pesquisar sobre várias recolhas da web
portuguesa, a disponibilização de um serviço de pesquisa apenas sobre a recolha
mais recente, como acontece nos motores de busca actuais, é uma mais-valia para
a comunidade portuguesa;
- Colecções históricas de conteúdos
web para fins de investigação: a web contém informação sobre os mais diversos
assuntos sendo o reflexo dos nossos dias. Investigadores das mais diversas
áreas usam-na como fonte de informação para os seus estudos, que vão da
Sociologia à Informática. A disponibilização de colecções da web permitirá que
estes investigadores possam processar informação localmente nos seus computadores sem terem de realizar recolhas da web;
- Relatórios periódicos de caracterização
da web de Portugal: o desenho de sistemas para processamento de dados
provenientes da web depende das suas características gerais. Por exemplo, quanto
espaço em disco seria necessário para criar um repositório de todas as imagens
da web portuguesa? Os relatórios a emitir permitirão responder a estas questões e fornecerão medidas
indicadoras da difusão das tecnologias de informação em Portugal;
- Sistema de salvaguarda da
informação arquivada (rARC): será um mecanismo distribuído que permitirá a um
utilizador da Internet disponibilizar espaço em disco no seu computador para
armazenar uma cópia de segurança de parte dos dados arquivados, recorrendo à instalação de
uma pequena aplicação no seu computador. Pretende-se assim que em caso de falha
do arquivo central, a colecção de conteúdos arquivados possa ser recuperada a
partir das cópias de segurança distribuídas pelos utilizadores. Assim sendo, qualquer
indivíduo ou instituição poderá colaborar para a preservação da web portuguesa;
- Infra-estrutura para processamento
paralelo dos dados arquivados: irá permitir que investigadores, mesmo sem
serem especialistas em sistemas informáticos distribuídos, executem os seus
programas sobre os dados web arquivados usando várias máquinas do projecto em
paralelo.
Colateralmente, pretendemos também com este
projecto atingir os seguintes objectivos:
-
Formação de recursos humanos na
área de arquivo da web que possibilitem a manutenção do sistema no futuro;
- Exportação do saber-fazer e tecnologia de arquivo da web para outros países,
nomeadamente os de língua portuguesa;
- Contribuição para o aumento do
número de registos sob o domínio nacional .PT, uma vez que o arquivo histórico
gratuito da informação publicada sob este domínio constituiria uma motivação
adicional para os registradores;
- Publicação de artigos científicos
e técnicos que permitam a partilha dos conhecimentos adquiridos e obtenção de retorno acerca do trabalho desenvolvido.