Archives web « Arquivo.pt »

Partager
Portugal

Actualité
Portugal | Sciences et technologies de l’information et de la communication : TIC, télécoms, micro-nanotechnologies, informatique
29 février 2016

Le site portugais Arquivo.pt archive toutes les pages web régulièrement depuis 1996. Il s’agit d’un service public et gratuit soutenu par la Fondation pour la Science et la Technologie et la Fondation Nationale pour la Science de l’Informatique.

Après une année de publication, 80% des pages en ligne disparaissent ou sont modifiées. Le service de préservation digital Arquivo.pt conserve une partie de la culture du pays et contribue à la valorisation de ces informations. Certains contenus sont d’intérêts internationaux et certaines archives sont uniques au monde.
Le défi de préserver le web est un effort continu de récupération et d’accès aux sites depuis 1996 via Arquivo.pt. Ce travail permettra aux générations futures de consulter les sites du passé.

Illust: logo Arquivo.pt, 11.2 ko, 400x105
logo Arquivo.pt
arquivo.pt

Ce projet est à l’initiative de la Fondation Nationale pour la Science de l’Informatique (Fundação para a Computação Científica Nacional – FCCN) et la Fondation pour la Science et la Technologie (Fundação para a Ciência e a Tecnologia – FCT). Il s’agit d’une infrastructure de recherche concentrée sur la préservation de contenu d’intérêt pour la communauté portugaise. De plus, le contenu est utilisable par les internautes internationaux. Le site offre aussi la possibilité d’accéder à une version des sites portugais automatiquement traduite.

Arquivo.pt permet également au Portugal d’être indépendant des autres pays pour l’archivage du web notamment des États-Unis et du système Wayback Machine.

Fonctionnement
La sauvegarde est réalisée automatiquement grâce un code informatique capable de gérer des données à grande échelle. Arquivo.pt sauvegarde automatiquement 300 sites par jour au hasard et, tous les 3 mois, il sauvegarde tous les sites « .pt » . De plus, il sauvegarde également quelques sites en « .org », « .com » ou « .eu ». Actuellement, 2.7 milliard de fichiers sont disponibles (95 Téra Octets de données).

Histoire d’Arquivo.pt
Arquivo.pt tient son origine du projet « TUMBA » de la Faculté de Sciences de l’Université de Lisbonne entre 2001 et 2006, et dont le résultat a donné lieu au premier prototype du système d’archivage du web portugais.
En 2007, la FCCN a lancé le projet « Archiver le web portugais » qui a été réalisé en 2008. C’est en 2012 que le projet a été mis pour la première fois à la disposition du public.

En 2015, Arquivo.pt a sauvegardé 580 millions de fichiers et le service a enregistré en moyenne 3700 utilisateurs par mois.
Actuellement, une nouvelle version de Arquivo.pt est en préparation (version « Fénix ») pour une meilleure interopérabilité du système. Pour 2016, Arquivo.pt prévoit une portée européenne et un système de recherche d’image.

Sources
Consulter le site Arquivo.pt

Fundação para a Ciência e a Tecnologia, (2016). Projeto da FCT | FCCN permite reencontrar websites do passado. Lisboa : FCT. Disponible : http://www.fct.pt/media/notas_imprensa/docs/ProjetoFCT-FCCNpermite_reencontrar_websites_do_passado_12012016.pdf

Angélique Verrecchia, chargée de coopération scientifique à l’Institut Français du Portugal, angelique.verrecchia [@] ifp-lisboa.com