
Cecurity.com
Editeur du Coffre-fort électronique Communicant
75 rue Saint Lazare
75 009 Paris
Tél. : 01 56 43 37 37
Fax : 01 56 43 37 40
contact@cecurity.com
Newsletter 2007
Article mis en ligne le 25 juin 2007
« Train de bits », émulateur universel ou migrations en entrée : trois grandes approches sont envisageables en matière de formats de fichiers dans un système d'archivage électronique avec pour chacune des avantages et des inconvénients.
***
La première approche consiste à ne voir dans les données que des « trains de bits » qui doivent être conservés de façon intègre. Cette façon de faire possède l'avantage d'être mise en oeuvre rapidement car tout document peut être reçu immédiatement et peut donc être archivé sans contrainte particulière. Mais cette organisation d'un système d'archivage conduit à différer le problème de la relecture à plus ou moins long terme. Les archives resteront certes facilement accessibles mais elles ne seront pas obligatoirement exploitables, c’est-à-dire lisibles, dans le futur. Elle ne peut donc convenir que pour des situations d’archivage à court terme, ce qui est pratiquement un oxymore.
L’émulation : solution idéale mais inaccessible
Une deuxième solution envisageable repose sur la mise en œuvre de la conversion à la demande. Cette technique consiste à entretenir en permanence des logiciels de lecture de tous les formats enregistrés dans le système d'archivage. Les fichiers ne sont jamais convertis de leur format originel vers un autre format, ils sont juste mis en forme au moment de leur demande pour être affichables. Cette technique présente théoriquement l'avantage de ne pas nécessiter de campagnes de conversion massives. Seuls les documents demandés en consultation sont traités. Par ailleurs, la garantie de l'intégrité des documents est très facile à mettre en oeuvre puisque tous les fichiers sont conservés dans leur état d'origine. Cependant, cette approche a priori très séduisante de l’émulateur universel en est encore au stade de la recherche et il serait donc prématuré d'inclure cette technologique dès aujourd'hui dans les plateformes d’archivages électroniques.
Restreindre le nombre des formats d’archivage
La troisième approche consiste à restreindre très fortement le nombre de formats de fichiers admis par le système d'archivage avec par exemple un seul format autorisé pour les documents textuels, un format pour les images fixes, un format pour les images animées, etc. Le premier avantage de cette solution est de rendre homogène tous les documents. Il est en effet possible de valider les formats fichiers en entrée, avant leur archivage, et donc de rejeter tous les fichiers non conformes. Le risque d'erreurs de conversion dans le futur s'en trouve ainsi très fortement réduit. Le nombre de logiciels à mettre en oeuvre pour ces opérations étant limité, des conversions de masse sont donc plus facilement réalisables.
La contrepartie est la très forte contrainte induite
lors de l'archivage initial. Il faut en effet soit, imposer aux services versants
ces formats, ce qui n'est pas toujours facile, soit convertir les documents
dès l'entrée, ce qui nécessite un nombre important de logiciels
de vérification et/ou de conversion de formats. C’est cette approche
qui a été retenue par la Direction des Archives de France dans
le cadre de la mise en œuvre de sa plateforme pilote d’archivage
électronique (Projet PIL@E).
Une telle politique conduit le responsable de la plateforme d’archivage
électronique à donner des réponses à la liste -
non exhaustive - des questions suivantes :
A chaque fois il convient de procéder à des arbitrages pragmatiques entre deux objectifs potentiellement contradictoires : la préservation de l’intégrité du document numérique d’une part et l’assurance de sa lisibilité dans la durée d’autre part. En l’espèce, il apparaît à l’usage que les réponses pertinentes seront bien plus souvent le fait des archivistes que des informaticiens.
Veille et traçabilité
La mise en œuvre d’une politique de gestion des
formats pour l’archivage électronique n’est pas une voie
facile mais, en attendant la mise à disposition d’un hypothétique
émulateur universel en provenance des laboratoires de R&D, elle semble
aujourd’hui la seule qui puisse donner satisfaction aux gestionnaires
d’une plateforme d’archivage électronique.
Deux mesures doivent cependant être retenues pour professionnaliser cette
démarche : la traçabilité de toutes les opérations
de migration et la mise en œuvre d’une cellule de veille à
même de décider des campagnes de conversions au sein de la plateforme
sur les formats en voie d’obsolescence.
Jean-Louis Pascon et Arnaud Belleil
En savoir plus :
La Direction des Archives de France a publié en ligne, le 25 avril 2007,
un document intitulé « Gestion des formats de fichier
» qui présente la stratégie retenue par la Direction des
Archives de France en matière de sélection des formats de fichiers
pour l'archivage électronique à long terme :
http://www.archivesdefrance.culture.gouv.fr/fr/archives%20electroniques/PIL@E.pdf
Le document a été réalisé sur la base d’une
prestation de Cecurity.com et de Hénon Conseil (Jean-Louis Pascon).