Gestion des formats pour l'archivage électronique

Article mis en ligne le 25 juin 2007

« Train de bits », émulateur universel ou migrations en entrée : trois grandes approches sont envisageables en matière de formats de fichiers dans un système d’archivage électronique avec pour chacune des avantages et des inconvénients.

***

La première approche consiste à ne voir dans les données que des « trains de bits » qui doivent être conservés de façon intègre. Cette façon de faire possède l’avantage d’être mise en oeuvre rapidement car tout document peut être reçu immédiatement et peut donc être archivé sans contrainte particulière. Mais cette organisation d’un système d’archivage conduit à différer le problème de la relecture à plus ou moins long terme. Les archives resteront certes facilement accessibles mais elles ne seront pas obligatoirement exploitables, c’est-à-dire lisibles, dans le futur. Elle ne peut donc convenir que pour des situations d’archivage à court terme, ce qui est pratiquement un oxymore.

 L’émulation : solution idéale mais inaccessible

Une deuxième solution envisageable repose sur la mise en œuvre de la conversion à la demande. Cette technique consiste à entretenir en permanence des logiciels de lecture de tous les formats enregistrés dans le système d’archivage. Les fichiers ne sont jamais convertis de leur format originel vers un autre format, ils sont juste mis en forme au moment de leur demande pour être affichables. Cette technique présente théoriquement l’avantage de ne pas nécessiter de campagnes de conversion massives. Seuls les documents demandés en consultation sont traités. Par ailleurs, la garantie de l’intégrité des documents est très facile à mettre en oeuvre puisque tous les fichiers sont conservés dans leur état d’origine. Cependant, cette approche a priori très séduisante de l’émulateur universel en est encore au stade de la recherche et il serait donc prématuré d’inclure cette technologique dès aujourd’hui dans les plateformes d’archivages électroniques.

 Restreindre le nombre des formats d’archivage

La troisième approche consiste à restreindre très fortement le nombre de formats de fichiers admis par le système d’archivage avec par exemple un seul format autorisé pour les documents textuels, un format pour les images fixes, un format pour les images animées, etc. Le premier avantage de cette solution est de rendre homogène tous les documents. Il est en effet possible de valider les formats fichiers en entrée, avant leur archivage, et donc de rejeter tous les fichiers non conformes. Le risque d’erreurs de conversion dans le futur s’en trouve ainsi très fortement réduit. Le nombre de logiciels à mettre en oeuvre pour ces opérations étant limité, des conversions de masse sont donc plus facilement réalisables.

La contrepartie est la très forte contrainte induite lors de l’archivage initial. Il faut en effet soit, imposer aux services versants ces formats, ce qui n’est pas toujours facile, soit convertir les documents dès l’entrée, ce qui nécessite un nombre important de logiciels de vérification et/ou de conversion de formats. C’est cette approche qui a été retenue par la Direction des Archives de France dans le cadre de la mise en œuvre de sa plateforme pilote d’archivage électronique (Projet PIL@E).
Une telle politique conduit le responsable de la plateforme d’archivage électronique à donner des réponses à la liste – non exhaustive – des questions suivantes :

  • Quels critères retenir pour la détermination des formats cible d’archivage ?
  • Quels critères retenir pour choisir les logiciels de vérification et/ou de conversion de format ?
  • Faut-il conserver le format d’origine après une opération de conversion ? Faut-il conserver les différentes versions d’un document pour chacune des différentes opérations de migration ?
  • Comment traiter le cas des documents chiffrés, des documents compressés, des documents signés ? Comment régler le cas des documents contenant des liens externes ou des macros ?

A chaque fois il convient de procéder à des arbitrages pragmatiques entre deux objectifs potentiellement contradictoires : la préservation de l’intégrité du document numérique d’une part et l’assurance de sa lisibilité dans la durée d’autre part. En l’espèce, il apparaît à l’usage que les réponses pertinentes seront bien plus souvent le fait des archivistes que des informaticiens.

 Veille et traçabilité

La mise en œuvre d’une politique de gestion des formats pour l’archivage électronique n’est pas une voie facile mais, en attendant la mise à disposition d’un hypothétique émulateur universel en provenance des laboratoires de R&D, elle semble aujourd’hui la seule qui puisse donner satisfaction aux gestionnaires d’une plateforme d’archivage électronique.
Deux mesures doivent cependant être retenues pour professionnaliser cette démarche : la traçabilité de toutes les opérations de migration et la mise en œuvre d’une cellule de veille à même de décider des campagnes de conversions au sein de la plateforme sur les formats en voie d’obsolescence.

Jean-Louis Pascon et Arnaud Belleil

Partager cet article

Restez informé !

Abonnez-vous à notre newsletter

  • Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.

A lire aussi

Article
Cecurity.com vous propose de vous éclairer en revenant sur les 5 clichés les plus courants à
En savoir plus
Article
2024, l'année de tous les défis... Pour bien commencer l'année, Cecurity.com vous propose un premier défi...
En savoir plus
Article
Cecurity.com suspend ses activités sur X (anciennement Twitter) en raison des récentes évolutions de ce réseau
En savoir plus
Cecurity.com
Téléphone Email