Recommandations relatives à la préservation numérique pour les petits musées

Table des matières

Liste des abréviations

DNF
dépôt numérique fiable
OAIS
système d'information archivistique ouvert (« open archival information system »)
RCIP
Réseau canadien d'information sur le patrimoine
SSD
disques à circuits intégrés
TI
technologie de l'information
To
téraoctet (240 octets ou 1 000 gigaoctets)

Introduction

Il existe déjà des normes de préservation numérique bien établies. Toutefois, certains petits établissements du patrimoine culturel, comme les musées communautaires, n'ont pas les ressources pour y répondre. À titre d'exemple, les systèmes d'archivage numérique sont coûteux et nécessitent des investissements en temps que les organisations gérées par des bénévoles ou par un seul employé n'ont pas ou ne peuvent se permettre. Il n'est tout simplement pas possible d'obtenir une certification de dépôt numérique fiable (DNF), ni même de maintenir des archives numériques conformes au cadre du système d'information archivistique ouvert (OAIS pour « open archival information system »). Pourtant, les options autres que ne rien faire ou ne faire que des sauvegardes présentent des risques inutiles.

Afin de venir en aide aux établissements de petite et de moyenne taille, le Réseau canadien d'information sur le patrimoine (RCIP) a formulé un ensemble de recommandations relatives à la préservation numérique. Ces recommandations sont fondées sur l'expérience du RCIP dans trois domaines :

  • la mise en œuvre de plans et de politiques de préservation numérique dans les petits établissements du patrimoine culturel;
  • la prestation d'ateliers sur la préservation numérique à de petites organisations;
  • la collecte de commentaires ayant suivi la présentation de ses travaux au Groupe de discussion sur la numérisation et la préservation numérique, un groupe informel d'experts en numérisation et en préservation numérique de partout au Canada.

Recommandation 1 : utiliser la Boîte à outils de la préservation numérique du Réseau canadien d'information sur le patrimoine

Des établissements de n'importe quelle taille peuvent utiliser la Boîte à outils de la préservation numérique. Elle aide les établissements du patrimoine culturel :

  1. à faire le portrait (dresser un inventaire et évaluer les risques et les répercussions des pertes) de leurs biens numériques;
  2. à rédiger une politique de préservation numérique;
  3. à établir un plan et des procédures de préservation numérique.

Il faut respecter chacune des étapes, car elles sont toutes importantes, quelle que soit la taille de l'établissement. Toutefois, les deux dernières étapes (la rédaction d'une politique et l'établissement d'un plan) seront probablement beaucoup plus simples à mettre en œuvre au sein de petits établissements. Dans les études de cas menées par le RCIP (Musée du 8th Hussars et Musée Medalta), on a même pu observer que la politique et les plans étaient, avec le recul, plus détaillés que nécessaire.

Nul besoin de rédiger une politique de plus de deux pages. Il faut se concentrer sur ce qu'il faut préserver et la raison pour laquelle il faut le préserver, et utiliser l'élaboration de ce document comme outil de gestion du changement afin de susciter l'intérêt à l'égard de la préservation de ces ressources et l'engagement continu de tous ceux qui participeront à ces activités.

De même, le plan nécessitera bien moins de recherches de solutions et de comparaisons qu'un plan visant de grands établissements aux budgets et aux besoins plus importants. En effet, on recommande ici des solutions de base précises à des problèmes de préservation précis.

Recommandation 2 : utiliser les raccourcis et les outils déjà en place pour simplifier l'inventaire

La première étape du processus de préservation consiste à dresser l'inventaire des biens numériques d'un établissement (consulter Comment utiliser la Boîte à outils de la préservation numérique). Voici une liste de conseils et de raccourcis qui faciliteront la tâche :

  • Utiliser l'outil d'identification des formats DROID (en anglais seulement) (distribué gratuitement par les Archives nationales du Royaume-Uni) pour cerner rapidement les types de fichiers, leur nombre et les besoins en stockage.
  • En plus de DROID, utiliser le registre technique PRONOM (en anglais seulement) de ces mêmes archives pour établir les caractéristiques techniques de tout format de fichier.
  • Évaluer le nombre de biens numériques se trouvant sur des supports amovibles, comme les disques optiques, et les besoins connexes en stockage. Ce nombre ne doit pas nécessairement être exact.
  • S'assurer que tout plan de préservation mis en œuvre est assez souple pour répondre aux besoins éventuels, en tenant compte des biens numériques susceptibles d'être détenus dans un proche avenir, par exemple si l'on prévoit ou qu'on mène déjà un grand projet de numérisation. Prévoir une estimation de la capacité de stockage nécessaire pour répondre à ces besoins (en cas de doute, arrondir à l'unité supérieure dans votre estimation).

Recommandation 3 : utiliser de l'espace de stockage supplémentaire plutôt qu'un système d'information archivistique ouvert

Une pratique exemplaire courante consiste à utiliser un système d'archivage conforme au modèle de référence OAIS. Ce type de système archive des éléments de contenu (le plus souvent sous forme de biens numériques distincts), qu'il faut décrire de façon exhaustive à l'aide de métadonnées de préservation; il faut ensuite les gérer (les tenir à jour et les migrer) au fil des années. L'avantage de cette méthode, c'est que les biens archivés se gèrent et se récupèrent mieux que les exemplaires faisant autorité, sans compter que les recherches dans ceux-ci sont plus efficaces.

Ce modèle présente cependant des problèmes pour les petits établissements. Premièrement, on ne dispose habituellement pas des ressources (argent, main-d'œuvre et compétences) nécessaires pour mettre en œuvre ou maintenir un tel système, pour lequel il faut souvent un archiviste numérique spécialisé. Deuxièmement, le nombre et la nature des biens numériques peuvent ne pas justifier un système OAIS; on peut facilement répertorier sans archives officielles un contenu modeste et statique (soit dans sa forme définitive) pour lequel les métadonnées de biens multiples se ressemblent. Troisièmement, le nombre et la nature des requêtes prévues à l'égard des archives peuvent ne pas justifier un système OAIS. Un petit établissement n'ayant qu'un employé gérant un contenu peu susceptible d'être consulté ultérieurement peut souhaiter le conserver sans investissement d'envergure.

Si les conditions ci-dessus s'appliquent, le RCIP recommande d'effectuer des sauvegardes régulières semblables à celles qu'effectuent les services de technologie de l'information (TI), ainsi que de produire régulièrement des copies de préservation accompagnées de métadonnées de préservation de base. Ces copies ne doivent jamais être écrasées.

Nous avons rédigé les recommandations qui suivent en pensant à un environnement Windows, mais la plupart se prêtent aussi à d'autres systèmes d'exploitation.

3(a) Regrouper et organiser les biens numériques

Regrouper, sur un seul disque dur partagé, tous les originaux des biens numériques de l'établissement stockés localement en gardant à l'esprit les facteurs suivants :

  • Faire en sorte que ce disque ne puisse être accessible qu'au personnel qui en a besoin.
  • Si le contenu se trouve déjà sur d'autres supports physiques (par exemple, des disques optiques), ces supports peuvent être conservés, en particulier s'ils sont de qualité archivistique. Cependant, le contenu doit également être centralisé sur les disques durs comme il est décrit ici. Il est à noter que la Loi sur la modernisation du droit d'auteur interdit la migration de données à partir de supports visés par une mesure de protection technologique, qu'on trouve parfois sur des supports optiques commerciaux.
  • Établir la structure du répertoire du disque partagé en fonction des groupes de biens établis pendant l'inventaire, ce qui correspond à l'étape 1 de la Boîte à outils de la préservation numérique.
  • Désigner clairement qu'il s'agit d'originaux. Pour ce faire, on peut nommer les répertoires en conséquence (par exemple, en donnant au répertoire racine le nom « Originaux »), ou ajouter une mention normalisée dans le nom de fichier de chaque ressource (par exemple, « original_ »).
  • Il est également possible de stocker les copies de travail de ces biens numériques sur le disque partagé, mais il faut les distinguer clairement des fichiers originaux au moyen de répertoires séparés et d'une convention d'appellation distincte.
  • Dans la mesure du possible, consigner les biens numériques dans les bases de données existantes. Un musée peut intégrer le numéro d'acquisition au nom de fichier de toute copie numérique d'un objet matériel, associant ainsi le bien numérique à l'objet original et à son enregistrement. De même, il est possible d'inscrire les objets d'origine numérique (comme la piste audio d'une entrevue) au registre des biens d'un musée : il faut alors ajouter un enregistrement au système de gestion des collections du musée et intégrer le numéro d'acquisition de l'objet au nom de fichier de ce bien numérique.

3(b) Localiser et répertorier le contenu de la base de données

Certains biens numériques (ou groupes de biens) sont évolutifs de nature. Une base de données de gestion des collections, par exemple, est constamment mise à jour. Considérer ce qui suit pour un tel contenu :

  • Dans la mesure du possible, stocker cette base de données sur le disque partagé (si elle est installée et fonctionne localement); ainsi, malgré ses modifications, son répertoire sera considéré comme faisant partie des originaux.
  • S'il n'est pas possible ni pratique de transférer la base de données sur le disque partagé, il convient de la conserver sur le disque où elle se trouve et d'exécuter toutes les tâches subséquentes, comprises dans cette liste, de manière distincte par rapport à ce disque.
  • Ne pas modifier le répertoire ni les noms de fichiers d'un tel système, car le bon fonctionnement de certaines applications pourrait nécessiter des noms de chemins d'accès précis.
  • Toute base de données stockée en ligne (par exemple, un système de gestion des collections en ligne ou un système de gestion des biens numériques) peut également être considérée comme une copie originale de cette ressource. Toutefois, il faut en télécharger régulièrement les données et les enregistrer sur le disque partagé dans un format accessible, en cas de perte d'accès au service en ligne. Enregistrer les données textuelles ou numériques provenant de ces sources dans les formats suivants : valeurs séparées par des tabulations ou valeurs séparées par des virgules, ou tout autre format texte facilement accessible. À tout moment, seule la copie la plus récente de ces données doit être conservée sur le disque partagé. Les versions antérieures sont versées dans les copies de sauvegarde et les copies de préservation, comme décrit ci-dessous.

3(c) Créer immédiatement des métadonnées de préservation pour les originaux

Une fois la structure du disque partagé établie, et immédiatement avant de faire une copie de préservation, il faut créer des métadonnées de préservation pour les originaux ou y associer de telles données.

Dans la mesure du possible, ajouter les métadonnées de préservation aux groupes de biens numériques (comme le prévoit l'inventaire, étape 1 du Déroulement des activités – Boîte à outils de la préservation numérique) plutôt qu'aux biens individuels. S'il n'y a aucune autre méthode, enregistrer ces données à l'aide d'un simple éditeur de texte dans un fichier intitulé « préservation_métadonnées » et stocker ce fichier sur le disque partagé, dans le même répertoire que le groupe de biens numériques.

Voici certaines des métadonnées les plus importantes à consigner :

Provenance

Origine du bien ou du groupe de biens numériques.

  • Si le bien est lié à un document dans un système de gestion des collections, un système de gestion des biens numériques ou une base de données analogue, certaines données sur la provenance seront déjà enregistrées; aucune intervention n'est alors nécessaire.
  • À la création de fichiers dans certains formats (comme les images), des métadonnées sont également produites et intégrées dans l'en-tête. Pour une photographie, l'appareil peut notamment enregistrer la date, l'emplacement et le type d'équipement utilisé. Aucune intervention n'est alors nécessaire.
  • S'il est possible d'ajouter des données concernant la provenance d'un groupe ou d'un sous-groupe de biens, les enregistrer dans le fichier texte des métadonnées de préservation figurant dans le répertoire. Aucun format n'est prescrit; il faut simplement enregistrer les données jugées pertinentes.

Contexte

Données sur les liens entre le bien numérique et d'autres biens, les propriétés de l'établissement, les projets de numérisation, les installations et autres.

  • Certaines d'entre elles se trouvent peut-être dans les champs d'une base de données à laquelle le bien est lié. Aucune intervention n'est alors nécessaire.
  • S'il existe d'autres données contextuelles sur un groupe ou un sous-groupe de biens, on peut les ajouter au fichier texte des métadonnées de préservation figurant dans le répertoire. Ajouter une ligne « Contexte », puis décrire le contexte en texte libre sur la ligne suivante. Indiquer toute information jugée pertinente.

Activité de préservation

Historique ou piste d'audit de toutes les mesures appliquées au bien numérique pendant le processus de préservation.

  • Le processus décrit ici ne prévoit aucune disposition relative à l'enregistrement de l'activité de préservation des biens numériques individuels, mais on peut consigner les mesures appliquées à des groupes ou à des sous-groupes de biens dans le fichier texte des métadonnées de préservation (dans le répertoire du groupe). Consigner toute activité de conversion de fichiers nécessaire à la création d'originaux (y compris les dates, formats de fichiers et logiciels utilisés) ainsi que toute migration de fichiers au cours de la vie du bien numérique (y compris, encore une fois, les dates, formats de fichiers et logiciels utilisés). Consulter la section Migration de contenu.
  • On peut aussi nommer le répertoire principal d'une copie de préservation (consulter la section 3(d) Créer annuellement des copies de préservation) de tous les contenus selon la date de la copie (par exemple, « copie_préservation_aaaammjj »).

Authenticité

Toutes les activités visant à s'assurer que le bien numérique est bel et bien ce qu'il est censé être. Il s'agit également d'une combinaison de nombre des éléments de métadonnées de préservation décrits ici. En règle générale, un archiviste numérique gère les données d'authenticité; c'est là un processus qui dépasse la portée des présentes recommandations. Cependant, les recommandations fournissent suffisamment d'autres informations pour permettre à toute personne faisant des recherches élémentaires sur les originaux ou sur les copies de préservation d'établir avec assez de certitude l'authenticité d'un bien numérique.

Intégrité

Un bien numérique intègre n'a pas été modifié accidentellement pendant le processus de préservation. Des modifications peuvent survenir au cours de la migration (on trouvera plus de détails dans la section Migration de contenu); de même, il peut y avoir modification ou écrasement des données d'une copie originale. On désigne parfois par « vérification de la fixité » le fait de s'assurer qu'un fichier n'a pas été modifié par inadvertance.

  • Le moyen le plus simple de mener cette vérification consiste à générer et stocker une somme de contrôle pour chaque ressource préservée.
  • En préservation numérique, une somme de contrôle désigne une séquence de données produite par un algorithme précis appliqué au contenu détaillé d'un fichier. Le même algorithme appliqué au même contenu donne toujours la même somme de contrôle. De même, toute modification du fichier d'origine produit presque systématiquement une somme de contrôle différente.
  • À la création d'un répertoire comprenant des fichiers originaux, produire des sommes de contrôle pour tous les fichiers. Les stocker dans un emplacement facilement accessible, le plus souvent un fichier texte enregistré dans le même répertoire.
  • Si l'on produit des sommes de contrôle plus tard, puis qu'on les compare à celles d'origine, on peut cerner les fichiers modifiés, le cas échéant. S'il y en a, on peut récupérer les fichiers d'origine au moyen des sauvegardes (consulter la section 3(f) Effectuer des sauvegardes régulières) ou des copies de préservation.
  • MD5 est un algorithme souvent utilisé en préservation. Plusieurs logiciels calculent la somme de contrôle MD5, comme MD5 Summer (en anglais seulement), un logiciel libre appuyé par des dons.
  • Quel que soit le logiciel choisi, il faut veiller à stocker les résultats dans un document texte facilement accessible; ainsi, on pourra utiliser plus tard n'importe quel logiciel de somme de contrôle MD5 pour vérifier la fixité.
  • Les logiciels de sauvegarde utilisent parfois les algorithmes de la somme de contrôle MD5, habituellement pour déceler les fichiers modifiés entre deux sauvegardes. Malheureusement, ceux-ci stockent souvent ces sommes de contrôle dans un format propriétaire inaccessible aux autres logiciels. Pour assurer la vérification de la fixité à long terme, de tels logiciels de sauvegarde ne sont pas pratiques, puisqu'ils pourraient devenir périmés ou inutilisables. Ils demeurent utiles pour les sauvegardes, mais il faut toujours utiliser un générateur de sommes de contrôle distinct s'ils n'enregistrent pas les sommes de contrôle MD5 dans un fichier texte d'accès facile.
  • Quand utiliser les sommes de contrôle :
    • Pour les biens numériques rarement modifiés ou qui ont des originaux (images, audio, vidéo, etc.), il convient d'utiliser les sommes de contrôle MD5 dans les situations suivantes :
      • Au regroupement initial des originaux sur un disque partagé (effectué une seule fois), il faut créer et enregistrer les sommes de contrôle.
      • À la suite de modifications délibérées à un répertoire contenant des originaux sur le disque partagé, comme l'ajout de nouveaux fichiers ou la migration de fichiers existants vers de nouveaux formats. Dans ces deux cas, il faut confirmer l'exactitude des sommes de contrôle des anciens fichiers du répertoire. Une fois les changements souhaités effectués (par exemple, ajout ou migration de fichiers), il faut remplacer les anciennes sommes de contrôle.
      • Juste avant de créer une copie de préservation annuelle (consulter la section 3(d) Créer annuellement des copies de préservation), il faut vérifier les sommes de contrôle de tous les répertoires du lecteur partagé qui comprennent des fichiers originaux, enregistrer le fichier de ces sommes de contrôle et l'inclure dans la copie de préservation.
      • Au moment d'utiliser une copie de préservation ou une sauvegarde (consulter la section 3(f) Effectuer des sauvegardes régulières) pour restaurer des fichiers originaux corrompus ou perdus sur le disque partagé. Dans de tels cas, il faut vérifier le fichier de sommes de contrôle stocké dans la copie de préservation ou la sauvegarde.
    • Pour les bases de données et autres groupes de biens numériques constamment mis à jour, créer des sommes de contrôle sur le disque partagé est inutile, car le bien change constamment. On s'en sert plutôt pour les copies de préservation, selon les modalités suivantes :
      • À la création de la copie annuelle de préservation de la base de données, on produit les sommes de contrôle, qui sont versées directement dans la copie.
      • Avant d'extraire des enregistrements d'une copie de préservation (si les documents de travail ont été perdus ou effacés par inadvertance), il faut vérifier les sommes de contrôle de cette copie afin de confirmer la fixité de la base de données.

Environnement technique

Données sur le matériel, les logiciels et le système d'exploitation ayant servi à produire le bien numérique ou pouvant être nécessaires pour y avoir accès.

  • Certaines métadonnées sur l'environnement technique se trouvent peut-être déjà dans l'en-tête de fichiers en certains formats (par exemple, données sur l'appareil utilisé pour produire une image). Aucune autre mesure n'est requise pour garder ces données.
  • On trouve également des renseignements supplémentaires sur l'environnement technique d'un format de fichier donné dans le registre technique PRONOM (en anglais seulement) des Archives nationales du Royaume-Uni.
  • Enfin, si d'autres informations spécifiques sont jugées importantes, on peut les ajouter au fichier de métadonnées de préservation.

Gestion des droits

Droits d'auteur et autorisations d'utilisation d'un bien numérique donné.

  • Certaines informations peuvent se trouver dans une base de données à laquelle le bien numérique est lié. D'autres peuvent figurer dans les documents administratifs sur le disque partagé.

3(d) Créer annuellement des copies de préservation

Une fois qu'on a classé les fichiers du disque partagé, il faut enregistrer, sur des disques durs externes, un instantané de tout le contenu des répertoires principaux; il s'agit des copies de préservation annuelles. Il faut y copier l'intégralité de la structure des répertoires. Contrairement aux sauvegardes, ces copies comprennent tous les attributs des fichiers et dossiers d'origine (date de création, date de modification, etc.). Ces copies contiennent également des sommes de contrôle associées aux bases de données; il est absolument essentiel de ne jamais écraser ces copies. Voici d'autres facteurs à prendre en considération :

  • Sur les systèmes d'exploitation Windows, utiliser la commande robocopy pour copier en masse tous les contenus et les structures de répertoires et pour conserver la date et l'heure associées aux fichiers et aux dossiers.
  • Les sommes de contrôle liées aux biens numériques sur le disque partagé doivent faire partie de la copie de préservation.
  • Aucune somme de contrôle n'est créée pour les copies de préservation des bases de données et les autres fichiers en évolution constante sur le disque partagé. Il faut plutôt produire des sommes de contrôle dans la copie de préservation immédiatement après avoir exécuté la commande robocopy.
  • Conserver deux ensembles de ces copies de préservation sur deux disques externes séparés, dont un hors site. Il ne faut jamais les écraser.
  • Conserver ces copies de préservation indéfiniment. Bien qu'il soit théoriquement possible de supprimer du contenu ayant dépassé sa date d'aliénation, il n'y a généralement aucun avantage à le faire. Il vaut mieux supprimer ce contenu du disque partagé. Consulter la section 3(h) Gérer les disques durs pour en savoir davantage sur le dépassement de capacité.
  • On peut également stocker dans le nuage les copies de préservation, mais la façon de procéder dépendra de la nature du service de stockage. De plus, il ne faut jamais verser les copies de préservation uniquement dans le nuage : au moins une copie doit se trouver sur un disque dur.

3(e) Gérer le contenu

Copie de contenu

Copie du contenu sur de nouveaux supports physiques, principalement pour parer à leur dégradation.

  • Il faut copier au moins tous les cinq ans le contenu se trouvant sur des disques durs individuels. Utiliser la commande robocopy à cette fin. Consulter la section 3(h) Gérer les disques durs pour obtenir de plus amples renseignements à ce sujet.
  • En règle générale, il faut transférer sur des disques durs le contenu des supports optiques, mais on peut conserver la copie originale.
  • Il vaut mieux ne pas transférer le contenu entre supports optiques, sauf si l'organisation l'exige pour une raison précise, comme la planification en cas de sinistre à long terme.

Migration de contenu

Conversion des biens numériques d'un format à un autre pour éviter l'obsolescence des fichiers et les garder accessibles.

  • À l'occasion de l'inventaire régulier des biens numériques (consulter la Boîte à outils de la préservation numérique), établir le contenu du disque partagé à migrer, puis le migrer en le conservant sur le disque partagé. Conserver, dans un sous-dossier, le format original ainsi que les fichiers visés par la migration, et marquer ces derniers en conséquence.
  • Les logiciels DROID et PRONOM peuvent servir à planifier une migration.
  • Ne pas migrer le contenu vers des copies de préservation existantes, car il ne faut jamais les modifier ni les écraser.
  • Dans toute migration, il est préférable d'utiliser des outils qui permettent la migration par groupes de biens numériques et qui garantissent que le processus de conversion des anciens aux nouveaux formats conserve autant de détails pertinents que possible, y compris les métadonnées.
  • Il faut consigner toutes les activités de migration (par exemple, la nature du contenu migré, la personne responsable de la migration, les outils qu'elle a utilisés et tout autre commentaire) dans le fichier texte des métadonnées de préservation enregistré dans le répertoire du groupe de biens visé.

Préservation et aliénation des biens numériques

  • Si un bien doit être conservé conformément au calendrier de préservation et d'aliénation des biens numériques, ne pas le supprimer du disque partagé. S'il y a plusieurs versions du bien, toujours s'assurer que la copie originale, sur le disque partagé, est désignée et placée de manière à être facile d'accès.
  • À l'échéance d'aliénation d'un bien, selon le calendrier, on peut en supprimer toutes les copies du disque partagé.
  • Conserver toutes les copies de préservation aussi longtemps que l'exige la présence d'un seul bien numérique dans la copie (conformément au calendrier de préservation et d'aliénation des biens numériques). On peut supprimer le contenu inutile d'une copie de préservation; si on le fait, toutefois, il en résultera une image partielle de ce qui a été stocké, de même que des sommes de contrôle indiquant les fichiers manquants. Il est habituellement plus simple de conserver la copie dans son intégralité.

3(f) Effectuer des sauvegardes régulières

Outre les copies de préservation annuelles, il faut sauvegarder plus souvent tous les biens numériques du disque partagé. Idéalement, il faut stocker ces sauvegardes hors site, mais cela risque d'être peu pratique s'il y a un seul disque de sauvegarde. Ces sauvegardes ne nécessitent aucune donnée de fixité ni le recours à la commande robocopy pour préserver les attributs des fichiers. On peut faire ces sauvegardes dans le nuage ou sur des lecteurs externes amovibles. Le plus souvent, ces sauvegardes sont déjà effectuées par le service de soutien informatique du musée.

  • Si l'on utilise des disques durs externes :
    • Effectuer des sauvegardes cycliques (par exemple, hebdomadaires ou mensuelles). Pour gagner de l'espace sur le disque, on peut écraser les archives les plus anciennes après un certain temps.
    • Comme les fichiers de base de données changent constamment, il faut effectuer une sauvegarde hebdomadaire ou mensuelle.
    • Les fichiers d'autres types changent probablement moins souvent. Pour gagner de l'espace sur le disque dur, il vaut mieux choisir un logiciel de sauvegarde qui n'enregistre que les fichiers modifiés depuis la dernière sauvegarde (ce qu'on appelle une sauvegarde incrémentielle).
  • Si l'on utilise le stockage en nuage :
    • Choisir un service spécialisé dans les sauvegardes, par opposition à un service d'échange de fichiers ou à un service de stockage en ligne qui sert d'emplacement principal pour le contenu.
    • Certains services proposent un historique qui permet de consulter ce que contenait le disque dur à n'importe quel moment. Ces services sont pratiques, mais à moins que les métadonnées des fichiers soient elles aussi préservées (date de création du fichier, dates de modification, etc.), ils ne doivent servir qu'aux sauvegardes, et non aux copies de préservation.
    • Soyez au fait des données délicates qu'on pourrait téléverser de même que des lois et des pratiques concernant la protection des renseignements personnels sur Internet du pays où sont hébergés les serveurs de stockage.

3(g) Pour accéder au contenu, chercher d'abord le contenu sur le lecteur partagé, puis dans les sauvegardes et les copies de préservation en même temps

Pour accéder à un bien numérique, le chercher d'abord sur le disque partagé. Parce que rien n'est supprimé, sauf si le calendrier de préservation et d'aliénation des biens numériques l'exige, il devrait s'y trouver. Sinon, vérifier les sauvegardes hebdomadaires ou mensuelles, plus récentes que les copies de préservation, puis les copies de préservation annuelles, car les dates s'y rattachant sont fidèles. Dans la mesure du possible, toujours restaurer à partir de la copie de préservation.

S'il manque un bien sur le disque partagé, en établir la raison et déterminer si tout autre contenu est manquant. Restaurer, le cas échéant, les biens numériques manquants (encore une fois, à partir des copies de préservation, si possible) afin d'éviter que le problème se répète. La commande robocopy peut servir à conserver les dates des fichiers restaurés, mais il faut faire preuve de diligence pour ne pas écraser d'autres documents du disque partagé.

S'il manque du contenu attendu d'une copie de préservation, laisser la copie telle quelle. Il ne faut jamais écraser une copie de préservation. S'il manque un grand nombre de fichiers dans une copie de préservation récente, il peut être utile de créer une autre copie après avoir restauré le contenu manquant sur le disque partagé. Décrire tout le travail effectué dans les fichiers texte des métadonnées de préservation sur le disque partagé.

3(h) Gérer les disques durs

La gestion de tous les disques durs exige de prendre les mesures suivantes :

  • Inscrire la date de remplacement (cinq ans à compter de la date d'achat) sur tout disque dur externe et en copier le contenu, à l'aide de la commande robocopy, sur de nouveaux disques, en conséquence. Le disque partagé interne est susceptible d'être remplacé en même temps que l'ordinateur, habituellement tous les cinq ans environ. Dans ce cas, ajouter le nouvel ordinateur au réseau et utiliser la commande robocopy pour copier le contenu sur le nouveau disque partagé.
  • Pour les copies (sauvegardes ou copies de préservation) en environnement Windows, si les besoins de stockage dépassent les capacités des disques durs commerciaux, envisager l'utilisation des espaces de stockage Windows avec parité; il s'agit là d'un moyen simple de regrouper des disques en un grand disque virtuel pour l'archivage de données. Ceux-ci sont plus stables et accessibles dans les versions les plus récentes du système d'exploitation. Puisque la façon de faire varie d'une version de Windows à l'autre, les utilisateurs sont priés de consulter la documentation de Microsoft pour connaître les bonnes procédures. En 2018, il était possible de créer de cette manière un espace de stockage de 63 téraoctets (To).
  • Pour les disques partagés en environnement Windows, si l'espace nécessaire dépasse les capacités des disques commerciaux, envisager l'utilisation d'un espace de stockage Windows en miroir. Les espaces de stockage en miroir et ceux fondés sur la parité assurent une redondance en cas de défaillance d'un lecteur; les systèmes avec parité utilisent plus efficacement l'espace disque, mais les délais d'accès des systèmes en miroir sont plus courts.
  • Si l'on utilise des espaces de stockage Windows, n'utiliser que des disques de même capacité, car le système ne « voit » dans tous les disques que la capacité du plus petit.
  • Pour remplacer un disque d'un espace de stockage Windows, ne pas utiliser la commande robocopy. Suivre plutôt les instructions concernant le remplacement d'un disque; celles-ci varient selon la version de Windows.
  • Que les disques durs externes soient utilisés dans un espace de stockage ou comme périphériques autonomes, utiliser des disques de divers fabricants connus et fiables afin de réduire le risque de pannes simultanées des disques.

3(i) Limiter l'utilisation d'autres supports de stockage

Conserver les disques optiques non vierges si et seulement si ils sont réputés être de qualité archivistique. Autrement, ne pas compter ce support dans les copies en réserve. Pour conserver du nouveau contenu, les disques durs sont habituellement préférables aux disques optiques.

Les disques à circuits intégrés (SSD) constituent une solution de remplacement acceptable aux disques durs s'ils sont utilisés comme disques partagés. Cependant, en 2018, au moment de rédiger ce document, l'utilisation d'un SSD pour stocker des copies de préservation n'était pas recommandée.

3(j) Nommer les fichiers d'une manière structurée et cohérente

Observer les pratiques et conventions d'appellation de fichiers suivantes :

  • Préfixer le nom des originaux (par exemple, « original_ »).
  • Éviter d'utiliser des espaces ou des caractères spéciaux, car cela cause parfois des problèmes dans les scripts et pendant le transfert de fichiers entre systèmes d'exploitation.
  • Le nom des copies de travail des fichiers multimédias doit indiquer le type de copie dont il s'agit, soit une copie de travail; de même, il faut assurer le contrôle des versions en intégrant au nom la date de création de la version (en format « AAAAMMJJ »).
  • Utiliser des sous-répertoires pour organiser les originaux, les versions anciennes et les copies de travail les plus récentes.

3(k) Envisager de passer à un modèle ouvert de préservation des systèmes d'archives si la capacité et les besoins augmentent

Un établissement doit envisager de passer à une solution entièrement conforme à l'OAIS si elle en a les moyens et si :

  • la recherche de contenu préservé ne peut être effectuée à la satisfaction de l'établissement;
  • l'authenticité du contenu consulté ne peut être garantie à la satisfaction de l'établissement;
  • au total, les ressources et le temps consacrés à la préservation et à la gestion du contenu de même qu'à l'accès à celui-ci selon les recommandations ci-dessus dépassent ce qui serait investi dans un modèle OAIS traditionnel.

Architecture matérielle d'un système typique utilisant ces recommandations

Dans la configuration la plus simple, il n'y a qu'un seul ordinateur, dont le disque dur contient autant de biens numériques que possible. Si le musée dispose d'ordinateurs supplémentaires, ceux-ci peuvent partager l'accès au disque dur au moyen d'un routeur sans fil (de préférence) ou d'une connexion Ethernet. S'il utilise une base de données en ligne, comme un système de gestion des collections, il faut stocker, sur le disque partagé et dans un format accessible, une copie régulièrement mise à jour de cette base de données. Le musée peut également souhaiter recourir à un service de sauvegarde en ligne, qui est plus coûteux que les disques durs externes, mais qui peut être plus pratique. Les copies de préservation devraient toujours être sauvegardées sur des disques durs externes, et au moins une copie devrait être sauvegardée à l'extérieur des lieux. Si les besoins de stockage l'exigent, on peut remplacer n'importe quel disque dur de ce diagramme (disque dur partagé ou disque dur externe) par une unité multidisque (par exemple, espace de stockage Windows).

© Gouvernement du Canada, Institut canadien de conservation. ICC 130950-0002
Figure 1 : Configuration matérielle typique d'un petit musée disposant d'un système facultatif de sauvegarde en ligne et d'un système facultatif de gestion des collections en ligne.

Description de la figure 1

Texte de remplacement pour la figure 1 : Cette figure représente la configuration matérielle courante d'un petit musée, et est conforme aux recommandations énoncées dans le présent document. La totalité des biens numériques se trouve sur un lecteur partagé (le plus souvent un disque interne) hébergé sur un seul ordinateur. Tous les autres appareils présents sur les lieux ont accès à ce lecteur, habituellement par l'intermédiaire d'un routeur sans fil. En règle générale, un lecteur externe branché à l'ordinateur central reçoit les copies de sauvegarde hebdomadaires du lecteur partagé. De plus, un deuxième lecteur est branché une fois l'an à cet ordinateur pour y stocker les copies de préservation annuelles des biens numériques que contient le lecteur partagé. Ces copies sont également versées sur un troisième lecteur installé dans un site externe. Il est possible que l'ordinateur central soit doté d'un accès à Internet (par exemple, au moyen d'un routeur sans fil). Le cas échéant, une telle liaison permet d'accéder à un système de gestion des collections (SGC) ou de sauvegarde facultatif en ligne.

Risques connus associés à ces recommandations

Les recommandations présentées en remplacement du modèle OAIS (c'est-à-dire celles présentées dans la section Recommandation 3 : utiliser de l'espace de stockage supplémentaire plutôt qu'un système d'information archivistique ouvert) visent à permettre aux petits établissements, dont les exigences sont moins grandes, d'assurer la préservation malgré le manque de ressources. Il est entendu que ces recommandations ne sont pas sans risque.

Risque : violation de la règle du 3-2-1

Selon cette règle de préservation généralement acceptée, il faut conserver au moins trois copies de tout bien numérique, utiliser deux types distincts de supports (c'est-à-dire de supports matériels) et stocker au moins une copie hors site. Pourtant, le processus expliqué ci-dessus permet l'utilisation de disques durs pour toutes les copies. La question a été abordée par le Groupe de discussion sur la numérisation et la préservation numérique. Les supports de stockage optiques de qualité archivistique, qui sont réputés avoir la durée de vie la plus longue de tous les supports de stockage, restent acceptables pour les biens qui y sont déjà enregistrés. Dans la plupart des plans de préservation, on juge toutefois le disque dur préférable dans les nouvelles installations en raison de sa capacité de stockage supérieure, de sa souplesse et de son prix abordable. Pour compenser le non-respect de la règle, on recommande de remplacer les disques durs tous les cinq ans, de conserver les copies sur plusieurs disques de différentes marques connues et d'en conserver au moins une hors site.

Risque : pas d'archivage formel d'une copie faisant autorité

Les recommandations ci-dessus ne prévoient pas de piste d'audit clairement documentée pour confirmer l'authenticité des copies d'un bien numérique faisant autorité. En outre, faire des recherches dans les biens préservés ou les récupérer n'est pas aussi simple que dans un système d'archivage. On suppose plutôt que la copie originale qui se trouve sur le disque partagé est la version faisant autorité et qu'il sera nécessaire de passer par des systèmes connexes (comme des bases de données de gestion des collections, des sommes de contrôle ou des métadonnées de préservation ponctuelles) pour confirmer l'authenticité de la copie. En l'absence d'un système d'archivage rigoureux qui améliore les fonctions de recherche ou qui exige l'utilisation appropriée des métadonnées de préservation, il y aura toujours un risque. Vu l'absence de ressources nécessaires à la mise en œuvre d'un système OAIS, et comme ces recommandations permettent d'assurer le plus grand taux de préservation possible dans les établissements ayant un petit budget et des besoins modérés, un tel risque est acceptable. D'ailleurs, il est possible de l'atténuer en liant les biens numériques aux systèmes de base de données en place (en utilisant le numéro d'acquisition dans un nom de fichier, par exemple) et en mettant à jour avec diligence le fichier texte des métadonnées de préservation (fichier texte stocké avec la copie originale) chaque fois que le bien fait l'objet d'une manipulation.

Sommaire

Ces recommandations visent à simplifier les mesures de préservation des musées de petite et moyenne taille et des établissements semblables du patrimoine culturel. Il demeure entendu que leur mise en œuvre constitue un pas dans la bonne direction et qu'elles seront plus efficaces si les responsables sont bien informés.

Ces recommandations sont conçues de manière à pouvoir être adaptées aux besoins et aux capacités des établissements qui les observent. C'est pourquoi elles s'appliquent à divers environnements techniques. Un système implanté selon ces recommandations pourra croître au rythme de l'établissement; il est par exemple possible de passer à une unité multidisque ou au stockage en ligne. Les recommandations encouragent également la création et la tenue à jour de métadonnées de préservation, ce qui permettra un accès à long terme aux biens numériques et, si les besoins et les ressources de l'établissement augmentent, aidera à simplifier la mise en œuvre ultérieure d'un système conforme à l'OAIS.

Enfin, ce ne sont que des recommandations. Si elles ne répondent pas aux besoins de votre établissement, vous pouvez et même devriez les adapter. Pour obtenir de plus amples renseignements sur la mise en œuvre de ces recommandations, n'hésitez pas à communiquer avec le RCIP.

Annexe : exécution de la commande robocopy

La commande robocopy peut servir à copier rapidement un grand nombre de fichiers, y compris tous les attributs, ce que la technique du glisser-déposer de Windows et de nombreux systèmes de sauvegarde ne permettent pas. Exécutable à partir de la ligne de l'interpréteur de commandes DOS, la commande robocopy est présente sur tous les systèmes d'exploitation Windows. Aucun logiciel supplémentaire n'est nécessaire pour l'utiliser.

L'interpréteur de commandes DOS s'ouvre de diverses façons, légèrement différentes les unes des autres, selon la version de Windows. En règle générale, il faut cliquer sur le bouton « Démarrer » ou « la sphère Démarrer » dans le coin inférieur gauche de l'écran du bureau, choisir l'article de menu « Exécuter », entrer « cmd » dans le champ « Ouvrir » et, enfin, appuyer sur la touche « Entrée ». Voici le format de la commande nécessaire pour créer des copies de préservation :

robocopy c:\répertoire_source\  e:\répertoire_destination\   /MIR /DCOPY:T

détails :

  • c:\répertoire_source\ — lecteur et chemin où se trouvent les fichiers originaux (noter que les chemins comprenant des espaces nécessiteront des guillemets).
  • e:\répertoire_destination\ — lecteur et chemin où copier les fichiers (s'assurer que ce chemin n'existe pas déjà).
  • /MIR — copie de tous les fichiers et sous-répertoires, tels quels.
  • /DCOPY:T — conservation de la date et de l'heure associées à tous les fichiers, répertoires et sous-répertoires.

Une fois la copie terminée, entrez « exit » et appuyez sur la touche « Entrée » pour fermer l'invite de commande.

Remarque : si l'on utilise l'option /MIR, il faut toujours copier les fichiers dans un répertoire de destination qui n'existe pas encore, car la commande peut écraser les fichiers d'un répertoire source si le chemin de destination existe déjà.

Glossaire

Boîte à outils de la préservation numérique
Ressource offerte par le RCIP pour aider les établissements canadiens du patrimoine culturel à conserver leurs biens numériques. Elle comprend des modèles, des diagrammes de décision, des lignes directrices et des études de cas qui aident les musées à produire des politiques, plans et procédures de préservation numérique.
calendrier de préservation et d'aliénation des biens numériques
Liste des biens numériques (habituellement par groupes) et de leur date d'aliénation. Il arrive souvent que cette date soit indéterminée, mais elle peut être révisée au cours de l'examen de l'inventaire d'un établissement.
commande robocopy
Commande offerte dans tous les systèmes d'exploitation Windows actuels. Exécutable par l'intermédiaire de l'interpréteur de commandes DOS, elle peut servir à copier des répertoires et des sous-répertoires entiers ainsi que leurs métadonnées connexes, y compris la date et l'heure associées aux dossiers et aux fichiers.
copie de contenu
Copie du contenu numérique sur un nouveau support physique, le plus souvent du même type. L'opération vise à éviter la perte de contenu due à la dégradation du support.
copie de préservation
Dans le contexte des recommandations du RCIP pour les petits musées, désigne la copie du fichier original et de toutes les métadonnées d'une ressource numérique en particulier. Contrairement aux copies d'archives, qui ne sont intégrées qu'une seule fois dans des archives, puis gérées, les copies de préservation sont sauvegardées annuellement.
copie de travail
Bien numérique dérivé d'une copie originale. Les copies de travail sont modifiables en fonction des besoins du projet.
copie originale
Copie d'un bien numérique dont toutes les autres copies sont dérivées. Une fois désignée comme telle, une copie originale ne devrait jamais être modifiée.
disque à circuits intégrés (SSD)
Périphérique de stockage de masse semblable à un disque dur mais sans pièce mobile. Les disques SSD sont fabriqués à partir de puces mémoires à semi-conducteurs.
disque optique
Support qui conserve les données sur une surface réfléchissante. Les disques compacts (CD) et les disques vidéo numériques (DVD) sont des disques optiques courants.
DROID
Outil logiciel développé par les Archives nationales du Royaume-Uni pour déterminer automatiquement, par lots, les formats de fichiers.
espace de stockage
Terme de Microsoft Windows désignant un regroupement de disques configurés. La configuration peut se faire de plusieurs façons pour répondre aux besoins (pas de redondance, redondance par mise en miroir ou redondance avec parité).
espace de stockage Windows avec parité
Façon de configurer un espace de stockage Windows pour assurer la redondance des données sur une unité multidisque. Cette façon de faire permet une plus grande capacité de stockage que la mise en miroir, mais au prix de délais d'accès plus longs.
espace de stockage Windows en miroir
Façon de configurer un espace de stockage Windows pour assurer la redondance des données sur une unité multidisque. La mise en miroir offre moins d'espace de stockage que la méthode avec parité, mais les délais d'accès sont plus courts.
Ethernet
Réseau local filaire le plus courant. Il est généralement repérable par la grosse prise « téléphone » (RJ-45) se trouvant sur les ordinateurs en réseau.
MD5
Algorithme de somme de contrôle utilisé dans la préservation numérique pour assurer la fixité des fichiers. Appliqué à un fichier, l'algorithme MD5 produit une valeur alphanumérique de 32 caractères (la somme de contrôle) qu'on peut enregistrer dans un fichier texte. Appliquer plus tard la même fonction au même fichier et comparer les deux sommes de contrôle permet d'établir si le fichier a été modifié.
mesure de protection technologique
Moyen technique (matériel, logiciel ou les deux) d'empêcher la copie d'une ressource numérique (habituellement une ressource vendue commercialement).
migration de contenu
Conversion du contenu dans un nouveau format de fichier. L'opération vise à s'assurer que le contenu reste accessible par les logiciels, les systèmes d'exploitation et le matériel récents.
OAIS
Système d'information archivistique ouvert et modèle de référence de ce système. OAIS est une organisation de personnes, de technologies, de flux de travaux et de procédures qui respecte un ensemble déterminé de normes du modèle OAIS.
PRONOM
Ressource et registre technique offerte par les Archives nationales du Royaume-Uni à quiconque a besoin d'informations objectives et définitives sur les formats de fichiers, les produits logiciels et les autres composants techniques nécessaires pour assurer l'accès à long terme aux documents électroniques et aux autres objets numériques ayant une valeur culturelle, historique ou commerciale.
somme de contrôle
Petite quantité de données générées par l'application d'une fonction à un bloc de données plus grand. Dans le contexte de la préservation numérique, elle sert à détecter les modifications accidentelles du contenu des fichiers.

Détails de la page

Date de modification :