Un peu, selon les experts. D’une part, ce que nous pensons être permanent ne l’est pas. Les systèmes de stockage numérique peuvent devenir illisibles en aussi peu que trois à cinq ans. Les bibliothécaires et les archivistes se précipitent pour copier les choses dans des formats plus récents. Mais l’entropie est toujours là, attendant dans les coulisses. “Nos professions et nos gens essaient souvent de prolonger la durée de vie normale autant que possible grâce à une variété de techniques, mais cela freine toujours la marée”, explique Joseph Janes, professeur agrégé à la University of Washington Information School.
Pour compliquer les choses, les archivistes sont désormais aux prises avec un déluge d’informations sans précédent. Dans le passé, les matériaux étaient rares et l’espace de stockage limité. “Maintenant, nous avons le problème inverse”, dit Janes. “Tout est enregistré en permanence.”
En principe, cela pourrait réparer un tort historique. Pendant des siècles, d’innombrables personnes n’avaient pas la bonne culture, le bon sexe ou la bonne classe socio-économique pour que leurs connaissances ou leur travail soient découverts, valorisés ou préservés. Mais l’échelle massive du monde numérique présente désormais un défi unique. Selon une estimation de l’année dernière de la société d’études de marché IDC, la quantité de données que les entreprises, les gouvernements et les particuliers créeront au cours des prochaines années sera le double de toutes les données numériques générées auparavant depuis le début de l’ère informatique.
Des écoles entières au sein de certaines universités s’efforcent de trouver de meilleures approches pour sauvegarder les données sous leur égide. Le Centre de données et de services pour les sciences humaines de l’Université de Bâle, par exemple, a développé un plate-forme logicielle appelée Knora non seulement pour archiver les nombreux types de données du travail des sciences humaines, mais pour garantir que les gens à l’avenir pourront les lire et les utiliser. Et pourtant, le processus est lourd.
“Nous ne pouvons pas tout sauver… mais ce n’est pas une raison pour ne pas faire ce que nous pouvons.”
Andréa Ogier
“Vous faites des suppositions éclairées et vous espérez le meilleur, mais il y a des ensembles de données qui sont perdus parce que personne ne savait qu’ils seraient utiles”, explique Andrea Ogier, vice-doyenne et directrice des services de données aux bibliothèques universitaires de Virginia Tech.
Il n’y a jamais assez de personnes ou d’argent pour faire tout le travail nécessaire, et les formats changent et se multiplient tout le temps. « Comment allouer au mieux les ressources pour préserver les choses ? Parce que les budgets ne sont pas très importants », déclare Janes. “Dans certains cas, cela signifie que des éléments sont enregistrés ou stockés, mais restent là, non catalogués et non traités, et donc presque impossibles à trouver ou à accéder.” Dans certains cas, les archivistes finissent par refuser de nouvelles collections.
Les formats utilisés pour stocker les données sont eux-mêmes impermanents. La NASA a stocké environ 170 bandes de données sur la poussière lunaire, collectées pendant l’ère Apollo. Lorsque les chercheurs ont commencé à utiliser les bandes au milieu des années 2000, ils n’ont trouvé personne avec la machine IBM 729 Mark 5 des années 1960 nécessaire pour les lire. Avec de l’aide, l’équipe en a finalement retrouvé un en mauvais état dans l’entrepôt de l’Australian Computer Museum. Des bénévoles ont aidé à remettre en état la machine.
Le logiciel a également une durée de vie. Ogier se souvient d’avoir essayé d’examiner un ancien fichier de feuille de calcul Quattro Pro pour découvrir qu’il n’y avait pas de logiciel facilement disponible capable de le lire.