Accueil   Semaine   Mois   Occaz'   Compte   Forum   Bas
Mercredi 15 septembre 2004
Sauvegarder, mais comment?

Introduction

Comme tout le monde le sait, l'informatique est un secteur qui ne cesse d'évoluer. Depuis 1976, année de la sortie du premier Apple I, Apple ne déroge pas à cette règle. À cette époque, les ordinateurs ne faisaient pas tellement partie de notre "Digital Lifestyle" comme Jobs aime le dire. Au mieux, les ordinateurs étaient employés à des fins professionnelles et quelques programmeurs chevronnés tentaient de créer un monde nouveau.

Aujourd'hui, les ordinateurs sont omniprésents au travail et depuis 20 ans, ils ont également envahi nos foyers. L'époque où les gens n'employaient leur ordinateur que pour sauvegarder une petite feuille de calculs ou quelques pages de textes de 20 KB est révolue. Maintenant, avec l'arrivée en masse des appareils photos et caméras numériques, le moindre transfert prend des allures d'encyclopédies complètes à déplacer. Comptez dans les 1 Go par minute de vidéo si vous transférez une vidéo de votre caméra numérique à l'ordinateur.

Pour mieux cerner les problèmes liés à la sauvegarde de vos données, je vous propose de parler aujourd'hui des évolutions que nous avons eu ces dernières années et quelles sont les solutions qui s'offrent à nous pour préserver nos données.

Que vous ayez un Mac ou un PC à la maison, un parc de machines à gérer au travail, cette humeur devrait en aider plus d'un à s'y retrouver (du moins je l'espère!).

Enfin, il faut peut-être faire une petite distinction à l'attention de nos lecteurs: cette humeur n'est pas franchement destinée aux personnes qui n'utilisent leur ordinateur que pour faire les jeux "Solitaire" ou encore le "Mahjong". Là, mis à part peut-être vos scores, il n'y a vraiment rien à sauvegarder et je me demande même pourquoi vous avez acheté un ordinateur.

Sauvegarder, mais quoi, pourquoi?

Au cours de ma vie professionnelle, j'ai notamment été Ingénieur Systèmes et Consultant au sein de sociétés diverses. Une des erreurs les plus communes de mes clients et de beaucoup de particuliers, c'est de brûler les étapes et en se posant les mauvaises questions. Effectivement, quand on aborde la question des sauvegardes en informatique, une des premières questions qui est posée c'est "Quel système de sauvegarde est adapté à mes besoins?".

Cette question n'est pas erronée en soit, mais elle est prématurée dans le cadre d'une réflexion globale.

Tout d'abord, avant d'entrer dans le vif du sujet, il faut se poser quelques questions essentielles: 

  • Qu'est-ce qu'on veut sauvegarder?
  • Dans quel but on effectue cette sauvegarde et pour combien de temps? 
  • Quel délai sera nécessaire afin de restaurer la sauvegarde?
  • Et enfin, le nerf de la guerre, quel est mon budget?

En répondant à ces quelques questions simples, vous aurez déjà répondu à 90 % de la question: "Quel système de sauvegarde est adapté à mes besoins?"

Comprendre de quoi on parle

Énormément de gens, encore aujourd'hui, ne font jamais de sauvegarde. Leur ordinateur fonctionne très bien depuis 4 ans, alors pourquoi se préoccuper de quelque chose qui n'a jamais posé de problème?

Aux gens qui ne sauvegardent jamais rien, je leur dirai tout simplement que sauvegarder les données importantes de son ordinateur, c'est un peu comme prendre une assurance. Je suis certain que des lecteurs ont souscrit des assurances non obligatoires et qu'ils n'ont jamais eu besoin de s'en servir. Et bien une sauvegarde, c'est un peu la même chose. Vous prenez une assurance sur quelque chose qui pourrait faillir et vous laisser dans la mouise (pour pas dire autre chose).

À quelle somme ou temps de travail évaluez-vous le dernier film que vous avez monté (1 à 3 heures selon certains "experts" de ce site pour faire 1 minute de vidéo)? Ou la feuille de calcul pour votre association que vous maintenez depuis 8 ans? Ou votre journal intime que vous tenez dans un but de publication depuis que vous avez reçu votre premier Mac Classic en 1990? Etc, etc.

Perdre un travail qui a été réalisé en quelques heures, jours, mois ou années parce que votre disque dur ou votre ordinateur a brûlé peut s'avérer une expérience assez pénible, pour vous et votre ordinateur:
 

Enfin, en fonction de vos besoins, choisir un système de sauvegarde implique une évaluation d'une solution purement software (logiciel) ou hardware (matériel) et dans certains cas, une combinaison des deux.

Quoi sauvegarder?

Le premier point qu'on doit évaluer, c'est déterminer les données qu'on veut sauvegarder. Est-ce qu'on veut pouvoir copier tout son disque sans aucune distinction? Est-ce qu'on veut juste sauvegarder certains documents comme les feuilles de calculs, ses textes ou présentations?

Évidemment, par les temps qui courent, le plus petit Mac ou PC est livré avec un disque dur de 60 GB. En théorie, ça devrait largement suffire mais l'arrivée des appareils de loisir numérique et les connexions à Internet à 2 Mbit/s par exemple aident à remplir ce type de disque en peu de temps. Comptez 3 jours pour remplir 60 GB avec une connexion à Internet à 2 Mbit/s ou tout simplement 60 minutes de vidéo... Et je ne parle même pas des applications et systèmes qui grossissent à vue d'œil (pratiquement 1 GB pour un système 10.3.5!).

Par conséquent, l'époque des disquettes à 1.4 MB est un peu révolue. D'ailleurs, et à mon plus grand énervement, Apple ne fournit plus de lecteur de disquettes sur ses machines depuis 1999.

À ce stade, il y a généralement deux philosophies qui s'affrontent: la première consiste à tout copier (faire une image du disque dur) et la sauvegarder sur un autre support. La seconde est de choisir uniquement les fichiers et informations que l'on veut sauvegarder.

Les avantages et inconvénients de ces deux approches sont évidents. Pour la première, on ne perd pas de temps à sélectionner les fichiers et à restaurer ou réinstaller les données ou logiciels. Ca se traduit par un gain de temps important qui se chiffre en "heures" voire "jours" de travail. Le principal défaut de cette méthode c'est que si votre disque dur est rempli à hauteur de 50 GB ou plus avec des dizaines de milliers de fichiers, alors la sauvegarde sera beaucoup plus longue et, de fait, volumineuse.

But, durée et terminologie

Fondamentalement, il faut déterminer le type de sauvegarde que l'on souhaite effectuer et pour ça, on distingue 3 "familles". Chacune a une méthodologie propre et des objectifs différents:

  • La redondance (clustering)
  • La sauvegarde (backup)
  • L'archivage (archive)

La redondance est avant tout un système qui doit permettre une disponibilité continue de vos données. Par "disponibilité continue", on entend un système qui de part son architecture vous permet d'accéder en tout temps à vos données et ce, même si un de vos disques durs lâche! Une des technologies les plus courantes pour atteindre ce résultat réside dans le fait d'installer un système du type Redundant Array of Independent (ou Inexpensive) Disks (RAID). Je ne rentrerai pas dans les détails (plus d'infos ici) mais en gros, l'information est dupliquée et/ou distribuée sur plusieurs disques via plusieurs techniques dites RAID niveau 0, 1, 3, 5, 6, 0+1, 10, 30, 50, S, etc.. Réservé il y a encore quelques années aux architectures SCSI, ce système c'est énormément démocratisé ces dernières années grâce notamment à des interfaces beaucoup moins coûteuses comme l'ATA ou le Firewire.

Mais ce système n'est pas tellement destiné aux particuliers qui utilisent leur ordinateur à des fins privées. De par son prix, cette solution est surtout réservée ou destinée aux entreprises munies de serveur(s). Beaucoup de constructeurs proposent ces produits pour toutes les plateformes informatiques (Apple, Sun, IBM, etc.) et Apple a bien compris ce besoin "professionnel". En 2003, elle a sorti son propre système: Xserve RAID:



Xserve RAID d'Apple offre une capacité de stockage maximale de 3.5 TB via 14 disques de 250 GB

Quand je parle de système onéreux pour particulier, il faut savoir que ce genre de solution s'échelonne de quelques centaines d'euros pour une solution interne (logiciel et matériel) à plusieurs centaines de milliers d'euros pour une solution externe (l'Xserve RAID chargé à bloc coûte dans les 14'000 euros).

La sauvegarde est certainement le moyen le plus courant qui est utilisé par tous pour mettre à l'abri nos données. Qu'on utilise une disquette (ok, ok, vous avez plus vu ce truc depuis 5 ans), des cartouches Syquest (quoi ça fait 10 ans que vous avez plus vu ce truc?), un CD, un DVD ou encore plus simplement, à travers le réseau via une solution .mac ou sur un serveur par exemple. À ce stade, le vrai problème, c'est la quantité de données que vous voulez sauvegarder.

Si votre objectif est de sauvegarder quelques dizaines, voir quelques centaines de MB, un CD ou DVD gravable fera parfaitement l'affaire et en fonction de vos besoins, vous pourrez procéder à une sauvegarde par jour, semaine ou mois en fonction de l'utilisation de votre machine préférée et des fichiers que vous générez.

Toutefois, ce type de sauvegarde à plusieurs défauts. Le premier est lié au temps qui est nécessaire au transfert des données de votre disque dur au support optique car en fonction du volume et du nombre de fichiers, il vous faudra compter plus de 30 minutes pour que l'opération soit complétée. Bien sûr, vous pouvez lancer une fois par semaine l'opération et aller faire un tour, mais ce n'est pas très pratique. Le second problème est financier car que vous achetiez des CD ou DVD à gravure unique ou multiple (je vous fais grâce des 15 formats existants), les coûts à longs termes peuvent être importants en fonction de la fréquence de ces sauvegardes et ce même avec des CD ou DVD à gravures multiples (mais j'y reviens plus loin).

Pour les entreprises, ce type de système n'est évidemment pas une option. Généralement, jusqu'à quelques dizaines voir centaines de GB de données par semaine, on confie la mission à des "cassettes" de type Digital Linear Tape (DLT), Super Digital Linear Tape (SDLT) ou Linear Tape Open (LTO).



HP SuperStore DLT type IV (40 à 80 GB)



Compaq StorageWorks SDLT de type I (160 à 320 GB)



HP StorageWorks LTO 2 (200 à 400 GB)

Les modèles ci-dessus permettent d'introduire une seule cassette à la fois et s'échelonnent de 1'400 à 4'500 euros. Des modèles dits "librairie" ou "silot" permettent d'accueillir de 2 à quelques milliers de cassettes (vous avez certainement vu à la TV ou ailleurs ces "bras" robotisés qui vont et viennent devant des murs entiers de cassettes). Au niveau des interfaces, c'est encore le SCSI qui domine et de plus en plus, le Fibre Channel. Aujourd'hui ces systèmes offrent déjà des capacités de stockage dépassant le Petabyte (1'000 Terabyte ou 1'000'000 Gigabyte).

Ce qu'il faut comprendre avec ces systèmes de sauvegarde, c'est que l'information qui est enregistrée sur un CD, DVD ou cassette doit répondre à deux exigences fondamentales: stocker des informations "plus ou moins" rapidement (de 650 MB avec un CD à plusieurs centaines de GB) et les restaurer "plus ou moins" rapidement. Quand je dis "plus ou moins", c'est surtout en fonction de vos besoins et critères qu'une solution sera plus adaptée comparée à une autre. Des facteurs aussi importants que la vitesse, le prix, la capacité, la longévité, etc. devront êtres analysés pour faire le bon choix.

Enfin, depuis quelques années on a vu apparaître des systèmes du type Network Attached Storage (NAS), Storage Area Network (SAN) ou encore Internet SCSI (iSCSI). Les systèmes NAS ne sont ni plus ni moins que des mini-serveurs (moins puissants et plus limités au niveau des fonctionnalités) branché au réseau. Un équipement de ce type, le LaCie Ethernet Disk, a même été testé ici par Noé (vous savez, le gars qui fait des trucs pour ce site).

Toutefois, ces derniers ne permettent pas d'être transportés aisément. En effet, quand vous faites une sauvegarde à la maison ou dans le cadre de votre travail, il est également important de pouvoir physiquement mettre à l'abri ailleurs le support qui contient vos données! Le disque dur qui lâche n'est malheureusement pas le seul incident qui peut arriver. Votre domicile ou votre lieu de travail peut subir un incendie, une inondation, un vol, etc. Dans ces cas, il faut également penser à ne pas entreposer toutes vos données au même endroit et ce, même si des sociétés de "récupération" de données existent (comptez entre 50 et 150 euros de l'heure pour récupérer des données depuis un support "abîmés").

L'archivage fait partie de la dernière famille de systèmes qui permet de "sauver et préserver" les données à long terme. Ce système a une fonction simple a priori: garder sur un support des données pour "l'éternité". Par conséquent, on n'utilise pas ce système pour sauvegarder des données et les rendre accessibles tous les jours... L'objectif est de pouvoir archiver un projet terminer ou les résultats d'une expérience par exemple et, en fonction des besoins, pouvoir les relire quelques fois par an.

Il existe toutefois deux gros problèmes avec ce système: la durée de vie des médias sur lesquels sont sauvegardés les données et le format de ces données.

Dans le but de mieux cerner ces défis, je parlerai brièvement des problèmes qu'affronte la National Aeronautics and Space Administration (NASA) depuis quelques décennies. Grâce à l'amélioration continuelle des instruments qui sont placés dans les satellites que nous envoyons dans l'espace, les données qui doivent être stockées, traitées et archivées su Terre sont toujours plus importantes. Aujourd'hui, la NASA et ses différents organismes reçoivent plus de 100 TB de données par mois et bien sûr, ce chiffre est en augmentation constante (1 %à 3 % par mois). Pour se rendre compte des volumes qui sont générés, il faut savoir que les seuls 11 satellites d'observation terrestre dépendants de la NASA font parvenir 450 GB de données par jour (tout n'est pas gardé, mais quand même) et pour la mission Hubble, c'est 18 GB de données qui sont transmises tous les jours... soit en moyenne 120 GB par semaine! Mais plus que tout, c'est la pérennité de ces données qui est remise en question à l'ère du tout numérique.

Pour mieux comprendre, on peut faire une analogie avec les caméras. Les anciens systèmes à base de Super-8 ou VHS ne sont pas facilement transférables sous une forme numérique et on sait tous que tôt ou tard, les données enregistrées sur ces supports seront abîmées, voir détruites. De plus, même si vous avez l'infrastructure nécessaire au "transfert", il ne faut pas sous-évaluer le temps qui sera nécessaire à la migration.

C'est en fait le fond du problème. On estime que pour migrer toutes les données de la NASA sur une nouvelle technologie, il faudrait 10 ans... Le même temps qui rendra cette technologie obsolète et qui devra à nouveau être migrée à la fin de la migration! C'est un cercle vicieux mais la NASA n'a pas le choix car à moins de garder de vieux systèmes sous tension et de continuer à les maintenir, elle doit les migrer.

Un projet de ce type a été démarré en 1998 et avait pour but de migrer 35'000 cassettes de 800 MB sur une nouvelle plateforme constituée de cassettes de 10 GB. L'opération a été effectuée, mais elle a duré 4 ans et dans 5 ans, il faudra recommencer.

Pour bien se rendre compte du problème, il faut savoir que la NASA a déjà perdu, selon ses propres estimations, 20 % des informations liées aux missions Viking des années 70-80. C'est quand même triste de dépenser autant d'argent pour aller chercher des informations et tout perdre à la fin...

Enfin, le dernier problème réside dans le transfert et la récupération des données. Si on peut dire sans trop de risque que les images JPG ou GIF seront encore lisibles par Safari 9.5 en 2015, c'est nettement moins sûr pour des fichiers "propriétaires" qui ont été générés par des applications exotiques. Je suis certain que tout comme moi, vous avez vous aussi eu de la peine à récupérer 5 ou 10 ans plus tard de vieux fichiers créés par des éditeurs connus et qui ont disparu aujourd'hui.

Conclusions

Comme on l'a aperçu, en fonction de vos besoins et objectifs, il existe un large spectre de solutions. Mon but n'était pas de proposer une solution complète avec tests à l'appui, mais tout simplement de vous aider à vous poser les bonnes questions sur ce thème.

Personnellement, depuis quelques années, j'ai toujours deux disques connectés à ma machine, un en interne livré avec l'ordinateur et un autre en miroir, généralement de la même capacité, connecté en externe.

Cette solution n'est pas onéreuse puisqu'on trouve des disques externes Firewire de 120 GB pour moins de 200 euros. Pour la partie logicielle, il y a comme d'habitude 3 catégories: le logiciel gratuit (freeware), le logiciel participatif (shareware) ou le logiciel (software).

Le plus simple est moins coûteux, c'est bien évidemment le logiciel gratuit. Afin de copier les informations d'un disque à l'autre, vous pouvez procéder manuellement à la copie ou écrire un petit script qui se met en route à chaque démarrage ou extinction de la machine.

Pour les logiciels qui offrent un peu plus de fonctionnalités, il y a les logiciels participatifs comme Tri-Backup (testé ici par François, un autre gars qui fréquente cuk de temps à autre) ou Synk. Pratique et facile pour 20 dollars, il fera peut-être même l'objet d'un test prochainement.

Enfin, pour des solutions plus professionnelles et qui offrent des options à n'en plus finir, il existe beaucoup de logiciels de sauvegarde et de restauration comme Retrospect, BrightStor (ARCserve), etc.

Voilà, je reste bien évidemment à disposition dans les commentaires pour tout complément d'information, voir pour recevoir des plaintes! Et n'oubliez pas, faites des sauvegardes de vos précieuses données aussi souvent que vous le pouvez, quitte même à laisser une fois par mois un CD ou DVD physiquement ailleurs...

Icon_print