Introduction
Comme tout le monde le sait, l'informatique est un secteur
qui ne cesse d'évoluer. Depuis 1976, année de la sortie du
premier Apple I, Apple ne déroge pas à cette règle. À cette
époque, les ordinateurs ne faisaient pas tellement partie
de notre "Digital Lifestyle" comme Jobs aime le dire. Au
mieux, les ordinateurs étaient employés à des fins
professionnelles et quelques programmeurs chevronnés
tentaient de créer un monde nouveau.
Aujourd'hui, les ordinateurs sont omniprésents au travail
et depuis 20 ans, ils ont également envahi nos foyers.
L'époque où les gens n'employaient leur ordinateur que pour
sauvegarder une petite feuille de calculs ou quelques pages
de textes de 20 KB est révolue. Maintenant, avec l'arrivée
en masse des appareils photos et caméras numériques, le
moindre transfert prend des allures d'encyclopédies
complètes à déplacer. Comptez dans les 1 Go par minute de
vidéo si vous transférez une vidéo de votre caméra
numérique à l'ordinateur.
Pour mieux cerner les problèmes liés à la sauvegarde de vos
données, je vous propose de parler aujourd'hui des
évolutions que nous avons eu ces dernières années et
quelles sont les solutions qui s'offrent à nous pour
préserver nos données.
Que vous ayez un Mac ou un PC à la maison, un parc de
machines à gérer au travail, cette humeur devrait en aider
plus d'un à s'y retrouver (du moins je l'espère!).
Enfin, il faut peut-être faire une petite distinction à
l'attention de nos lecteurs: cette humeur n'est pas
franchement destinée aux personnes qui n'utilisent leur
ordinateur que pour faire les jeux "Solitaire" ou encore le
"Mahjong". Là, mis à part peut-être vos scores, il n'y a
vraiment rien à sauvegarder et je me demande même pourquoi
vous avez acheté un ordinateur.
Sauvegarder, mais quoi, pourquoi?
Au cours de ma vie professionnelle, j'ai notamment été
Ingénieur Systèmes et Consultant au sein de sociétés
diverses. Une des erreurs les plus communes de mes clients
et de beaucoup de particuliers, c'est de brûler les étapes
et en se posant les mauvaises questions. Effectivement,
quand on aborde la question des sauvegardes en
informatique, une des premières questions qui est posée
c'est "Quel système de sauvegarde est adapté à mes
besoins?".
Cette question n'est pas erronée en soit, mais elle est
prématurée dans le cadre d'une réflexion globale.
Tout d'abord, avant d'entrer dans le vif du sujet, il faut
se poser quelques questions essentielles:
- Qu'est-ce qu'on veut sauvegarder?
- Dans quel but on effectue cette sauvegarde et pour combien de temps?
- Quel délai sera nécessaire afin de restaurer la sauvegarde?
- Et enfin, le nerf de la guerre, quel est mon budget?
En répondant à ces quelques questions simples, vous aurez déjà répondu à 90 % de la question: "Quel système de sauvegarde est adapté à mes besoins?"
Comprendre de quoi on parle
Énormément de gens, encore aujourd'hui, ne font jamais de
sauvegarde. Leur ordinateur fonctionne très bien depuis 4
ans, alors pourquoi se préoccuper de quelque chose qui n'a
jamais posé de problème?
Aux gens qui ne sauvegardent jamais rien, je leur dirai
tout simplement que sauvegarder les données importantes de
son ordinateur, c'est un peu comme prendre une assurance.
Je suis certain que des lecteurs ont souscrit des
assurances non obligatoires et qu'ils n'ont jamais eu
besoin de s'en servir. Et bien une sauvegarde, c'est un peu
la même chose. Vous prenez une assurance sur quelque chose
qui pourrait faillir et vous laisser dans la mouise (pour
pas dire autre chose).
À quelle somme ou temps de travail évaluez-vous le dernier
film que vous avez monté (1 à 3 heures selon certains
"experts" de ce site pour faire 1 minute de vidéo)? Ou la
feuille de calcul pour votre association que vous maintenez
depuis 8 ans? Ou votre journal intime que vous tenez dans
un but de publication depuis que vous avez reçu votre
premier Mac Classic en 1990? Etc, etc.
Perdre un travail qui a été réalisé en quelques heures,
jours, mois ou années parce que votre disque dur ou votre
ordinateur a brûlé peut s'avérer une expérience assez
pénible, pour vous et votre ordinateur:
Enfin, en fonction de vos besoins, choisir un système de sauvegarde implique une évaluation d'une solution purement software (logiciel) ou hardware (matériel) et dans certains cas, une combinaison des deux.
Quoi sauvegarder?
Le premier point qu'on doit évaluer, c'est déterminer les
données qu'on veut sauvegarder. Est-ce qu'on veut pouvoir
copier tout son disque sans aucune distinction? Est-ce
qu'on veut juste sauvegarder certains documents comme les
feuilles de calculs, ses textes ou présentations?
Évidemment, par les temps qui courent, le plus petit Mac ou
PC est livré avec un disque dur de 60 GB. En théorie, ça
devrait largement suffire mais l'arrivée des appareils de
loisir numérique et les connexions à Internet à 2 Mbit/s
par exemple aident à remplir ce type de disque en peu de
temps. Comptez 3 jours pour remplir 60 GB avec une
connexion à Internet à 2 Mbit/s ou tout simplement 60
minutes de vidéo... Et je ne parle même pas des
applications et systèmes qui grossissent à vue d'œil
(pratiquement 1 GB pour un système 10.3.5!).
Par conséquent, l'époque des disquettes à 1.4 MB est un peu
révolue. D'ailleurs, et à mon plus grand énervement, Apple
ne fournit plus de lecteur de disquettes sur ses machines
depuis 1999.
À ce stade, il y a généralement deux philosophies qui
s'affrontent: la première consiste à tout copier (faire une
image du disque dur) et la sauvegarder sur un autre
support. La seconde est de choisir uniquement les fichiers
et informations que l'on veut sauvegarder.
Les avantages et inconvénients de ces deux approches sont
évidents. Pour la première, on ne perd pas de temps à
sélectionner les fichiers et à restaurer ou réinstaller les
données ou logiciels. Ca se traduit par un gain de temps
important qui se chiffre en "heures" voire "jours" de
travail. Le principal défaut de cette méthode c'est que si
votre disque dur est rempli à hauteur de 50 GB ou plus avec
des dizaines de milliers de fichiers, alors la sauvegarde
sera beaucoup plus longue et, de fait, volumineuse.
But, durée et terminologie
Fondamentalement, il faut déterminer le type de sauvegarde que l'on souhaite effectuer et pour ça, on distingue 3 "familles". Chacune a une méthodologie propre et des objectifs différents:
- La redondance (clustering)
- La sauvegarde (backup)
- L'archivage (archive)
La redondance est avant tout un système qui doit
permettre une disponibilité continue de vos données. Par
"disponibilité continue", on entend un système qui de part
son architecture vous permet d'accéder en tout temps à vos
données et ce, même si un de vos disques durs lâche! Une
des technologies les plus courantes pour atteindre ce
résultat réside dans le fait d'installer un système du type
Redundant Array of Independent (ou Inexpensive) Disks
(RAID). Je ne rentrerai pas dans les détails (plus d'infos
ici) mais en gros, l'information est
dupliquée et/ou distribuée sur plusieurs disques via
plusieurs techniques dites RAID niveau 0, 1, 3, 5, 6, 0+1,
10, 30, 50, S, etc.. Réservé il y a encore quelques années
aux architectures SCSI, ce système c'est énormément
démocratisé ces dernières années grâce notamment à des
interfaces beaucoup moins coûteuses comme l'ATA ou le
Firewire.
Mais ce système n'est pas tellement destiné aux
particuliers qui utilisent leur ordinateur à des fins
privées. De par son prix, cette solution est surtout
réservée ou destinée aux entreprises munies de serveur(s).
Beaucoup de constructeurs proposent ces produits pour
toutes les plateformes informatiques (Apple, Sun, IBM,
etc.) et Apple a bien compris ce besoin "professionnel". En
2003, elle a sorti son propre système: Xserve RAID:

Xserve RAID d'Apple offre une capacité de stockage maximale
de 3.5 TB via 14 disques de 250 GB
Quand je parle de système onéreux pour particulier, il faut
savoir que ce genre de solution s'échelonne de quelques
centaines d'euros pour une solution interne (logiciel et
matériel) à plusieurs centaines de milliers d'euros pour
une solution externe (l'Xserve RAID chargé à bloc coûte
dans les 14'000 euros).
La sauvegarde est certainement le moyen le plus
courant qui est utilisé par tous pour mettre à l'abri nos
données. Qu'on utilise une disquette (ok, ok, vous avez
plus vu ce truc depuis 5 ans), des cartouches Syquest (quoi
ça fait 10 ans que vous avez plus vu ce truc?), un CD, un
DVD ou encore plus simplement, à travers le réseau via une
solution .mac ou sur un serveur par exemple. À ce
stade, le vrai problème, c'est la quantité de données que
vous voulez sauvegarder.
Si votre objectif est de sauvegarder quelques dizaines,
voir quelques centaines de MB, un CD ou DVD gravable fera
parfaitement l'affaire et en fonction de vos besoins, vous
pourrez procéder à une sauvegarde par jour, semaine ou mois
en fonction de l'utilisation de votre machine préférée et
des fichiers que vous générez.
Toutefois, ce type de sauvegarde à plusieurs défauts. Le
premier est lié au temps qui est nécessaire au transfert
des données de votre disque dur au support optique car en
fonction du volume et du nombre de fichiers, il vous faudra
compter plus de 30 minutes pour que l'opération soit
complétée. Bien sûr, vous pouvez lancer une fois par
semaine l'opération et aller faire un tour, mais ce n'est
pas très pratique. Le second problème est financier car que
vous achetiez des CD ou DVD à gravure unique ou multiple
(je vous fais grâce des 15 formats existants), les coûts à
longs termes peuvent être importants en fonction de la
fréquence de ces sauvegardes et ce même avec des CD ou DVD
à gravures multiples (mais j'y reviens plus loin).
Pour les entreprises, ce type de système n'est évidemment
pas une option. Généralement, jusqu'à quelques dizaines
voir centaines de GB de données par semaine, on confie la
mission à des "cassettes" de type Digital Linear Tape
(DLT), Super Digital Linear Tape (SDLT) ou Linear Tape Open
(LTO).

HP SuperStore DLT type IV (40 à 80 GB)

Compaq StorageWorks SDLT de type I (160 à 320 GB)

HP StorageWorks LTO 2 (200 à 400 GB)
Les modèles ci-dessus permettent d'introduire une seule
cassette à la fois et s'échelonnent de 1'400 à
4'500 euros. Des modèles dits "librairie" ou "silot"
permettent d'accueillir de 2 à quelques milliers de
cassettes (vous avez certainement vu à la TV ou ailleurs
ces "bras" robotisés qui vont et viennent devant des murs
entiers de cassettes). Au niveau des interfaces, c'est
encore le SCSI qui domine et de plus en plus, le Fibre
Channel. Aujourd'hui ces systèmes offrent déjà des
capacités de stockage dépassant le Petabyte (1'000 Terabyte
ou 1'000'000 Gigabyte).
Ce qu'il faut comprendre avec ces systèmes de sauvegarde,
c'est que l'information qui est enregistrée sur un CD, DVD
ou cassette doit répondre à deux exigences
fondamentales: stocker des informations "plus ou
moins" rapidement (de 650 MB avec un CD à plusieurs
centaines de GB) et les restaurer "plus ou moins"
rapidement. Quand je dis "plus ou moins", c'est surtout en
fonction de vos besoins et critères qu'une solution sera
plus adaptée comparée à une autre. Des facteurs aussi
importants que la vitesse, le prix, la capacité, la
longévité, etc. devront êtres analysés pour faire le bon
choix.
Enfin, depuis quelques années on a vu apparaître des
systèmes du type Network Attached Storage (NAS), Storage
Area Network (SAN) ou encore Internet SCSI (iSCSI). Les
systèmes NAS ne sont ni plus ni moins que des mini-serveurs
(moins puissants et plus limités au niveau des
fonctionnalités) branché au réseau. Un équipement de ce
type, le LaCie Ethernet Disk, a même été testé ici
par Noé (vous savez, le gars qui fait des trucs pour ce
site).
Toutefois, ces derniers ne permettent pas d'être
transportés aisément. En effet, quand vous faites une
sauvegarde à la maison ou dans le cadre de votre travail,
il est également important de pouvoir physiquement mettre à
l'abri ailleurs le support qui contient vos données! Le
disque dur qui lâche n'est malheureusement pas le seul
incident qui peut arriver. Votre domicile ou votre lieu de
travail peut subir un incendie, une inondation, un vol,
etc. Dans ces cas, il faut également penser à ne pas
entreposer toutes vos données au même endroit et ce, même
si des sociétés de "récupération" de données existent
(comptez entre 50 et 150 euros de l'heure pour
récupérer des données depuis un support "abîmés").
L'archivage fait partie de la dernière famille de
systèmes qui permet de "sauver et préserver" les données à
long terme. Ce système a une fonction simple a
priori: garder sur un support des données pour
"l'éternité". Par conséquent, on n'utilise pas ce système
pour sauvegarder des données et les rendre accessibles tous
les jours... L'objectif est de pouvoir archiver un projet
terminer ou les résultats d'une expérience par exemple et,
en fonction des besoins, pouvoir les relire quelques fois
par an.
Il existe toutefois deux gros problèmes avec ce
système: la durée de vie des médias sur lesquels sont
sauvegardés les données et le format de ces données.
Dans le but de mieux cerner ces défis, je parlerai
brièvement des problèmes qu'affronte la National
Aeronautics and Space Administration (NASA) depuis
quelques décennies. Grâce à l'amélioration continuelle des
instruments qui sont placés dans les satellites que nous
envoyons dans l'espace, les données qui doivent être
stockées, traitées et archivées su Terre sont toujours plus
importantes. Aujourd'hui, la NASA et ses différents
organismes reçoivent plus de 100 TB de données par mois et
bien sûr, ce chiffre est en augmentation constante
(1 %à 3 % par mois). Pour se rendre compte des
volumes qui sont générés, il faut savoir que les seuls 11
satellites d'observation terrestre dépendants de la NASA
font parvenir 450 GB de données par jour (tout n'est pas
gardé, mais quand même) et pour la mission Hubble, c'est
18 GB de données qui sont transmises tous les jours... soit
en moyenne 120 GB par semaine! Mais plus que tout, c'est la
pérennité de ces données qui est remise en question à l'ère
du tout numérique.
Pour mieux comprendre, on peut faire une analogie avec les
caméras. Les anciens systèmes à base de Super-8 ou VHS ne
sont pas facilement transférables sous une forme numérique
et on sait tous que tôt ou tard, les données enregistrées
sur ces supports seront abîmées, voir détruites. De plus,
même si vous avez l'infrastructure nécessaire au
"transfert", il ne faut pas sous-évaluer le temps qui sera
nécessaire à la migration.
C'est en fait le fond du problème. On estime que pour
migrer toutes les données de la NASA sur une nouvelle
technologie, il faudrait 10 ans... Le même temps qui rendra
cette technologie obsolète et qui devra à nouveau être
migrée à la fin de la migration! C'est un cercle vicieux
mais la NASA n'a pas le choix car à moins de garder de
vieux systèmes sous tension et de continuer à les
maintenir, elle doit les migrer.
Un projet de ce type a été démarré en 1998 et avait pour
but de migrer 35'000 cassettes de 800 MB sur une nouvelle
plateforme constituée de cassettes de 10 GB. L'opération a
été effectuée, mais elle a duré 4 ans et dans 5 ans, il
faudra recommencer.
Pour bien se rendre compte du problème, il faut savoir que
la NASA a déjà perdu, selon ses propres estimations,
20 % des informations liées aux missions Viking des
années 70-80. C'est quand même triste de dépenser autant
d'argent pour aller chercher des informations et tout
perdre à la fin...
Enfin, le dernier problème réside dans le transfert et la
récupération des données. Si on peut dire sans trop de
risque que les images JPG ou GIF seront encore lisibles par
Safari 9.5 en 2015, c'est nettement moins sûr pour des
fichiers "propriétaires" qui ont été générés par des
applications exotiques. Je suis certain que tout comme moi,
vous avez vous aussi eu de la peine à récupérer 5 ou 10 ans
plus tard de vieux fichiers créés par des éditeurs connus
et qui ont disparu aujourd'hui.
Conclusions
Comme on l'a aperçu, en fonction de vos besoins et
objectifs, il existe un large spectre de solutions. Mon but
n'était pas de proposer une solution complète avec tests à
l'appui, mais tout simplement de vous aider à vous poser
les bonnes questions sur ce thème.
Personnellement, depuis quelques années, j'ai toujours deux
disques connectés à ma machine, un en interne livré avec
l'ordinateur et un autre en miroir, généralement de la même
capacité, connecté en externe.
Cette solution n'est pas onéreuse puisqu'on trouve des
disques externes Firewire de 120 GB pour moins de
200 euros. Pour la partie logicielle, il y a comme
d'habitude 3 catégories: le logiciel gratuit
(freeware), le logiciel participatif (shareware) ou le
logiciel (software).
Le plus simple est moins coûteux, c'est bien évidemment le
logiciel gratuit. Afin de copier les informations d'un
disque à l'autre, vous pouvez procéder manuellement à la
copie ou écrire un petit script qui se met en route à
chaque démarrage ou extinction de la machine.
Pour les logiciels qui offrent un peu plus de
fonctionnalités, il y a les logiciels participatifs comme
Tri-Backup (testé ici
par François, un autre gars qui fréquente cuk de temps à
autre) ou Synk. Pratique et facile pour 20 dollars,
il fera peut-être même l'objet d'un test
prochainement.
Enfin, pour des solutions plus professionnelles et qui
offrent des options à n'en plus finir, il existe beaucoup
de logiciels de sauvegarde et de restauration comme
Retrospect, BrightStor (ARCserve), etc.
Voilà, je reste bien évidemment à disposition dans les
commentaires pour tout complément d'information, voir pour
recevoir des plaintes! Et n'oubliez pas, faites des
sauvegardes de vos précieuses données aussi souvent que
vous le pouvez, quitte même à laisser une fois par mois un
CD ou DVD physiquement ailleurs...

