La relève informatique après un désastre

illParler de désastre informatique n’implique pas nécessairement un cirque hollywoodien avec mille acteurs et figurants, dont Silvester Stallone en sapeur héroïque qui émerge d’un étage bétonné en voie d’inondation où quelque 250 ordinateurs serveurs crépitent encore dans une fantasmagorie de courts circuits, de câbles tronçonnés et de gicleurs exacerbés. De ses bras tachés d’huile et de sang, le Rambo de la Caserne 32 brandit une caisse de DVD ruisselante. « Got your backups, Mr. Hawthorne », fait-il en direction de William H. Macy dans le rôle d’un porteur de cravate aux yeux dégoulinant de reconnaissance éternelle.

Non. Les désastres sont généralement moins spectaculaires; par contre, ils peuvent causer de très sérieux désagrément, voire des pertes financières énormes. Imaginez Amazon, Apple ou Dell privés pendant 24 heures de leur commerce en ligne et de leur système de soutien à la clientèle. À combien s’évalueraient le manque à gagner, l’absence de suivi, d’aide, de communication, le tort à l’image de marque ou encore les frais de remise en fonction ? Idem pour des PME moins connues dont le rôle dans un système juste à temps, entendre la séquence dans un progiciel de gestion client-fournisseur, se retrouve soudainement compromis à la suite d’une panne électrique majeure.

ill

ligne.jpg

D’où l’obligation pour les entreprises d’avoir un plan de relève digne de ce nom. On parle d’un plan conforme aux besoins, constamment mis à jour et régulièrement testé, un plan établi en fonction de ses coûts, de ses risques et de ses résultats (combien ça prend de temps pour rétablir de telle ou telle façon des centaines et des centaines de gigs ?), un plan multicouche (archivage maison, archivage imparti, archivage de type nuage, réplication, etc.) établi selon la nature des données à protéger (courriel, CRM, données financières, info hautement stratégique, etc.).

Est-ce que tout dont être disponible dans les secondes qui suivent le sinistre ? Est-ce que le système de relations avec la clientèle est plus prioritaire que celui de la gestion des ressources humaines ou que celui de la communication avec ses fournisseurs ? illOu encore, est-ce que tout devrait être imparti à quelques kilomètres du siège social (off-premise), méticuleusement stocké dans des machines ronronnant au dix-septième étage (on-premise) ou pompé sur le Net (Cloud computing) ? Devrait-on plutôt avoir recours à ces trois grands modes d’archivage en fonction d’une étude de coût ou de priorité ? Comment obtenir les meilleures réponses possible à toutes ces questions ?

Je vous parle de cette réalité puisque, la semaine dernière, un expert en la matière pour CA Technologies, M. Eric Pitcher, m’a fait parvenir un document maison intitulé Business Continuity Planning IT Survival Guide à la suite d’une rencontre téléphonique. illC’est un aide-mémoire pour les gestionnaires, une sorte de guide bien actualisé dont je vous recommande la lecture (en anglais) si le sujet vous intéresse (en cliquant sur le titre ou sur l’image ci-contre, vous avez accès à un PDF).

Un peu décontenancé, j’avais demandé à cet évangéliste des bonnes pratiques ce que CA Tech foutait dans un secteur probablement archibalisé et couvert. Effectivement, quelle entreprise digne de ce nom se risquerait, en 2020, à faire des affaires sans plan de relève ?

« Vous seriez étonné de voir ce que je découvre régulièrement », m’a-t-il répondu. S’il est vrai qu’il y a normalement un plan de relève en place, trop souvent, il n’est pas actualisé en fonction des technos récentes implantées dans l’entreprise ou de celles offertes par des fournisseurs de services. Bref, il arrive souvent que les plans ne soient plus adaptés aux nouvelles réalités technos, qu’ils n’aient pas été testés depuis belle lurette ou encore qu’on ne sache plus qui fait quoi considérant les modifications structurelles survenues dans la boîte. « Au cours des dernières années, la pratique a été de couper dans les dépenses, aussi bien dans le public que dans le privé et les postes budgétaires relatifs à la relève informatique en ont souvent pris pour leur rhume ».

illD’un autre côté, les outils offerts ne sont pas toujours les mieux adaptés et bien des entreprises l’ignorent. Prenez le Nuage. « Passé 200 Go par semaine, ce mode peut s’avérer très onéreux sur une période de trois ans », fait remarquer M. Pitcher. Mais c’est une mode. Encore faut-il pouvoir en évaluer le coût chez soi. « À plus forte raison qu’aucun fournisseur n’accepte présentement de se porter légalement responsable (notion de Iiability) des contenus que l’on stocke sur son nuage. « Si son système s’écrase, il ne doit rien au client ! » Un peu inquiétant, non ? « Disons que c’est un débat qui va faire couler beaucoup d’encre d’ici les deux prochaines années. »

Et ainsi de suite. Chaque méthode, chaque techno, a ses pour et ses contre. Encore faut-il pouvoir les évaluer, les mesurer, les comparer. D’où le service de M. Pitcher.

Avis : j’utilise personnellement des machines sous Windows, Mac OS X et Linux et je n’ai aucune préférence; en fait j’ai une relation d’amour-haine avec chacune. Si vous croyez que je suis parti-pris envers l’une ou l’autre de ces plates-formes, je vous soumets respectueusement que vous avez tort et ne peux vous recommander que de consulter mes chroniques antérieures.
Pourquoi commenter cet article : Pour dépasser ou préciser mon propos, pour le nuancer, l’illustrer, le compléter avec des adresses, pour débattre du sujet. Il en ressort un “produit d’information” (mon article + les commentaires) beaucoup plus intéressant et utile qu’un simple article de journaliste. D’où les demandes régulières de la part de participants pour que je sévisse quant aux trolls ou aux propos vexatoires et inutilement agressifs. On n’est pas ici pour s’enguirlander à qui mieux mieux, mais pour partager de l’information utile.
Nelson Dumais

ligne.jpg

Publicités

25 réflexions sur “La relève informatique après un désastre

  1. Les entreprises d’une certaine taille ont des plans pour protéger leurs données et se remettre sur pieds au besoin. Mais chez les PME… oubliez cela. Un exemple ? Les données comptables d’une entreprise sont corrompues, impossible d’y accéder. Le responsable étant en vacances, on ne sait pas si des copies de sécurité faites par le logiciel de comptabilité existent, et où elles seraient situées. Manque de chance, les copies de sécurité de sécurité sur le serveur sont inutilisables.

    Je leur ai suggéré un système pro-actif qui informe des résultats des copies de sécurité, bonnes ou pas. Réponse: pas besoin de ça, on a déjà un système, c’est juste qu’il n’a pas fonctionné.

    Tant que l’informatique sera considérée comme un mal nécessaire, tant qu’on ne comprendra pas que l’intégrité des données c’est important, les désastres vont se produire.

    Question quiz: de quelle copie de sécurité aurez-vous le plus besoin ? Je donnerai la réponse plus tard…

  2. Ou je travaille on utilise VMWare. C’est vraiment efficace et ca rend la gestion de nos environnements beaucoup plus facile en cas de panne majeure.

    En plus de pouvoir rouler plusieurs clients sur le même serveur on peut copier chaque environnements et les rouler sur un autre serveur avec des outils comme VMotion. Le downtime est beaucoup plus bas. Ca plante, t’envois tes affaires sur les serveurs de backup et tes reparti.

    Au début la virtualization ca peut sembler un peu impressionnant mais quand tu maitrises la technologie c’est vraiment efficace.

  3. @planteg

    Une PME répondrait le bénéfice net !!! c’est le plus important tout ne vit qu’autour de ce famux bénéfice …

    Le propriétaire parlerait du dividende …

    Ayant travailler sur un projet informatique de moyenne envergure pour une PME, disons que le topo était jsutement celui-là. Pas grave les informations … ÇA marche depuis 1 an … ok fine …

  4. Cher M’sieur Dumais,

    à propos de: “Disons que c’est un débat qui va faire couler beaucoup d’encre d’ici les deux prochaines années.”

    Je sais pertinemment que je suis plutôt mal placé pour parler d’être de son époque car moi-même, je suis maniaque de la musique des années 60 mais, ne devrait-on plus parler de « faire couler de l’encre » mais de « faire bouger des électrons »?

    – l’empêcheur de tourner en rond!

  5. Les plans de releve, (DRP) sont toujours galvaudés, que ca soit dnas les pme, dans les GE ou les TGE, il y’a toujours des feux plus « important » a gérer que les mises a jour des documentation de DRP. De plus, il y’a maintenant beaucoup de maniere de la faire cette releve, mais souvent, les resposables des TI ne jurent que par GARTNER et cie, donc, on se retrouve avec des énormes services fournis par de gourmandes entreprises comme Sungard et on a aucun controle sur rien…

  6. gerant une infrastructure unicenter international , je peut sans hesitation affirmer que je hait CA avec passion pour son manque de transparence et de documentation .
    simplement pour ca je ne peut recommander cette firme aux collegues

  7. @_Renaud.
    C’est vrai que la virtualisation est une superbe solution pour failover ou du disaster recovery. Mais il faut une super bonne architecture pour y répondre. Dans le cas de Desaster recovery, il faut une site redondant c’est à dire avec SAN redondant, réseau redondant, architecture VMware redondant, Réseau de couche 2 étirer sur les 2 sites, s’assurer que les images virtuelle sont recopier d’un site à l’autre et même à jour en temps réel pour certaine applications comme le DBs par exemple. J’ai très rarement vu cela, j’en ai monter qu’un seul. Les coût sont énorme.
    Pour le failover, oui c’est très simple sous VMware ou sous virtualisation.

    Dans ta description je ne peux voir si ta config repond au besoin de disaster recovery.
    Est-ce que tu peux repartir les systèmes si ton sites est complètement détruit?

    @ TOUS
    Beaucoup de monde mélange failover et disaster recovery.

    J’ai fait beaucoup d’entreprise et j’ai travaillé dans seulement une qui avait un VRAI plan de disaster recovery.
    Tous les mois nous devions basculer les serveurs sur un autre site distant de plus de 300Km du premier. Donc un mois nous fonctionnons sur le site A et le mois suivant sur le site B.

    De plus tout les trois mois nous avions un exercice de désastre planifier.

    Une fois par année au minimum nous avions un appel de désastre et nous savions pas si c’était simuler ou pas. Ex.: J’ai recu un appel durant la nuit de ne pas entrer au bureau, qu’il y avait eu un camion accidenter avec déversement chimique. La zone étais totalement interdite par la protection civil. J’ai du me rendre en train au site de secours, à plus d’une heure de train et faire le travail donc je dois faire selon les circonstances et travailler avec mes collègues de travail sur place. Imaginer l’ exercice et le nombres d’ individues que cela implique.

  8. @_renaud, Si vous utiliser windows : http://www.google.ca/url?sa=t&source=web&cd=3&ved=0CCEQFjAC&url=http%3A%2F%2Fdownload.microsoft.com%2Fdownload%2FF%2FC%2FA%2FFCAB58A9-CCAD-4E0A-A673-88A5EE74E2CC%2FWindows_Server_2008_Virtual_Tech-VL_Brief-Jan_09.docx&rct=j&q=microsoft%20server%202008%20license&ei=eJtpTPcKg7i9A4Xv9P0D&usg=AFQjCNHWeWuhgrEPSv2Kbb6JVIuIpDzzWQ&cad=rja

    Ce lien est seulement pour vous avisé à propos du licensing et de vmotion. VMotion semble ètre merveilleux mais virtualiser un server sans être avec un host DATACENTER … ca coute tres tres cher. Car si tu veux « mové » une vm sur un autre server, ca te prend une license de windows sur le server qui est le nouveau « host » car les license sont associé au host.

    Donc en résumé
    Server 1 Server 2
    Vm1 –Transfert — > Vm1

    Ca te prend 2 license pour Vm1
    Si ta seulement 1 VM, ca fonctionne si ton host est standard et +. Si ta 4 VM ca prend Enterprise, si ta plus que 4 VM ca te prend Datacenter

    Standard vien avec 1 license de virtualisation, enterprise avec 4 et datacenter avec unlimited (cependant la license demande de roulé sur 2 CPU (WTF tu va dire ??)) donc demande 2 license de datacenter pour chaque host.

  9. Comme le dit bien l’article de Nelson, en matière de plan de relève, tout n’a pas la même priorité et la même sévérité. Certains services peuvent rester indisponibles pendant des jours sans que cela n’affecte de manière significative une entreprise. Ou en cas de désastre majeur, l’indisponibilité de certains services devient acceptable alors que d’autres ne le seront pas. Tout n’est pas au même niveau. Et c’est cet exercice d’établir les priorités et les sévérités que certaines entreprises ne font pas. Et c’est rarement au gars de l’informatique de le faire, lui il est là pour fournir les solutions et les alternatives avec les coûts afférents. Ce n’est pas vrai non plus qu’il faut assurer la résilience de certains services à n’importe quel prix. L’évaluation des risques permet justement de déterminer les plages de confort d’une entreprise avec certains risques.

    Un plan de recouvrement en cas de désastre n’est pas qu’un truc informatique. Bien beau de relever le système informatique en cas d’inondation, mais ça donne quoi si l’usine est sous trois pieds d’eau?

  10. @bigtoune et shwin

    Personnellement j’ai seulement utilisé les versions workstation de VMWare (qui vont très bien), je ne suis pas assez fort techniquement pour élaborer sur le sujet comme vous le faites.

    Ce que je connais sur le sujet je l’ai appris en parlant a notre gars du datacenter et il semble vraiment enthousiaste a propos de ses environnements.

    Il travaille avec la grosse version corporate et selon lui, si on en venait a perde nos environnements de prod on switcherais sur nos environnements DR pratiquement sans downtime et dans le pire des cas on perdrait les données des 5 dernières minutes.

    Je ne sais pas s’il exagère mais il semble assez confiant. Et de ce que j’ai vu jusqu’à maintenant c’est vraiment un bon produit.

  11. @planteg
    Le plan de relève ne sera pas pareil pour une compagnie publique ou une compagnie pivée. La compagnie publique a un vérificateur externe. Et depuis plusieurs années, ils sont formés pour vérifier ce genre de choses.

  12. Les gens mélangent donnees et systeme d’exploitation, le DBA est le gars qui s’occupe des donnees et des sauvegardes encryptées qui peuvent être copiées en x nombres de fois et envoyees sur la lune si ils en ont les moyens.

    planteg
    …Tant que l’informatique sera considérée comme un mal nécessaire…
    Mon grand-père roulait sa business avec des cartes perforées, l’informatique fait partie integrante de la business depuis … que la business existe …

  13. @gl000001

    Bien d’accord avec la différence dont vous faites part entre le privé et le publique. Je voulais seulement indiquer que dans les PME, on ne pense pas une seconde que l’on pourrait perdre des données. Les backups, on ne s’en préoccupe pas trop. Le cas que j’ai décrit n’est pas théorique, mais bien réel ! Toute entreprise devrait avoir au minimum une stratégie de copie de sécurité FIABLE. Mais ce n’est pas le cas. Et quand un problème se produit, c’est la panique. Et ça finit invariablement en « maudits ordinateurs ».

  14. @_renaud
    Non il n’exagère pas, dans une design d’architecture pensée et monté pour cela, c’est possible de faire de la relève sans ou très peux de downtime. Mais c’est très complexe à mettre en place, très couteux et demande des connaissances multidisciplinaire dans le domaine soit réseaux, stockage, server et datacenter. La gestion des licences est aussi très complexe. Dans les grosse corpo je me frappe à des problèmes de processus qui n’ont pas été pensée pour des VMs comme simplement demander une adresse IP sans port réseau, ou des port réseaux configurer en trunking.

    @Shwin:
    effectivement comme je le dit la gestion des licences est très complexe, si vous trouver cela complexe avec Windows Server consulter un peux la licence de Windows SQL server, 78 pages de résumer de condition d’utilisation et imaginer, même le fuseau horaire de déplacement de la VM impacte le cout de la licence. Le cout n’est pas le meme aussi si vous pouvez predire sur quel CPU votre VM peux rouler, etc.

    Et là je ne parle pas d’applications qui sont lier avec des licences matériel comme clé USB ou autre qui empêche toutes les avantages de la virtualisation et du Vmotion.

  15. Salut Nelson,
    Je ne peux quand même pas te téléphoner toutes les trois minutes, alors… un petit mot rapide pour te dire que je ne reconnais plus mon ordi. Il est normal! Il va vite. Après avoir suivi tes conseils, point pas point, me revoilà en 2010. Avec un ordi, quoi. Pas un truc qui traîne et qui écrit moins vite que moi à la main. Merci et gros bisou. Je t’enverrais bien des concombres, mais tu croules déjà sous ta récolte. 🙂

  16. @planteg

    Oui le backup est un must, mais un plan de relève c’est beaucoup plus. Si, par exemple, mon comptable passait au feu demain matin, un backup externe recouvré ne suffirait pas (loin de là) à le rendre à nouveau opérationnel.

  17. Chose certaine, avec VirtualBox… le cauchemar des licences… Goodbye Charlie!

    Mais bon, quand tu y tiens à payer…. tu payes: VMware, Office, MS et consorts…

  18. Y a peut-être juste Alex qui fournit un truck gratuitement mais comme il reste sur une ile….. les chances qu’il se le fasse voler…. tsé!

  19. @dennis_dubeau ,
    VirtualBox = gratuit pour le personnal, payant pour les corpo
    Vmware = assez cher pour la version server (ESXI)
    Windows, il y a VirtualPC. Coté server il y a HyperV qui est gratuit (un simple rôle a ajouté) et qui run tempête et embedded dans windows server!!

    @bigtitoune, oui je suis au courant pour Sql Server licensing. Nous somme justement en pleine migration de notre datacenter pour y rajouté des nodes de failover.

  20. @ Shwin

    Dans mon psyché, une corpo… ça devrait avoir les moyens de payer. Encore qu’il soumettent ces frais en dépense et donc en économies d’impôts… ce qui donne qu’au bout de la ligne, je dois payer cet impôt qu’eux sauvent!

    ishhhh… Rien de gratuit, à part l’amour unconditionnel de nos mamans!!!

  21. Avant cela était très dispendieux et difficile de mettre en place des serveurs Cluster à distance, mais aujourd’hui c’est assez facile avec Oracle Cluster, 2 SAN et des fibres optique entre les 2 batiments. Une salle informatique disparait! l’autre salle continu et les usagers ne voient même pas la différence(sauf ceux qui ont fait un UPDATE). C’est certain que les firmes de consultant désirent que vous engager un consoltant à 300$ pendant 6 mois pour évaluer vos besoins… ha ha ha. Un consultant qu’eux même ont engagé à la pige et qu’il ne connaissait pas 2 semaine avant… Mais dans la vrai vie, une multitude de petit SAN/NAS dispersé géographiquement, des robots backup dans 2 salles et les ruban qui font une rotation avec l’extérieur dont une troisième salle de recouvrement….. Vmotion est une concept disponible sous différentes technologie mais inéfficace en cas de panne majeur et encore plus lorsque la panne survient dans un temps relativement court. Surtout lorsque vous avez des Tera de données….

  22. Je suis traductrice au fédéral et votre article me fait sourire, car il ne se passe pas une semaine sans que je n’ais à traiter de ce sujet. Évidemment, il est difficile de comparer les PME et la machine gouvernementale, mais le principe est sensiblement le même. Merci pour l’article, il est important de se rappeler que ce ne sont pas toutes les entreprises qui ont un plan de reprise après sinistre et, indirectement, nous sommes tous touchés par les mesures prises (ou non) par ces entreprises.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s