5 mesures que vous devez connaître sur votre système de sauvegarde et de récupération

village de l’emploi

Il est plus compliqué de savoir si les systèmes de sauvegarde et de restauration fonctionnent bien que de savoir combien de temps prennent les sauvegardes et les restaurations; accepter un ensemble de mesures essentielles est la clé pour juger correctement votre système afin de déterminer s’il réussit ou a besoin d’une refonte.
Voici cinq mesures que chaque entreprise doit rassembler afin de s’assurer que ses systèmes répondent aux besoins de l’entreprise.
Capacité de stockage et utilisation
Commençons par une métrique très basique: votre système de sauvegarde a-t-il une capacité de stockage suffisante pour répondre à vos besoins de sauvegarde et de restauration actuels et futurs? Que vous parliez d’une bandothèque ou d’une baie de stockage, votre système de stockage a une quantité limitée de capacité, et vous devez surveiller quelle est cette capacité et quel pourcentage de celle-ci vous utilisez au fil du temps.
Ne pas le surveiller peut vous obliger à prendre des décisions qui pourraient aller à l’encontre des politiques de votre entreprise. Par exemple, la seule façon de créer une capacité supplémentaire sans en acheter plus est de supprimer les anciennes sauvegardes. Il serait dommage que le fait de ne pas surveiller la capacité de votre système de stockage se traduise par l’incapacité de répondre aux exigences de rétention fixées par votre entreprise.
Le stockage d’objets basé sur le cloud peut aider à atténuer cette inquiétude car certains services offrent une capacité essentiellement illimitée.
Capacité de débit et utilisation
Chaque système de stockage a la capacité d’accepter un certain volume de sauvegardes par jour, généralement mesuré en mégaoctets par seconde ou en téraoctets par heure. Vous devez connaître ce numéro et vous assurer de surveiller l’utilisation de votre système de sauvegarde. Si vous ne le faites pas, les sauvegardes peuvent prendre de plus en plus de temps et s’étendre sur la journée de travail.

La surveillance de la capacité de débit et de l’utilisation de la bande est particulièrement importante. Il est très important que le débit de vos sauvegardes corresponde au débit de la capacité de votre lecteur de bande à transférer des données. Plus précisément, le débit que vous fournissez à votre lecteur de bande doit être supérieur à la vitesse minimale du lecteur de bande. Consultez la documentation du lecteur et le système d’assistance du fournisseur pour connaître la vitesse minimale acceptable et essayez de vous rapprocher le plus possible de cette vitesse. Il est peu probable que vous approchiez de la vitesse maximale du lecteur de bande, mais vous devez également surveiller cela.
Calculer la capacité et l’utilisation
La capacité de votre système de sauvegarde dépend également de la capacité du système de calcul derrière lui. Si la capacité de traitement des serveurs de sauvegarde ou de la base de données derrière le système de sauvegarde ne parvient pas à suivre, cela peut également ralentir vos sauvegardes et les faire saigner dans la journée de travail. Vous devez également surveiller les performances de votre système de sauvegarde pour voir dans quelle mesure cela se produit.

Fenêtre de sauvegarde

Les deux mesures précédentes sont très importantes car elles affectent ce que nous appelons la fenêtre de sauvegarde: la période pendant laquelle les sauvegardes sont autorisées à s’exécuter. Si vous utilisez un système de sauvegarde traditionnel où il y a un impact significatif sur les performances de vos systèmes principaux pendant la sauvegarde, vous devez convenir à l’avance de la fenêtre de sauvegarde. Si vous êtes sur le point de remplir toute la fenêtre, il est temps de réévaluer la fenêtre ou de repenser le système de sauvegarde.

Les entreprises qui utilisent des techniques de sauvegarde qui entrent dans la catégorie incrémentielle permanente (par exemple, la protection continue des données (CDP), le quasi-CDP, les sauvegardes incrémentielles de niveau bloc ou les sauvegardes par déduplication de source) n’ont généralement pas à se soucier d’une fenêtre de sauvegarde. En effet, les sauvegardes s’exécutent sur de très courtes périodes et transfèrent une petite quantité de données, un processus qui a généralement un impact très faible sur les performances des systèmes principaux. C’est pourquoi les clients utilisant de tels systèmes effectuent généralement des sauvegardes tout au long de la journée, aussi souvent qu’une fois par heure, voire toutes les cinq minutes. Un véritable système CDP fonctionne en fait en continu, transférant chaque nouvel octet tel qu’il est écrit.

Point de récupération et réalité du temps de récupération

Personne ne se soucie vraiment du temps nécessaire à la sauvegarde; ils se soucient du temps qu’il faut pour restaurer. L’objectif de temps de récupération (RTO) est le temps convenu par toutes les parties qu’une restauration doit prendre après une sorte d’incident qui en nécessite un. La durée d’un RTO acceptable pour une entreprise donnée est généralement déterminée par le montant d’argent qu’il perdra lorsque les systèmes seront en panne. Par exemple, si une entreprise perd des millions de dollars par heure pendant les temps d’arrêt, elle souhaite généralement un RTO très serré. Des sociétés telles que les sociétés de négoce financier, par exemple, cherchent à avoir un RTO aussi proche de zéro que possible. D’autres sociétés qui peuvent tolérer de plus longues périodes d’indisponibilité informatique peuvent avoir un RTO mesuré en semaines. L’important est que le RTO corresponde aux besoins commerciaux de l’entreprise.

Il n’est pas nécessaire d’avoir un seul RTO dans toute l’entreprise. Il est parfaitement normal et raisonnable d’avoir un RTO plus serré pour les applications plus critiques et un RTO plus détendu pour le reste du centre de données.

L’objectif de point de récupération (RPO) est la quantité de perte de données acceptable après un incident majeur, mesurée en temps. Par exemple, si nous convenons que nous pouvons perdre l’équivalent d’une heure de données, nous avons convenu d’un RPO d’une heure. Cependant, la plupart des entreprises optent pour des valeurs beaucoup plus élevées, comme 24 heures ou plus. Cela est principalement dû au fait que plus votre RPO est petit, plus vous devez exécuter votre système de sauvegarde plus fréquemment. De nombreuses entreprises peuvent souhaiter un RPO plus strict, mais elles se rendent compte que ce n’est pas possible avec leur système de sauvegarde actuel. Comme le RTO, il est parfaitement normal d’avoir plusieurs RPO dans toute l’entreprise en fonction de la criticité des différents ensembles de données.

Les métriques de point de récupération et de réalité de temps de récupération sont mesurées uniquement si une récupération se produit – qu’elle soit réelle ou via un test. Le RTO et le RPO sont des objectifs, le RPR et le RTR mesurent dans quelle mesure vous avez atteint ces objectifs après une restauration. Il est important de mesurer cela et de le comparer avec le RTO et le RPO pour évaluer si vous devez envisager une refonte de votre système de sauvegarde et de récupération.

La réalité est que la plupart des RTR et RPR de la plupart des entreprises sont loin des RTO et RPO convenus pour leur entreprise. L’important est de mettre cette réalité en lumière et de la reconnaître. Soit nous ajustons le RTO et le RPO, soit nous avons repensé le système de sauvegarde. Il est inutile d’avoir un RTO ou RPO serré si le RTR et le RPR sont complètement différents.

Que faire des métriques

L’une des façons d’augmenter la confiance dans votre système de sauvegarde consiste à documenter et à publier toutes les mesures mentionnées ici. Faites savoir à votre direction dans quelle mesure votre système de sauvegarde fonctionne comme prévu. Faites-leur savoir – sur la base du taux de croissance actuel – combien de temps il leur faudra avant d’acheter de la capacité supplémentaire. Et surtout, assurez-vous qu’ils sont conscients de la capacité de votre système de sauvegarde et de récupération à respecter les RTO et RPO convenus. Cacher ce fait ne fera du bien à personne en cas de panne.

  1. Léo dit :

    Le calcul de la capacité et de l’utilisation est essentiel, merci pour l’information.

  2. Eva dit :

    La fenêtre de sauvegarde sera l’un de mes prochains sujets de recherche.

  3. Zoé dit :

    J’aimerais en apprendre davantage sur la surveillance de la capacité de débit et de l’utilisation.

  4. Enzo dit :

    Je vais en parler à mon patron pour voir si nous sommes en train de suivre ces mesures.

  5. Anna dit :

    Le point de récupération et la réalité du temps de récupération sont des aspects clés pour évaluer un système de sauvegarde.

  6. Noah dit :

    Merci d’avoir partagé ces informations, je vais commencer à surveiller ces mesures.

  7. Emma dit :

    Je n’avais jamais pensé à surveiller la capacité de stockage de cette manière.

  8. Hugo dit :

    Très utile pour comprendre les systèmes de sauvegarde et de restauration.

  9. Sophie dit :

    La performance du système de sauvegarde peut être affectée par la capacité de traitement des serveurs. Cela a du sens.

  10. Jade dit :

    Intéressant point de vue, merci pour les explications détaillées.

  11. Maxime dit :

    Le temps de récupération est certainement plus important que le temps de sauvegarde. Ça a du sens.

  12. Lola dit :

    Quelles sont les meilleures pratiques à suivre pour surveiller la capacité de stockage?

  13. Jade dit :

    Ce sont des informations intéressantes à considérer avant de prendre des décisions sur les systèmes de sauvegarde et de restauration.

  14. Camille dit :

    Le débit et l’utilisation de la bande sont souvent négligés, mais je vois maintenant à quel point ils sont importants.

  15. Zoé dit :

    Je ne connaissais pas les différentes techniques de sauvegarde, c’est intéressant de savoir qu’il existe des options qui n’ont pas d’impact significatif sur les performances des systèmes principaux.

  16. Antoine dit :

    Il est essentiel de surveiller la capacité de votre système de stockage pour pouvoir répondre aux exigences de rétention de votre entreprise.

  17. Chloé dit :

    Les points de récupération et le RTO sont cruciaux pour chaque entreprise, car tout le monde veut minimiser les temps d’arrêt.

  18. Hugo dit :

    La fenêtre de sauvegarde est un aspect à ne pas négliger, surtout si cela affecte les performances des systèmes principaux.

  19. Lucas dit :

    Je ne savais pas que le stockage d’objets basé sur le cloud pouvait aider à atténuer les inquiétudes liées à la capacité de stockage. C’est vraiment bon à savoir !

  20. Raphael dit :

    Je ne sais pas si une entreprise détermine son RTO en fonction de l’argent qu’elle perdrait, mais il est important d’avoir un objectif clair en tête.

  21. Manon dit :

    La surveillance de la capacité de débit est très importante.

  22. Romain dit :

    La capacité de stockage est vraiment importante, je n’y pensais pas.

  23. Sophie dit :

    Le temps de récupération est essentiel pour calculer l’impact d’un incident.

  24. Louis dit :

    La fenêtre de sauvegarde est un concept intéressant.

  25. Hugo dit :

    Je ne savais pas à quel point le système de calcul avait un impact sur les sauvegardes.

  26. Sophie dit :

    J’ignorais l’importance du stockage sur le cloud! ☁️

  27. Mathilde dit :

    C’est très important de surveiller la capacité de stockage pour éviter des problèmes.

  28. Jérôme dit :

    La fenêtre de sauvegarde est un point clé à ne pas négliger. ⏱️

  29. Luc dit :

    Je ne savais pas qu’il y avait différents types de sauvegardes.

  30. Marc dit :

    C’est intéressant de savoir la différence entre les types de sauvegarde.

  31. Camille dit :

    Le RTO est une mesure à prendre en compte.

  32. Marie dit :

    Merci pour cette information! C’est très utile.

  33. Anna dit :

    Je pense que le stockage d’objets basé sur le cloud est très utile.

  34. Lea dit :

    Je trouve important de pouvoir surveiller la capacité de stockage et l’utilisation, cela peut vraiment impacter les performances.

  35. Sophie dit :

    Ces mesures sont vraiment essentielles pour assurer le bon fonctionnement des systèmes de sauvegarde.

  36. Tom dit :

    La fenêtre de sauvegarde est un concept intéressant que je n’avais pas pris en compte jusqu’à présent.

  37. Eva dit :

    Le temps de récupération est effectivement plus important que le temps de sauvegarde, j’ai appris beaucoup de choses sur ce sujet.

  38. Luc dit :

    Je ne savais pas que le stockage d’objets basé sur le cloud pouvait aider à résoudre le problème de capacité de stockage. Merci pour l’info!

  39. Hugo dit :

    Il est bon de savoir qu’il est normal d’avoir des RTO et des RPO différents en fonction de la criticité des données.

  40. Nina dit :

    Ces informations sont très utiles, merci pour cet article complet sur les systèmes de sauvegarde!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *