Définir les SLA de votre prestation d’infogérance et d’hébergement web
La prestation d’infogérance doit décrire les techniques et humains mis en œuvre pour réaliser les prestations de services prévues au contrat, mais les SLA constituent la véritable finalité de la prestation. Chaque SLA doit répondre à vos objectifs exprimés par rapport aux questions suivantes :
- Sur quelle plage horaire votre application doit-elle disponible ? La plupart des applications web ont maintenant besoin de 24/7/365.
- Quelle durée d’interruption pouvez vous permettre par an ? L’architecture technique et les dispositifs prévus doivent permettre de réduire au minimum les durées d’indisponibilité.
- Quelle durée maximale sur incident ? La sécurité de l’architecture, les mécanismes de rétablissement et la réactivité du prestataire doivent permettre de rétablir le service dans une durée maximale en cas d’incident.
- Quel niveau de perte est-il acceptable ? Les mécanismes de sauvegarde/restauration doivent vous éviter de perdre trop d’historique de travail et de transactions.
- Quel délai de traitement pour les opérations les plus urgentes ? Il s’agit d’identifier les opérations courantes et standards dont vous pourriez avoir besoin régulièrement, et de prévoir un délai de réalisation
Chacun de ces objectifs devra être défini en regard de l’architecture et des dispositifs mis en œuvre pour les respecter. Une architecture sans redondance, ou sans sécurisation suffisante des données, ne pourra respecter des SLA très ambitieux.
Les principaux SLA d’un contrat d’infogérance
PSG = Plage de Service Garanti
Il s’agit de la plage horaire pendant laquelle le prestataire s’engage la disponibilité et la GTR de vos applications. 2 PSG sont principalement proposées : heures et jours ouvrés, ou 24/7/365. La PSG sera toujours plus étendue en production que pour le hors-production.
Taux de disponibilité
Le taux de disponibilité est exprimé en %, en ramenant la durée maximale d’indisponibilité contractuelle sur la durée totale de la PSG, le plus souvent sur une base annuelle. En 24/7/365, sur une infrastructure web, on visera entre 99,7 et 99,9%, ou 99,95% avec une architecture très redondée sur 2 sites.
GTR = Garantie de temps de rétablissement
La GTR est le délai dans lequel le prestataire s’engage à rétablir le service sur incident. Elle s’exprime en heures, à compter de sa détection, généralement 2h ou 4h selon l’architecture mise en oeuvre. Elle doit être cohérente avec la PSG et le taux de disponibilité.
PSNG = Plage de Service non garanti
Pendant la PSNG, vos systèmes et applications restent disponibles, mais votre prestataire n’a pas d’engagement de disponibilité et de GTR. Par exemple, l’alerting en HNO sera désactivé en PSNG.
RPO = délai de perte de données
Le RPO, ou Recovery Point Objective, est le point auquel le prestataire peut remonter pour restaurer les données à partir de la dernière sauvegarde. Ce sera soit J-1 au soir, soit un délai de 2h ou moins si le bon mécanisme est mis en place.
Délais de traitement
Pour les opérations de support technique, des délais de traitement peuvent être convenus selon le niveau d’urgence/criticité des demandes. Cela passe souvent par la définition d’un catalogue d’opérations standards.