Comment mettre en place un processus de gestion des incidents informatiques ?

Comment mettre en place un processus de gestion des incidents informatiques ?

De la sortie imprimante bloquée à l’application hors service, nombreux sont les incidents, plus ou moins critiques, que votre système informatique éprouve. D’où l’intérêt de mettre en place un processus de gestion des incidents.

Mais comment vous assurer de la performance de votre procédure de gestion des incidents ? Quelles étapes de résolution définir et comment déterminer les rôles de chacun dans votre processus ? Est-il possible d’apporter une solution satisfaisante à l’utilisateur, conforme à votre SLA (Service Level Agreement), et dans des délais raisonnables ?

Afin de trouver une réponse à toutes ces questions, rapportez-vous au processus de gestion des incidents normé par le référentiel ITIL.

Pour vous aider à gagner en efficacité et en cohérente, appvizer détaille dans cet article les principes et étapes de ce référentiel, et rappelle les avantages à tirer de cette méthode de travail.

Enfin, nous vous présentons une sélection de logiciels reconnus pour le soutien qu’ils apportent lors de la résolution de vos incidents informatiques.

Sommaire :

Suggestion de logiciels pour vous

Splunk Cloud

Splunk Cloud
Le moyen le plus rapide d’agréger et d’analyser des données
En savoir plus
Voir ce logiciel

Splunk Enterprise Security

Splunk Enterprise Security
Lutte contre les menaces grâce à des analyses avancées
En savoir plus
Voir ce logiciel

Vade Secure Office 365

Vade Secure Office 365
La solution native de protection de votre messagerie Office
Démarrer un essai gratuit
Voir ce logiciel

Définition de la gestion des incidents

La norme ITIL

Les incidents rencontrés en informatique sont, la plupart du temps, gérés en accord avec la norme ITIL, ou Information Technology Infrastructure Library.

Mais de quoi s’agit-il exactement ?

Projet développé dans les années 1980 par l’Office public britannique du commerce, ITIL est un ensemble de documents énumérant les bonnes pratiques à appliquer dans la gestion des services informatiques de manière étendue. L’objectif est d’apporter un support méthodologique aux professionnels, avec une intention d’amélioration continue.

Le processus ITIL aborde plusieurs thématiques (organisation du système d’information, gestion des configurations, gestion des changements, etc.), dont celle de la gestion des incidents, définie de la sorte :

Un incident se définit par tout événement qui ne fait pas partie du fonctionnement standard d’un service et qui cause, ou peut causer, une interruption ou une diminution de la qualité de ce service.

Cette définition englobe différents types d’incidents.

Catégorisation des incidents

Nous pouvons classer les incidents en trois types :

  • Les incidents logiciel ou application. Exemples :
    • erreur programme freinant l’utilisateur,
    • ralentissement de l’application, etc.
  • Les incidents concernant le matériel. Exemples :
    • sortie imprimante bloquée,
    • disque dur bientôt saturé, etc.
  • Les demandes de service. Exemples :
    • oubli de mot de passe,
    • demande de documentation particulière, etc.

Notez que la demande de service est un cas à part. Elle ne constitue pas un incident à proprement parler. Mais son traitement s’intègre au processus, d’où l’assimilation.

La priorisation des incidents

D’autre part, si nous rencontrons différents types d’incidents, il existe également plusieurs degrés de priorité, en fonction de la gravité de l’incident et de l’urgence à le traiter.

Comment savoir si l’incident rencontré est critique ou mineur ?

C’est à l’entreprise, par exemple à la DSI (direction du système d’information), de déterminer sa propre priorisation, en tenant compte de divers paramètres comme :

  • la perte financière pour l’entreprise générée par l’incident,
  • l’impact de l’incident sur des utilisateurs VIP,
  • le non-respect des réglementations et des lois auquel l’incident peut conduire, etc.

En d’autres termes, ce sont l’impact sur l’activité de l’entreprise, et l’urgence à mettre en place une solution qui déterminent la classification des priorités.

gestion des incidents : tableau impact urgence

Source : octopus-itsm.com

Le tableau en exemple ci-dessus montre une proposition de matrice de priorisation des incidents. En fonction des cas de figure, l’incident est affecté à un type de priorité. Celui-ci sera par la suite relié à un délai de résolution qui décroît à mesure que l’incident est critique. Par exemple, vous pouvez déterminer qu’un incident P4 nécessite deux jours de traitement, alors qu’un P1 doit être résolu en deux heures.

Gestion des incidents ITIL ≠ gestion des problèmes ITIL

Enfin, il arrive de confondre gestion des incidents avec gestion des problèmes. Pourtant, ils impliquent des procédures différentes.

Selon ITIL, la gestion des problèmes sert à :

Minimiser l’impact négatif sur les activités de l’entreprise des incidents et problèmes causés par des erreurs dans l’infrastructure informatique, et prévenir la réapparition des incidents induite par ces erreurs.

➡️ Autrement dit, la gestion des problèmes s’effectue davantage de manière proactive, alors que la gestion des incidents relève plus d’une démarche réactive.

Les deux processus fonctionnent néanmoins en parallèle, la gestion des problèmes opérant grâce à l’identification d’incidents récurrents.

Bénéfices de la gestion des incidents et difficultés

Les bénéfices

Peut-être vous demandez-vous pourquoi il est si important de mettre en place un processus tant normé pour gérer vos incidents.

Parce qu’il en découle nombre de bénéfices pour votre entreprise. La gestion des incidents :

  • réduit plus rapidement l’impact, parfois critique, des incidents sur l’entreprise et le business,
  • simplifie grandement le processus en évitant, par exemple, les allers et retours d’emails,
  • permet d’identifier les incidents récurrents, et d’ainsi déployer le processus de gestion des problèmes évoqué plus haut,
  • améliore la qualité de la base de connaissances métiers grâce à la mise en place de base de données destinées au traitement des incidents,
  • apporte de la transparence au sein de la structure quant à la résolution des incidents,
  • améliore la satisfaction des utilisateurs et la productivité de tous les acteurs de l’entreprise.

Il est important de garder à l’esprit qu’un processus de gestion des incidents va au-delà de la simple résolution d’un problème informatique. Il constitue un solide soutien aux fonctions business de l’entreprise, en diminuant le nombre de ralentissements ou arrêts des activités qui impacteraient le chiffre d’affaires.

Les difficultés

Cependant, malgré tout le bien fondé d’une politique de gestion des incidents structurée, certaines difficultés sont à prévoir lors de sa mise en pratique. Citons par exemple :

  • le manque d’engagement des collaborateurs, parfois réfractaires aux changements. Conséquence ? Une mauvaise application de la méthode, et donc des résultats moins satisfaisants ;
  • le manque d’engagement de la direction. Il peut mener à des freins tels qu’un manque de moyens (matériel et ressources) pour la bonne conduite du processus ;
  • le manque de connaissance des utilisateurs, qui parfois court-circuitent les procédures mises en place.

Parce que ces barrières mettent en péril les procédures préalablement définies, il est important « d’éduquer » les différentes parties prenantes impliquées directement ou indirectement dans la gestion des incidents.

Vous vous assurez ainsi une meilleure gestion du processus, que nous allons maintenant décrire plus en détails.

Le processus de gestion des incidents

Les différentes activités du processus

Schéma figurant le processus de gestion des incidents et les différentes activités associées :

gestion des incidents : schéma du cycle de vie de l'incident

Source : researchgate.net

La détection et l’enregistrement

Le service responsable enregistre les détails afférents à l’incident sur l’outil choisi (logiciel, tableur, formulaire, etc.) et le signale aux équipes de support chargées de le traiter selon la procédure.

La classification et l’analyse

L’incident est classifié selon l’ordre de priorité défini en amont, en fonction de l’impact sur l’activité et de l’urgence de la situation.

Notez que s’il s’agit d’une demande de service, vous devez suivre la procédure associée au service.

L’investigation et le diagnostic

Toutes les informations relatives à l’incident sont analysées, dans l’objectif de procéder à la résolution et à la remise en service dans les délais.

Sachez que parfois, le premier niveau de service ne peut résoudre l’incident : il se déclenche alors une escalade des incidents sur des niveaux de service supérieurs, sur laquelle nous reviendrons ultérieurement.

La résolution et la remise en service

La résolution de l’incident prend diverses formes :

  • l’incident est réparé immédiatement. Il a été résolu et les activités reprennent leur cours normal.
  • une solution de contournement a été trouvée. En effet, la gestion des incidents doit mener au rétablissement rapide des services. Si le système n’est pas parfait, mais qu’il rend la situation « acceptable », le processus est respecté.

Notez que si les causes sous-jacentes d’un incident sont inconnues, mais qu’elles semblent partager la même origine, il est recommandé d’initier un processus de gestion des problèmes. Rappelons que les flux de gestion des incidents et des problèmes sont souvent croisés.

La fermeture de l’incident

Pour clore convenablement un incident, les équipes en charge du processus mènent un certain nombre d’actions :

  • elles prennent soin de consigner tous les détails de l’incident et le temps passé dessus,
  • elles informent l’utilisateur de la résolution,
  • elles veillent à ce que tous les détails de la solution soient clairs et lisibles.

Grâce à ce niveau de détails, vous diminuez le risque de conflit entre les différentes parties prenantes.

L’escalade des incidents

Nous avons vu que l’escalade des incidents survient lorsque la résolution est transférée à un niveau supérieur.

En règle générale, cette manœuvre intervient lorsque les personnes en charge de la gestion au premier niveau ne possèdent pas l’expertise nécessaire, ou lorsque le délai initialement prévu est dépassé.

Dans ce cas, le schéma du cycle de vie de l’incident diffère un peu :

gestion des incidents : schéma de l'escalade des incidents

Source : slideshare.net

Nous constatons qu’au moment de la résolution de l’incident, le travail est transféré au niveau de support supérieur, et ce jusqu’à ce qu’il puisse être clôturé. Cette escalade conduit parfois jusqu’à l’éditeur du logiciel ou au fabricant du matériel.

Les acteurs de la gestion des incidents

Différents acteurs sont impliqués dans la gestion des incidents. S’ils diffèrent d’une organisation à l’autre, nous identifions toutefois quelques rôles fondamentaux :

  • le demandeur/l’utilisateur : il signale l’incident en spécifiant clairement de quoi il s’agit. L’équipe technique peut également le solliciter en fin de processus pour répondre à des enquêtes.
  • les différents niveaux de support : en fonction de leur niveau, les équipes de support apportent les solutions nécessaires à la résolution de l’incident, et réaffectent parfois l’incident non résolu au niveau supérieur.
  • le gestionnaire d’incident : garant de la bonne conduite de la gestion des incidents, il planifie le processus et peut recommander des axes d’amélioration.
  • le propriétaire du processus : il assume, au sein de l’entreprise, les responsabilités du processus de gestion des incidents de manière générale. Il peut également se charger de la définition des KPIs (Key Performance Indicators), ou indicateurs clés.

Les KPIs de la gestion des incidents

Pour mesurer l’efficacité de votre processus de gestion des incidents, référez-vous à des KPIs.

Oui, mais lesquels choisir ?

C’est à vous de les définir, en accord avec vos objectifs et la configuration de votre structure. Toutefois, certains KPIs ont fait leurs preuves, comme :

  • le nombre total d’incidents décomptés,
  • le temps de résolution moyen d’un incident,
  • le nombre d’incidents récurrents,
  • le nombre d’incidents en suspens, ou backlog des incidents,
  • le coût moyen de traitement d’un incident.

Sélection de logiciels pour gérer vos incidents

Vous y voyez clair plus sur la problématique de la gestion des incidents, mais peut-être vous demandez-vous comment mettre correctement toutes ces recommandations en pratique ? Vous vous imaginez déjà appliquer votre procédure de gestion des incidents à l’aide d’un tableur Excel ou d’un outil classique de gestion de projet ?

Fort heureusement, des logiciels ont été développés pour accompagner vos équipes de manière pertinente dans toutes les étapes de la procédure de gestion des incidents.

Nombreux sont ces logiciels, couvrant des fonctionnalités différentes : outils de ticketing (Helpdesk ITIL de Zendesk, Jira, etc.), ITSM (Easyvista, Octopus, etc.) ou SIEM (Splunk Enterprise Security, QRadar, etc.).

Pour y voir plus clair, découvrez notre sélection.

Jira — l’outil de ticketing

Développé par Atlassian, Jira standardise le traitement des tickets ouverts suite au signalement d’un incident.

gestion des incidents : visuel Jira

Source : atlassian.com

Pourquoi Jira ?

  • créez des tickets avec un degré d’information précis (descriptions, niveau de gravité, captures d’écran, etc.) et suivez tous les processus nécessaires à la gestion de votre service informatique ;
  • classez et hiérarchisez en toute simplicité les bugs, et assignez-les au bon collaborateur ou au bon service ;
  • intégrez vos tickets dans un workflow tout prêt, ou personnalisé en accord avec vos besoins et vos processus ;
  • exploitez vos données en temps réel à l’aide de rapports ;
  • profitez d’un outil évolutif et compatible avec plus de 1 000 extensions (Zephyr, Tempo Timesheet, etc.), et plus d’une centaine d’outils de développement (Confluence, HipChat, Bitbucket, etc.).

Octopus — l’ITSM

Octopus est un ITSM (Information Technology Service Management), c’est-à-dire un logiciel de gestion des services informatiques.

Pourquoi Octopus ?

  • profitez d’un outil développé en accord avec les bonnes pratiques ITIL : vos équipes peuvent les appliquer naturellement sans avoir besoin de les maîtriser parfaitement au préalable ;
  • gérez en toute simplicité les requêtes provenant de vos utilisateurs, qu’il s’agisse d’un incident ou d’une demande de service ;
  • améliorez le préventif grâce à une base de données gérant l’ensemble des aspects de la configuration de vos systèmes d’information ;
  • mesurez facilement vos performances afin de dégager des axes d’amélioration et d’évaluer la conformité avec vos SLAs.

Lire aussi : Le marché de l’ITSM

Splunk Enterprise Security — le SIEM

Splunk Enterprise Security est un SIEM (Security information and event management) destiné à vous accompagner dans le renforcement de la sécurité des systèmes informatiques, et dans la gestion des incidents.

Notez que le logiciel est aussi disponible en mode SaaS, grâce à la version Splunk Cloud.

gestion des incidents : splunk enterprise security

Source : splunk.com

Pourquoi Splunk Enterprise Security ?

  • profitez d’une solution axée sur l’analytique et donc la rationalisation des tâches relatives à la cybersécurité. Vous gagnez ainsi du temps sur la résolution des différentes menaces ;
  • prenez connaissance des informations en temps réel grâce à des tableaux de bord et des vues personnalisés ;
  • détectez plus rapidement les incidents et menez des actions préventives ;
  • automatisez vos workflows et ne perdez plus de temps à trier les alertes : ainsi vous diminuez le cycle de vie de vos réponses.

Performance et satisfaction utilisateur

Nous pouvons conclure que la gestion des incidents, normée par ITIL, est une procédure à intégrer rapidement à votre système d’information, tant elle permet d’apporter une réponse claire et rapide aux problèmes. De plus, elle conduit progressivement à une diminution du nombre de ces incidents en alimentant vos processus de gestion des problèmes, et par là même vos actions préventives.

Et bonne nouvelle, tout le monde ressort gagnant de la mise en pratique d’une telle méthode de travail :

  • Les équipes techniques travaillent plus efficacement et en toute transparence.
  • Les utilisateurs sont moins impactés par des bugs et sont davantage satisfaits par votre produit.
  • L’entreprise essuie moins de pertes en cas d’incident critique.

Enfin, rappelons qu’une bonne gestion des incidents va de pair avec l’utilisation d’outils pertinents, qui viennent en soutien de votre processus et font gagner un temps précieux aux équipes.

Et vous, ITILisez-vous un logiciel pour votre gestion des incidents ? 😉

Suggestion de logiciels pour vous

Splunk Enterprise

Splunk Enterprise
Le moyen le plus rapide d’agréger et d’analyser les données
En savoir plus
Voir ce logiciel

ServeurProtect

ServeurProtect
La solution de sécurisation des systèmes de stockage NAS
En savoir plus
Voir ce logiciel

Stormshield Endpoint security

Stormshield Endpoint security
Une Protection active pour des postes de travail sécurisé
En savoir plus
Voir ce logiciel
Commenter cet article

Ajouter un commentaire