La communauté Gandi

Incident Simple Hosting

Nous avons de nouveau subi une panne matérielle sur un des équipements utilisé pour le simple hosting.
Ci dessous la chronologie des événements :
– 21:06 PM CET : l’équipement monte en utilisation CPU
– 21:06 PM CET : l’équipement est a 100% de CPU sans raison apparente et ne répond plus
– 21:08 PM CET : décision prise de basculer sur l’équipement secondaire
– 21:08 PM CET : l’équipement secondaire présente les même symptomes alors que le trafic n’a pas été basculé
– 21:09 PM CET : tentative de débugage pour comprendre ce qui se passe.
– 21:26 PM CET : bascule sur le deuxième équipement qui est stabilisé
– 21:27 PM CET : retour à la normale du service
– 23:42 PM CET : suite à l’incident réseau il y a eu un effet de bord sur les DNS, les instances simple hosting n’avaient plus de résolution DNS depuis 21:06 PM CET, problème maintenant résolu (provoquant des problèmes d’envois d’ emails)
Détail :
– Les équipements réseaux servant de gateway pour le simple hosting ont montré des signes de faiblesses, le diagnostic sur l’équipement principal est en cours (probablement un problème de mémoire sur l’équipement). Nous utilisons l’équipement secondaire pour le moment.