Bonjour à tous, un thread pour expliquer la situation sur nos services.

Suite aux interruptions récentes, nous avons reserré les suspicions sur la matériel.

Vu l'urgence, nous avons pris le parti d'en changer rapidement. Nous traitons en parallèle avec l'hébergeur pour identifier l'origine du problème.

Follow

Cela signifie de nouvelles migrations, et donc potentiellement de nouvelles interruptions.

Nous allons mener les premières aujourd'hui, d'abord sur les services les plus critiques, à savoir , , et

Nous préviendrons avant chaque migration / interruption, qui ne devrait chaque fois pas durer plus d'une minute.

Ensuite, nous allons poursuivre avec les autres services hébergés sur la machine.

Nous prêteront attention particulièrement à ne pas interrompre et en journée et en semaine en raison de la forte sollicitation en cette période.

Nous réserverons pour ces services les créneaux après 20h et le week-end.

Merci encore de nous soutenir, désolé pour ces désagrément, qui heureusement se voient peu mais prouvent que nous pouvons progresser sur la qualité de notre infrastructure.

Show thread

A l'issue, nous publierons un RFO / narratif détaillant les étapes de ce périple, les mesures conservatoires prises, les problèmes identifiés et comment (spoiler : dips de debugging IO à venir).

Show thread
Sign in to participate in the conversation
Mastodon

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!