Être un SRE est un travail difficile (bien que gratifiant) n’importe quel jour de l’année. Mais c’est particulièrement difficile le Black Friday et le Cyber Monday, l’événement post-Thanksgiving qui est devenu le plus grand jour de shopping en ligne de l’année. Nous nous concentrerons sur l’appel de Cyber Monday tout au long de ce guide.
Et pour 2021, Cyber Monday promet d’inclure non seulement les défis standard associés aux pics massifs de trafic, mais aussi un pic d’attaques de cybersécurité, que le FBI s’attend à ce que la fréquence augmente en cette période des fêtes. Et bien que la sécurité ne soit pas le travail principal des SRE, on s’attend à ce qu’ils aident les équipes de sécurité et DevSecOps à faire face aux menaces de fiabilité que posent les pirates.
Voilà donc les problèmes auxquels les SRE sont confrontés à l’approche du Cyber Monday 2021 et au-delà. Pour trouver des solutions, examinons six meilleures pratiques pour gérer les défis de fiabilité et de sécurité qui se profilent en cette période des fêtes.
Évaluez votre stress lors du cyberlundi
La première étape de la préparation du Cyber Monday consiste à évaluer le stress que les vacances sont susceptibles d’exercer sur les systèmes que vous prenez en charge.
De toute évidence, les détaillants en ligne, en particulier ceux qui vendent des produits technologiques, seront confrontés à la plus forte augmentation de la charge lors de la flambée des achats du Cyber Monday.
Les entreprises qui ne vendent pas d’objets en ligne sont moins susceptibles de connaître un pic majeur de trafic. Cela dit, le fait que Cyber Monday attire plus de personnes en ligne, en général, peut augmenter la demande à tous les niveaux. Ne présumez donc pas que Cyber Monday sera comme d’habitude pour vous simplement parce que votre entreprise n’est pas un détaillant.
Configurer la mise à l’échelle automatique, y compris pour Kubernetes
Vous savez probablement déjà que vous pouvez configurer la mise à l’échelle automatique pour les machines virtuelles cloud afin de les aider à faire face à un pic de demande.
Mais saviez-vous que vous pouvez également dimensionner automatiquement les clusters Kubernetes ? Les fonctionnalités de mise à l’échelle automatique de Kubernetes vous permettent d’ajouter des nœuds à vos clusters afin qu’ils puissent supporter une charge plus élevée.
Toutes les distributions Kubernetes ne prennent pas en charge la mise à l’échelle automatique, mais la plupart des distributions Kubernetes gérées basées sur le cloud le font. (Vous pouvez trouver des détails sur ce que chaque service Kubernetes majeur prend en charge dans notre blog sur le choix d’une distribution Kubernetes pour les SRE.) Si vous utilisez Kubernetes et que la mise à l’échelle automatique est disponible, assurez-vous d’en profiter pour aider à gérer la montée subite du Cyber Monday. .
Distribuez encore plus votre infrastructure distribuée
Ajouter plus de redondance à votre infrastructure est un autre moyen relativement simple et très efficace de se préparer aux augmentations de charge du Cyber Monday. Cela peut également aider à protéger contre les attaques DDoS, si elles ciblent votre environnement (ou votre hôte cloud) pendant l’événement.
Alors, envisagez d’ajouter une autre zone ou région de disponibilité à votre cloud si vous avez le temps de le configurer avant l’arrivée du Cyber Monday. Vous pouvez également déplacer des images de VM ou de conteneurs vers une autre région (ou un cloud entièrement différent) afin qu’elles soient à portée de main au cas où vous auriez besoin de les faire tourner en réponse à une défaillance dans une autre région ou un autre cloud.
Doublez votre plan de réponse aux incidents
Il y a fort à parier que quelque chose va mal tourner avec vos applications ou votre infrastructure au cours du Cyber Monday. Mais à quel point cela va mal dépend de la rapidité et de l’efficacité avec laquelle vous pouvez réagir.
À cette fin, il est maintenant temps de vérifier que vous avez mis en place des manuels de réponse aux incidents. Il est tout aussi important de vous assurer que vous disposez d’une plate-forme de réponse aux incidents qui vous aide à gérer les incidents rapidement et efficacement.
Vérifiez vos sauvegardes
Dans le même ordre d’idées, la période précédant le Cyber Monday est un excellent moment pour vous assurer que vous sauvegardez systématiquement les données critiques.
N’oubliez pas non plus de vous assurer que vos données de sauvegarde sont stockées dans un emplacement où elles resteront intactes si les systèmes de production échouent – ou pire – s’ils sont piratés. Pour maximiser les chances d’une récupération rapide dans le cas de ce dernier scénario, pensez à « espacer » vos données de sauvegarde, ce qui signifie les déconnecter du réseau afin que les attaquants distants ne puissent pas les toucher.
Ingénieur du chaos
L’ingénierie du chaos peut vous aider à détecter des problèmes de fiabilité imprévus à tout moment de l’année. Mais cela est particulièrement utile pour préparer le Cyber Monday, lorsque vos sites seront probablement soumis à un stress plus élevé que d’habitude.
Donc, si vous n’avez effectué aucune ingénierie du chaos ces derniers temps, procurez-vous un outil d’ingénierie du chaos et donnez un coup de pied aux pneus de votre système avant que les utilisateurs ne le fassent.
Conclusion
Cyber Monday peut créer des contraintes de fiabilité particulières. Mais cela ne doit pas conduire à des défaillances de fiabilité. Avec les bons plans et outils en place, les SRE peuvent préparer leurs environnements à gérer tout ce que Cyber Monday apporte, des pics de trafic aux attaques DDoS et au-delà.