Der Höhepunkt: Den Black Friday orchestrieren
10.000 Anfragen pro Sekunde. Keine Ausfallzeiten erlaubt. Wie wir die Infrastruktur für BFCM laden, testen, einfrieren und skalieren.
Black Friday (BFCM) ist der Super Bowl des E-Commerce. Sie verbringen 11 Monate damit, sich auf 4 Tage vorzubereiten. Wenn Sie 10 Minuten lang abstürzen, verlieren Sie 100.000 $.
Der Code-Freeze
Am 1. November treten wir in den Code Freeze ein. Keine neuen Funktionen. Keine „schnellen CSS-Korrekturen“. Es sind nur P0-Bugs (kritische Blocker) zulässig. Warum? Denn jeder Einsatz birgt Risiken. Stabilität ist von größter Bedeutung.
Lasttest mit k6
Wir gehen nicht davon aus, ob die Website den Datenverkehr bewältigen kann. Wir greifen es an. Wir verwenden k6, um 50.000 gleichzeitige Benutzer beim Surfen, Hinzufügen zum Warenkorb und Bezahlen zu simulieren. Wir identifizieren die Engpässe (normalerweise nicht optimierte DB-Abfragen oder APIs von Drittanbietern) und beheben sie.
Der Kriegsraum
In „The Big Night“ schlafen wir nicht. Wir haben einen virtuellen War Room eingerichtet.
- Datadog-Dashboards: Überwachung von Fehlerraten (5xx), Latenz (S. 95) und CPU-Auslastung.
- PagerDuty: Automatisierte Benachrichtigungen, wenn die Erfolgsquote der API-Antworten unter 99 % fällt.
- Fallback-Strategien: Wenn die Such-API ausfällt, blenden wir die Suchleiste automatisch aus. Die Site muss sich sanft verschlechtern und darf nicht explodieren.
Überleben ist kein Glück. Es ist Vorbereitung.