Uitval van een gemeentelijk portaal of Rijksdienst-registratieketen leidt direct tot politieke en maatschappelijke druk. Brand, een regionale stroomstoring of ransomware mag daarom nooit betekenen dat paspoorten, vergunningen of uitkeringen dagenlang stilliggen. Business continuity begint bij duidelijke RPO/RTO-afspraken en eindigt bij een aantoonbaar geteste failover.
Artikel 21 van de NIS2-richtlijn en de BIO eisen dat back-ups, disaster recovery en crisisprocessen aantoonbaar zijn ingericht, getest en gedocumenteerd. Azure Backup en Azure Site Recovery leveren de bouwstenen: vaults met immutable opslag, policygestuurde retentie, replicatie tussen regio's, automatisch gegenereerde runbooks en integraties met Monitoring en Sentinel.
Deze implementatiegids helpt overheidsorganisaties hun Azure-omgeving veerkrachtig te maken. We behandelen het bepalen van RPO/RTO's, het ontwerp van back-ups en tiers, het opzetten van failoverstromen en het testen en auditen van het geheel.
- Tiering van workloads met onderbouwde RPO/RTO's en transparant kostenplaatje
- Azure Backup-configuraties voor VM's, databases, files en SaaS-data
- Azure Site Recovery-runbooks voor geautomatiseerde failover en terugschakelen
- Immutable en versleutelde opslag om ransomware en insider risks te mitigeren
- Test-, documentatie- en rapportagestructuur voor BIO- en NIS2-audits
Plan minimaal twee keer per jaar een integrale DR-oefening en koppel de resultaten aan de concernbrede risicorapportage. Laat elke oefening eindigen met een bijgewerkt runbook, een kosteninschatting en een lessons-learned die het CAB verplicht behandelt. Zonder vast ritme verouderen runbooks en valt crisiscommunicatie alsnog door de mand.
Stap 1: RPO/RTO en workload-tiering
Businessimpact Inventariseer per dienst hoe snel data verandert, welke wet- en regelgeving van toepassing is (Archiefwet, Awb, Wft) en wat een uur downtime kost. Gebruik die cijfers om drie tiers te definieren: tier-1 publieke diensten (RTO 0-4 uur, RPO < 1 uur), tier-2 ketens met interne afhankelijkheden (RTO 4-24 uur, RPO 4 uur) en tier-3 ondersteunende systemen (RTO 24-72 uur, RPO 24 uur).
Kosten versus risico Koppel ieder tier aan de benodigde technologie: Site Recovery met continuous replication voor tier-1, frequente back-ups en snelle restore voor tier-2, reguliere back-ups voor tier-3. Documenteer waarom een hogere RTO/RPO acceptabel is en laat bestuurders expliciet akkoord geven op residuele risico's.
SLA's en leveranciers Leg RTO/RPO-afspraken vast in contracten met softwareleveranciers en hostingpartners. Voor SaaS-workloads zonder exportmogelijkheden: verplicht leveranciers tot API-toegang voor back-up of kies third-party backup-as-a-service.
Stap 2: Back-uparchitectuur ontwerpen
Azure Backup vaults Gebruik dedicated vaults per gevoeligheidsniveau en regio. Activeer soft delete, multi-user authorisation en immutable retention zodat kwaadwillenden geen recovery points kunnen verwijderen. Beperk toegang via PIM en log alle bewerkingen naar Log Analytics.
Werkload-specifieke policies
- VM's: dagelijks application-consistent snapshots, wekelijkse full backup, retentie 30-90 dagen plus maandelijkse archiefkopie.
- SQL/PaaS-data: combineer full, differential en logback-ups voor point-in-time herstel.
- Files en M365-data: gebruik Azure Files snapshots of Microsoft 365 Backup (Preview) plus export naar een secundaire kluis.
- Kritieke configuratie (ARM/Bicep, policies, runbooks): check-in naar Git en periodiek export naar een backupkluis.
Geo- en zone-redundancy Selecteer LRS, ZRS of GRS per workload. Staatsgeheime data kan lokaal blijven met LRS plus offline kopie; overige workloads profiteren van GRS (West-Europa -> Noord-Europa). Versleutel altijd met klantbeheerde sleutels in Key Vault en documenteer waar de sleutels worden beheerd.
Stap 3: Failover en failback met Azure Site Recovery
Replicatieontwerp Plaats primaire workloads in West-Europa en configureer replicatie naar Noord-Europa met passende disk- en netwerk-mappings. Gebruik hub-spoke-segmentatie zodat failover-VNET's dezelfde IP-reeksen of een tijdelijk subnet gebruiken zonder conflicten.
Runbooks en automatisering Orkestreer failover via ASR Recovery Plans, gekoppeld aan Automation runbooks of Logic Apps voor DNS-updates, communicatie naar bestuur en het activeren van crisis-Teams-kanalen. Documenteer per stap wie verantwoordelijk is (platformteam, applicatiebeheer, communicatie).
Failback Plan al tijdens ontwerp hoe workloads terugkeren naar de primaire regio: dataconsistentie controleren, replicatie opnieuw activeren en change freeze opheffen. Gebruik staged data sync zodat de terugkeer geen onverwachte downtime veroorzaakt.
Stap 4: Testen, rapporteren en auditen
Testkalender Voer per tier minimaal de volgende tests uit: kwartaalgewijs restore-tests van back-ups, halfjaarlijkse ASR-failoveroefening voor tier-1, jaarlijkse integrale crisisoefening inclusief communicatie. Gebruik productieachtige datasets (geanonimiseerd) om verrassingen te voorkomen.
Bewijs en rapportage Leg testresultaten vast in Purview of SharePoint met versiebeheer. Voeg screenshots, log-exports, duurmetingen en lessons learned toe en koppel bevindingen aan het CAB of risicoregister. Voor NIS2 en BIO is aantoonbaar herstelvermogen belangrijker dan een papieren plan.
Continu verbeteren Koppel incident- en probleemmanagement aan de DR-roadmap. Elke storing levert input op voor nieuwe scripts, extra monitoring of aangepaste RTO/RPO. Maak kosteninzicht onderdeel van governance zodat optimalisaties (cold standby, archiefstorage) hard gemaakt kunnen worden.
Met een doordacht Azure Backup- en Site Recovery-ontwerp bewijzen overheidsorganisaties dat zij ook tijdens brand, regionale storing of ransomware-aanval dienstverlening overeind houden. Heldere RPO/RTO's, immutable opslag, geautomatiseerde failovers en een strak test- en rapportageproces maken het verschil tussen een gecontroleerd incident en een bestuurlijke crisis. Investeer daarom structureel in tooling, runbooks, oefening en documentatie: het is de enige manier om NIS2- en BIO-eisen na te leven en het vertrouwen van burgers te behouden.