Databaserecovery. Heb jij al getest?
Vrijwel iedere organisatie met bedrijfskritische systemen heeft de back-ups netjes geregeld. Er draait een back-upproces, er is monitoring ingericht en in het beleid staat beschreven hoe vaak data wordt veiliggesteld. Als de back-upjob groen kleurt, voelt dat als geruststelling. Toch stellen we in gesprekken met IT-managers regelmatig een vraag die even stil maakt: wanneer heb je voor het laatst daadwerkelijk getest of je kunt herstellen?
Thomas Spoelstra, teamlead en senior Database Reliability Engineer bij OptimaData, loopt al meer dan 30 jaar mee in de databasewereld. In die tijd heeft hij tientallen omgevingen van binnen gezien, van legacy-systemen tot moderne cloudarchitecturen. In deze blog legt Thomas uit waarom een werkende back-up nog geen werkend herstel betekent en wat je kunt doen om dat verschil te dichten.
Een back-up is een middel. Herstelbaarheid is een uitkomst. Dat verschil lijkt subtiel, maar het is fundamenteel. Een back-up is alleen iets waard is als die ook echt bruikbaar is.
Een organisatie kan dagelijks kopieën maken van haar databases en toch onvoldoende voorbereid zijn op een serieus incident. Herstel gaat niet alleen over het terugzetten van data. Het gaat over tijd, volgorde, afhankelijkheden en verantwoordelijkheden. Hoe snel moet je weer operationeel zijn? Hoeveel dataverlies is acceptabel? Wie voert het herstel uit en wat gebeurt er als die persoon er niet is?
In theorie is het antwoord vaak duidelijk. In de praktijk blijkt het beeld soms minder scherp.
In de afgelopen jaren hebben we meerdere situaties gezien waarin organisaties overtuigd waren dat hun back-up goed geregeld was. Tot een incident anders uitwees. Een foutieve update, een menselijke vergissing, datacorruptie of een beveiligingsincident kan voldoende zijn om te ontdekken hoe kwetsbaar een omgeving werkelijk is.
Dan blijkt dat een restore veel langer duurt dan verwacht. Of dat de laatste back-up wel gemaakt is, maar niet volledig bruikbaar blijkt. Soms is de herstelprocedure afhankelijk van één medewerker die precies weet welke stappen in welke volgorde moeten worden gezet. En regelmatig is de documentatie simpelweg niet meer actueel.
Dat zijn geen uitzonderingen en ook geen verwijten. Het zijn logische gevolgen van het feit dat herstel zelden actief wordt geoefend. Zolang alles draait, is er weinig urgentie om het terugzetten van een complete productieomgeving te simuleren. Toch zit daar precies het risico.
Voor bestuurders en CFO’s is herstelbaarheid geen technisch onderwerp, maar een continuïteitsvraagstuk. Wat betekent het voor de organisatie als orderverwerking een halve dag stilligt? Wat gebeurt er als klantportalen niet bereikbaar zijn? Hoe wordt reputatieschade ingeschat als data tijdelijk niet beschikbaar is?
In veel organisaties leeft de aanname dat back-ups automatisch gelijkstaan aan controle. Maar controle ontstaat pas wanneer herstel aantoonbaar werkt binnen vooraf vastgestelde grenzen. Wanneer duidelijk is hoe lang herstel maximaal mag duren en wanneer dat in de praktijk ook haalbaar blijkt. Dat vraagt om meer dan een tool of een contract. Dat vraagt om structuur.
Herstelbaarheid organiseren betekent dat je regulier test of een database daadwerkelijk kan worden teruggezet in een representatieve omgeving. Dat hersteltijden inzichtelijk zijn en dat duidelijk is welke systemen in welke volgorde moeten worden hersteld. Het betekent ook dat kennis niet in één hoofd zit, maar overdraagbaar en gedocumenteerd is.
Dit zijn geen dagelijkse werkzaamheden en ook geen voltijdsbaan. Maar ze vragen wel structurele aandacht. Niet alleen op het moment dat er iets misgaat, maar juist wanneer alles ogenschijnlijk rustig is. Het verschil tussen een organisatie die “back-ups heeft” en een organisatie die echt herstelbaar is, zit vaak in die structurele benadering.
Bij OptimaData kijken we niet alleen naar de vraag of een back-up draait, maar of een databaseomgeving binnen acceptabele kaders kan herstellen. We toetsen of hersteltijden realistisch zijn, of afhankelijkheden inzichtelijk zijn en of kennis geborgd is. Niet vanuit wantrouwen, maar vanuit verantwoordelijkheid. Continuïteit mag geen aanname zijn. Het moet aantoonbaar zijn.
Elke organisatie met bedrijfskritische data heeft back-ups. Dat is inmiddels de norm. De vraag is of die back-ups ook daadwerkelijk zekerheid bieden.
Misschien is de belangrijkste vraag die je jezelf kunt stellen niet of er een back-up wordt gemaakt, maar wanneer voor het laatst is bewezen dat herstel echt werkt. Dat verschil bepaalt of je back-up een geruststelling is, of slechts een gevoel van veiligheid.
Wil je weten of jouw organisatie echt herstelbaar is? Neem contact op, dan kijken we er samen naar.