Een doorzoekbaar archief is iets heel anders dan een reservekopie.
Het verschil tussen een back-up en archief is niet alleen een technisch verschil, het is ook juridisch gezien onderscheidend. Elke IT’er moet dat verschil eigenlijk kunnen benoemen en aangeven in welke situatie wat nodig is.
Als je een back-updeskundige een rolberoerte wil geven, noem een oude back-up dan ‘een archief’. Het is bijna net zoiets als zeggen dat gegevens op een RAID-array geen back-up nodig hebben. Het goede nieuws is dat het verschil tussen een back-up en archief vrij duidelijk zijn en makkelijk te begrijpen zijn.
Een backup
Een back-up is een reservekopie van gegevens om te herstellen mocht de data beschadigd worden of verloren raken. De originele data wordt niet verwijderd als je een back-up maakt. Denk aan de nachtelijke back-up van bestanden op werkstations, of het kopiëren van foto’s naar iCloud voor het geval je iPhone kapot gaat.
In de IT back-uppen we bestandsservers (ongestructureerde data) en databases (gestructureerde data). Een back-up kan zich richten op pure gegevens, zoals bij de dump van een database, de hele besturingssystseemomgeving van een server als in een bare-metal back-up, of op allebei als in een back-up van bijvoorbeeld VMware’s .vmdk-bestanden.
De definitie van een back-up komt neer op het doel ervan en dat doel is altijd hetzelfde: herstellen van gegevens voor het geval er iets mee gebeurt. Er kan bijvoorbeeld een driedubbele schijffaal zijn in een RAID 6-array, en dan moet alle data worden hersteld. Of iemand kan per ongeluk (of expres) een virtuele machine hebben gewist in je Hyper-V, VMware of EC2-configuratie en die situatie moet worden hersteld.
Of je wordt het slachtoffer van ransomware en moet een schone situatie herstellen met de gekopieerde gegevens. Zonder back-up heb je maar twee keuzes: het losgeld betalen (niet doen) of het verlies nemen. Maar met een back-up heb je de tijd om de bron van de ransomware-aanval te ontdekken, die tegen te houden en vervolgens alle data te herstellen.
Een archief
Een archief daarentegen is een datakopie die voor een heel specifiek doel. Hoewel het geen vereiste is, wordt het origineel vaak verwijderd nadat een archief is aangemaakt. Het idee van een back-up is om de situatie van eerder te herstellen, maar een archief heeft meerdere doelen.
Het meest voorkomende doel is om data te vinden van lang geleden. Dat kan een enkel bestand zijn dat een belangrijk onderdeel bevat, bijvoorbeeld een contract dat een klant jaren geleden heeft getekend. Of het kan een groep gerelateerde gegevens zijn, zoals de blauwdrukken van een gebouw dat is ingestort. Of CAD-tekeningen van een product dat je bedrijf vroeger maakte, uit de mode raakte, maar nu weer in is.
Of denk aan een dataset van e-mails die kan worden gebruikt om iets te bewijzen, zoals een werknemer die dacht te mogen beunhazen en vervolgens werd ontslagen. In een rechtszaak kan het spoor van e-mails worden gebruikt met zoekwoorden als “bijklussen”, “werktijden” of de naam van het bedrijf waarmee hij of zij contractbreuk pleegde. Of iemand probeert te bewijzen dat er pesterijen op de werkvloer zijn geweest en vraagt e-mails van management op met bepaalde sleutelwoorden die we hier maar niet zullen specificeren.
Met een archief kun je deze doelen bereiken. Ook is een archief niet bedoeld voor herstel van data, en hoeft hij dus ook niet bereikbaar te zijn, zoals een back-up dat meestal wel is. Je hebt misschien een archief van elk verkoopcontract, elke factuur en elke offerte. Je bewaart wellicht de huidige contracten en orders op een netwerkverbonden plaats, maar de hele geschiedenis zit in een archief dat een index zou moeten hebben om orders en contracten op te zoeken.
Je hebt misschien ook een archief van elke e-mail die ooit is verzonden of ontvangen in je bedrijf. Sommige archiveringssystemen verwijderen e-mails van de mailserver zodra een archief is aangemaakt, groter zijn dan een bepaalde grootte, en/of n-dagen niet meer zijn geraadpleegd. Dat houdt het systeem slank, bespaart kosten in opslag en serveruitgaves, en maakt back-uppen makkelijker. Zelfs als het wettelijk niet noodzakelijk is om een archief bij te houden, kan het om deze redenen nuttig zijn om een archief bij te houden.
[alert type=”info” title=”Wilt u weten welke managementopleiding bij u past? “] Klik hier en u weet het direct
Herstellen versus ophalen
Zelfs als het doel van een archief is om te besparen op primaire opslagkosten, moet het een ophaalopdracht kunnen uitvoeren. Simpel gezegd is dat een belangrijk verschil: een back-up herstel je (naar de oude situatie) en een archief haal je op (om gegevens te raadplegen).
Als je een back-up herstelt, is het in de regel een enkel bestand, server of hele database. Bij ophalen van een archief haal je meestal een verzameling gerelateerde gegevens op die op één of meerdere servers heeft gestaan en mogelijk niet eens hetzelfde bestandsformaat hebben. Een herstel van een back-up wordt gedaan naar een specifiek punt in de geschiedenis, bijvoorbeeld naar de database zoals deze gisteren was om 8.00 uur. Een ophaalactie gebruikt een tijdsreeks van punt X naar Y, bijvoorbeeld de e-mails van de afgelopen drie jaar.
Herstellen vereist dat je precies weet om welke bestanden of data het gaat, bijvoorbeeld de naam van de server waar het stond, de database of directory waar het in staat, de namen van de bestanden of tabellen die je vereist, en de datum van het laatste moment dat het intact was. Voor ophalen is dat niet nodig: je hoeft alleen maar te weten welke bestanden of records overeenkomen met je gestelde parameters, bijvoorbeeld “geef me alle e-mails uit de laatste drie jaar met sleutelwoord-x en/of zijn geschreven door werknemer-y.
Waarom dit ertoe doet
Veel mensen proberen hun back-upsysteem als een archiefsysteem te bewaren: met back-ups die jaren of zelfs voor eeuwig worden bewaard. Maar de eerste keer dat je een ophaalverzoek krijgt, zie je hoe lastig het is om gegevens te verkrijgen uit iets dat is bedoeld voor herstel. Dat maakt het ophaalproces in plaats van een taak van enkele minuten al snel dagen of zelfs maanden, en de kosten komen veel, veel hoger te liggen.
Als het ophaalverzoek komt vanwege een rechtszaak en je kunt niet tijdig de gewenste data produceren, dan krijg je problemen met juristen en/of de rechtbank. Het kan zes maanden duren om gegevens te vinden die de eisers als een simpele ophaalinstructie beschouwen en dan heb je wellicht nog niet wat ze precies zoeken. Dit is geen louter theoretische zaak: financieel instituut Morgan Stanley verloor miljarden door dit exacte scenario.
Kortom, gebruik back-ups niet als archieven. Als je langetermijnopslag zoekt, investeer dan in een daadwerkelijk archiveringssysteem. Dat betekent een kostenpost aan het begin van dit traject, maar het kan je op termijn veel geld besparen.
Bron: Computerworld.nl
Wilt u de winstgevendheid van uw organisatie verhogen?
Bekijk dan –kosteloos- de online kennissessie. Tijdens de sessie worden er kennis en inzichten gedeeld op het gebied van waardecreatie, winstoptimalisatie, waarderingsmethoden en het kapitaliseren/ monetizen van de gerealiseerde financiële bedrijfswaarde. Vul uw e-mailadres in en ontvang de video.Mogelijk ook interessant
In het verlengde van de inhoud van de artikelen op onze website, biedt Utrecht Business de mogelijkheid op het onderwerp/vakgebied een opleiding te volgen. Hiertoe worden verschillende varianten aangeboden.
Laat een reactie achter