storage / Opinie
Hoge beschikbaarheid: zaak van balans
Nu bedrijven in toenemende mate afhankelijk zijn geworden van informatietechnologie, is hoge beschikbaarheid van groot belang. Maar wat is dat eigenlijk, en hoe is het te bereiken? Volgens Aad Dekkers moeten alle schakels in de keten even sterk zijn: hardware, software, opslag, services en beheer.
Hoge beschikbaarheid is voor sommigen een voorwaarde 'sine qua non' voor anderen 'nice to have'. Maar wat is 'high availability' eigenlijk? Er blijkt nogal wat spraakverwarring te zijn. En moet hoge beschikbaarheid koste wat het kost worden nagestreefd? Het antwoord ligt genuanceerd. Er zijn diverse voorzieningen die de beschikbaarheid van een gekozen automatiseringsoplossing tegen acceptabele kosten kunnen verhogen. Wat acceptabel is, zal overigens van geval tot geval verschillen. Voor de verkeersleiding van een luchthaven of de effectentransactiesystemen van een wereldwijd opererende bank of effectenhuis gelden andere criteria dan voor een advocatenkantoor in Middelburg.De groeiende vraag naar hoge beschikbaarheid is het resultaat van een aantal trends. Allereerst neemt de hoeveelheid data en elektronisch beschikbare informatie met hoge snelheid toe. Hiermee hangt samen dat automatisering steeds meer een centrale plaats inneemt binnen ondernemingen. Bedrijfskritisch is daarom een toepasselijke term in dit verband: het goed functioneren van het IT-systeem is een kritische factor voor het succesvol functioneren van het bedrijf. Dit geldt voor kleine bedrijven net zo hard als voor de grote multinationals, hoewel de gevolgen in absolute zin in het laatste geval natuurlijk veel groter zijn. De afhankelijkheid van IT zal in de toekomst alleen maar toenemen daar het aantal aan het netwerk verbonden apparaten sterk zal blijven toenemen. 'Personal digital assistants' (pda's), mobiele telefoons, notebooks en andere nog niet eerder in een netwerk ondergebrachte intelligente apparaten vereisen in de toekomst continue 'datatone' of 'webtone'. Dit zal dan net zo vanzelfsprekend zijn als de kiestoon ('dialtone') die je nu hoort bij het opnemen van de telefoon. Al die systemen moeten vrijwel volcontinu kunnen opereren.
Wat is beschikbaarheid?
Beschikbaarheid kan gedefinieerd worden als de tijd dat specifieke systemen, applicaties of data toegankelijk en bruikbaar zijn. Hogere beschikbaarheid begint al bij het systeemontwerp en strekt zich uit tot de overall software-applicatiestructuur. Vaak wordt beschikbaarheid gedefinieerd in termen van het percentage van de totale 'uptime' over de periode van een jaar. Zo betekent een beschikbaarheid van 99,99 procent ('fault resilient clusters') ongeveer 53 minuten 'downtime' per jaar volgens Gartner en de Transaction Processing Council. Een hoge beschikbaarheid wordt door hen gedefinieerd als een beschikbaarheid van 99,9 procent, resulterend in 8,8 uur 'downtime' per jaar.Verschillende bronnen hanteren overigens verschillende grenzen, hetgeen al aangeeft dat hoge beschikbaarheid in wezen een relatief begrip is, en gerelateerd wordt aan het belang van een zo hoog mogelijke beschikbaarheid voor een onderneming.
Voor een groot deel is beschikbaarheid een resultante van betrouwbaarheid en beheersbaarheid. Hoe meer er ingebouwd wordt om het aantal fouten te reduceren, des te hoger de beschikbaarheid zal zijn. Ook het reduceren van de hersteltijd na een probleem houdt hiermee nauw verband. Vaak heeft men het over de 'ras'-aspecten van beschikbaarheid: betrouwbaarheid ('reliability'), beschikbaarheid (availability), service-gerichtheid (serviceability).
Betrouwbaarheid
Voorzieningen die de beschikbaarheid verhogen zijn onder te verdelen in drie groepen : Standaard/optioneel in de hardware; besturingssysteem en clustering.In principe kan elke verbetering die resulteert in een vergroting van de betrouwbaarheid en de beschikbaarheid al als bijdrage aan hoge beschikbaarheid worden gezien. Zelfs 'bugfixes'. Betrouwbare systemen (hardware plus software) moeten mijns inziens minimaal over de volgende voorzieningen beschikken:
Het systeem:
- 'Dynamic reconfiguration & alternate pathing' (dr/ap)
Online zijn belangrijke onderdelen van het systeem te wisselen, zoals I/O borden, geheugen en cpu-borden, vooropgesteld dat ook de componenten hierop afgestemd zijn ('hot swappable'). - 'Dynamic system domains'. Dit biedt de gelegenheid om meerdere virtuele systemen op te zetten binnen één systeem. De domeinen kunnen verschillende groottes aannemen en al dan niet onderling geclusterd worden, of geclusterd worden met een ander systeem
- Redundante voeding.
- Verschillende raid-niveaus. Verschillende niveaus van redundantie in opslag, van eenvoudige 'mirror/duples' tot volledige raid.
- Ook hier 'hot swappable' onderdelen en redundante voeding.
- 'Remote dual copy' (opslag over langere afstanden).
- 'Fibre channel arbitrated loop', zeer snelle opslagkoppelingen, dubbel uitgevoerd.
- UPS (accu) en generator, voor ononderbroken stroomvoorziening
- Klimaatbeheersing (temperatuur, vocht, statische elektriciteit).
- Systeembeheertools die proactief fouten opsporen en isoleren;
- 'Naar huis telefoneren' ('Phone home'). Systeem informeert beheerder actief over een probleem, en staat toe om op afstand oplossingen te bieden.
Besturingssysteem
Het besturingssysteem speelt bij de hele discussie over hoge beschikbaarheid een sleutelrol. Voor echt bedrijfskritische omgevingen zal iedereen gebruik willen maken van bewezen technologie. De problemen die Windows NT momenteel ondervindt om geloofwaardig gevonden te worden als oplossing voor bedrijfskritische omgevingen, heeft Unix zo'n tien jaar geleden ook doorgemaakt. Unix was toen allesbehalve veilig. De openheid maakte het kwetsbaar en lastig te beheren. Hierdoor konden ook in een intrinsiek zeer stabiele omgeving toch fouten optreden. Inmiddels is Solaris uitgegroeid tot een zeer betrouwbaar en schaalbaar alternatief voor mainframe-omgevingen. Hierbij dient opgemerkt te worden dat Solaris clustering niet hoeft te gebruiken om schaalbaarheid te bereiken, hetgeen bij Windows NT wel het geval is. Bij Solaris doet clustering waar het voor bedoeld is: het verhoogt de beschikbaarheid.Organisatorische aspecten
De meest geavanceerde voorzieningen met betrekking tot hoge beschikbaarheid blijken nutteloos wanneer de procedures fouten vertonen. Wie mag er muteren en waar? Wat zijn autorisaties, en zijn er controlemechanismen? Wat is er geregeld voor back-up, 'fall back'-scenario's en zelfs uitwijkcentra? De laatste zijn nauwelijks standaardkenmerken van hoge beschikbaarheid te noemen, maar ook problemen die niet hun oorsprong hebben in de IT-omgeving kunnen voorkomen, denk bijvoorbeeld aan brand of overstroming.De menselijke factor speelt ook een rol bij de hele implementatie en het goed laten werken van de systemen. Professionale diensten (voor ontwerp met implementatie), educatieve diensten (voor training) en een goede service- en support-organisatie voor het onderhoud, zijn van levensbelang voor elke hoge beschikbaarheid. Hiermee hangt ook het begrip 'serviceability' samen: de tijd die het kost om een fout te isoleren en te herstellen. Hierbij moet iedereen weer overwegen of de kosten van een 7 x 24 uur servicecontract opwegen tegen die van een 5 x 8 uur contract in combinatie met een zelfherstellend systeem. Zaken als 'dynamic reconfiguration' en 'alternate pathing' zijn op dit gebied zeer belangrijk.
Aantal partijen
Voor een goede hoge beschikbaarheid komt het erop aan dat alle schakels in de keten even sterk zijn: hardware, software, opslag, services en beheer. De keten is zo sterk als de zwakste schakel. Alle prachtige voorzieningen zijn zinloos wanneer het geheel is opgehangen aan een niet beveiligd stopcontact, of wanneer de toegang tot het systeem vrij beschikbaar is. Om de keten te optimaliseren is het zeker handig, hoewel niet essentieel, om een aantal elementen bij dezelfde leverancier te betrekken. Zo is te verzekeren dat er niet op onderdelen een onredelijk kostbare over- of onderdimensionering plaatsvindt.Voor elke organisatie verdient het aanbeveling om net als bij elke verzekering een goede inventarisatie te maken van de mogelijke risico's van tijdelijke uitval van het systeem en de kans daarop. Vervolgens is een inschatting te maken van de financiële consequenties - op korte zowel als lange termijn (schade voor imago, klantentrouw, enzovoort). Daaruit volgt dan een maximaal bedrag dat besteed mag worden om een omgeving voor hoge beschikbaarheid neer te zetten, waarbij het essentieel is om alle elementen op hetzelfde niveau van beschikbaarheid te brengen. Zorgwekkend is in dit licht toch dat het enthousiasme voor de aanpak van het 'jaar 2000'-probleem niet synchroon lijkt te lopen met de belangstelling voor hoge beschikbaarheid, hoewel de consequenties van de eerste wellicht veel ingrijpender zijn.
Aad Dekkers, product marketing manager computer systems
Sun Microsystems Nederland
- 16:55 Reorganisatie bij EMC kost 2400 banen
- 11:29 CA koopt leverancier van data loss prevention
- 14:03 ASMI sluit pact voor kleinere chips
- 10:45 Samsung overweegt halvering chipproductie
- 13:15 Stille RAIDs van LaCie en Noctua
- 14:08 Compellent geeft Windows gratis storage-tools
- 10:16 Toshiba haalt halve terabyte met SSD
- 13:44 CSC bouwt centrale databank wegverkeer
- 14:23 Toshiba schrapt eenderde geheugenproductie
- 12:09 Reduceren kosten van ons enorme data-stuwmeer
Dataverlies voorkomen met storage-oplossingen
Alle sectoren zien hun data tegenwoordig snel toenemen. Elk bedrijf heeft dan ook baat bij een meer dynamische, flexibele en niet te vergeten veilige storage-oplossing. Deze whitepaper legt uit hoe een Storage Area Network (SAN)op een betrouwbare manier de datacapaciteit kan vergroten.... Download nu
Case Study DTZ Zadelhoff: de stap naar betrouwbare replicatie- en backup
Met 13 vestigingen over het hele land had DTZ Zadelhoff de behoefte aan een goede replicatie- en back-up-oplossing. Lees in deze Case Study hoe dit traject verliep, welke maatregelen zijn genomen en wat de uiteindelijke resultaten zijn.... Download nu
Meer Storage whitepapersComputable Events - Storage
Computable organiseert verschillende events met praktijkgerichte informatie over actuele onderwerpen in de ICT:
Doetinchem en Oude IJsselstreek samen in opslag
30-07 14:54 De gemeente Doetinchem telt bijna 57.000 inwoners en vervult een centrumfunctie op maatschappelijk, cultureel en economisch terrein in de Achterhoek. Gemeente Oude IJsselstreek...
Meer storage praktijkDell probeert het opnieuw met diensten
10-12 09:05 Dell zoekt zijn heil in de "oplossingen": de combinatie van computers, opslag en diensten. Ondanks dat het bedrijf tot voor kort niets van het dealerkanaal moest hebben, is er in...
Meer storage achtergrondReduceren kosten van ons enorme data-stuwmeer
17-12 12:09 Een recessie stopt de datagroei nauwelijks, dat is een ervaring die we in de jaren 2001 - 2003 hebben kunnen zien. Zoals IDC verschillende malen heeft onderzocht, blijft de door...
Meer storage opinieStille RAIDs van LaCie en Noctua
30-12 13:15 De Franse storagefabrikant LaCie en koelingproducent Noctua bouwen samen stille schijfstations. De LaCie 4big Quadra en LaCie 5big Network bevatten Noctua-koeltechnologie. Door de...
Meer storage productenBekijk de leveranciers op het gebied van Storage.

