Wat is High Availability?


High Availability (HA) verwijst naar het vermogen van een IT-systeem, -toepassing of -onderdeel om zonder significante onderbreking continu te werken, waardoor het toegankelijk blijft voor gebruikers, zelfs wanneer afzonderlijke onderdelen onvermijdelijk uitvallen.

Wat kunt u doen met een afgeschermde server?

Definitie van High Availability

Het fundamentele principe achter het bereiken van High Availability (HA) is het systematisch identificeren en elimineren van single points of failure binnen de infrastructuur, waaronder hardware, software, netwerken, opslag en stroombronnen.

Door systemen met ingebouwde mechanismen voor redundantie en resilience te ontwerpen, wil HA voorkomen dat lokale storingen uitmonden in merkbare downtime. Dit garandeert hoge operationele prestaties en een constante beschikbaarheid van services, wanneer deze nodig zijn.

De effectiviteit van een high availability-strategie wordt meestal gekwantificeerd aan de hand van het percentage uptime dat over een specifieke periode wordt bereikt. Dit wordt vaak uitgedrukt met de notatie "nines" (zoals 99,9% of "three nines", 99,99% of "four nines," etc.), wat aangeeft dat de operationele tijd bijna 100% is.

Belangrijkste kenmerken van High Availability

Hoge beschikbaarheid is geen product of inspanning, maar eerder een resultaat dat wordt behaald door de implementatie van verschillende technische basiskenmerken en ontwerpprincipes die samenwerken om de veerkracht en continuïteit van het systeem te garanderen. De meest kritieke functies die aan een HA-omgeving ten grondslag liggen, zijn:

  • Redundantie: Dit is de hoeksteen van High Availability (HA). Het omvat het dupliceren van kritieke onderdelen binnen de IT-infrastructuur - zoals servers, opslagapparaten, netwerkpaden en voedingen. Als een component uitvalt, is een redundante tegenhanger klaar om zijn functie over te nemen, waardoor een single point of failure wordt vermeden.
     
  • Automatic failover : Wanneer een storing wordt gedetecteerd in een primair onderdeel, moet een HA-systeem automatisch en naadloos overschakelen naar het redundante (stand-by) onderdeel.
     
  • Betrouwbare foutdetectie : Om een automatische failover te activeren moet het systeem eerst op betrouwbare wijze vaststellen of er een fout is opgetreden. Dit wordt typisch bereikt door continue monitoring, vaak met behulp van "heartbeat"-mechanismen waarbij componenten regelmatig elkaars status controleren.
     
  • Replicatie en synchronisatie van gegevens : Voor applicaties en systemen die gegevens beheren, zoals databases, is het simpelweg overschakelen naar een stand-byserver niet genoeg; de gegevens moeten ook beschikbaar en consistent zijn op het stand-bysysteem.

Dankzij deze essentiële voorzieningen zijn systemen collectief bestand tegen storingen in onderdelen, kan onderhoud probleemloos worden uitgevoerd en worden de continue operationele prestaties geleverd die van een service met hoge beschikbaarheid worden verwacht.

Voordelen van High Availability

De implementatie van hoge beschikbaarheid biedt aanzienlijke voordelen die veel verder gaan dan technische robuustheid en die een directe impact hebben op bedrijfsactiviteiten, klanttevredenheid en financiële prestaties.

Het meest onmiddellijke en belangrijke voordeel is de drastische vermindering van de systeemdowntime. Door onderbrekingen door zowel onverwachte componentstoringen als noodzakelijke geplande onderhoudsvensters tot een minimum te beperken, zorgt HA ervoor dat kritieke toepassingen en services consistent operationeel en toegankelijk blijven.

Bovendien heeft een verminderde downtime aanzienlijke positieve financiële en operationele gevolgen. Het beschermt direct tegen inkomstenverlies dat vaak optreedt tijdens storingen, zoals verloren e-commerce verkopen of mislukte transacties, en voorkomt dure dalingen in de productiviteit van werknemers wanneer essentiële systemen niet beschikbaar zijn.

Een consistente systeembeschikbaarheid beschermt de moeizaam verdiende reputatie van een organisatie en voorkomt negatieve publiciteit, frustratie bij klanten en potentiële merkschade die vaak samenhangt met een storing in de service.

Onderdelen met hoge beschikbaarheid

Om een hoge beschikbaarheid te realiseren, moet een robuuste infrastructuur worden samengesteld met een combinatie van gespecialiseerde hardware- en softwarecomponenten die ontworpen zijn om 'single points of failure' te elimineren en automatisch herstel te vergemakkelijken.

Hoewel de specifieke configuratie varieert op basis van de behoeften van de toepassing en het budget, vormen verschillende belangrijke typen onderdelen doorgaans de bouwstenen van een HA-architectuur:

  • Redundant servers : Meerdere fysieke of virtuele servers gebruiken, vaak gegroepeerd in clusters. In veel voorkomende configuraties, zoals active-passive of active-active, is er, als een server uitvalt of onderhoud vereist, een andere server gereed om onmiddellijk de werklast over te nemen, wat continue verwerking van toepassingen garandeert.
     
  • Load balancers Deze hardwareapparaten of softwaremodules verdelen inkomend netwerkverkeer en toepassingsaanvragen over de groep servers in een cluster. Dit voorkomt dat een enkele server overbelast raakt, verbetert de responsiviteit en maakt het, essentieel, mogelijk om verkeer automatisch om te leiden van servers die zijn uitgevallen of offline zijn gehaald.
     
  • Redundant storage : Gebruikmakend van opslagsystemen die ontworpen zijn voor resilience. Dit omvat vaak interne redundantiefuncties zoals RAID (Redundant Array of Independent Disks) in een opslageenheid en omvat vaak de replicatie van gegevens tussen afzonderlijke fysieke opslagsystemen (met SAN/NAS-replicatiefuncties of hostgebaseerde replicatiesoftware) om ervoor te zorgen dat gegevens toegankelijk blijven, zelfs als de primaire opslag uitvalt.
     
  • Redundant network infrastructure : Duplicatie in de netwerkpaden implementeren. Hierbij worden meerdere netwerkinterfacekaarten (NIC's) gebruikt in servers, redundante netwerkswitches en routers en worden meerdere fysieke verbindingen tussen apparaten geconfigureerd om ervoor te zorgen dat kritieke systemen niet worden geïsoleerd door één kabelonderbreking of apparaatstoring.
     
  • Betrouwbare voedingen : De continue stroomtoevoer via ononderbreekbare voedingen (UPS) garandeert onmiddellijke back-ups bij korte stroomfluctuaties of -uitval, zodat de werking niet wordt onderbroken. Voor langere tijd worden vaak backup generatoren ingezet. Het beveiligen van de stroombron is essentieel om de operationele status van alle andere HA-componenten te behouden.

De exacte combinatie en configuratie van deze componenten is sterk afhankelijk van de specifieke beschikbaarheidsvereisten, beoogde hersteltijd (BHT), beoogde herstelpunten (BHP) en het budget voor het systeem dat wordt beveiligd.

Hoe werkt hoge beschikbaarheid

Hoge beschikbaarheid is meer dan alleen het hebben van back-uphardware; het is een geautomatiseerd, dynamisch proces dat is ontworpen om servicecontinuïteit te behouden in het geval van storingen. Het is gebaseerd op het constante samenspel tussen redundante componenten, continue monitoring en intelligente softwareorkestratie binnen een raamwerk dat vaak een cluster wordt genoemd.

In een typische configuratie voor hoge beschikbaarheid waarbij we bedenken wat cloud computing met hoge beschikbaarheid is, worden meerdere servers (nodes) geconfigureerd om samen te werken, samen met potentieel redundante opslag- en netwerkpaden.

Bij normale werking worden kritieke toepassingen uitgevoerd op een primaire node (of op meerdere actieve nodes) terwijl de gegevens continu worden gerepliceerd naar een of meer stand-bynodes.

De sleutel tot HA ligt in constante waakzaamheid: de nodes in het cluster houden voortdurend elkaars gezondheidstoestand in de gaten, vaak met behulp van "heartbeat"-signalen - regelmatige netwerkberichten die bevestigen dat ze in leven zijn en correct functioneren. Applicatiespecifieke health checks kunnen ook worden uitgevoerd om te garanderen dat de services zelf responsief zijn.

Wanneer een node het verzenden van heartbeats stopt of een kritieke health check na een gedefinieerde drempelwaarde mislukt, detecteert de clustersoftware deze fout. Deze detectie activeert automatisch het failover proces.

Het gehele proces, van detectie tot service-hervatting op het failover-knooppunt, is ontworpen om automatisch en snel te gebeuren, vaak binnen seconden of minuten, afhankelijk van de configuratie en toepassing.

Hoge beschikbaarheid versus noodherstel

Hoewel zowel High Availability en Disaster Recovery (DR) essentiële componenten zijn van een robuuste strategie voor bedrijfscontinuïteit, hebben ze, als we denken aan wat public cloud is, verschillende doelen en pakken ze verschillende soorten foutscenario's aan.

Het begrijpen van hun verschillen is van cruciaal belang voor uitgebreide bescherming. HA richt zich vooral op het voorkomen van serviceonderbrekingen die het gevolg zijn van lokale storingen - zoals een crash van één server, een storing van een opslagcomponent, een non-respons van een toepassing binnen een datacenter of nauw verbonden beschikbaarheidszones van de cloud.

Dit wordt gerealiseerd door middel van automatische failover naar redundante onderdelen die binnen dezelfde algemene infrastructuur werken, met als doel minimale tot nul downtime (zeer lage BHT) en minimaal tot geen gegevensverlies (zeer lage BHP). 

Disaster Recovery bereidt zich daarentegen voor op grootschalige, catastrofale gebeurtenissen die een heel primair datacenter of een hele primaire faciliteit onbruikbaar kunnen maken - denk aan grote branden, overstromingen, aardbevingen of wijdverbreide stroomuitval die een heel gebied kunnen beïnvloeden.

Hoge beschikbaarheid in IT-infrastructuur

Het bereiken van uitgebreide hoge beschikbaarheid wanneer u bedenkt wat een virtuele server inhoudt, vereist meer dan alleen maar aandacht voor een enkele toepassing of server; het vereist een gelaagde aanpak, die veerkracht insluit in de hele IT-infrastructuurstack.

Als u een laag verwaarloost, kan er een single point of failure ontstaan die de hele actie ondermijnt. HA-principes worden toegepast in verschillende technologische domeinen, wat cruciaal is als je bedenkt wat een cloud-VPC inhoudt als we een echt robuust systeem proberen te bouwen.

Op het fundamentele fysieke en netwerkniveau houdt HA het implementeren van redundantie in kerninfrastructuren in. Dit omvat het gebruik van redundante voedingen (ondersteund door UPS en potentiële generatoren), meerdere netwerkinterfacekaarten (NIC's) in servers, redundante netwerkswitches en routers die vaak in failoverparen zijn geconfigureerd (met protocollen als HSRP of VRRP) en diverse fysieke netwerkpaden om verbindingsverlies te voorkomen.

Firewalls worden ook vaak ingezet in HA-paren om ervoor te zorgen dat beveiligingsmaatregelen actief blijven tijdens een storing.

Het verhogen van de stack, de beschikbaarheid van de server is essentieel. Dit wordt vaak bereikt door middel van serverclustering, ofwel met fysieke machines of, meer gebruikelijk vandaag de dag, door functies van het virtualisatieplatform te gebruiken (zoals VMware vSphere HA of Hyper-V Failover Clustering).

Hoge beschikbaarheid behouden

Het implementeren van een oplossing met hoge beschikbaarheid is een begin, maar het waarborgen van de doorlopende effectiviteit ervan vereist voortdurende aandacht, proactief beheer en regelmatige validatie.

High availability is geen "set it and vergeet it"-technologie; het vereist voortdurende toewijding lang na de initiële installatie om te garanderen dat het naar behoren werkt als er onvermijdelijk een storing optreedt. Het handhaven van hoge beschikbaarheid omvat verschillende belangrijke activiteiten:

  • Regelmatig testen Dit is aantoonbaar het meest kritieke aspect van HA-onderhoud. Het periodiek uitvoeren van gecontroleerde failover- en failbacktests (drills) is essentieel om te controleren of de geautomatiseerde mechanismen correct werken, of de herstelprocedures nauwkeurig zijn en door het personeel worden begrepen, en of het systeem zich herstelt binnen de beoogde hersteltijd (BHT).
     
  • Continue monitoring en alerts : Waakzame, 24 uur per dag, bewaking van alle componenten in het HA-ecosysteem - inclusief serverstatus, netwerkconnectiviteit, opslagstatus, latentie en integriteit van gegevensreplicatie en responsiviteit van toepassingen - is van fundamenteel belang. Robuuste waarschuwingssystemen moeten zo worden geconfigureerd dat het juiste IT-personeel onmiddellijk wordt ingelicht.
     
  • Disciplined patch management and updates : Het is essentieel om besturingssystemen, toepassingen en HA-software up-to-date te houden met beveiligingspatches en functionele updates. Patching dient echter zorgvuldig te worden uitgevoerd in een HA-omgeving om te voorkomen dat er per ongeluk downtime wordt veroorzaakt.
     
  • Configuration management en consistentie : Het is essentieel om ervoor te zorgen dat de configuratie-instellingen - inclusief het besturingssysteem, de toepassingen, het beveiligingsbeleid en de parameters van de HA-software - identiek blijven en gesynchroniseerd zijn tussen alle redundante nodes.

Een consistente uitvoering van deze onderhoudsactiviteiten transformeert high availability van een theoretische capaciteit naar een betrouwbare operationele realiteit. Deze doorlopende inspanning garandeert dat de initiële investering bescherming blijft bieden voor kritieke bedrijfsservices, een noodzaak voor organisaties overal ter wereld.

OVHcloud en High Availability Solutions

OVHcloud biedt een flexibele Public Cloud, een veilige Private Cloud op dedicated hardware en high-performance Bare Metal-servers. Kies voor schaalbare on-demand resources, verbeterde controle en isolatie of directe fysieke hardwaretoegang voor maximale prestaties en consistente hoge beschikbaarheid:

Public Cloud Icon

Public Cloud

Ervaar de ultieme flexibiliteit en schaalbaarheid met OVHcloud Public Cloud. Bouw, implementeer en beheer uw applicaties met on-demand resources, waaronder rekeninstances, opslag en netwerken, allemaal powered by open standaarden zoals OpenStack.

Hosted Private cloud Icon

Private Cloud

Krijg betere controle, beveiliging en prestaties met de Hosted Private Cloud van OVHcloud. Deze service maakt gebruik van toonaangevende VMware-technologie en biedt dedicated hardwareresources, voorspelbare prestaties en robuuste isolatie voor uw bedrijfskritieke toepassingen. Als we bedenken wat een private cloud is, kunnen we zeggen dat ze ideaal is voor bedrijven die een hoge mate van beveiliging, gegevenssoevereiniteit en op maat gemaakte infrastructuurconfiguraties nodig hebben.

Bare MetaL Icon

Bare Metal-servers

Ontsluit maximale prestaties en totale controle met OVHcloud Bare Metal Servers. Krijg direct toegang tot dedicated fysieke hardware zonder virtualisatielaag, wat optimale verwerkingskracht en I/O-prestaties garandeert voor uw meest veeleisende workloads.