Chaos Monkey

//Chaos Monkey

Chaos Monkey

Netflix hanteert het begrip Chaos Monkey om aan te tonen hoe “resilient” haar diensten zijn. Netflix is aanbieder van films volgens het streaming principe. De klant hoeft niet meer fysiek een DVD of Blue Ray van de film te kopen. De film wordt middels een abonnement naar je toegestuurd, “gestreamed”.

Resilient betekent veerkrachtig. In het vakgebied van de performance dienen applicatie ketens bekeken te worden op hun veerkracht. De veerkracht wordt vanuit het eindgebruikersperspectief bekeken. Hoe ervaart de klant de dienstverlening ondanks dat er drie van de vier applicatie servers onbeschikbaar zijn? Heeft de klant nog steeds een antwoord binnen de door hem verwachte tijd? Rules of thumb is de 2 seconden regel, de tijd waarin er een antwoord op het beeldscherm van de klant moet staan.

Chaos Monkey is een georchestreerde manier van het onbeschikbaar maken van componenten in de applicatie keten. Netflix heeft daar diverse tooltjes voor geschreven. Het doel is om te valideren hoe goed de grip en controle is van de beheerspartij. Merken de monitoring tools de onbeschikbaarheid op, weten ze vervolgens adequaat te handelen en de oorzaak van de onbeschikbaarheid snel te vinden? Wordt de dienstverlening nog steeds als snel ervaren?

Chaos Monkey wordt gewoon op productie omgevingen uitgevoerd, iets waar de meeste klanten niet aan moeten denken. Men kiest eerder om middels resilience performance testen op een gecontroleerde en veilige manier te ervaren wat er gebeurt als men specifieke componenten uit de keten onbeschikbaar maakt, zonder dat de eindklant er last van heeft. Maar…..veelal is de acceptatie omgeving waarop de resilience performance testen worden uitgevoerd, niet productie-like. Niet dezelfde hardware, niet dezelfde sizing, monitoring is veelal niet ingericht op de acceptatie omgeving. Dus wat zeggen resilience testen dan op een acceptatie omgeving, of ├╝berhaupt, wat zeggen de performance testen op een niet-productie alike acceptatie omgeving?

Eerlijk gezegd vind ik dat het van lef getuigt om Chaos Monkey op een productie omgeving uit te voeren. Maar is dit geen voer voor Allestoringen.nl, de site waarin genadeloos wordt gemeten hoeveel keer een publieke website van grote organisaties onbeschikbaar is geweest gedurende de afgelopen tijd?

360Performance biedt Chaos Monkey aan als dienst om haar klanten te helpen in het het verkrijgen en behouden van de juiste grip en controle. 360Performance komt graag uitleggen hoe ze dit aanpakken.

By | 2015-05-07T23:11:22+00:00 april 8th, 2015|Technologie|2 Comments

2 Comments

  1. Danny vd Boon 16 april 2015 at 13:38 - Reply

    Voor een optimale dienstverlening is een (bijna) 100% beschikbaarheid een must. Het getuigt van een grote volwassenheid en vertrouwen als een bedrijf Chaos Monkey testen op produktie uitvoert.
    Je gehele software onwikkeling met alle bijkomende aktiviteiten als oa. versiebeheer, testen en deployment zal van hoog niveau moeten zijn om een dusdanige mate van vertrouwen te hebben om deze testen uit te voeren. Daarbij gaat het mijns inziens ook om een gedegen infrasctructuur die de applicatielaag perfect moet kunnen ondersteunen.

    Nogmaals petje af voor de bedrijven die Chaos Monkey testen uitvoeren.
    Goed te weten dat ook op dit vlak 360Performance ondersteuning kan bieden!

  2. Stephen Tittel 16 april 2015 at 17:16 - Reply

    Ha Danny,

    Bedankt voor je reactie. Helder wat je zegt en ik sluit me volledig aan bij je antwoord.

    Zowel monitoring als diagnostiek helpen bij het Chaos Monkey testen om, indien er performance instabiliteit ontstaat, snel en adequaat te reageren en exact te weten wat de oorzaak is. De monitoring en diagnostiek dient wel te voldoen aan bepaalde eisen. Relaties tussen de betrokken componenten en het gevolg van de status van deze componenten op elkaar moeten snel tot de beschikking staan en betrouwbaar zijn. Ook het snel diagnosticeren door de gehele keten heen, met correlatie mogelijkheden te midden van de context is belangrijk om Chaos Monkey optimaal te bedienen.

Leave A Comment