Ruxit is een rijzende ster in het APM-tooling landschap. Ruxit is een next generation APM tool, met smart analytics functionaliteit, auto discovery van de infrastructuur, een alles-in-1 oplossing, en geen alerts! Geen alerts. Leuke sales praat, maar welke baten levert Ruxit een klant eigenlijk op?

Dit artikel geeft een korte introductie van Ruxit. In latere artikelen zal er worden ingezoomed op bijzondere functionaliteiten met de bijbehorende baten die Ruxit biedt.

Oorsprong van Ruxit

Ruxit is gemaakt door voormalige werknemers van het bedrijf dynaTrace (voormalig Compuware), een gevestigd bedrijf op het vlak van Application Performance Management (APM). dynaTrace biedt tooling aan waarmee eindgebruikers end-2-end, door de gehele keten, real-time en minitieus gevolgd kunnen worden. Op deze manier is het mogelijk om inzichtelijk te maken hoe iedere eindgebruiker de performance ervaart en hoeveel tijd en resources elke schakel in de applicatie keten consumeert. Het is een tool met zware diagnostische functionaliteit waar de analyse gedaan wordt door ervaren consultants die op dynaTrace getrained zijn. dynaTrace toont zijn toegevoegde waarde door het over de gehele OTAP-straat in te zetten om grip en controle te behouden over alles wat performance aangaat gedurende de applicatie life cycle. dynaTrace is in te zetten op zowel klantlocatie als in de cloud van de klantorganisatie.

Tada! Ruxit

Het doel van Ruxit is om een tool aan te bieden waarmee het de gebruiker een snelle en simpele manier geeft om achter de root cause van performance problemen te komen op een productie omgeving en te adviseren in oplossingen. Geen ingewikkelde correlatie en zware analyse vaardigheden zijn nodig om snel tot de toegevoegde waarde te komen. Ruxit is anders dan andere APM-tooling.

Lightweight cloud productie monitoring

Ruxit is de lightweight variant van dynaTrace en concurreert met New Relic, de vendor van cloud based monitoring. Kort gezegd: de infrastructuur in de cloud van de klant wordt gemonitored en de verzamelde monitoring gegevens worden op een beveiligde manier opgeslagen bij Ruxit in de cloud. dynaTrace kan de cloud ook monitoren en diagnosticeren, maar Ruxit is vanaf het begin af aan ontwikkeld met de gedachte om de productie omgeving in de cloud te monitoren en te diagnosticeren.

Andere monitoring benadering

Ruxit is anders. De tool is grotendeels van de grond af aan opgebouwd. Hierdoor heeft men ook de tijd gehad om na te denken wat men nu anders moet doen op het gebied van monitoring. Want eerlijk gezegd, vind ik dat er weinig innovatie heeft plaatsgevonden in de traditionele manier van monitoring en de bijbehorende functionaliteit. Men heeft een dashboard, men kan thresholds instellen en er alarmen op definiëren. Het is ook niet meer bijzonder dat er van de infrastructuur een real-time visualisatie wordt gemaakt.

Dat anders denken, zit hem onder andere in het niet hebben van alerting. Hiervoor verder meer in dit artikel. Ook probleem isolatie en grafisch weergave worden opnieuw leven ingeblazen. Erg interessant is de automatische analyse op basis van kunstmatige intelligentie, niet nieuw maar wel verfrissend in de stapel van APM-tools. Noemenswaardig is ook het dashboard dat wederom verfrissend is en op een andere manier systemen en te de monitoren metrieken weergeeft.

360 graden monitoring

Ruxit biedt alle functionaliteit om grip en controle te behouden over de performance van de productie omgeving van de klantorganisatie. Met behulp van een agent op de te monitoren server wordt zowel de eindgebruiker als de systeem resources (CPU, memory, memory pool, #threads) in de gaten gehouden, de 360 graden benadering.

De eindgebruiker wordt onder andere bewaakt door middel van synthetische handelingen die eens per tijdseenheid worden uitgevoerd vanaf het Internet richting de webserver van de klant.

Het levert 2 KPI’s op:

  1. eindgebruikers responstijd (hoe snel deed de eindgebruikershandeling erover om uitgevoerd te kunnen worden) en
  2. eindgebruikersbeschikbaarheid (heeft de eindgebruiker de handeling kunnen uitvoeren).

Helaas is op dit moment alleen het http-protocol mogelijk (geen VDI, SAP, fat client) en bestaat er nog geen mogelijkheid om applicaties te monitoren binnen de infrastructuur van de klant (on customer premise).

Ruxit problem topologyDe agents zorgen voor een automatische visualisatie van de applicatie keten, iets wat standaard functionaliteit is bij een next generation APM-oplossing. De visualisatie wordt door middel van kleuren van een status voorzien waardoor gemakkelijk te detecteren valt waar in de applicatie keten het fout gaat. De applicatie keten wordt in lagen opgedeeld (Applications, Services, Processes, Hosts, Data Centers). De visualisatie zorgt er voor dat iedereen aankijkt tegen 1 werkelijkheid in plaats van tegen achterhaalde documentatie. Hierbij geldt dat een plaatje meer zegt dat 1000 woorden.

Ook worden de eindgebruikershandelingen real-time gevolgd door de gehele applicatie keten (track and tracing). Deze real-time track and tracing is niet zichtbaar in Ruxit, maar wordt wel gebruikt om mede tot de smart analytics functionaliteit te komen.

Daarnaast wordt de gehele systeem stack (Operating System, Virtualisatie, Middleware, Applicatie) van de monitoren server bewaakt. Aangezien in de cloud gevirtualiseerde oplossingen worden gebruikt, houdt Ruxit ook de gevirtualiseerde laag en de daarmee verbonden opslag in de gaten. Dit is zeker een differentiator, omdat er zeer weinig tools zijn die vanuit het ketenperspectief de relatie leggen tussen eindgebruikershandelingen en de virtualisatie/storage componenten. Virtualisatie en storage kunnen al zeer snel leiden tot een spagetti brei, ook door het dynamisch en automatisch verplaatsen van vmware’s binnen de gevirtualiseerde omgeving. Iets wat zeker veel plaatsvindt binnen cloud omgevingen.

Geen alerts

Ruxit heeft gekozen voor een afwijkende en verfrissende benadering met betrekking tot alerting. Het gebruikt helemaal geen alerting! Alerts ervaar ik zelf ook als een never ending story. False positive alerts worden verstuurd in de nacht naar beheerders die vervolgens de dure tool links laten liggen. Men bouwt alert op alert om specifieke metrieken in de gaten te houden die iets zeggen over de werking van de applicatie keten. De beheerders proberen causale verbanden te vinden tussen de alerts, maar dit kost allemaal te veel tijd. De verder gaande digitalisering vraagt om problemen voor te zijn dan wel problemen het liefst in seconden al te detecteren en te analyseren. Alerts gaat niet helpen om deze uitdaging op te lossen, de mens kan het simpelweg niet bijhouden.

Ook de context waarin het probleem zich voordoet, wordt veelal vergeten. Het ene alert is het andere alert niet, maar op het blote oog lijken twee dezelfde alerts op elkaar. De informatie van hoe een probleem zich ontwikkeld gedurende de tijd kan anders zijn en dus ook de alerts die gegeneerd worden.

Ruxit laat de machines het probleem analyseren en het advies geven wat er gedaan moet worden door data te verzamelen afkomstig van de betrokken systemen. Context waarin de problemen zich voordoen, wordt opgebouwd door op alle lagen van de systeem stack specifieke metrieken te vergaren. Doordat Ruxit ook de eindgebruiker in de gaten houdt, wordt er een 360 graden monitor gebouwd. Het analyse systeem in Ruxit maakt visueel inzichtelijk, waar het probleem zich voordoet en hoe het is op te lossen. Ruxit heeft niet de verre gaande diagnostische mogelijkheden van dynaTrace, maar men komt een heel eind vergeleken met de tooling die nu veelal gebruikt wordt door organisaties.

Kijk eens naar deze Ruxit video dat dieper ingaat op het issue waarom alerts geen zin hebben.

Baten

Ruxit’s kracht zit hem in het automatisch analyseren van verzamelde monitoring data vanuit een 360 graden perspectief (eindgebruiker, de betrokken infrastructuur) en het adviseren om de gedetecteerde problemen op te lossen. Het is niet de traditionele tool waarbij er alarmen en thresholds gedefinieerd moeten worden om vervolgens de gebruiker te attenderen dat er “iets” mis is. Dit betekent een enorme acceleratie (efficientie van de tool) in de Mean Time To Identify en de Mean Time to Resolution (effectiviteit van de tool).

De snelle implementatie van Ruxit (1 agent, instrumentatie out-of-the-box) leidt tot snelle grip en controle over de te beheren infrastructuur (enkele dagen in plaats van weken|maanden). Problemen in productie worden direct opgemerkt en advies wordt gegeven zodat de MTTI en MTTR enorm worden verkort (kostenbesparing, verkorte oplostijd). De eindgebruikers hebben minder last van de verstoring door de pro-activiteit van de tool als gevolg van de ingebouwde smart analytics. Een ander voordeel is de korte tijd waarin performance testen veelal uitgevoerd moeten worden. Een kwalitatief goede performance test vereist inzicht in de te testen infrastructuur, snelle analyses van problemen dan wel isolatie van waar het probleem zit, en hoe de infrastructuur zich gedraagt onder de belasting. Ruxit biedt deze mogelijkheid door onafhankelijk van de vele beheerpartijen binnen de klantorganisatie analyses uit te voeren tijdens de performance test in plaats van er na.

Ruxit biedt door de automatische discovery ook 1 zicht van de werkelijkheid. Veelal heeft men te maken met achterhaalde of helemaal geen documentatie, verkeerde component configuraties etc waardoor het snel oplossen van problemen enorm wordt vertraagd. Men kan sneller en gerichter acteren doordat men de waarheid over de infrastructuur al heeft waardoor eindeloze kostbare vergaderingen en zoektochten naar hoe het nu werkelijk in elkaar steekt, zijn uitgesloten.

De exploitatie van de toe te passen monitoring tooling wordt enorm vereenvoudigd en gedownsized qua kosten. Met slechts 1 tool is grip en controle te behouden, de trainingskosten zijn beperkt doordat de tool gemakkelijk is aan te leren. Door de “Alles-in-1” benadering aangaande performance heeft men ook geen onnodige tooling aangekocht, wordt er geen tijd verspild om de data te analyseren uit gefragmenteerde tools.

In een volgend artikel ga ik in op specifieke functionaliteiten van Ruxit.