OBSERVABILITET I SKATTEETATEN
Fra monolitt til microtjenester
Agenda
Om Skatteetaten
Arkitektur (LGMT)
Event-prosess
Utvikling
Forvaltning
Overvåkning
Robert Myhren
Skatteetaten
4 925 377 privatkunder (2022)
Noen av dere får igjen 43 336 186 373 NOK
Resten må dekke 18 981 117 614
Bakgrunn
Omorganisering i 2021. Gruppen Overvåkning oppsto.
RAMO «Ansvar for å overvåke alle tjenestene. Ende til ende målinger, SLA-ansvar»
Etter litt «hjelp» fra ledelsen, kom AppDynamics inn i 2018. Forsvant ut i 2023.
Overvåkningsteamet bestod av 2 mann
Grafana kom inn med Openshift i 2015/2016. Prometheus var en del av Openshift-stacken. 2 enslige Prometheus-servere sørget for infrastruktur-metrikker.
Vi har en lang rekke tunge enterprise overvåkningsystemer i bagasjen
1.Oversikt over systemene
2. Status på systemene
3. Overvåking, alarmering & beredskap
4. Trace, metrikker & log
5. Rådgivning
6. Støtteverktøy
7. Forvaltning & utvikling
Den spede begynnelse
Splunk ble innført på «bakrommet»
Icinga ble satt opp av Bård i mangel av noe annet.
1 prometheusserver pr. VM med eget funksjonsområde. Lokale disker
Grafana med en datakilde pr. prometheus.
I 2019 erstattet vi BMC Truesight med Prometheus
Dagens bilde
LGMT
Log = Splunk
Grafana Enterprise
Mimir
Grafana Enterprise Trace
Logg
Metrikker
Mimir
Mimir ble klekket etter en lang rugeperiode.
Av prosesuelle grunner tok det eviglang tid å på plass objektbasert lagring.
Pt. har vi rundt 20 mill timeseries. Maks har vært over 40.
Vi henter inn data fra kilder. Gjør oppsett i Grafana lett
Ytelse og forvaltning er ikke «en big deal» nå. Det meste er automatisert gjennom Openshift / Helm
Vi har ikke kjøpt lisens her. Ser ikke helt behov, og det vil bli veldig kostbart
Grafana
Vi kjører Grafana Enterprise grunnet støtte for plugins og auth.
Fantastisk til å samkjøre data og visualisere data
1250 dashboards. Mye ræl
Krevende å administrere
Her begynt på egen løsning for å automatisk rydde i dashboard
Vi har begynt å kikke på Grafana Scenes
Vi jobber med å flytte alarmering og event-prosess inn i Grafana og Grafana OnCall
Kan ikke bruke SaaS av sikkerhetshensyn
Dette skaper merarbeid og merkost for oss
Trace
Arkitektur
IT-målbilder for overvåkning
Event-prosess (IPCE / ITIL)
Utvikling
Lager applikasjoner etter behov
Tilpasser exportere og integrasjoner
Enklere å utvikle enn å tilpasse
Go gjør det det lettere å skille seg ut i stillingsmarkedet
Siden Grafana slipper mange apps kun i cloud, må vi lage en del selv
Forvaltning
OMG (Overvåkningmodenhetsgrad)
OMG detaljer
Overvåkning
SLO
SLO - detaljer
Oppsummert
Takk for meg
robert.myhren@skatteetaten.no