Rätt check_load värden i Nagios

I alla system av Unix typ övervakas CPU belastningen i kernel och visas som tre ”load average” värden över tid (5, 10 och 15 min), vilka kan visas med tex top och andra monitoreringsprogram.

”Load average” brukar ofta skapa huvudbry för särskilt nybörjare då de värden som visas förhåller sig till antalet processorkärnor. Men det är mycket enkelt att räkna ut ett användbart värde:

p = la * 100 / c

la = load average värde
c = antalet kärnor
p = belastning i %

ex. en server med 4 kärnor har ett la = 3,2

3,2 * 100 / 4 = 80(%)

Vi kan alltså lätt räkna ut vilka värden som ska anges i övervakningsprogram som tex Nagios genom att svänga på formeln:

y = c * p / 100

ex. en server med 4 kärnor kan konfigureras som:

tid 5m 10m 15m
varning 90% 70% 50%
kritiskt 100% 80% 60%

I tex Nagios ”check_load” skulle då konfigurationen se ut så här:

check_load -w 3.6,2.8,2 -c 4,3.2,2.4

Annonser
Tagged with: ,
Publicerat i Operativsystem
Erik Schütten

Hej! Jag heter och är bosatt på Åland, bekvämt mittemellan Sverige och Finland.

Jag har jobbat med IT i drygt 30 år och är bla delägare i ett internationellt mjukvaruföretag där jag ansvarar för den tekniska driften och -utvecklingen (Vice President of Technology).

Behöver du kvalificerad hjälp med din IT verksamhet? Fråga Erik! Du når mig via erik@scab.ax. Mer info om mina tjäntser hittar du på www.scab.ax.

Linkedin Twitter Facebook Google+ RSS

Ange din e-postadress för att följa denna blogg och få meddelanden om nya inlägg via e-post.

QR-code
About Erik Schütten
Senior IT expert with 30 years of experience in designing, implementing and managing IT systems and staff. Follow Erik Schütten on Google+, Twitter and Facebook