Rittal CMC-III per Icinga 2 überwachen

Diesen Beitrag schrieb ich 5 Jahre und 9 Monate zuvor; die nachfolgenden Ausführungen müssen heute nicht unbedingt noch genau so funktionieren. Behalte das beim Lesen (und vor allem: beim Nachmachen!) bitte stets im Hinterkopf.

Geschätzte Lesezeit: 1 Minute

Es gibt viele Wege, Dinge in Icinga 2 zu überwachen; ich wollte unsere Rittal CMC-III LCPs ins Monitoring aufnehmen, aber das erwies sich als gar nicht so einfach: die Plugins, die ich auf Nagios Exchange entdeckte, funktionierten alle entweder nur teilweise oder gleich überhaupt nicht. Wie ich die Fragestellung für mich löse, zeige ich dir hier.

Rittal CMC-III Icinga 2 Ich habe kein eigenes Plugin geschrieben, sondern behelfe mir mit Bordmitteln – namentlich dem üblichen check_snmp. Per object CheckCommand definiere ich mit einen Aufruf, der konkret meinen Bedürfnissen angepasst ist und den ich für alle Abfragen verwenden kann. Die Abfragen ihrerseits laufen via SNMPv3, das logischerweise zuvor im Rittal-Webinterface aktiviert werden muss. Mit vars.rittal_warn wird der Schwellenwert definiert, ab welchem der Service auf WARNING gehen soll, mit vars.rittal_crit analog der für CRITICAL. Wichtig auch zu beachten: sollen mehrere Werte abgeprüft werden – im Beispiel ist das bei den Lüftern der Fall – so müssen sowohl die OIDs als auch die Schwellenwerte als Array übergeben werden.

Meine Definition für CheckCommand, die HostGroup und das Host-Template habe ich dir in in der Datei rittal.conf zusammengefasst; der Host lcp-example und all seine Service-Checks sind in der Datei lcp-example.conf enthalten.

Rittal Icinga 2 CMC-III Der leicht gewöhnungsbedürftige Part an der Sache ist, dass die SNMP-Abfragen für die Temperaturen Zehntelgrad-Werte zurückliefern; die 143 bei der water-in-temperature steht also für 14,3°C. Das ist Geschmackssache und sicherlich etwas, das sich scripten ließe – mir ist es den Aufwand lediglich nicht wert ;-) Insbesondere im Zusammenspiel mit den Graphen, die ich zeichnen lasse, lassen sich Ausreißer sehr zeitnah entdecken und Fehlerquellen eingrenzen. Wie überwachst du solche Dinge? Wie immer freue ich mich über Denkanstöße und Kommentare!