Server Monitoring: Unterschied zwischen den Versionen
(Die Seite wurde neu angelegt: « == Festplatten == === RAID (mdadm/mdmon) === === smartd/smartmontools === ''smartd'' überwacht == zabbix == == anderes == Server Monitoring mit apybot|apyb…») |
|||
Zeile 4: | Zeile 4: | ||
=== RAID (mdadm/mdmon) === | === RAID (mdadm/mdmon) === | ||
=== smartd/smartmontools === | === smartd/smartmontools === | ||
− | ''smartd'' überwacht | + | ''smartd'' überwacht den Zustand der Festplatten auf der dom0. ''smartd'' wird im Debian-Paket ''smartmontools'' mitgeliefert. |
+ | |||
+ | Zuerst müssen wir herausfinden, wie man die SMART-Daten der Festplatten abruft. Bei normalen Computern ist dies meist einfach: | ||
+ | <pre> | ||
+ | # smartctl -a /dev/sdX | ||
+ | </pre> | ||
+ | '''/dev/sdX''' ist durch die zu prüfende Festplatte zu ersetzen, z.B. '''/dev/sda''', '''/dev/sdb''', etc. | ||
+ | |||
+ | Etwas komplizierter kann es werden bei Rackservern mit Hardware-RAID Controllern. Beim Dell Poweredge (pingu) zum Beispiel, sieht es so aus: | ||
+ | <pre> | ||
+ | # smartctl -a -d megaraid,0 /dev/sda | ||
+ | # smartctl -a -d megaraid,1 /dev/sdb | ||
+ | </pre> | ||
+ | Und so weiter bis megaraid,5 /dev/sdf | ||
+ | |||
+ | Bei Servern mit Adaptec AAC-RAID Controllern ist dies der richtige Befehl: | ||
+ | <pre> | ||
+ | # smartctl -a -d scsi /dev/sg6 | ||
+ | # smartctl -a -d scsi /dev/sg7 | ||
+ | </pre> | ||
+ | Bis '''/dev/sg11'''. '''/dev/sg[0-5]''' ensprechen nicht den Festplatten, dies sind die Devicenames für die jeweiligen SAS-Controller. | ||
+ | |||
+ | Jetzt, wo wir den Befehl kennen, können wir die korrekten Einträge in '''/etc/smartd.conf''' einfügen. Beispiel AACRAID-Controller: | ||
+ | <pre> | ||
+ | /dev/sg6 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner | ||
+ | /dev/sg7 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner | ||
+ | /dev/sg8 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner | ||
+ | /dev/sg9 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner | ||
+ | /dev/sg10 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner | ||
+ | /dev/sg11 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner | ||
+ | </pre> | ||
+ | |||
== zabbix == | == zabbix == | ||
Version vom 2. November 2015, 13:13 Uhr
Festplatten
RAID (mdadm/mdmon)
smartd/smartmontools
smartd überwacht den Zustand der Festplatten auf der dom0. smartd wird im Debian-Paket smartmontools mitgeliefert.
Zuerst müssen wir herausfinden, wie man die SMART-Daten der Festplatten abruft. Bei normalen Computern ist dies meist einfach:
# smartctl -a /dev/sdX
/dev/sdX ist durch die zu prüfende Festplatte zu ersetzen, z.B. /dev/sda, /dev/sdb, etc.
Etwas komplizierter kann es werden bei Rackservern mit Hardware-RAID Controllern. Beim Dell Poweredge (pingu) zum Beispiel, sieht es so aus:
# smartctl -a -d megaraid,0 /dev/sda # smartctl -a -d megaraid,1 /dev/sdb
Und so weiter bis megaraid,5 /dev/sdf
Bei Servern mit Adaptec AAC-RAID Controllern ist dies der richtige Befehl:
# smartctl -a -d scsi /dev/sg6 # smartctl -a -d scsi /dev/sg7
Bis /dev/sg11. /dev/sg[0-5] ensprechen nicht den Festplatten, dies sind die Devicenames für die jeweiligen SAS-Controller.
Jetzt, wo wir den Befehl kennen, können wir die korrekten Einträge in /etc/smartd.conf einfügen. Beispiel AACRAID-Controller:
/dev/sg6 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner /dev/sg7 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner /dev/sg8 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner /dev/sg9 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner /dev/sg10 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner /dev/sg11 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner