Server Monitoring: Unterschied zwischen den Versionen

Aus revampedia
(Die Seite wurde neu angelegt: « == Festplatten == === RAID (mdadm/mdmon) === === smartd/smartmontools === ''smartd'' überwacht == zabbix == == anderes == Server Monitoring mit apybot|apyb…»)
 
Zeile 4: Zeile 4:
 
=== RAID (mdadm/mdmon) ===
 
=== RAID (mdadm/mdmon) ===
 
=== smartd/smartmontools ===
 
=== smartd/smartmontools ===
''smartd'' überwacht
+
''smartd'' überwacht den Zustand der Festplatten auf der dom0. ''smartd'' wird im Debian-Paket ''smartmontools'' mitgeliefert.
 +
 
 +
Zuerst müssen wir herausfinden, wie man die SMART-Daten der Festplatten abruft. Bei normalen Computern ist dies meist einfach:
 +
<pre>
 +
# smartctl -a /dev/sdX
 +
</pre>
 +
'''/dev/sdX''' ist durch die zu prüfende Festplatte zu ersetzen, z.B. '''/dev/sda''', '''/dev/sdb''', etc.
 +
 
 +
Etwas komplizierter kann es werden bei Rackservern mit Hardware-RAID Controllern. Beim Dell Poweredge (pingu) zum Beispiel, sieht es so aus:
 +
<pre>
 +
# smartctl -a -d megaraid,0 /dev/sda
 +
# smartctl -a -d megaraid,1 /dev/sdb
 +
</pre>
 +
Und so weiter bis megaraid,5 /dev/sdf
 +
 
 +
Bei Servern mit Adaptec AAC-RAID Controllern ist dies der richtige Befehl:
 +
<pre>
 +
# smartctl -a -d scsi /dev/sg6
 +
# smartctl -a -d scsi /dev/sg7
 +
</pre>
 +
Bis '''/dev/sg11'''. '''/dev/sg[0-5]''' ensprechen nicht den Festplatten, dies sind die Devicenames für die jeweiligen SAS-Controller.
 +
 
 +
Jetzt, wo wir den Befehl kennen, können wir die korrekten Einträge in '''/etc/smartd.conf''' einfügen. Beispiel AACRAID-Controller:
 +
<pre>
 +
/dev/sg6 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
 +
/dev/sg7 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
 +
/dev/sg8 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
 +
/dev/sg9 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
 +
/dev/sg10 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
 +
/dev/sg11 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
 +
</pre>
 +
 
 
== zabbix ==
 
== zabbix ==
  

Version vom 2. November 2015, 14:13 Uhr


Festplatten

RAID (mdadm/mdmon)

smartd/smartmontools

smartd überwacht den Zustand der Festplatten auf der dom0. smartd wird im Debian-Paket smartmontools mitgeliefert.

Zuerst müssen wir herausfinden, wie man die SMART-Daten der Festplatten abruft. Bei normalen Computern ist dies meist einfach:

# smartctl -a /dev/sdX

/dev/sdX ist durch die zu prüfende Festplatte zu ersetzen, z.B. /dev/sda, /dev/sdb, etc.

Etwas komplizierter kann es werden bei Rackservern mit Hardware-RAID Controllern. Beim Dell Poweredge (pingu) zum Beispiel, sieht es so aus:

# smartctl -a -d megaraid,0 /dev/sda
# smartctl -a -d megaraid,1 /dev/sdb

Und so weiter bis megaraid,5 /dev/sdf

Bei Servern mit Adaptec AAC-RAID Controllern ist dies der richtige Befehl:

# smartctl -a -d scsi /dev/sg6
# smartctl -a -d scsi /dev/sg7

Bis /dev/sg11. /dev/sg[0-5] ensprechen nicht den Festplatten, dies sind die Devicenames für die jeweiligen SAS-Controller.

Jetzt, wo wir den Befehl kennen, können wir die korrekten Einträge in /etc/smartd.conf einfügen. Beispiel AACRAID-Controller:

/dev/sg6 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
/dev/sg7 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
/dev/sg8 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
/dev/sg9 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
/dev/sg10 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
/dev/sg11 -d scsi -a -o on -S on -n standby -m root -M exec /usr/share/smartmontools/smartd-runner

zabbix

anderes

apybot