ich habe ein ziemliches Problem mit einem FSC Primergy TX200S2, auf dem
ein Suse Linux Enterprise Server 9.0 SP3 (komplett neu aufgesetzt) und
ein Mailsystem/Groupware für ca. 800 User installiert ist.
Das System hängt in unregelmässigen Abständen. Bild ist noch da, "ping"
funktioniert z.B. auch noch. Login ist nicht mehr möglich, Groupware und
Mail funktioniert auch nicht mehr. Nach einem Reset bzw. in einem Fall
auch nach einem reboot wird beim Neustart das Dateisystem repariert,
teilweise recht umfangreich. Zum Teil muss die LDAP Datenbank aus der
Datensicherung wieder hergestellt werden.
Die Logs habe ich mir mehrfach angeschaut und nichts gefunden. Syslog
über das Netzwerk auf einen anderen Server wurde von Kunden leider
wieder deaktiviert.
An Hand des Fehlerbildes tippe ich ganz stark auf das Raidsystem bzw.
Probleme mit den Festplatten.
Wir haben zumindest /var/ schon mal auf eine andere Festplatte gelegt
(die allerdings am selben Controller hängt), das hat keine Besserung
gebracht.
Es ist leider nicht ganz einfach, hier größere Sachen zu tauschen, da
das System 24/7 laufen sollte.
Raidcontroller ist ein "LSI 53c1030", "/root/" liegt auf einem Raid1,
"/var/" im Moment auf einem einfachem Hostdrive.
Hat jemand noch eine Idee, in welche Richtung ich noch suchen sollte
bzw. mit einer ähnlichen Konstellation schon einmal Probleme gehabt?
Ich wäre für jeden Tip wirklich dankbar.