Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Server deaktivert Pool

23 views
Skip to first unread message

Eugen Gentner

unread,
May 10, 2013, 12:04:48 PM5/10/13
to
Hallo,

wir haben hier noch einen NW65-Server SP8. Er dient vor allem als
Fileserver.
Es ist ein HP ML350 G5 mit einem Raid 5 (Smart Array P2600). Vor ein
paar Tagen wurden plᅵtzlich die Pools deaktiviert.
Nach einem Neustart waren die Volumes wieder da, eine defekte Platte
wurde angezeigt und ersetzt. Alles schien ok.
Nach einem guten Tag wurden die Pools pᅵtzlich wieder deaktivert. Nach
einem Neustart sind die Pools aber nur kurze Zeit (3-5 Minuten)
verfᅵgbar und werden dann vom Server wieder deaktiviert.

Der geladene HPqcss-Treiber ist Version 1.14.

Wo kᅵnnte der Fehler liegen?

Danke

Eugen Gentner

Peter Schwindt

unread,
May 10, 2013, 3:33:52 PM5/10/13
to
On Fri, 10 May 2013 18:04:48 +0200, Eugen Gentner wrote:

> Nach einem guten Tag wurden die Pools pötzlich wieder deaktivert. Nach
> einem Neustart sind die Pools aber nur kurze Zeit (3-5 Minuten)
> verfügbar und werden dann vom Server wieder deaktiviert.

Ein Versuch: Cache des RAID-Controllers defekt. Tausch den mal mit dem
Riegel eines anderen Servers aus.

Peter

Eugen Gentner

unread,
May 10, 2013, 4:51:46 PM5/10/13
to
> Ein Versuch: Cache des RAID-Controllers defekt. Tausch den mal mit dem
> Riegel eines anderen Servers aus.

Wir haben den Raid-Controller schon getauscht. Ohne Erfolg!

Gruß

Eugen

Massimo Rosen

unread,
May 12, 2013, 2:35:57 PM5/12/13
to
Hallo.

On 10.05.2013 18:04, Eugen Gentner wrote:
>
> Der geladene HPqcss-Treiber ist Version 1.14.

Der ist schwer veraltet und kaputt. 1.16b ist der "aktuelle" WIMRE.

> Wo kᅵnnte der Fehler liegen?

Klingt nach Hardware, bzw mᅵglicherweise jetzt einem korrupten Raid/Pool
nach dem die Platte gestorben ist.

CU,
Massimo

Eugen Gentner

unread,
May 12, 2013, 3:03:01 PM5/12/13
to

Am 12.05.2013 20:35, schrieb Massimo Rosen:

>
> Der ist schwer veraltet und kaputt. 1.16b ist der "aktuelle" WIMRE.

Bei HP hab ich nur den 1.16a gefunden, der brachte aber auch keine ᅵnderung.
>
>> Wo kᅵnnte der Fehler liegen?
>
> Klingt nach Hardware, bzw mᅵglicherweise jetzt einem korrupten Raid/Pool
> nach dem die Platte gestorben ist.

Wie kᅵnnen wir die Daten retten? Ein poolrebuild wᅵrde wohl mehr
zerstᅵren, und ist ja gar nicht mᅵglich, weil der Pool deaktiviert wird.

Vielen Dank

Eugen Gentner

Massimo Rosen

unread,
May 14, 2013, 6:38:09 PM5/14/13
to
On 12.05.2013 21:03, Eugen Gentner wrote:
>
> Wie kᅵnnen wir die Daten retten?

Sicherung?

> Ein poolrebuild wᅵrde wohl mehr
> zerstᅵren,

Wer sagt denn sowas? Klar, wenn die Hardware hinᅵber ist, durchaus
mᅵglich. Wenn aber "nur" der Pool einen abgekriegt hat, dann nicht.

> und ist ja gar nicht mᅵglich, weil der Pool deaktiviert wird.

Nenenee... Klar ist ein Poolreuild mᅵglich. Der Pool muss vorher sowieso
in den Maintenancemode versetzt werden.

CU,
Massimo

Eugen Gentner

unread,
May 15, 2013, 7:46:36 AM5/15/13
to
Hallo,
das Problem ist gelᅵst.
wir konnten mit Hilfe von Acronis die Daten auf ein neues Plattensystem
kopieren. Das steckt nun in einem Ersatzserver unseres Hᅵndlers. Bis
jetzt konnten wir keinen Datenverlust feststellen. Mein Vertrauen in ein
Raid-5-System ist aber nachhaltig gestᅵrt.

>>
>> Wie kᅵnnen wir die Daten retten?
>
> Sicherung?
Die letzte funktionierende Sicherung war ein paar Tage alt.

>> Ein poolrebuild wᅵrde wohl mehr
>> zerstᅵren,
>
> Wer sagt denn sowas? Klar, wenn die Hardware hinᅵber ist, durchaus
> mᅵglich. Wenn aber "nur" der Pool einen abgekriegt hat, dann nicht.
>
>> und ist ja gar nicht mᅵglich, weil der Pool deaktiviert wird.
>
> Nenenee... Klar ist ein Poolreuild mᅵglich. Der Pool muss vorher sowieso
> in den Maintenancemode versetzt werden.
>

Es war sicher ein Hardware-Defekt.
Das Problem fᅵr uns war, dass man die Pools gar nicht mehr gesehen habe,
die waren einfach weg.

Noch eine Frage: Ist jetzt ein Poolrebuild ratsam?

Danke und viele Grᅵᅵe

Eugen Gentner


Massimo Rosen

unread,
May 17, 2013, 5:40:56 AM5/17/13
to
Hallo.

On 15.05.2013 13:46, Eugen Gentner wrote:
> Hallo,
> das Problem ist gelᅵst.
> wir konnten mit Hilfe von Acronis die Daten auf ein neues Plattensystem
> kopieren. Das steckt nun in einem Ersatzserver unseres Hᅵndlers. Bis
> jetzt konnten wir keinen Datenverlust feststellen. Mein Vertrauen in ein
> Raid-5-System ist aber nachhaltig gestᅵrt.

Hatte das Raid eine Batterie? Sind die Platten fᅵr diesen Controller
zugelassen? Solche Effekte wie bei Dir sind leider nicht wirklich
selten. Genau wie Raids die wᅵhrend des Rebuild mit einer neuen Platte
scheinbar grundlos auseinanderfliegen. :(

> Es war sicher ein Hardware-Defekt.

Ich vermute ein Parity-Fehler im Raid. Wenn Ihr jetzt auf der gleichen
Hardware das Raid komplett neu anlegt wird das wahrscheinlich wieder
funktionieren als wᅵre nie was geschehen. Oder mit den Diagnosetools
drᅵberlaufen, die werden das evtl. finden. Irgendwo in dem Raid ist
etwas inkosistent, und sobald darauf zugegriffen wird ist Feierabend.

> Das Problem fᅵr uns war, dass man die Pools gar nicht mehr gesehen habe,
> die waren einfach weg.

Das passt nicht zu Deiner Eingangsbeschreibung. ;)

> Noch eine Frage: Ist jetzt ein Poolrebuild ratsam?

Im Prinzip ja.

CU,
Massimo
0 new messages