SQ-X2RU3e, Verhalten im Fehlerfall

    SQ-X2RU3e, Verhalten im Fehlerfall

    Ich habe seit ca. 3 Monaten
    - 2 SQ-X2RU3e-Geräte (A+B) erworben und betreibe sie mit jeweils
    - 2x Western Digital WD40EZRX Caviar Green interne-Festplatte 4TB (8,9 cm (3,5 Zoll), 64MB Cache, SATA III)
    als
    - Raid1 (Ausfallsicherheit), unter Ubuntu.

    A) für täglichen Betrieb
    B) für Backup mittels 'dd'

    Alles klappt soweit wunderbar.

    Ich möchte für den Ausfall einer Festplatte vorbereitet sein und teste das deswegen durch:
    Dazu habe ich die untere Festplatte herausgezogen (im ausgeschalteten Zustand) und ein paar Daten geschrieben.

    Ich hatte jetzt die Erwartung, dass bei fehlender Platte
    - grüne Netzleuchte brennt - wie erwartet
    - obere HDD1 flackert blau - wie erwartet
    - untere HDD2 flackert rot oder gelb - tatsächlich war sie vollkommen aus.

    Nun gut, die Platte hat gefehlt, also war eben keine LED an, so kann man es auch vernünftig interpretieren.
    Bei dieser Gelegenheit stellt sich für mich die Frage, wann gehen die anderen LEDs überhaupt an ?

    Das Gerät hat ja insgesamt 6 LEDs; wann kommen die alle zum Einsatz?

    1.) - Netz - ist klar
    2.) - ???
    3.) - HDD1 - flackert bei Betrieb blau - ist klar
    4.) - ???
    5.) - ???
    6.) - HDD2 - flackert bei Betrieb blau - ist klar

    Später habe ich die untere Festplatte wieder eingeschoben (im ausgeschalteten Zustand).
    Ich hatte jetzt die Erwartung, dass eine andersfarbige LED (vielleicht rot oder gelb) die Synchronisation anzeigt:
    [HDD2 wird wieder auf den Stand der Daten von HDD1 gebracht.]

    Farblich hat sich nichts geändert. Allerdings kommt es mir so vor, als ob - auch wenn der Rechner selber ausgeschaltet
    ist - HDD1 und auch HDD2 verstärkt flackert, wass darauf hindeuten könnte, dass eine Synchronisation im Gange ist.
    Ist dieser Eindruck richtig?

    Damit kann ich auch leben, allerdings ist diese blaue Flacker-Aktivität nicht unbedingt so klar zu erkennen.
    Eine andersfarbige LED wäre besser, die klar signalisiert: Synchronisation läuft gerade.

    Dazu noch folgende Überlegenung: Die Beobachtung, dass die obere Platte scheinbar Daten auf die untere (zeitweise fehlende) Platte überträgt - auch wenn der Rechner ausgeschaltet ist, könnte ich doch für das Backup ausnutzen:
    1) untere Platte aus (A) herausziehen:
    2) untere Platte aus (B) einbauen
    3) nur Gehäuse (A) einschalten - Sync. läuft (von oben nach unten)
    4) untere Platte nun wieder in (B) einbauen
    3) nur Gehäuse (B) einschalten - Sync. läuft (von unten nach oben)
    Vorteil:
    Der Rechner ist nicht ca. 12 h wegen 'dd' belegt (blockiert übliche Rechnernutzung).

    Sind diese Annahmen richtig? Das Manual macht leider zu LEDs, Verhalten im Fehlerfall, Sync., Backup-Möglichkeiten keine Aussagen.
    Moin,

    FriedrichDerGrosse schrieb:

    Ich möchte für den Ausfall einer Festplatte vorbereitet sein und teste das deswegen durch:
    Dazu habe ich die untere Festplatte herausgezogen (im ausgeschalteten Zustand) und ein paar Daten geschrieben.


    wie im Forum bereits unzählige Male beschrieben wurde, geht das so nicht, du hast das Raid lediglich abgeschaltet durch diesen Vorgang und keine Fehlermeldung hervorgerufen. Generell sollte man das so nie machen, will man es doch ausprobieren (klappt nicht unbedingt, dass Gerät braucht normalerweise die defekt Meldung der Festplatte!), muss man die Festplatte im Betrieb ausbauen, sonst "degraded" man das Raid nur.

    FriedrichDerGrosse schrieb:

    Später habe ich die untere Festplatte wieder eingeschoben (im ausgeschalteten Zustand).


    Ebenfalls falsch, niemals im ausgeschalteten Zustand am Raid etwas ändern, da sind dann auch mal ganz flott alle Daten weg. ;) Festplatten immer im eingeschalteten Zustand austauschen!

    Es sind nur 3 LEDs relevant, sonst gibt es da erstmal weiter nichts zu beachten.

    Rebuild: die LEDs für die Festplattenaktivität leuchten so wie beim Schreiben auf das Raid (also schnelles blinken)

    Festplattendefekt: die LED blinkt langsam und durchgehend, ohne Unterbrechung

    FriedrichDerGrosse schrieb:

    Dazu noch folgende Überlegenung: Die Beobachtung, dass die obere Platte scheinbar Daten auf die untere (zeitweise fehlende) Platte überträgt - auch wenn der Rechner ausgeschaltet ist, könnte ich doch für das Backup ausnutzen:
    1) untere Platte aus (A) herausziehen:
    2) untere Platte aus (B) einbauen
    3) nur Gehäuse (A) einschalten - Sync. läuft (von oben nach unten)
    4) untere Platte nun wieder in (B) einbauen
    3) nur Gehäuse (B) einschalten - Sync. läuft (von unten nach oben)
    Vorteil:
    Der Rechner ist nicht ca. 12 h wegen 'dd' belegt (blockiert übliche Rechnernutzung).

    Sind diese Annahmen richtig?


    NIEMALS! Wir haben hier wirklich häufig genug vor solchen Experimenten gewarnt, wer es dennoch machen will, macht das völlig auf eigene Gefahr und mit Pioniergeist. :D

    Gruß,
    Lars
    Erst mal herzlichen Dank für die schnelle Antwort.

    wie im Forum bereits unzählige Male beschrieben wurde, geht das so nicht, du hast das Raid lediglich abgeschaltet durch diesen Vorgang und keine Fehlermeldung hervorgerufen. Generell sollte man das so nie machen, will man es doch ausprobieren (klappt nicht unbedingt, dass Gerät braucht normalerweise die defekt Meldung der Festplatte!), muss man die Festplatte im Betrieb ausbauen, sonst "degraded" man das Raid nur.


    Ich habe jetzt die untere Festplatte mal im Betrieb herausgezogen, ein paar Daten geschrieben und wieder im Betrieb eingeschoben.
    Das Verhalten war das Gleiche: Ein paar Augenblicke nach dem Einschieben der Platte setzte das schnelle Blinken beider LEDs ein.
    So wie vermutet (und von Lars bestätigt) bedeutet also ein schnelles blaues Blinken, dass die Platten synchronisiert werden.
    Vorher leuchteten beide LEDs (HDD1/2) durchgehend blau (wenn der Rechner nicht aus anderen Gründen etwas schreibt).

    Ein langsames und durchgehendes LED-Blinken, ohne Unterbrechung, wie es als Festplattendefekt-Erkennungsmerkmal erklärt wurde, habe ich erneut nicht beobachtet. Das mag daran liegen (wie von Lars ausgeführt), dass auch ein Herausziehen während des Betriebes die Festplatte nicht dazu bringt, eine Defekt-Meldung abzusenden. Kann sie ja auch gar nicht, da sie ja abgezogen wurde. :)
    Also hatten wir vorübergehend lediglich den Status "degraded". Wichtig ist mir vor allem, dass anschließend
    • die Synchronisation einsetzt und
    • vor allem auch die Richtung stimmt (von oben nach unten, wenn unten abgezogen war)
    Aber das scheint ja der Fall zu sein.

    Ebenfalls falsch, niemals im ausgeschalteten Zustand am Raid etwas ändern, da sind dann auch mal ganz flott alle Daten weg. ;) Festplatten immer im eingeschalteten Zustand austauschen!

    Ja gut, daran werde ich mich halten. Aber warum ist das so? Ohne zu sehr in komplizierte techn. Details zu gehen, kann es doch nur daran liegen,
    dass bestimmte Statusinformationen ("degraded" oder defekt - welche Platte ist betroffen) nicht auf die verbliebene intakte Platte geschrieben werden können (wenn das Netzkabel ab ist). Deswegen wird dann vielleicht (nach erneutem Anschluß einer ausgetauschten Platte) in die falsche Richtung synchronisiert und die Daten sind weg. Das ist die einzig logische Erklärung für mich?
    Es könnte bspw. das Datum des letzten Schreibvorgangs auf der verbliebenen intakten Platte vermerkt worden sein. Jede Platte
    die hinzukommt (mit einem älteren Datum) wird dann bei der Synchronisation überschrieben.

    Was die LEDs anbelangt, ist mir dank der Erklärung jetzt alles klar.

    Noch eine andere, ergänzende Überlegung: Die von mir beobachtete Synchronisation dauerte grob geschätzt die gleiche Zeit, wie ich für 'dd' benötigt hätte (ca. 12 h), was auch logisch erscheint. Wenn ich den Rechner ausgeschaltet habe, dann wurde die Synchronisation fortgesetzt; Lüfter lief auch weiter. (Ansonsten (ohne Sync.) ging bald nach dem Ausschalten auch der Lüfter aus, einzig die Netz-LED blieb an.)
    Gleiches Verhalten nach dem Einschalten, wenn der Rechner selber aber noch gar nicht an war: Sync. setzte ein.

    Ich hatte den Rechner bzw. Plattengehäuse nie durchgehend 12 h eingeschaltet. Also muss er sich ZUSÄTZLICH noch irgendwo den Fortschritt der
    Sync. vermerkt haben, denn sonst hätte diese immer wieder von null beginnen müssen bis mal irgendwann der Rechner bzw. Plattengehäuse wenigstens 12 h durchgehend eingeschaltet waren.

    Deswegen die Frage (techn. Realisierung muss nicht bis ins Detail beschrieben werden): Ist es so, dass das Plattengehäuse Statusinformation
    auf der verbliebenen (intakten, nicht herausgezogenen) Platte ablegt über
    • welche Platte war defekt/fehlte und muss durch eine Sync. überschrieben werden
    • Fortschritt der Sync.?

    Auf die Platte zu schreiben kollidiert ja evtl. mit den Anwenderdaten?!
    Oder gibt es da intern noch einen Extra-Speicher mit Stützbatterie?

    NIEMALS! Wir haben hier wirklich häufig genug vor solchen Experimenten gewarnt, wer es dennoch machen will,
    macht das völlig auf eigene Gefahr und mit Pioniergeist. :D

    Möglicherweise ist das ja ein verstecktes Feature, aber noch nicht ausreichend ausgetestet - deswegen darf es noch nicht beworben werden.
    (Ich habe auch so gut wie keine Eintäge zu SQ-X2RU3e-Geräten im Forum gefunden.)

    Wenn man sich nur von der Logik leiten läßt, so ist doch das Szenario vermutlich insbesondere sicher für den Fehlerfall ausgelegt.
    Also: Untere Platte fällt aus, wird während des Betriebs durch eine neue Platte ersetzt, Sync. setzt ein und beschreibt die neue Platte.
    Ob die neue Platte wirklich neu (unbeschrieben) ist oder aus einem anderen Gehäuse entnommen wurde, sollte doch dabei keine Rolle spielen?

    Es könnte nur problematisch sein, wenn das andere Gehäuse auch Statusinformationen auf der Platte hinterlassen hätte, die jetzt irgendwie
    mit den Statusinformationen auf der oberen Platte kollidieren. Dann würde ggf. in die falsche Richtung sync. und die Daten sind weg.

    Deswegen ist der Kern meiner Frage also: Wo und wie werden die Statusinformationen abgelegt?
    Insbesondere auch wo und wie wird der Fortschritt der Sync. abgelegt?

    Schon mal vielen Dank im Voraus.
    Moin,

    dass geht viel zu weit und war so auch gar nicht gemeint, aber wie oft im Forum beschrieben sollten sich bitte alle daran halten, damit am Ende nicht ein unbedarfter Datenverlust entsteht. ;)

    Die Platte, die beim Start im Gerät befindlich ist, wird zum "Master" und deshalb wird dann von dieser Platte aus gespiegelt, bei zwei eingebauten Festplatten während das Gerät aus ist passiert in der Regel deswegen auch gar nichts. Man müsste also in der Theorie die leere Festplatte einbauen, dass Gerät einschalten und dann die volle Festplatte einbauen, damit sicher alle Daten gelöscht sind! :D

    FriedrichDerGrosse schrieb:

    Auf die Platte zu schreiben kollidiert ja evtl. mit den Anwenderdaten?!
    Oder gibt es da intern noch einen Extra-Speicher mit Stützbatterie?


    In der Regel hat ja jedes Raid zu Beginn des Volumens geschriebene Daten, um was es sich da eigentlich handelt. :thumbsup:

    Gruß,
    Lars
    Um das Thema mal abzuschließen - habe ich den Test gemacht und eine einzelne Platte aus Gerät (A) in das zweite SQ-X2RU3e-Gerät (B) eingebaut - mit der Erwartung das dann die Sync. einsetzt und mir ein 'dd' erspart bleibt (vorausgehend schon erklärt).

    Ist jetzt keine Frage für Lars, sondern nur für andere Anwender, falls die ähnliche Ideen haben:

    Das Ergebnis war weder ein Datenverlust noch eine Sync., sondern führte stattdessen dazu, daß das SQ-X2RU3e als Gerät mit zwei Festplatten vom OS wahrgenommen wurde. Auch nach dem Rückbau der Platte trat dieses Phänomen dann in (A) auf. Offensichtlich schreibt das SQ-X2RU3e etwas auf das LW, was dessen Zugehörigkeit zum Gerät kennzeichnet.

    Lösung:
    (B) wurde wieder wie ursprünglich hergestellt, es synchronisierte sich dann ordnungsgemäß.
    Von (A) (nur mit einer Platte ausgestattet) wurde dann auf (B) mittels 'dd' gesichert.
    Reset des Raids auf (A), so dass (A) wieder nur als eine Platte auftritt.
    Rücksicherung von (B) auf (A).
    Fazit:
    Ohne 'dd' geht es nicht.