Posts Tagged ‘linux’

Es WAR einmal RAID5

Tuesday, July 22nd, 2008

Eine Gute-Nacht-Geschichte fuer Nerds
nach einer wahren Begebenheit im Sommer 2008

Es war einmal ein Rechner mit 3 Festplatten und einem Linux. Die Festplatten waren gluecklich und drehten sich voller Freude und tauschten mit dem Kernel Daten aus. Der Kernel sprach: “Ihr, meine Freunde, sollt ein Raid 5 sein.”, und die Festplatten folgten seinem Befehl und schaufelten Daten hin und her, hashten und lasen, bis der Kernel sie fuer synchronisiert hielt.

Und so arbeiteten die Platten im Verbund, lieferten Daten und strahlten Sicherheit und Geborgenheit aus. Eines Tages jedoch schmerzte es eine der Platten gar fuerchterlich. Sie nahm all ihren Mut zusammen und sprach zum Kernel: “hdg: task_out_intr: status=0×58 { DriveReady SeekComplete DataRequest }”. Nachdem der Kernel die Schmerzen der Festpllatte untersucht und sich ein Bild gemacht hatte, sprach er: “Mein Freund, ide3: reset: slave: ECC circuitry error!. Ich werde dich entlasten und deine Freunde mit deinen Aufgaben betrauen.”. Der RAID-Dienst fuegte hinzu: “raid5: Disk failure on hdg1, disabling device. Operation continuing on 2 devices”. So wurde das Raid 5 degraded und die verbleibenden 2 Festplatten schufteten allein.

Nicht viele Stunden vergingen, so sprach auch die zweite Festplatte: “hdh: task_out_intr: status=0×58 { DriveReady SeekComplete DataRequest }”.  Der Kernel - sichtlich beunruhigt - konnte nicht glauben was er da hoerte und bruellte: “Nein! Nein! Nichtdoch ide3: reset: master: ECC circuitry error!”. Das Leid war Gross, denn alle wussten… alleine konnte die letzte Festplatte das Datenvolumen niemals verkraften. Der Kernel klagte sein Leid dem RAID-Dienst, welcher erwiderte: “Weine nicht Kernel… raid5: Disk failure on hdh1, disabling device. Operation continuing on 1 device. Denk an was schoenes und warte ab.”. Der Kernel jedoch war verdriesst und mochte sich nicht so recht erholen. Er schwelgte in Erinnerungen an die Daten, die er einst von den 3 wackeren Platten hatte lesen koennen. Die Gedaechtnisluecken schmerzten so sehr, dass er sein Leid nicht mehr fuer sich behalten konnte. “Buffer I/O error on device dm-0, logical block 733475!”, bruellte er, “lost page write due to I/O error on dm-0…”.

Schlussendlich konnte er die Schmerzen nicht mehr ertragen und verlor die Kontrolle. “Aborting journal on device dm-0.”, schluchzte er… und als ihm klar wurde, was er gerade gesagt hatte, schob er nach: “EXT3-fs error (device dm-0): ext3_journal_start_sb: Detected aborted journal!”. Er hoerte auf nach den Daten zu rufen und verharrte panisch zitternd und unsynchronisiert, bis ein Anruf eines Technikers endlich das Geraet endlich stromlos schalten liess.

Und vielleicht - eines Tages - kommt ein Techniker, tauscht die beiden defekten Platten aus und haucht dem System so neues Leben ein.