0x1b - ESCAPE
HTML PDF Postscript
 Das Spiel mit dem Feuer 
Computer Geschrieben von Beat Rubischon (Link) am Samstag, 12. August 2006, 15:03
aus dem backup dept.

Die vergangene Woche war gespickt mit verlorenen Disks, naiven Systemadministratoren und einem restaurierten System. Warum sind die Menschen nicht in der Lage, aus den Fehlern anderer zu lernen?

Ich musste an drei Systemen arbeiten, teilweise ziemlich tief eingreifen, von welchen kein Backup existiert. Man kauft Computer mit redundanten Nezteilen, RAID, ECC Memory. Man organisiert personelle Ablösungen, Serverräume mit Batchsystemen, doppelte und dreifache Klimaanlagen. Aber man lässt das Backup links liegen. Weder die Installation des Systemes, welche durchaus einen Gegenwert von 10'000.- darstellen kann, noch die Benutzerdaten, die oft unersetzbar sind, werde auf irgend eine Art und Weise gesichert.

Dann ein Posting auf einer der Mailinglisten, die ich verfolge. Ein Adaptec RAID-Kontroller mit einem RAID-5 hat zwei Platten verloren. Ein Zustand, der bei der aktuellen Zuverlässigkeit von Disks leider vorkommen kann. Scheinbar 15 Jahre Informatikerfahrung weg.

Und dann am Montagabend. Ein yum update - dieses Mal nicht von mir - und ein System tat nicht mehr das, was es machen sollte. Ich han äs Bäköp fo hütämorge war meine Antwort. Mein RUBI hat das System am Morgen vor dem Desaster noch erfolgreich gezogen. Per rsync die alte Installation in ein Unterverzeichnis kopiert, das System mit einer Knoppix gebootet, Inhalt von root in ein Sicherungsverzeichnis, die restaurierte Version aus ihrem Unterverzeichnis ins root verschoben, Grub neu installiert und gebootet. Eine Dreiviertelstunde später ist alles wieder so wie es sein sollte.

Einerseits wird die Notwendigkeit von Backup naiv verdrängt. Man hat ja RAID, jetzt keine Zeit, kein Geld für eine gute Lösung. Ein rm, ein defekter Sektor unter den Metadaten des RAID-Kontrollers oder des Filesystemes und ein grosser Berg Daten sind weg.

Andererseits aber auch das Wissen über den Restore. Wer ist heutzutage in der Lage, eine Kopie eines Systemes wieder einzuspielen? Die Partitionierung, die Erstellung eines Filesystemes, das Mounten, das Kopieren von Daten und die Installation eines Bootloaders werden von praktisch allen Distributionen unter einem mehr oder minder schönen GUI versteckt. Löbliche Ausnahme hier Gentoo - was aber nicht heissen soll, dass man nach der Installation eines Gentoos in der Lage ist, sein System ab einem Tape zu restaurieren. Man muss die Vorgänge nicht nur einmal gemacht, sondern auch verstanden haben.

Ich erinnere mich an die AS/400. Da gab es eine Befehlskombination, mit der man das System auf das jeweils mitgelieferte Tape sichern konnte: go save und 21. Das gab ein Band, ab welchem das System gestartet und komplett restauriert werden konnte - ein Manual mit einer Schritt für Schritt Anleitung wurde jedem System in Papierform mitgeliefert. Selbst eine Sekretärin ohne Flair für Informatik war damit in der Lage, ein System nach einem Crash wieder auf die Beine zu bekommen.

Vielleicht brauchen wir eben für Linux ein solches Konzept. Den ersten Teil - ein zuverlässiges Backup - habe ich mit RUBI bereits ausprogrammiert. Jetzt fehlen noch die nötigen Metainformationen wie Partitionierung und Filesysteme für einen erfolgreichen Restore und die CD, mit der das System wieder geholt werden kann.

Permalink

Das Kleingedruckte: Der Besitzer der folgenden Kommentare ist wer immer sie eingeschickt hat. Wir sind in keiner Weise für sie verantwortlich.

  • Re: Das Spiel mit dem Feuer
    Geschrieben von marcel am Dienstag, 15. August 2006, 18:25

    schon mal Mondo ausprobiert?
    http://www.mondorescue.org/


    • beat@0x1b.ch Re: Das Spiel mit dem Feuer
      Geschrieben von Beat Rubischon (Link) am Dienstag, 15. August 2006, 21:36

      Muss ich mir 'mal angucken. Danke für den Link!