Recovery am Produktivsystem

Diesen Beitrag schrieb ich 14 Jahre und 9 Monate zuvor; die nachfolgenden Ausführungen müssen heute nicht unbedingt noch genau so funktionieren. Behalte das beim Lesen (und vor allem: beim Nachmachen!) bitte stets im Hinterkopf.

Geschätzte Lesezeit: 1 Minute

Ein Root-Server. Achtundsiebzig (in Ziffern: 78) Präsenzen. Entsprechend viele Mailadressen. Und der Server läuft nicht.

Der Besitzer: entsprechend frustriert und angespannt. Warum geht das nicht? Schon vor $WEILE Anfrage an den Support gestellt, keine Antwort bekommen. Plesk bringt lediglich folgende Fehlermeldung: 0: /usr/local/psa/admin/htdocs/domains/databases/db.php3:19 psaerror(string "Domain id is undefined"). Mit dem internen Bearbeitungsstand und den Notizen des Vorgesetzten kann ich nicht viel anfangen; der Kunde indes ist hinreichend verzweifelt – und gibt mir root-Zugang zu seinem System.

Alles in allem war es dann eine Sache von etwa 11 Minuten; da ich mit df, du etc. umgehen kann hatte ich relativ schnell raus, dass schlichtweg /usr auf 100% stand… Eigentlich seltsam aber… stocher… Plesk legte unter /usr/local/psa/var/log zwei Logfiles an: maillog und xferlog. Letzteres war harmlos, ersteres hatte etwa 3GB und wurde seit Anfang 2005 kontinuierlich beschrieben. Also beide in einen Tarball gepackt, auf eine quasi leere Partition ausgelagert, die beiden Logfiles wieder ge-touch-ed… Und siehe da: /usr ist nun auf 22%, und der Kunde, der Plesk eifrig gegentestete, konnte nur feststellen: „ES FUNKTIONIERT WIEDER!!“

Abschließend äußerte er Bewunderung ob meiner Kenntnisse und Umsicht und fragte mich, ob er mir was Gutes tun könne? – Ja, Mann. Besorg’ mir einen vernünftigen Job. Du merkst doch, dass ich mehr kann…