Awaria serwera

April 10, 2008blog archive3 min read

Niektórzy pewnie zauważyli, że strona była przez ostatnie dwa dni chwilowo niedostępna. Niedostępność ta była spowodowana przez awarię serwera u mojego dostawcy hostingu. Uszkodzeniu uległa macierz dysków twardych. RAID zawiódł i nie dało się w prosty sposób przywrócić danych. Admini odzyskali dopiero dane z kopii zapasowej z poprzedniego dnia.

Jak teraz patrzę na komunikaty to wygląda to trochę przerażająco i trochę śmiesznie. Oto dlaczego:

08-04 18:28 - The server is not responding well and we have issued a reboot. Sorry for the inconveniences caused. It will be on-line shortly

Czyli serwer nie odpowiada, standardowo go zrestartujemy i będzie ok zaraz…

08-04 20:16 - A drive has failed and a second one has degraded in the RAID array - a very rare and unfortunate situation. We’re going to be swapping in a new drive immediately to rebuild the array.

Nawaliły dyski w macierzy RAID. Rzadki, nieszczęśliwy wypadek. Wymienimy dysk na nowy i przebudujemy macierz.

08-04 21:28 - It appears that the array is not recoverable and we’ll need to replace the drives, array, and file system this evening. (we have an OS backup from last night) It is strongly recommended that you back up as much data as possible right away. We’ll keep you posted through the evening with the status.

Wygląda na to, że nie da się naprawić i odtworzyć macierzy. Wymienimy wszystko na nowe. Lepiej zróbcie backup.

09-04 18:47 - Unfortunately the initial restore failed at the last minute due to a corrupted backup image. While we were hoping this announcement would be good news, unfortunately there will be more delays as we’re going to have to try a restore from a previous backup. If that doesn’t work we will try a file-based restore and go from there.

Obraz kopii zapasowej też nie jest do końca w porządku. Musimy poszukać czegoś innego. Ewentualnie spróbujemy ręcznie odtworzyć system i dane z plików. Zajmie to trochę więcej niż przypuszczaliśmy (nawet 24h)

09-04 21:44 - As a file-based restore is underway now you may see a blank page or blank directory on your site or a 503 (Service Temporarily Unavailable) error if you’re on Mongrel. That doesn’t mean your site has vanished, it just means your /home/username directory hasn’t restored yet. We’ll be restoring /home as fast as possible, and while we cannot control the order in which they are restored, we will try to get mongrels up and ensure sites are working as they come up. Again, thank you for your patience and we’ll keep you posted.

Wreszcie udało nam się zacząć odtwarzać system. Potrwa to trochę długo. Wasz katalog /home nie zniknął tylko nie został jeszcze odtworzony. Dziękujemy za cierpliwość… Blah, blah…

Uf… :) coż - uroki shared hostingu za oceanem.

You may also like the following content