Nawigacja okruszkowa Nawigacja okruszkowa

Widok zawartości stron Widok zawartości stron

Awaria jednego z węzłów klastra

W nocy z 25 na 26 stycznia 2012 roku miała miejsce awaria jednego z węzłów klastra HA, w ramach którego realizowany jest nowy testowy portal uniwersytecki, p2.dev.zpu.uj.edu.pl. Awaria polegała na utracie przez węzeł łączności z macierzą dyskową, co spowodowało zawieszenie się wszystkich działających na tym konkretnym węźle usług, w tym usługi p2.dev.zpu. Z powodu specyfiki awarii nie zadziałał mechanizm automatycznej migracji usług (awaria nie została wykryta przez oprogramowanie monitorujące). Po wykryciu awarii i ręcznym wyłączeniu problematycznego węzła, usługi przez niego realizowane, zostały automatycznie odtworzone na drugim z węzłów, a po usunięciu awarii automatycznie zmigrowane na odpowiedni węzeł macierzysty. Przyczyna awarii została zdiagnozowana jako błąd w sterowniku karty sieciowej. Mamy nadzieję, że aktualizacja sterownika w nadchodzącym oknie serwisowym pozwoli uniknąć takich awarii w przyszłości.

Data opublikowania: 27.01.2012
Osoba publikująca: Tomasz Orzechowski