• 16-09-2016
  • Technologie serwerowe
  • Grzegorz

Predictive Failure Analysis – Czy można przewidzieć awarię systemu informatycznego?

Wielu użytkowników zastanawia się, czy ich system jest bezpieczny, czy dane wciąż będą dostępne wtedy, kiedy będą ich potrzebować. Istnieje wiele rodzajów zabezpieczeń, pozwalających na zachowanie ciągłości działania systemu IT w przypadku awarii. W większości są to jednak drogie rozwiązania klastrowe lub wykorzystujące wirtualizację. Może lepiej byłoby nie korzystać z nich wcale, zwyczajnie wiedząc o awarii wcześniej i jej przeciwdziałać? Takie możliwości oferuje Predictive Failure Analysis.


Predictive Failure Analisys (PFA) to rozwiązanie, które wykrywa potencjalne awarie jeszcze przed ich wystąpieniem. Jest ono częścią systemu Light Path Diagnostic funkcjonującego w systemach Lenovo. Rozwiązania takie można spotkać w dużych systemach data center, jednak producent udostępnia je również mniej wymagającym użytkownikom, którzy do swojej działalności potrzebują jednego czy dwóch serwerów.

Jak działa Lenovo Predictive Failure Analysis?
Predictive Failure Analysis to rozwinięcie pomysłu IBM, który zakładał informowanie użytkownika o potencjalnej awarii dysków twardych. Przez lata system uległ znacznemu udoskonaleniu i obecnie analizuje o wiele więcej parametrów, potrafiąc wykryć awarię takich komponentów, jak: pamięć, procesor, dyski SSD oraz magnetyczne SAS/S-ATA, wentylatory, zasilacze, czy moduł VRM, odpowiadający za dostarczanie właściwego napięcia dla procesora.

Za pomocą odpowiednich sond i czujników, PFA zbiera dane o zachowaniu poszczególnych komponentów konstruując model ich oczekiwanego oraz przyszłego zachowania. Następnie system porównuje aktualny stan komponentów z modelem ich oczekiwanego zachowania. Jeżeli w działaniu komponentu występują anomalie nie pasujące do modelu wypracowanego przez system, ten uruchamia procedurę informującą o możliwym wystąpieniu awarii komponentu.

PFA może to robić na kilka sposobów, np. za pomocą zainstalowanego na froncie serwera wyświetlacza Light Path Diagnostic Kit – istnieje możliwość przeglądu aktualnego stanu komponentów. Użytkownik może skorzystać również z przejrzystego GUI, gdzie ma dostęp do wszystkich informacji na temat uszkodzonego komponentu oraz logów. Co ciekawe, także po otwarciu obudowy, jeżeli którykolwiek z komponentów działa niewłaściwie lub uległ awarii, diody znajdujące się na płycie głównej informują o stanie komponentu, a jednocześnie wskazują na jego umiejscowienie, dzięki czemu natychmiast odnajdujemy np. uszkodzoną pamięć RAM.

Kiedy i komu takie rozwiązanie może się przydać? Jak wiadomo czas to pieniądz. Każda chwila, kiedy system IT nie działa to stracony czas, który przekłada się na realne koszty ponoszone przez firmę. Tak też PFA jest rozwiązaniem, które znajdzie zastosowanie w zasadzie na każdym szczeblu biznesu; począwszy od małych firm, poprzez średnie posiadające kilka serwerów, aż po te wielkie, gdzie stoją zaawansowane rozwiązania, a każda chwila przestoju kosztuje.

Autor: Adam Grzesiak