W celu świadczenia usług na najwyższym poziomie stosujemy pliki cookies. Korzystanie z naszej witryny oznacza, że będą one zamieszczane w Państwa urządzeniu. W każdym momencie można dokonać zmiany ustawień Państwa przeglądarki. Zobacz politykę cookies.
Powrót

Wysoka dostępność (High Availability) systemów informatycznych w jednostkach realizujących zadania publiczne - korzyść czy przeszkoda?

Wysoka dostępność systemu informatycznego jest powszechnie wymagana od rozwiązań funkcjonujących w jednostkach publicznych. To wynika przede wszystkim z potrzeb klientów tych jednostek. W tym wymiarze potrzeby odbiorców usług są oczywiste. Każdy chce załatwić swoje sprawy on-line o dowolnej porze. Tym samym system informatyczny, która zapewnia dostęp do usługi, musi być dostępny przez cały czas. Oczywiście dostępność systemu na poziomie 100% nie jest możliwa, dlatego przy jego projektowaniu przyjmujemy poziom dostępności, który system musi zachować.

Najczęściej dostępność systemu szacuje się w przedziale od 90% do 99,9999%. Im dla systemu zakłada się wyższe SLA (Service Level Agreement), tym droższe jest jego zaimplementowanie i utrzymanie.
W tym właśnie miejscu ujawnia się podstawowa różnica między systemem informatycznym działającym w podmiocie komercyjnym a tym, który funkcjonuje w podmiotach realizujących zadania publiczne. Polega na tym, że wzrost oczekiwań dostępności systemu od poziomu 90% do 99,9999% powoduje wzrost kosztów wdrożenia i kosztów utrzymania w postępie geometrycznym. Podmioty komercyjne mogą oszacować stratę finansową, którą spowodowała niedostępność systemu informatycznego przez np. 1 godzinę i przeliczyć to na wzrost kosztów systemu informatycznego spowodowany zwiększaniem poziomu SLA o kolejny punkt procentowy. Analiza wzrostu kosztów spowodowanych zwiększeniem SLA systemu o kolejny punkt procentowy, poprzez zastosowanie technologii HA, w porównaniu do potencjalnego spadku kosztów przestoju systemu na skutek zwiększenia SLA (wdrożona technologia zmniejsza ryzyko przestoju), pozwala wyznaczyć punkt równowagi pomiędzy kosztami inwestycji a korzyściami z niej. Podmioty publiczne nie mogą tak łatwo policzyć kosztów spowodowanych niedostępnością systemu. Dlatego często wskazują na etapie projektowania systemu jak najwyższy poziom SLA. Jest to powszechne, gdy projekt może uzyskać dofinansowanie ze środków Unii Europejskiej. Wtedy wnioskodawcy często starają się wskazać poziomy 99% i wyższe. Ma to podnieść atrakcyjność projektu w oczach oceniającego dokumentację konkursową. Często wnioskodawcy nie zdają sobie sprawy z kosztów utrzymania systemów, w których zaimplementowano zaawansowane rozwiązania HA. Mimo to w studium wykonalności zobowiązują się utrzymać rozwiązania z własnych środków. Jest to z punktu widzenia oceniającego trudne do podważania, dlatego projekt może uzyskać pozytywną ocenę w kryterium dotyczącym jego trwałości.

Pomysłodawcy projektów informatycznych z jednej strony starają się przedstawić jak najwyższe SLA systemu, z drugiej strony w opisie projektu podają jedynie bardzo ogólne informacje dotyczące tego, co „kryje” się pod określeniem HA. Samo pojęcie HA dla systemu informatycznego jest bardzo szeroko rozumiane. Można je rozpatrywać w wielu warstwach systemu:

  1. fizycznej infrastruktury technicznej data center – zasilanie energią elektryczną, systemy klimatyzacji, ochrona dostępu czy systemy PPOŻ
  2. sieci LAN i routingu L3
  3. serwerów fizycznych, macierzy dyskowych czy sieci SAN
  4. serwerów logicznych (usługowych) – aplikacyjnych, baz danych, infrastrukturalnych (np. system uwierzytelniania)
  5. monitorowania całej infrastruktury
  6. rozwiązań organizacyjnych w administrowaniu systemem

Dopiero wysoka dostępność na wszystkich tych poziomach daje podstawę do określenia SLA systemu na poziomie powyżej 95%. Przy takim SLA niedostępność systemu w ciągu roku to łącznie maksymalnie ok. 18 dni. Poziom 99% oznacza już niedostępność jedynie przez 3 dni w roku. Zaplanowanie systemu, którego łączny czas niedostępności w ciągu roku wynosi 3 dni, z zaplanowanymi przestojami w związku z aktualizacją poszczególnych składników całego rozwiązania, oznacza brak jakichkolwiek awarii, które nie pozwalają korzystać z usług.

Doświadczenie administratorów systemu pokazuje, że najczęściej awarie wynikają z awarii podstawowych elementów systemu, czyli:

  • braku zasilania energią elektryczną
  • uszkodzenia fizycznych połączeń pomiędzy węzłami sieci, np. uszkodzenie kabla światłowodowego lub skrętki UTP
  • uszkodzenia serwerów fizycznych

Zabezpieczenie przed takimi awariami podnosi SLA o klika punktów procentowych, nawet do poziomu 95%. Samo rozwiązanie HA może spowodować brak dostępności systemuDlatego. Bardzo często zdarza się, że zawodzą mechanizmy kontrolne poprawności funkcjonowania funkcjonalności HE i przy braku awarii fizycznych elementów systemu system staje się niedostępny. W zaawansowanych rozwiązanych HA pojawia się jeszcze jedna grupa problemów, które są trudne do rozwiązania. Wdrożenie zaawansowanych mechanizmów HA na wielu warstwach systemu komplikuje cały system. Ta złożoność sprawia, że:

  • Testy prawidłowości funkcjonowania systemu możemy prowadzić praktycznie w środowisku produkcyjnym, przy ryzyku niepowodzenia testu i zatrzymania całego systemu. Trudno zapewnić sobie środowisko testowe, niezależne od środowiska produkcyjnego, z powodu wysokich kosztów.
  • Wgrywanie aktualizacji jest bardzo skomplikowane i złożone. To negatywnie wpływa na możliwości rozwoju systemu.
  • Rozwiązanie tego typu nie są powszechne. Często jego wdrożenie sprawia, że administrator systemu, mimo szkoleń w zakresie administracji daną technologią, przy minimalizacji ryzyka przestoju systemu nie ma możliwości zdobycia doświadczenia, które pozwoli mu szybko i skutecznie diagnozować problem w chwili awarii. Dlatego trzeba podpisać umowy serwisowe z firmą, która często wdraża podobne rozwiązania w różnych konfiguracjach. To pozwala takim wdrożeniowcom zdobyć doświadczenie w diagnozowaniu systemu. Oznacza to wysokie koszty utrzymania systemu.

Z tego powodu może dziwić, że wnioskodawcy wskazują w studium wykonalności chęć zdublowania wszystkich elementów infrastruktury informatycznej, by zapewnić wysoką dostępność systemu. W kontekście opisanych problemów przedstawianie w dokumentacji konkursowej jedynie ogólnych faktów dotyczących dostępności systemu może rodzić problemy na etapie prowadzenia kontroli realizacji projektu. Może się bowiem zdarzyć, że osoba kontrolująca produkty zażąda od wnioskodawcy zaprezentowania implementacji HA na każdym poziomie, który wcześniej przedstawiono. Różnica poglądów między osobą kontrolującą projekt a wnioskodawcą może doprowadzić do nałożenia kar finansowych i długotrwałego procesu odwoławczego.

Przy określaniu SLA systemu informatycznego skup się przede wszystkim na podstawowych obszarach infrastruktury informatycznej. W ten sposób przy niewielkich nakładach osiągniesz wysoki poziom dostępności, adekwatny do charakteru świadczonych usług. Rozwiązania w tych obszarach są utrwalone na rynku, co skutkuje ich niewielką awaryjnością. Zainwestuj w bardziej złożone rozwiązania HA, jeśli masz świadomość zagrożeń, jakie to niesie, a przede wszystkim akceptujesz wysokie koszty utrzymania systemu.

 

Autor: Wojciech Ciesielski

{"register":{"columns":[{"header":"Pozycja","value":"124","registerId":20735334,"dictionaryValues":[],"nestedValues":[],"showInContent":false,"positionSelector":".article-area__article h2","insertMethod":"after"},{"header":"Obszar publikacji","value":"","registerId":20735334,"dictionaryValues":[{"id":"aspekty techniczne/technologie IT","value":"aspekty techniczne/technologie IT"},{"id":"rozwiązania IT","value":"rozwiązania IT"}],"nestedValues":[],"showInContent":false,"positionSelector":".article-area__article h2","insertMethod":"after"}]}}