Gandi tłumaczy awarię swojego serwera. Zawiódł ZFS

Gandi tłumaczy awarię swojego serwera. Zawiódł ZFS29.01.2020 01:02
Gandi tłumaczy awarię swojego serwera (fot. Pixabay)

Operator DNS i usługodawca hostingu Gandi doświadczył na początku roku (ósmego stycznia) awarii jednego ze swoich magazynów pamięci stałej (storage unit). Ucierpiało na tym do 414 klientów, korzystających między innymi z IaaS – infrastruktury jako usługi. O sprawie głośniej jest dopiero teraz, ponieważ firma wydała szczegółowe i bardzo interesujące oświadczenie dotyczące problemu.

BSD + ZFS

W swoim IaaS Gandi stosuje system FreeBSD oraz potrójny mirroring macierzy dyskowych zapewniany przez system plików ZFS. System ten pozwala klientom infrastruktury na robienie migawek. Należy tutaj zaznaczyć, że migawki i nadmiarowe macierze dyskowe nie są mechanizmem tworzenia kopii zapasowych. To metoda zwiększania dostępności (high availability), a nie bezpieczeństwa danych. Jest w tym subtelna różnica.

Po awarii jednego z serwerów przechowywania stan macierzy był niemożliwy do przywrócenia, ponieważ sama pula ZFS raportowała uszkodzenie. Wymiana sprzętu i wymuszenie importu puli doprowadziło do sytuacji, w której odbudowa znanego stanu trwała tak długo, że wymagałaby 370 godzin na ukończenie.

Stara implementacja

Dokumentacja oferowała opisy parametrów potencjalnie przyspieszających odnalezienie spójnego stanu, ale wersja użyta w Gandi była za stara i nie implementowała ich. Zapadła decyzja, by sprzęt z pulą podpiąć do nowego serwera, z nowszą wersją ZFS. Użyto linuksowej implmenetacji (ZOL). Gandi przytacza ustawienia, które zmodyfikowano celem uniknięcia przejść przez całą pulę i zapewnienia trybu tylko-do-odczytu. ZOL poradził sobie z odbudową puli, ale przywrócenie danych i sprawności infrastruktury zajęło aż cztery dni (!)

Expect the unexpected

Gandi miało nieprzyjemność wpaść w ciekawy scenariusz problemowy. Zastosowany system ZFS i potrójny mirroring (ponad połowa dysków w macierzy może umrzeć i nic się nie stanie) zapewniały łatwą odbudowę w razie awarii oraz szybko dostępne migawki dla spokoju sumienia. Problem, nieznanej zresztą genezy, wywołał jednak awarię metadanych, a na to ZFS nie był odporny tak od razu. Użycie od razu nowszej jego wersji, przyspieszającej odbudowę, doraźnie rozwiązałoby problem klientów, ale wciąż nie adresowało słabości, jaką była awaria metadanych.

To doskonały przykład trudności projektowania mechanizmów odtworzenia po katastrofalnych awariach (disaster recovery, DR). Konieczność postawienia granic w nadmiarowości może poskutkować pominięciem niektórych rzadkich, dziwnych scenariuszy. Nawet jeżeli ktoś w zespole pomyślał o potencjalnym problemie z metadanymi, bardzo możliwe, że odpowiedzią było "no ale na czymś przecież musimy polegać! Jasne, że może się wyłożyć rejestr metadanych, mogą też się popsuć wszystkie dyski w macierzy, może od razu wybudujmy dwie serwerownie?".

Tymczasem powód awarii dalej jest nieznany. Sprzęt okazał się sprawny. Po prostu struktura logiczna danych nagle odmówiła posłuszeństwa. A Gandi prawdopodobnie nie jest jedyną firmą nieposiadającą dokumentu "Procedura Odzyskiwania Danych na ewentualność absurdalnego problemu z integralnością, bez sensownych wytłumaczeń".

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.