Problemy z vSphere Data Protection

Ostatnio przygotowywałem w labie środowisko testowe vCloud Director dla klienta. Dla bezpieczeństwa – po zakończeniu konfiguracji – włączyłem backup poprzez vSphere Data Protection i udałem się na spokojny weekend. To co zastałem w poniedziałek rano było straszne. Maszyny wirtualne z systemem Windows zostały zdemolowane.

vSphere Data Protection

Spróbuję na początek nakreślić trochę scenariusz grozy

Dość stare środowisko LAB składało się z kilku hostów oraz oprogramowania w wersjach jak poniżej:

  • vSphere Data Protection 6.0.2.4
  • ESXi 5.1 (build 1483097)
  • vCenter 5.1.0 (build 1473063)

Jak zauważyłeś – nic nadzwyczajnego. Środowisko Demo vCloud Director dla klienta powstało w formie kilku maszyn wirtualnych.

To czego nikt się nie spodziewał – to problemy jakie napotkał vSphere Data Protection z tą dokładnie wersją serwerów ESXi. Oczywiście wszystko z grubsza zostało sprawdzone w macierzy kompatybilności, która jasno powiedziała że będzie wszystko działać.

VDP_602_compatible

Samo VDP także nie stawiało żadnych oporów podczas instalacji i konfiguracji… Baa nawet testowy backup i odzyskanie wirtualnych maszyn z Linuxem powiodło się.

Skonfigurowany harmonogram na codzienny backup i lecimy na weekend.

Niestety nikt nie sprawdził jak zachowa się backup podczas kopii zapasowej maszyn z Windowsem wykorzystując wyciszanie systemów plików (quiesce).

Okazało się że para VDP i ESXi w tych dokładnie wersjach powoduje odpinanie i podpinanie dysków twardych od serwerów podczas wykonywania kopii zapasowej. Rezultatem operacji były straty danych, brak możliwości dokończenia zapisów na serwerach Microsoft SQL oraz Microsoft AD.

VDP_disk_surprise_removed

VDP_failed_transaction_log

Na koniec – powtórzenie tego wszystkiego kilka razy przez weekend doprowadziło do stanu kompletnej bezużyteczności środowiska Demo – o czym dowiedziałem się dopiero w poniedziałek rano.

Pozostało zatem zweryfikować czy pierwsza kopia zapasowa wykonała się poprawnie – dokładnie tak było – środowisko zostało „na szybko” odzyskane z VDP i przywrócone do pracy. Prezentacja się odbyła, ale stresik nas nie ominął.

Po zakończeniu – można było poświęcić czas na głębszą analizę. Udało się znaleźć artykuł bazy wiedzy („Creating a quiesced snapshot of a Windows virtual machine generates Event”). Niestety opis rozwiązania lekko nas zaskoczył. Tłumacząc na język polski – jest to znany problem, ale nie ma w chwili obecnej jego rozwiązania („This is a known issue affecting VMware ESXi 4.x, 5.x, and 6.0. Currently, there is no resolution.”).

Niezła niespodzianka!

Wnioski

  1. Czytaj wszystkie KB 😀
  2. Testuj backupy zarówno na maszynach Linux i Windows
  3. Aktualizuj środowiska Labowe!

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *