Ostatnio przygotowywałem w labie środowisko testowe vCloud Director dla klienta. Dla bezpieczeństwa – po zakończeniu konfiguracji – włączyłem backup poprzez vSphere Data Protection i udałem się na spokojny weekend. To co zastałem w poniedziałek rano było straszne. Maszyny wirtualne z systemem Windows zostały zdemolowane.
Spróbuję na początek nakreślić trochę scenariusz grozy
Dość stare środowisko LAB składało się z kilku hostów oraz oprogramowania w wersjach jak poniżej:
- vSphere Data Protection 6.0.2.4
- ESXi 5.1 (build 1483097)
- vCenter 5.1.0 (build 1473063)
Jak zauważyłeś – nic nadzwyczajnego. Środowisko Demo vCloud Director dla klienta powstało w formie kilku maszyn wirtualnych.
To czego nikt się nie spodziewał – to problemy jakie napotkał vSphere Data Protection z tą dokładnie wersją serwerów ESXi. Oczywiście wszystko z grubsza zostało sprawdzone w macierzy kompatybilności, która jasno powiedziała że będzie wszystko działać.
Samo VDP także nie stawiało żadnych oporów podczas instalacji i konfiguracji… Baa nawet testowy backup i odzyskanie wirtualnych maszyn z Linuxem powiodło się.
Skonfigurowany harmonogram na codzienny backup i lecimy na weekend.
Niestety nikt nie sprawdził jak zachowa się backup podczas kopii zapasowej maszyn z Windowsem wykorzystując wyciszanie systemów plików (quiesce).
Okazało się że para VDP i ESXi w tych dokładnie wersjach powoduje odpinanie i podpinanie dysków twardych od serwerów podczas wykonywania kopii zapasowej. Rezultatem operacji były straty danych, brak możliwości dokończenia zapisów na serwerach Microsoft SQL oraz Microsoft AD.
Na koniec – powtórzenie tego wszystkiego kilka razy przez weekend doprowadziło do stanu kompletnej bezużyteczności środowiska Demo – o czym dowiedziałem się dopiero w poniedziałek rano.
Pozostało zatem zweryfikować czy pierwsza kopia zapasowa wykonała się poprawnie – dokładnie tak było – środowisko zostało „na szybko” odzyskane z VDP i przywrócone do pracy. Prezentacja się odbyła, ale stresik nas nie ominął.
Po zakończeniu – można było poświęcić czas na głębszą analizę. Udało się znaleźć artykuł bazy wiedzy („Creating a quiesced snapshot of a Windows virtual machine generates Event”). Niestety opis rozwiązania lekko nas zaskoczył. Tłumacząc na język polski – jest to znany problem, ale nie ma w chwili obecnej jego rozwiązania („This is a known issue affecting VMware ESXi 4.x, 5.x, and 6.0. Currently, there is no resolution.”).
Niezła niespodzianka!
Wnioski
- Czytaj wszystkie KB 😀
- Testuj backupy zarówno na maszynach Linux i Windows
- Aktualizuj środowiska Labowe!