3PAR Shutdown uitgelegd
Voordat je begint moet je er voor zorgen dat alle volumes die geëxporteerd zijn naar de hosts ge-unmount zijn of dat de hosts uitgeschakeld zijn.
Dit omdat uiteraard de volumes niet meer beschikbaar zijn als de 3PAR uit gaat (tenzij je een failover/peer persistence omgeving hebt)
Als het geplanned onderhoud is, dan is het ook nog aan te bevelen om de 3PAR in Maintenance mode te zetten, anders belt HP je namelijk dat er iets aan de hand is 🙂
Er zijn verschillende manieren om een 3PAR uit te schakelen, trek nooit zomaar de stekkers uit een 3PAR Server !
Uitschakelen kan d.m.v. SPOC, SPMAINT of CLI.
Maintenance Mode
Om onderhoud op een 3PAR uit te voeren, dien je de 3PAR in Maintenance Mode te plaatsen.
Dit zorgt er enkel voor dat de 3PAR bij alarmen en meldingen niet naar HP “belt” waarna een medewerker contact met je opneemt om te melden dat er problemen zijn.
Om een 3PAR in maintenance mode te plaatsen volg je onderstaande stappen :
- Login op de SPOCC (Service Processor, fysiek of virtueel)
- Ga links in het menu naar SPmaint
- Kies dan rechts 3. StoreServ Configuration Management
- Klik dan bij Action op Modify
- Zet dan de Maintenance Mode op ON
- Kies dan een Duration dus hoe lang moet de 3PAR in Maintenance Mode staan.
- Klik op Update StoreServ Info om de wijziging door te voeren.
Als dit gebeurd is, kun je verder met je 3PAR onderhoud.
Uitschakelen via SPOCC
Het uitschakelen via de SPOCC (Service Processor) gaat als volgt :
- Log in op de 3PAR Service Processor
- Selecteer StoreServ Product Maintenance
- Selecteer Halt a StoreServ cluster/node
- Volg de instructies voor het uitschakelen van een cluster. Schakel niet de individuele nodes uit.
- Schakel de stroom uit naar de node PCM’s
- Schakel de stroom uit naar de 3PAR server
Uitschakelen via SPMAINT
- Vanuit de 3PAR Service Processor Menu geef 4 in voor StoreServ Product Maintenance
- Selecteer Halt a StoreServ cluster/node
- Volg de instructies voor het uitschakelen van een cluster. Schakel niet de individuele nodes uit.
- Schakel de stroom uit naar de node PCM’s
- Schakel de stroom uit naar de 3PAR server
Uitschakelen via CLI
- Log met bijvoorbeeld Putty in op de 3PAR Server console.
- Voer het commando shutdownsys halt in, bevestig de vragen om door te gaan.
WAARSCHUWING : Indien je niet wacht tot het systeem volledig afgesloten en uitgeschakeld is, kan dit leiden tot een ongecontroleerde shutdown waarbij dataverlies / inconsistentie op kan treden !
Het systeem zal bij inschakelen dan een check gaan uitvoeren wat kan leiden tot onbeschikbaarheid van data naar de hosts tot de check klaar is. - Wacht ongeveer 2-3 minuten tot de nodes gestopt zijn, controleer dan of het lampje Status groen knippert en de Hotplug LED blauw brandt. Indien dit het geval is, is het systeem gestopt.
- Schakel de stroom uit naar de node PCM’s
- Schakel de stroom uit naar de 3PAR server
Uitschakelen van een 3PAR wanneer je Remote Copy gebruikt
Wat verwarrend is, is het feit dat een clean shutdown niet voor een failover zorgt !
Het systeem meldt zich tenslotte netjes af en er is geen sprake van een storing.
Wanneer je Remote Copy gebruikt, zou bij een failover de Read Only LUN’s op de nog actieve 3PAR moeten switchen naar Read/Write waardoor de LUN’s door blijven draaien.
Als je bovenstaande shutdown procedure gebruikt, zal dit niet gebeuren waardoor je storage onderuit gaat met alle gevolgen van dien !
Maar hoe moet je nu onderhoud aan een 3PAR uitvoeren wanneer er geen failover plaatsvindt ?
Hiervoor moeten we iets anders gaan denken qua failover logica :
Een failover is iets wat gebeurd wanneer er iets echt faalt door een defect. Dat is bij normaal onderhoud niet het geval. Er is niets defect, dus hoeft er ook geen failover plaats te vinden.
Bij 3PAR moeten er rekening mee houden dat we vóóraf moeten zorgen voor een veilige omgeving waarop de hosts verder kunnen draaien en daarna pas de 3PAR voor onderhoud kunnen uitschakelen.
In de shutdown procedure moeten we dus nog 1 stap toevoegen !
Als eerste stap moeten ervoor zorgen dat er een geplande “failover” plaatsvindt, een zogenaamde switchover.
Dit kun je doen door in de 3PAR SSMC naar de Remote Copy Groups te navigeren.
Selecteer daar de betreffende RC Group voor de 3PAR die down moet en klik in het Action Menu op Switchover.
Er volgt een scherm met uitleg wat er gebeurd (De RO LUN’s op de target worden Writable gemaakt) en klik nogmaals op Switchover.
Nu volgt een schermpje met de vraag of je dit zeker weet waarbij je aan moet vinken dat je akkoord gaat. Bevestig dit en de switchover zal plaatsvinden.
Je zult in bijvoorbeeld VMware zien dat bij Multipathing de Standby paden nu active zijn. Dat betekend dat de ESX machines geswitched zijn naar de andere 3PAR.
Nu dit gebeurd is, is de IO gestopt op de 3PAR waarop we onderhoud willen uitvoeren.
Voer nu de bovenstaande stappen uit om de 3PAR uit te schakelen en je kunt je onderhoud plegen.
Wanneer het onderhoud klaar is en je de 3PAR weer opgestart hebt en alles in orde, ga je weer naar de SSMC en klik je weer op switchover.
Nu zal er weer een switchover plaatsvinden, de delta’s worden gesynced en de LUN’s worden weer actief op de 3PAR.
Op de ESX machines zie je nu ook weer dat Multipathing weer geswitched zijn.
Het switchen is zodanig snel dat je er niets van merkt !
Maar dit werkt ook alleen als Multipathing goed ingericht is. In dit artikel lees je er meer over.
Vervolgens als je je datastores zo inricht dat Multipathing via Round Robin gaat werkt je failover feilloos.
Geen centje pijn dus, maar wel even een dingetje om rekening mee te houden.
Bij bijvoorbeeld een StoreVirtual cluster kun je gewoon een node uitschakelen (afhankelijk van je config natuurlijk) en de failover gaat automatisch en hoef je er dus niet over na te denken.