sábado, 6 de diciembre de 2025

Cómo apagar correctamente un clúster Nutanix

Recibimos una notificación de que por tareas de mantenimiento eléctrico, van a apagar un CPD enterito, de manera que hay que apagar todo aquello que no sea crítico para liberar los SAI. Da la casualidad que hay un clúster de Nutanix recién montado pero sin máquinas de producción corriendo, así que es un candidato perfecto para ser apagado, lo que nos viene de perlas para hacer un mini tutorial sobre cómo apagar correctamente uno (no, aunque esté recién montado, el botonazo a los host no es un apagado correcto, los servicios del clúster se mosquean un poco). De manera que vamos abriendo nuestra consola de Putty, mRemoteNG, MobaXterm o lo que uséis para establecer conexiones SSH, ¡que empezamos!

¡Lo decía en serio! Lo primero de todo, nos conectamos a una CVM del clúster con nuestro usuario nutanix, y lanzamos el comando "ncc health_checks run_all". Si dan errores, te mostrará los KBs para tratarlos. Si no puedes y el problema persiste, tendrás que abrir un caso a soporte:


En nuestro caso, avisos menores sin KB, asi que seguimos adelante. Lo siguiente seria ver el listado de VMs en el clúster, y verificar que estén apagadas. Podemos verificarlo con el comando "acli vm.list power_state=on" Si no aparece nada, perfecto, es que están apagadas. Como en este caso el clúster no está en producción, no lanzo el comando, porque no hay nada que apagar. Pero lanzamos un "cluster status" con el fin de asegurarnos de que está funcionando correctamente. El comando en la captura superior, y a continuación, el resultado:

Podemos ver que realiza un chequeo nodo por nodo, y finaliza con un Success. Tras esto, ejecutamos un "cluster stop" con el fin de detener los servicios de clúster correctamente previo al apagado.


Cuidadin porque, como podéis ver en la imagen, pide confirmación, no es poner el típico "y" o "yes", si no que hay que escribir "I agree" para que se ejecute. Una vez confirmada la orden, y finalizado el proceso, nos avisará con un "succeed":


Ahora sí, sólo queda conectarnos a cada una de las CVMs e ir ejecutando el comando "sudo shutdown -P now"


A veces la CVM se pone un poco tonta. No suele ser lo habitual, pero tienes dos opciones...esperar unos minutos y volverlo a intentar, o pasar al esta vez ya si, ultimo punto, que es entrar en las IPMIs de los host, y ejecutar el Power Off. Ten en cuenta que la CVM no es mas que la Controller VM, aunque la apagues, el host sigue funcionando así que hay que apagarlo igualmente, o bien físicamente, o bien desde la tarjeta de gestión, nuestra IPMI (ILO para HP, iDRAC para Dell, ya sabes...)

Tienes el proceso completo descrito también en la fantástica documentación de Nutanix, aunque sin tantos detalles con capturas. Puedes verlo AQUI.

No hay comentarios:

Publicar un comentario

¡Gracias por colaborar en este blog con tus comentarios! :)