Sostituire un disco rotto in RAID1 software con mdadm

Schema mirroring RAID1Un paio di giorni fa abbiamo ricevuto la notifica via email dal daemon di un server Debian GNU/Linux che ci informava senza alcun tatto di un disastro imminente. Il server in questione gestisce due dischi da 500GB/15k in RAID1 software ed uno dei due dischi ha deciso di fare testamento e mettersi in cammino per l’ultima, ineluttabile destinazione. La notifica non lasciava dubbi: la sincronizzazione con il disco /dev/sda non era più possibile a causa di ripetuti errori nella gestione della partizione /dev/sda1, urgeva quindi la sostituzione del disco.

L’intervento è andato liscio come l’olio, pertanto lo appunto qui a vantaggio di tutti, cercando di essere il più sintetico possibile.

Ecco i passaggi che hanno rimesso a nuovo il server:

1) per prima sono state marcate come failed le partizioni sda1 e sda2

mdadm --manage /dev/md0 --fail /dev/sda1
mdadm --manage /dev/md1 --fail /dev/sda2

2) poi le stesse partizioni sono state rimosse dai relativi array:

mdadm --manage /dev/md0 --remove /dev/sda1
mdadm --manage /dev/md1 --remove /dev/sda2

3) fatto questo, il server è stato spento e il disco sostituito:

shutdown -h now

4) una volta riavviato il server, sul nuovo disco sda sono state ricostruite le medesime partizioni presenti sul disco sdb:

sfdisk -d /dev/sdb | sfdisk /dev/sda

5) infine, sono stati aggiunti nuovamente le due partizioni all’array:

mdadm --manage /dev/md0 --add /dev/sda1
mdadm --manage /dev/md1 --add /dev/sda2

6) il resto del lavoro lo ha fatto egregiamente il server per conto suo, ricostruendo e rimettendo in pair il nuovo disco in circa 4 ore, durante le quali non è stato necessario interrompere in alcun modo il lavoro di chi quel server lo utilizza massicciamente per la gestione di progetti industriali…

… poi dicono che Linux è troppo difficile da utilizzare, va là va là… 🙂

Condivido

Leave a comment