Task #736
đóngThay disk OS headnode petasan 10.4.44.34
0%
Mô tả
Mô tả: disk OS bị bad sector làm readonly filesystem
Mục tiêu: Thay disk OS lỗi, replace headnode trên GUI Management
Rủi ro có thể gặp:
- OSD trên node bị Down, có thể ảnh hưởng performance
- Replace lỗi
- Rớt card 10G
===
Chuẩn bị: 1 disk SSD SAS 200G cài sẵn petasan cấu hình
IP MGT: 10.4.44.34
Hostname: dl360-g8-ps14
===
Vị trí:
HL DL360G9 U14 rack B4 DC7-2¶
Thực hiện
- Backup config
- network define trên /etc/rules.d/70-persistent-net.rules
c SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="38:ea:a7:8d:93:2a", ATTR{type}=="1", KERNEL=="eth*", NAME="eth2" SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="38:ea:a7:8d:93:2b", ATTR{type}=="1", KERNEL=="eth*", NAME="eth3" SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:16:31:f2:46:2f", ATTR{type}=="1", KERNEL=="eth*", NAME="eth7" SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:16:31:f2:46:2e", ATTR{type}=="1", KERNEL=="eth*", NAME="eth6" SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="38:ea:a7:8d:93:28", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0" SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="38:ea:a7:8d:93:29", ATTR{type}=="1", KERNEL=="eth*", NAME="eth1" SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="90:e2:ba:84:4b:e3", ATTR{type}=="1", KERNEL=="eth*", NAME="eth5" SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="90:e2:ba:84:4b:e2", ATTR{type}=="1", KERNEL=="eth*", NAME="eth4"
- /etc/hosts
- /etc/resolv.conf
/etc/ntp.conf
Thực hiện Maintenance Cluster
OFF Server / Thay disk boot
ON Server, kiểm tra phần cứng nhận đủ
Restore network config, các file /etc/resolv.conf , /etc/hosts, /etc/ntp.conf / Reboot lại server
Kiểm tra ping MGT đến các headnode còn lại 10.4.44.34
Replace Management Node trên GUI PETASAN
Link hướng dẫn: https://projects.longvan.net/projects/lvss/wiki/006-petasan-replace-management-loiKiểm tra host nhận lại, service OSD UP OK
Exit Maintenance, theo dõi và báo cáo
===
Đã thay disk OS và replace headnode, tất cả service ceph OK, cluster OK
Tập tin