Dự án

Tổng quan

Hồ sơ

Task #919

Cập nhật bởi Hiếu Nguyễn Phùng cách đây 5 tháng

HOST 10.6.10.32 bị lỗi treo host  
 Chuẩn bị 1 node thay thế 
 Stress test kiểm tra, lên quy trình thay thế node 

 =============================================================== 
 Phần alarm bình thường, có thể xử lý thay thế host: 
 ![](clipboard-202407121207-zvq5i.png) 
 Quy trình thay thế: 
 B1: Chuẩn bị 1 node Dell C6220 
 128GB RAM 
 CPU E5 2650 
 Stresstest 
 Set IPMI: 10.6.7.32 
 B2: Chỉnh Maintenance mode cho host 32 
 B2: OFF node 
 B3: Rút node lỗi để chuyển thiết bị sang node mới 
 - Chuyển CPU, usb boot của node cũ. 
 - RAM đẫ cắm đủ 128GB 
 - Card 10GB nhận đủ 
 B4: Cắm node đã thay thế vào chassis 

 B5: Kiểm tra tài nguyên đảm bảo nhận đủ 

 B6: Vào vcenter kiểm tra node đã kết nối lại 
 - Duy trì node ở mode maintenance 
 - Kiểm tra disk nhận đủ 
 - Kiểm tra diskgroup kết nối lại, nhận đủ disk trên vsan 
 - Kiểm tra resync 
 - Theo dõi node ổn định, thoát mode maintenance 

 ===================================== 

 Theo dõi host mới thay thế hoạt động ổn định 
 log IPMI báo nhiệt độ: 
 ![](clipboard-202407150924-l8yls.png) 
 Đã sử dụng ipmitool để điều chỉnh mức nhiệt độ cao hơn. 

 ![](clipboard-202407150925-2lygz.png) 
 ![](clipboard-202407150925-a8qvb.png) 

 Tiếp tục theo dõi 

Quay lại