Dự án

Tổng quan

Hồ sơ

Task #585

Cập nhật bởi Tùng Nguyễn cách đây 8 tháng

Mô tả: xảy ra tình trạng 1 vài repo bị mất khi restart lại pod gitaly 
 Qua kiểm tra hiện trạng, thì gitlab service trên cụm k8s prod hiện đang kết nối đến Postgre và Redis được tạo trước đó. 
 PostgreSQL: tạo theo statefulset với mode standalone  
 Redis: dạng statefulset với mode replication 
 ==== 
 18/3 
 Redis đang có 1 replica lỗi ko start được 
 ![](clipboard-202403181803-iblhr.png) 

 === 
 19/3 
 Lỗi trên do file AOF bị corrupted cần chạy redis-check-aof --fix 
 Do container không thể start nên phải thực hiện cài đặt redis-tools trên node k8s đang mount rbd volume đó 
 ![](clipboard-202403191746-psmc9.png) 
 Chạy command 
 ![](clipboard-202403191747-euhye.png) 

 Sau đó start lại pod, có thể sẽ xuất hiện lỗi "Found an empty aof manifest" 
 Từ Redis 7.0 thì cấu trúc AOF gồm 3 file 
 base.rdb 
 incr.aof 
 appendonly.aof.manifest 
 nội dung file appendonly.aof.manifest bị trống thì edit lại lưu ý seg ID như hình 
 ![](clipboard-202403191753-bmqn7.png) 
 ``` shell 
 file appendonly.aof.2510.base.rdb seq 2510 type b 
 file appendonly.aof.2510.incr.aof seq 2510 type i 
 ``` 
 Lưu lại và start lại pod 
 ![](clipboard-202403191758-qnwat.png) 



 


Quay lại