Task #617
Cập nhật bởi Tùng Nguyễn cách đây 12 tháng
Hiện trạng: Storage đang thiếu dung lượng cho Backup Mail và Backup Core pool FPT-HCM  Link hiện trạng storage: https://docs.google.com/spreadsheets/d/1euil2yZ0S6TwR1ZOKru79nLmPWdUpGIAeUsTbe0SoKk/edit#gid=529683622 Link hiện trạng Ceph CMC-Q7: https://docs.google.com/spreadsheets/d/1euil2yZ0S6TwR1ZOKru79nLmPWdUpGIAeUsTbe0SoKk/edit#gid=2130708949 Mục tiêu: bổ sung dung lượng cho các pool - Quy hoạch chuyển dữ liệu Backup FPT-Q7 qua CMC-Q7 - Chuyển dữ liệu S3 cũ FPT qua cluste S3 mới CMC ===== Chuẩn bị thiết bị: 5 Server Hyve Cygnus 1U - 32G RAM UDIMM - CPU E3-1230v2 có sẵn trong server - 24 disk HDD SATA 12T - 5 Disk boot sử dụng 100G-200G-400G - Card 10G + Raiser Cấu hình thông tin ứng với các server mới: https://docs.google.com/spreadsheets/d/1euil2yZ0S6TwR1ZOKru79nLmPWdUpGIAeUsTbe0SoKk/edit#gid=361178597 === Thao tác: 1. Chuẩn bị rack mới CMC-Q7 2. Chuẩn bị switch cấu hình thông network 3. Chuyển 7 server pool S3 từ rack G8 qua rack mới: vị trí được note trên netbox https://netbox.longvan.net/dcim/rack-elevations/?region_id=5&site_id=17  Đồng thời thực hiện bổ sung thêm RAM cho 7 server chi tiết như sau: --3 - 3 server D51PH-ULH cắm thêm mỗi node 64G -- - 4 server SD1Q cắm mổi node 16G 4. Lắp mới 7 server Hyve Cygnus ở rack mới, vị trí note trên netbox 5. Cấu hình Join Cluster các server mới 6 Set config: "ceph config set osd osd_crush_initial_weight 0 --force" mục đích các osd mới add vào cluster sẽ không resync data tránh ảnh hưởng performance, do mặc định crush rule đang lấy device class hdd 7. Add các OSD với disk 12T 8. Tạo pool Data mới ứng với giai đoạn: https://docs.google.com/spreadsheets/d/1euil2yZ0S6TwR1ZOKru79nLmPWdUpGIAeUsTbe0SoKk/edit#gid=799476222 9. Bổ sung thêm NFS GW https://docs.google.com/spreadsheets/d/1euil2yZ0S6TwR1ZOKru79nLmPWdUpGIAeUsTbe0SoKk/edit#gid=1974024134 10. Thực hiện kết nối đến server và move Data https://docs.google.com/spreadsheets/d/1Y872cpXWm9ETyZhP0HtCQQ5hQCFkTlXxBcLpimuAg64/edit#gid=132893193 11. Kiểm tra, báo cáo === Rủi ro: 1. Thực hiện chuyển server ảnh hưởng performance 2. Lỗi disk boot 3. Lỗi Server 4. Lỗi card 10G 5.