部署过ceph的pve节点故障,如何踢出集群 A、在正常节点上踢出故障节点 查看集群成员 + 查看集群状态 pvecm nodes pvecm status 在pve集群中删除故障节点 pvecm delnode $hostname 删除 故障节点的 ceph节点中故障的 mon信息(前提是有的话) ceph mon remove $hostname 删除故障节点 ... 辣条①号 CEPH维护类 2023年 3月 23日 645 次浏览 0 阅读全文
pve方式标准化部署ceph集群 A、总体规划 A1、设备规划 主机名 业务管理网 存储网 硬盘 pve-ceph01 10.15.11.198/24 10.99.99.1/24 3SSD+4HDD pve-ceph02 10.15.11.109/24 10.99.99.2/24 3SSD+4HDD pve-ceph03 10.15.11.78/24 ... 辣条①号 CEPH部署类 2023年 3月 23日 1,340 次浏览 0 阅读全文
ceph之mon常见故障处理方式 A、删除失效mon root@cunchu4:~# ceph -s cluster: id: xxxxxxxxxxxxxxxxxxxxxxx health: HEALTH_WARN 1/4 mons down, quorum cunchu2,cunchu3,cunchu4 root@cunchu4:~# ceph mo ... 辣条①号 CEPH故障类 2023年 3月 22日 279 次浏览 0 阅读全文
ceph常见WARN告警的处理方式 附:IBM关于ceph的故障类文章 https://www.ibm.com/docs/en/storage-ceph/6?topic=storage-setting-crush-location-daemons 1、类别:Too many repaired reads 解决办法:重启对应的OSD 2、类别:recent ... 辣条①号 CEPH故障类 2023年 3月 22日 1,123 次浏览 0 阅读全文
ceph常见ERROR告警处理方式 1、类别:scrub errors,pg inconsistent #故障现象: root@ceph01:~# ceph health detail HEALTH_ERR 1 scrub errors; Possible data damage: 1 pg inconsistent [ERR] OSD_SCRUB_ER ... 辣条①号 CEPH故障类 2023年 3月 22日 992 次浏览 0 阅读全文
ceph常用运维命令 systemctl管理命令[host级别] systemctl stop|start ceph.target #启动|停止所有ceph进程 systemctl start ceph-mon.target #启动mon进程 systemctl start ceph-osd.target #启动所有osd进程 system ... 辣条①号 CEPH维护类 2023年 2月 4日 441 次浏览 0 阅读全文