ceph常见故障之(系统重启后,因lvm信息丢失 OSD无法启动) 其他人也遇到过该问题 请点击该处查看 手动调试,启动osd(失败) root@node16072:~# /usr/bin/ceph-osd -f --cluster ceph --id 0 --setuser ceph --setgroup ceph 2023-05-04T21:39:39.250+0800 7f8d9 ... 辣条①号 CEPH故障类 2023年 6月 25日 39 次浏览 0 阅读全文
ceph常见故障之(dd直接破坏osd磁盘,导致osd无法重建) 问题现象 dd直接破坏osd的物理磁盘,会导致无法重建osd 问题原因 dd直接破坏osd后,会残留lvm信息,(lvscan 看不到,lsblk 或者dmsetup ls 可以看到残留信息)无法正常创建重新创建osd 处理方法 需要使用下面的命令删除残留后,才能正常创建osd dmsetup remove ceph- ... 辣条①号 CEPH故障类 2023年 6月 25日 15 次浏览 0 阅读全文
CEPH常见故障之(如何处理因osd full导致的ceph集群停服) osd 什么时候会达到full 状态 问1:osd 什么时候会出现full 答1:默认情况下osd写入达到85% 出现nearfull、达到90% 出现backfillfull、达到95% 出现full。 问2:如何查看osd的写入量 答2:执行命令:ceph osd df tree 问3:如何查看osd默认的这三个值 ... 辣条①号 CEPH故障类 2023年 4月 21日 108 次浏览 0 阅读全文
ceph之mon常见故障处理方式 A、删除失效mon root@cunchu4:~# ceph -s cluster: id: xxxxxxxxxxxxxxxxxxxxxxx health: HEALTH_WARN 1/4 mons down, quorum cunchu2,cunchu3,cunchu4 root@cunchu4:~# ceph mo ... 辣条①号 CEPH故障类 2023年 3月 22日 99 次浏览 0 阅读全文
ceph常见WARN告警的处理方式 附:IBM关于ceph的故障类文章 https://www.ibm.com/docs/en/storage-ceph/6?topic=storage-setting-crush-location-daemons 1、类别:Too many repaired reads 解决办法:重启对应的OSD 2、类别:recent ... 辣条①号 CEPH故障类 2023年 3月 22日 624 次浏览 0 阅读全文
ceph常见ERROR告警处理方式 1、类别:scrub errors,pg inconsistent #故障现象: root@ceph01:~# ceph health detail HEALTH_ERR 1 scrub errors; Possible data damage: 1 pg inconsistent [ERR] OSD_SCRUB_ER ... 辣条①号 CEPH故障类 2023年 3月 22日 273 次浏览 0 阅读全文