omv掉盘

Posted at 2024-03-07 Viewed Times

告警通知

收到报警邮件,提示raid文件系统丢失:

排查故障

ssh登录omv,列出磁盘:

对比发现少一块/dev/sdc,omv的磁盘列表还有,像是误显示

最初搭建omv时没有直通整个sata控制器,qm set方式直通的,所以pve宿主机还能看到磁盘,但列表异常,usage显示No,正常该是linux_raid_member:

omv磁盘阵列没了:

文件系统丢失:



查找办法

网友修复记录:
https://zhuanlan.zhihu.com/p/553047294

论坛资料:
https://forum.openmediavault.org/index.php?thread/40522-raid-array-missing

命令行检查raid状态
cat /proc/mdstat

raid状态是inactive,磁盘只有sda、sdb、sdd,同样缺少sdc

检测单块硬盘,sdb:



处理故障(降级恢复)

先停掉md0:

mdadm --stop /dev/md0

用剩下3块盘修复阵列:

刷新web界面,raid阵列恢复中:

状态是resyncing(pending),等待完成。

等了10多个小时收到一封邮件:

不过阵列状态还是一样:

文件系统没挂载:

命令行重新检查raid状态,变为激活:

选中md阵列,点“Mount”即可挂载成功:

此时阵列状态显示为降级:



采购新盘(替换旧盘)

购买新盘,关机拆下旧盘替换新盘,点“Recover”加入阵列:

开始恢复同步:

睡前看了眼,重建恢复进度90%,心想醒来就ok

第二天打不开:

omv的ip也ping不通

pve宿主机显示报错:

重启后能识别所有磁盘,包括掉的新盘:

此时raid状态还在重建99.8%,也就是说掉盘发生在99.8%的时候:

等了大概2分钟重建完成,此时状态:

md状态也是active正常:



记录状态

记录此时(2023-12-29T06:16:00)新盘信息:

截图发给gpt,让它分析这块磁盘状况:

此时pve宿主机显示有4块磁盘用于raid,其中VLKH43HZ是采购的新盘:

目前为止3个月一切正常。


If you like this blog or find it useful for you, you are welcome to comment on it. You are also welcome to share this blog, so that more people can participate in it. If the images used in the blog infringe your copyright, please contact the author to delete them. Thank you !