[问题] Raid-5炸掉和合理Raid组磁盘数量分配问题

楼主: maplefff (maplefff)   2019-08-15 19:15:51
Hi, 各位Linux前辈请多多指点小弟
事情是这样,今天早上我确认Raid-5磁盘阵列出现三颗异常便着急更换
操作过程有一些misunderstand和不谨慎,也没有确认Spare Disk的情况
到底是本来就不可能了,还是我脑残造成的,已经不可考。
总之,重建失败,Raid Fail, 资料爸爸、资料妈妈、资料阿公、资料弟弟
祖孙上下三代400TB已经一起上路。
我己经准备提头跟老板解释。
七月的台湾,真的好冷。
作者: Hurricaneger (裤袜脱落大尉)   2019-08-15 19:25:00
raid10或01就好,要速度请加ssd做快取。资料不要只有一份,最好是两地异地备援(不要备在自己家里)。rebuild都要看运气啦。这东西很玄学
作者: a1u1usul3 (Q-Max)   2019-08-15 19:29:00
该用raidz3,超过12颗就该用更厉害的做法。180颗硬盘只规划raid5....帮拍拍hadoopfs会duplicate三份,raidz不论是1还是2还是3都duplicate不到两份。可能不能直接拿来比较,但是重要的资料duplicate不到两份真的说的过去吗?没有异地备援,今天是硬盘坏了,明天如果天灾人祸火灾或漏水,这些资料一样都消失了乱讲了一些,再帮你拍拍一次。我觉得一开始的规划就非常有问题,希望对你有帮助理论上是吧。raid的rebuild也有个问题,通常一组raid的硬盘都是同时买的,寿命、品质可能也很接近,rebuild过程中也很有可能途中再挂一颗两颗其实单台180颗已经远超乎我的想像了,我也不是储存装置的专家,我只是知道这个数量绝对不可能用raid5........如果你自己无法评估,建议你找专业厂商去帮你们评估其实我回复的第一句话被ptt吃了,原本是说内可以考虑用raidz1,6~12颗考虑用raidz2,12颗以上考虑用raidz3。可是180颗只用raidz3真的够吗?我也不知道好像不能贴连结....reddit上面有讨论,五颗以内可以考虑 raidz1
楼主: maplefff (maplefff)   2019-08-15 20:48:00
好的,a大(更正),我再把高阶Raid跟单一Raid组规模加入跟Boss的讨论里。
作者: soem (流水)   2019-08-15 21:08:00
还有一点就是RAID并不是备份,如果资料真的重要还是要有备份
作者: Hurricaneger (裤袜脱落大尉)   2019-08-15 21:49:00
商用几乎不会有4TB×180颗的解。你是一次抽三颗还是一颗一颗换?
作者: kdjf (我抓得到什么呢?)   2019-08-15 22:01:00
最近一次ptt大爆炸也是raid rebuild时又坏了两颗...
作者: mirc (阿谷)   2019-08-15 22:42:00
你知道SATA有多容易坏吗?Raid5坏一颗在rebuild时你的Raid没有保护,所以建议raid5 9D(data)+1P(Parity)分成17个raid,商用的可以再将17个Raid加总起来,其他的做Spare当你越多D+1P,风险越高,所以180颗做一个Raid那根本是找死这么多颗硬盘你需要的是商用的储存设备,否则你可以常常要掉资料,常常被老板念到死,甚至工作不保>
作者: lspci (awk sed echo)   2019-08-15 22:52:00
改成raid6做一个LUN 所有的LUN再去组LVM 记得留足够的hot spare disk
作者: soem (流水)   2019-08-16 00:36:00
看你各个mount point资料总和大小是不是均匀的,我想180颗disk的架构,切开来的好处(可用性、分散存取效能)肯定是比较好。那当然如果有特定mount point的资料是热区就要另外规划
作者: kenwufederer (Nash)   2019-08-16 10:41:00
用那么多硬盘,看不懂…
作者: chang0206 (Eric Chang)   2019-08-16 13:33:00
你需求报出去 自然会有厂商帮你规划好..你要自己土炮一个接近200颗硬盘的storage ?
作者: after1 (aaaaaaaaaaaa)   2019-08-19 00:46:00
楼上说的有理 但原PO连50到100万都要考虑再三了 我看问题不在谁来规划了
作者: chang0206 (Eric Chang)   2019-08-19 09:40:00
可是4T 200颗就80了耶 预算才50-100 ??
作者: lspci (awk sed echo)   2019-08-19 19:16:00
老实说 学校里面因种种因素只能DIY 那就承受DIY的品质与风险 很公平
作者: yvb   2019-08-22 21:38:00
wiki:RAID -> 看看 RAID 50, RAID 60 那边.180个HDs 作成一个 RAID5 而不是 RAID50 RAID60 真不可思议.
作者: Hurricaneger (裤袜脱落大尉)   2019-08-23 16:48:00
因为raid卡吃raid50可能也是很贵吧?
作者: chang0206 (Eric Chang)   2019-08-23 17:17:00
我觉得原PO应该也没有用raid controller
作者: newversion (海纳百川)   2019-09-06 19:17:00
180颗........ 在悬崖边表演走钢丝?

Links booklink

Contact Us: admin [ a t ] ucptt.com