大家好:
小弟对于RAID的概念很差,几乎为0..所以有些问题!可能要麻烦各位先进解惑了!感谢
状况叙述:
一台SERVER电脑,RAID5然后有四颗硬盘!
由于这两天开始陆续发生SERVER资料存取上有问题
所以才开始检查SERVER,发现其中一颗硬盘灯亮橘色
询问同事,同事表示RAID5 (4颗硬盘) 其中一颗故障后
就有可能会造成资料无法存取的状况出现!(电脑正常运作)
由于目前没有硬盘的备品,同事建议我先直接将坏掉的硬盘关机后拆掉!
在尽快拿备品来补上!
想请问的部分是
1.RAID5 (4硬盘) 其中一颗挂掉,那会出现资料无法存取的状况是合理的吗?
2.将故障的硬盘卸除,这个部分建议这么做吗?有没有风险呢??
以上!!还烦请各位先进解惑了 !!谢谢大家
作者:
maniaque (maniaque)
2016-08-01 21:24:00应该是,会很慢,因为资料要解算回来.......
RAID5坏一颗,下次 第一时间不是上ptt 而是赶快叫料主机支援热插拔 就是到货后 换上去 让它重建重要资料能备份 先备起来 如果重建过程挂掉 就全没了坏一颗会变慢 会很慢 忙一点就容易没有回应是Server就先查过保没 保固内 免费料件很快就到货了
因为需要跑流程,备品没办法很快取得!我先将这颗故障硬盘卸下,她速度还会很慢吗??
有些买四颗RAID5是要3+1HotSpare但是很常被四颗全上
我的应该是没有hot-spare!因为有的话理论上一颗挂掉
厂商工程师建的RAID 不要太相信 有些菜到不行 还是验
是啊 明明一颗要当备援的 看过很多厂商 几乎都全上有些消费者 还以为四颗全上的 里面包含hotspare (笑
所以我第一次遇到这状况,因为是蛮重要的电脑老板跟我说 直接把那颗坏得先拔掉就好我不知道到底会不会出状况..很懊恼= =
所以很重要的Server 过保没? 已经叫料了没?
应该过保了..叫料部分需要先与客户谈完费用才有办法叫!我需要在最短时间内先稳住它的基本运作= =
ㄎㄎ 老板都不在意风险了 你又何必呢...我们这边都异地备份+RAID 出问题则是立刻处理...
我刚出社会第一份工作上司不懂RAID5坏一颗后乱搞全挂
更换时也是拔掉再插进去新的 理论上拔掉坏的不会怎样但是没料件更换 开一个大洞 是要吃灰尘吗?没备份快备份 然后求神保佑跑流程到货更换到结束
它们的说法是因为他存取时跑到这颗故障碟后,不会BYPASS所以会卡住,将他拿掉后就可以正常了没意外跑完流程拿到货可能也要两个礼拜!= =
了解!我会先去做这备份动作!!没备份到时候放新硬盘也很可怕
平常就要规划备份 坏了一颗的时候才在备 也很抖然后讲个小故事 看过有人挂掉一颗 两个月后才被发现我就很好心地(鸡婆)告诉他们 赶快找厂商吧后来就赶快到厂商 帮他们换硬盘 安全过关了
这个很正常..因为我的server也放在我平常不会去的地方所以除非是有人看到跟我们说,否则根本不会有人发现..我一年大概看到我的server主机不到2次..
所以Server上应该会装驱动附的monitor 定期连线检查有些会具备连线管理功能 可以集中管理检查各主机状态如果严重性够 有些状况可跑最急件 也许比平常快买到老板知道严重性后 还是要跑两周采购流程 就跑吧
作者: fonzae (fonzae) 2016-08-01 22:28:00
1.资料无法存取是正常,先进SRV提供的远端管理工具查看若没有设置远端管理设定,查看是否有Megaraid or SSA若为旧款则Serverraid or ACU若你的SRV属于intel or cisco or 工业电脑,则另外看2.没有必要将坏的硬盘取出,你同事给的观念错误很大Raid Card这边若是侦测到硬盘故障,是不会允许存取取出只是增加风险,且你没有准备备料,取出的意义不明关机后进行拔插的风险也高,没有必要做的事情其次上面所说的建立Raid,说真的大多都是用户的问题Raid其实在IT产业这块,是很基础的知识,甚至可以说不用特地拿出来讲,只要你有管理SRV都会知道要做什么RAID既然用户都知道,4颗做RAID5 还是 3+1的方式,这些都取决用户,4颗拥有多一颗容量,hotspare拥有二次备援的机会这些建置都一定是客户给的资讯因此我会建议你先行到管理工具查看,实体硬盘的状态确认资料存取正常,看看有没有做Cluster,做failover转移若只有单一台SRV,应该考虑是否要先告知主管,暂停服务避免硬盘存取挂点,导致Raid Crash若服务无法中断,应立即请维修厂商来更换,资料无价个人的经验,曾经有位管理SRV的说,他以为坏两颗的机率很低直到他发生坏一颗,要求厂商隔日到场更换,却在凌晨时挂了另外一颗,原本简单的换硬盘看Rebuild,瞬间变成抢救资料虽然有backup进行,但db的资料却步是最新,因此他写了三天报告,外加一天的检讨会议,以上...以上情况属于旧机型,现在资料都会存在Storage而且现在硬件太强,VM太方便,架构双重备援已不是难事
非常认同 感谢写这么多行 不过有些业界状况很糟糕公司没有资讯 然后系统要Srv就采购 然后没开条件厂商也不知道客户要什么 然后刚好请到菜鸟 就乱出了有看过四颗独立硬盘没raid 也看过raid0当raid1的归咎客户没想法 厂商给他看到Server登入桌面就好
作者: fonzae (fonzae) 2016-08-01 23:06:00
那是该家的SI素质太差,现在SRV的Raid白痴都会做SSA点几下,多余硬盘还会问你要不要做hotspareIBM 的M5现在整合到BIOS里头,按个几下也完成补正一下,IBM改Lenovo
感谢各位,明天会先请公司联络dell看能否尽快更换谢谢你们!
作者:
xisland (窄宅)
2016-08-02 03:44:00树状的分割区,每个分割都有好几个备份,才是正解,RAID已经过时