我本身是软件工程师 但是有10多年的2线兼职MIS经验
(第一线MIS没空时 我才要出手)
台面上常见的服务器设备 我大概都摸过一半
熟练度不算高 但是至少网管常识自认是充足的
反正 有GOOGLE~没懦夫~ 熟练度并不重要
这个礼拜碰到公司MIS一个令我非常傻眼的
“在工作日白天做虚拟化移机”的行为
工作日移机就算了 他事后的态度令我更感到神奇
其实这篇抱怨的成分居多 不过我还是简单的叙述就好 免得太多情绪
系统环境是 i7/16G/1T Windows IIS+Oracle
旧实体机是软件研发用主机 最大上线人数了不起只有5人
其实附载超凉的 i7根本就是浪费钱
状况是 原始管理者不正确的备份方针导致硬盘爆满 硬盘状况不佳需要转移
(将大量的ZIP备份丢在自动备份目录 导致一天就会有1GB的沉余备份)
故事是这样的
这个星期一莫约快中午 MIS跟我说[系统要"进行备份" 停机到下午]
其实 光是这句话就是个大地雷
MIS怎可以在"工作时间"把研发服务器停机??
不过我当时因为前一天没睡好 状态已非常疲倦
而且 不过就是备个分而已 正常两三小时已经非常充裕了
所以就没想太多让他去停机 而我也顺便偷懒打顿
边coding边打顿 等到了下午34点 我回过神后 系统还是没有恢复
后来我才知道
1. 他在平常日做VMWARE "虚拟化疑机"
这时我傻眼了
对一般民众可能是没有什么差别
但是对网管来说 移机&备份是两个天差地远的概念
完全不可以混淆
而且 虚拟化是"风险"非常大的工作 怎么可以在平常日执行
我过往做移机 都是选在周末假日有两天的空闲时间执行
若移植不成功 还可以复原取消
敢在工作日进行移机 若不是稀世天才 就是太天真
(其实我看他只是贪图便宜行事 揽得假日还要额外来处理)
结果好死不死的 灾难就这样开始了
虚拟化的host开机后
2. IIS是空的 完全不会运作!? (因为分割区不同 MIS只有转移C槽OS 没有复制DATA)
这. 这算什么??
系统转移前 不是应该都要先把原系统内所有的 "服务"/"资料"
以及一切相关内容都清册列表 并逐一清点复原吗?
我想"完整移机" 这应该是最基本程度的素养吧?
连系统中有什么东西都不清楚就直接进行移转 不怕崩溃吗??
在我去反应之后 MIS总算是开始复制网站
因为DELAY 正在验收赶进度 已经开始被老板骂了
我当下有点不耐烦 就请MIS直接"旧机改IP上线平行运作" 以让我能先工作优先
不过 MIS有点不情愿 仍然继续弄VMWARE
MIS很坚持 我也没办法只好回去等
等复制完后打开浏览器 页面直接跳出鲜艳的黄白红字错误讯息
[系统需要安装Oracle 8.X.X]........
算了 不意外~
IIS都会忘了复制 当然更别说是Oracle
又等弄到了67点 Oracle也还原了 再次打开浏览器
[ ora-12528: tns:listener: all appropriate instances are blocking new
connections ]
好样的! 虽然我很少用Oracle
所以并不熟设定值 不过可以猜测是网络接口异动造成的设定有异常
(这就是移机的醍醐味 凡是有绑硬件的服务 都很容易出事 炸过才知道他的痛
这个时候 MIS已经想要把责任抛给我了
想叫我自己处理/重设SQL的问题
我听到时差点有点爆气
在白天移机就已经是难以容忍的缺失了
移机失败 还想丢给工程师善后
我当下只跟他说 "直接把系统ROLLBACK 然后让网站要会动"
然后来接我回家的人刚好也到了 所以就收一收准备走人了
我不知道他有没有当MIS的自觉?
所谓的MIS 就是任凭电脑当机任崩溃
任何电脑上的把屎把尿问题 都是他要负责的范围
这确实是个鸟缺 但这就是MIS的职责所在
研发工程师是完全没有义务 更没有道理要帮忙的
更别说 这还是他自己捅出的皮漏
我对MIS已经是非常仁慈了 我在外面可是碰过一大堆
"自己IE不会使用 然后写信来客诉"的鸟案例
(网页太长 显示资料被盖住 滚轮往下滚3下后 结案!)
我还没用那种没常识的天兵去虐待他呢
然后隔天 他搞不定所以进行复旧
号称是回到星期一的1/15
但开机开始运作后 开使发生不明的资料/SQL的大量遗失
当下 我马上就了解 这下坑可捅大了
现在正值验收阶段 其实我当时根本不该答应让他"备份"(他宣称是备份)
不过 已经来不及了 我自己贪睡也有责任
后来到了今天
根据目录上的异动戳记判定 实际复旧日期是1/7 下午一点......
整整差了半个月
因为系统不是我一个人在开发而已(虽然当前主要负责人是我
有多少东西遗失 我根本没有头绪
到了今天 我叫他把旧主机改IP平行上线
他只跟我说要切换 叫我选一个
我非常不理解他的思维 为何不平行运行
后来我才知道 他买了一颗新硬盘 灌了VMWARE后
3. 直接在旧主机上(i7)抽换硬盘"取代"旧系统
他还非常"理所当然"的跟我说 只要切换硬盘就可以复原
太神奇了 我完全傻眼
"热机封存"的备援概念到哪去了
以我的认知
“任何的系统移植 一定都必须保留旧系统最少一个月以上 确认无误后才能挪用设备”
移植当天就直接"挪用旧设备"
还跟我说 "VMWARE可以任意再移植 没问题"
他根本没搞清楚问题的严重性在哪
然后他还很有理由的解释说
4. 原本的电脑上有8核心 只有这台i7主机有8核心 才能跑得动OS
听到这边 我只脱口讲了一句 "没经验"
VMWARE是可以"随便更改"CPU数量的
而且 VMware里最不重要的资源就是CPU
最重要的资源在于内存和硬盘速度
而且 只要使用VMWARE CPU速度就直接打8折 这是公认常识
如果想要运算速度 就不要用vmware
实务上 给host的CPU数量只要N+1就够了
因为虚拟IO效率非常差
光是上网都会随时会吃满一颗CPU 所以要额外给一个CPU
以我这种封闭开发机的环境来说
2+1就更够用了 (一个前台IIS服务 一个后台SQL服务) 速度根本不重要
P4都在灌VMWARE了 遑论i7
甚至 就算是只给他1+1两个CPU 也不会太吝啬
因为 根据实务经验上
数据库型网站 95%以上的CPU消耗都是来自于SQL
所以
IIS独自享有一颗CPU其实也没什么帮助 几乎没差
RAM加大还实际多了 毕竟Oracle是怪物
说真的 我是不知道MIS要学什么
我是觉得 这其实是没什么深度的领域
"入门简单 出师难" 一切的诀窍都在于经验(医生也是差不多喔)
要进来其实很容易 不用什么专长 但要熟练很费事 要摸很久
讲了这么多没营养的废话
最后 只想问问
板上对于MIS应有的素养认知大概是如何?