1. 情报or新闻 连结:
http://www.ithome.com.tw/news/116559
2017-08-31发表
2. 内文:
Google云服务爆重大网络连线事故,18小时无解只能回复旧设定,影响遍及美、欧及亚部
分用户
昨日下午,Google Cloud云端服务的网络连线出现大灾情,事故1小时后Google才找到原
因,原来是负载平衡设备连线出错,但一直找不出解决办法,直到18小时后,Google祭出
最后手段,将设定恢复到前一版,才将问题排除,但已影响到美国、欧洲和亚洲多个地区
用户使用。
Google Cloud云端网络连线出现异常,发生在昨天下午3点52分(美国时间0时52分),
Google随后也马上派人展开调查,从Google Cloud Status Dashboard网站页面上也记录
下整起网络连线灾情事件的经过。直到事故发生的1小时后,Google才找到问题原因,是
因为云端网络负载平衡设备连线设定出错,而造成应用程式与后端系统连线出现异常,导
致用户无法正常连线使用。
Google工程人员虽然紧急马上展开修补作业,但再事件爆发后的5小时还是修不好,而影
响所及的区域已经包含Google在us-east1, us-central1, europe-west1,
asia-northeast1 以及 asia-east1等多个服务地区,直到18小时后,Google发现问题解
决不了,才采取进一步紧急措施,改将负载平衡设定恢复到前一版本配置,才逐步将所有
有网络连线问题的区域排除。一直到今天早上11:18分,事件爆发快一天后,Google
Cloud服务的网络连线才全面恢复正常。
从Google Cloud Status Dashboard网站页面上也记录下整起网络连线灾情事件的经过,
从台湾时间8/30下午4点一直到8/31早上11点这段期间,Google Cloud Networking的网络
连线就一直出现异常情况。
Google没有解释原因,不过前不久Google才因为要降低网络延迟,而将可以大幅增加网速
的新算法运用在自家的Google云端平台,希望借此来加快网络速度。
前一周,Google也才因为不小心网络设定错误,误发了错误的BGP(Border Gateway
Protocol)路由资讯,让有效网站IP的流量,导向不负责转发的Google服务器,等同将这
些网站的流量导向黑洞,这也造成日本两大电信业者NTT和KDDI行动用户短暂无法正常上
网,甚至不少网络服务也大受影响,被迫暂时停止服务。
这次事件也反应出了全球性的大型网络服务公司,如Google等,在网络架构设计上已经具
备有全球性规模,若是一个不小心,网络设定配置不当,不只会对自家云端服务造成冲击
,甚至也可能连带影响到全球网络的稳定,严重更可能造成全球性大规模的网络灾情,这
也凸显出,当网络被掌握到少数像Google具全球规模的网络公司手中潜藏的新风险。
3.心得:
(记得附上至少15字心得唷,或是底下推文至少15字亦可)
之前听过不少次FB内部设定错误影响服务的消息,
这次看到google的,
心得觉得就算是知名云端,在这种意外错误的可能性下也不完全稳当