神魔之塔服务器事故说明与今后应变
首先,请容我们为服务器问题带来不愉快的游戏体验向所有召唤师致歉。
在列出背后原因及解决的方案前,先说明一下近期发生的服务器状况。
我们的服务器自 9 月份以来发生过 8 次事故 (未计画 18.1 版本更新停机维护) ,大部份
事故原因为服务器“数据传输不完整”所导致,和以往因人流众多而引起的问题不同。
在经过一个多月来的修复过程,我们竭力解决服务器的各种问题,以避免出现影响玩家游玩
神魔之塔的情况。
服务器事故时间:
1) 2019 年 9 月 11 日 11:08 至 2019 年 9 月 12 日 07:00 ( 包括 20 小时服务器维护
)
2) 2019 年 9 月 13 日 10:54 至 2019 年 9 月 13 日 23:10 ( 包括 12 小时服务器维护
)
3) 2019 年 9 月 17 日 06:00 至 2019 年 9 月 17 日 23:12 ( 包括 15 小时服务器维护
)
4) 2019 年 9 月 29 日 07:28 至 2019 年 9 月 29 日 08:30
5) 2019 年 10 月 02 日 22:10 至 2019 年 10 月 02 日 23:43
6) 2019 年 10 月 08 日 11:05 至 2019 年 10 月 08 日 14:00
7) 2019 年 10 月 13 日 18:42 至 2019 年 10 月 13 日 18:43
8) 2019 年 10 月 14 日 23:40 至 2019 年 10 月 15 日 00:40
1) 服务器出现了什么问题?原因为何?
当玩家进入游戏时,服务器会索取玩家帐户资料及游戏核心资料,服务器向数据库或快取伺
服器索取或储存资料时,传输的资料必须完整才能确保玩家能正常游玩。
在最近数次事中,服务器在进行资料传输的过程中出现数据不完整,当中包括部份玩家的个
人帐户资料及游戏核心资料,该批玩家由于个人帐户资料缺失而导致无法连接服务器;而其
他玩家则由于游戏核心资料缺失问题,所以在进入游戏后会出现各种异常问题。
对于服务器事故,我们设想了数个原因:
i. 内部系统逻辑出错
我们于事故出现时最先怀疑的,是内部系统逻辑上是否出现错误导致问题,但经过详细的检
查后已经排除了这个可能性。
ii. 第三方服务器服务供应商问题
另一个有可能的原因,则是第三方服务器服务供应商在进行传输时出现错误,导致数据出现
缺失及异常。
iii. 服务器作业系统问题
我们亦查找过其他公司有否发生相近情况,经调查发现,其他公司的服务也曾因服务器作业
系统的核心出现问题,发生类似事件。
2) 为什么维护时间都这么临时?
异常情况都是无预警及随机的状况,当我们发现部份玩家数据有异常时,我们需要即时进行
临时维护,以免影响到其他正常玩家的数据。
其中一个情况是,我们曾公告并安排在 9 月 17 日 09:00 停机维护,然而在当天 06:00
我们发现异常问题发生,所以提早在 08:48 进行维护。对于未有及时发布紧急维护消息,
我们在此诚恳地致歉。
3) 服务器出现问题后至今,神魔之塔官方人员实施了哪些修正及预防措施?
有关问题发生后,我们在多次服务器维护中进行以下工作措施,加强对我们服务器的保护,
尽力令系统正常运作。
为数据资料受损的玩家进行修复工作
将系统版本升级,加强修复系统漏洞及安全问题
在不同地方的数据读取及存入时加强校对及保护机制
把整个服务器结构及设置重建,好让系统在全新的操作环境下运行
服务器系统会因应负载情况而自动新增或减少服务器的数量,我们发现“数据传输不完整”
的问题随机发生在这些刚刚自动新增的服务器上。针对这情况,我们加强了对新增的服务器
的检测,当其中一台服务器发生类似问题,会即时自动地从系统脱离,停止运作,从而不会
影响当下玩家;同时系统亦会立即自动通知工程师,以检查情况。我们相信这做法能有效地
防止类似事件影响玩家游玩神魔之塔。
4) 神魔有增设服务器吗?
我们采用云端服务器服务,服务器可以随时增加数量以应付当时的需求。过往遇到人流众多
的活动时,服务器不单是自动添加数量,工程师也会提早增加服务器。可是,最近数次的事
件和以往因人流众多而引起的问题不同。
5) 最近数次的服务器问题和以往的有什么不同?
以往的情况大多是遇到人流过多情况,当下的服务器未能应付负荷时会造成分流,我们会预
早加设服务器数目,预先应付当下的人流负荷。而最近数次的事件不是服务器负荷过重,而
是系统数据随机地在网络传输中出现缺憾,增加服务器这方法并未能解决这个问题,所以期
间在多次服务器维护中进行各项预防问题的工作措施,加强对服务器的保护。我们同时亦正
跟第三方服务器服务供应商沟通,寻求完全解决的方案。
6) 18.1版本更新当天 (10 月 21 日) 服务器停机维护是因为什么原因?
第一次维护:10 月 21 日 09:00 – 17:15
除了原定的版本更新维护工作外,为进一步排除服务器网络会产生传输时出现数据缺失及异
常问题,在更新维护当天,我们再次重整服务器结构及设置到新的服务器网络中,维护时间
比我们预估的为长,延迟了 15 分钟,在此我们再次致歉。
第二次维护:10 月 21 日 19:15 – 23:00
开放服务器后,新建的服务器有设置问题,令机能运作处理比平常慢,出现效能问题,所以
在当天 19:15 时决定停机维护以解决问题,并于 23:00 确保所有玩家能进入游戏。
7) 官方在第二次停机维护做了什么措施吗?
我们当晚进行了紧急停机维护修正新建服务器的设置,设置完成并重新开服配合分流后,目
前服务器已确保正常运作。
8) 工程师的话
对于最近发生的服务器问题为大家带来不愉快的游戏体验,我们在此致上最高的歉意。
团队不断有新的工程师及测试员加入,并持续招聘合适的人选,致力改善游戏内的 Bug 问
题,加强服务器保护措施及稳定性,以避免出现影响玩家游玩神魔之塔的情况。感谢召唤师
的体谅,请大家继续支持神魔之塔。
文章来源: https://reurl.cc/ObMmp7
大家看完文章有什么感觉?
身为1420天登入的中生代玩家,希望神魔可以长长久久,他们好好检讨是必要的。希望可以
在改版之余还,好好稳定服务器。体验要好,玩家才回长久的玩下去。