[闲聊] D2R 暴雪对这几天服务器问题的官方解释

楼主: NiGHTsC   2021-10-15 13:06:21
暴雪对这几天服务器问题的官方长篇详细说明
https://us.forums.blizzard.com/en/d2r/t/diablo-ii-resurrected-outages-an-explanation-how-we%E2%80%99ve-been-working-on-it-and-how-we%E2%80%99re-moving-forward/28164
https://bit.ly/3lFPgYM
就重点节录一下,细节满多的就不全翻了
前言:先解释一下数据库是怎么运行的 -> 全球型数据库与地区型数据库
就如同字面上的意思,全球型就是玩家所有的资料与进度,
但当然不可能只有全球型有
所以地区型数据库(美/欧/亚)才是第一线保存库,
毕竟这样反应才即时与迅速,之后才再同步到全球型。
接下来就是整件事的全貌
起因是因为礼拜六美西早晨,突然发生了比D2R发行首日更巨大的突发流量,
完全超过了服务器可以承担的程度,而起因就是前天为了
加强创建房间的效率的更新所造成的
当然,我们立即的还原回更新前的状态,也同时观察真正的原因为何
礼拜天,前天的还原完全是不够的,因为流量又更大服务器又爆了,
游戏端和服务器端两边都在不断的重连,完全无法处理修复任务
又继续的修复,继续的观察真正的原因
礼拜天之后的正常状态也只是治标不治本,
因为当时首要任务只是能最基本的运行,
之后就是短时间内数以十万的流量,就又倒了
礼拜一,为了修复所以需要更新全球型数据库,
但又同时要承载各地区的角色资料与进度
继续的修复,继续的观察真正的原因,
继续的发现更多的问题,继续的加强
但至少是相信已经修复前几天服务器一直疯狂重连的问题,
因为礼拜二这问题没再出现了
礼拜二,一样的又爆流量爆同时线上人数量了,
而且是各单一地区的爆量
这一点工程师们还在解决中,也紧急求援其他部门与第三方伙伴处理其他小问题
所以为何会这样?
因为是20年前的游戏了,跟不上2021的脚步了。
不管是主要功能、创建/加入房间、大厅房间的列表/更新/筛选
服务器的健康程度、检查玩家是否符合所筛选的房间列表,等等
但最大的问题还是创建房间
现今因为网络的发达,20年前玩家群的效率是完全比不上的
例:巴尔车、暴皮、古道,其他热门MF区
大家可以更简单的借由网络找到更有效的方法
也同时的代表更大数量的服务器要求 -> 短时间内大量开房/离开/再开
其实发行前就有预估这情况了,但还是远远的不及现在的程度
再来,就是全球型数据库太频繁的同步更新
(之前在PTT这也有相关的建议,例如要换区玩家再手动更新之类的)
这会是长远的计划,因为这会牵涉到整个架构的重组
再来,大家最关心的进度流失问题
这是因为玩家们在选择地区后,大部分进度就会锁定在该地区
但当服务器过载时,数据库倒掉时,玩家们就会被锁在该地区
我们也无法将进度传送到全球型。
这时就只有两条路,解锁大家并且使用全球型的旧数据库
或,整个游戏无限期停摆去跑同步资料
这其实只有一个选择…
我们相信已有办法可以将这损失缩短到几分钟,但我们并不会满足于此
最后,大家更关心的解决方案
-限流:限制开房/加房的数量,大家前几天应该多少有注意到
例:跑暴皮的玩家,20秒内短时间的开房/离房/开房
这时你就会看到服务器出错的讯息,服务器其实没事,只是你被限流了
当然,这只是暂时的,绝对非长期手段
-排队机制:类WOW的排队
上个周末绝对是个灾难,新问题不停的出现
因为玩家群的“重生”、多平台的出现,有必要在高峰时段加入排队机制
排队机制是个可以避免服务器过载的方法,也能让我们观察到时段流量
并在之后做出相对应的人数提高限制
其实这已是现在进行式“登入认证系统失败”
-鸡蛋不要全放在同一个篮子里
也是现在进行式,有些已经完成
这样某功能有问题也只会是那个功能失效,而不是整组挂掉
最后的最后
工程师人人爆肝,大家都是2001年的骨灰级玩家,
D2R绝对对我们也很重要
一定会持续的服务玩家。
作者: shinichi4869 (工藤新一)   2021-10-15 13:09:00
呵呵
作者: assassin5561 (黑小梦)   2021-10-15 13:39:00
公开讲的都不是真相,不能讲的才是真相

Links booklink

Contact Us: admin [ a t ] ucptt.com