1.媒体来源:DQ地球图辑队
2.记者署名:徽徽
3.完整新闻标题:
Excel漏数据之乱 英国1万6,000名COVID-19患者没追踪到
4.完整新闻内文:
为什么不要用Excel纪录确诊病例?这个答案或许问英国公共卫生部最知道。
https://fpscdn.yam.com/world/202010/96/47/5f7c235839647.jpg
漏了将近1万6,000人
周一(5),在COVID-19(武汉肺炎)确诊病例飙破 51万8,000人的英国,传出在 9月25日到
10月2日这 8天内,有将近 1万6,000起新的确诊病例没有追踪到,这代表原本应该接受隔
离治疗的患者依旧在外头,加剧疫情蔓延的风险。
将Excel当作大型数据库
而这 1万5,841起确诊病例之所以被英国公共卫生部(Public Health England)漏掉,原因
就出在英国公共卫生部将微软推出的Excel试算软件当作大型数据库使用,没有注意到
Excel并不适合拿来纪录和追踪每天增幅调整的确诊病例数据。
https://fpscdn.yam.com/world/202010/e3/7f/5f7c2360ce37f.jpg
为什么会漏数据?
如果要还原整起漏数据事件,必须先从英国公共卫生部如何记录COVID-19(武汉肺炎)确诊
病例说起。
每天,英国各地的公私立检测中心会将确诊病例和检测人数等数据以CSV档寄给英国公共
卫生部,英国公共卫生部再将收到的数据汇入在Excel建立的数据库。
虽然CSV的档案大小没有限制,但英国公共卫生部使用的旧版Excel呈现的档案格式XLS只
能呈现 65,536列,这代表多出来的数据会自动被删除,这也是为什么确诊病例数会被遗
漏的原因。
如果是新版的Excel,呈现的档案格式XLSX可以容纳 1,048,576列,能够纪录的检测数据
量是前者的 16倍,相对来说就不容易发生数据遗漏的问题。
要存大数据 Excel不适合
不过,IT专家指出,不管是 1987年推出的Excel XLS档案格式,还是 2007年更新的XLSX
档案格式,这些都不适合拿来存放COVID-19(武汉肺炎)的检测数据,个中道理连中学生都
知道。
英国剑桥大学计算机实验室通讯系统教授克罗克洛夫(Jon Crowcroft)说:“一直以来,
Excel都是专门给小型公司处理数据,并且大致看看数据长相的软件。”
“当你要做某些比较严肃的正事时,你会用为那些正事量身打造处理数据的方式,你有很
多其他的选择,但你不会用Excel,没人会用这个起头。”
https://fpscdn.yam.com/world/202010/c9/e3/5f7c220a6c9e3.jpg
英国公卫部:“技术问题”已解决
回到Excel漏数据事件,在发现漏了 1万5,841起确诊病例没有追踪后,英国公共卫生部表
示他们立刻回溯追踪,并且在 3号凌晨 1点已经大致补完,这项“技术问题”已经被解决
。
卫生大臣:这起意外根本不该发生
周一,当英国卫生大臣韩考克(Matt Hancock)在下议院接受质询时,也提到了Excel漏数
据事件,他坦言整起事件肇因于英国公共卫生部使用“老旧系统”统计确诊和检测数据,
两个月前当局就已经决定要更换这套系统。
“这起意外根本不应该发生,”韩考克承诺当局除了会深入调查该意外,也会立刻升级过
时的电脑系统。
比一团乱糟多了
对于这起意外,来自工党的影子卫生大臣阿什沃斯(Jonathan Ashworth)表示,就算英国
公共卫生部事后力挽狂澜,人民的生命安全照样因为延迟追踪而陷于危险。
阿什沃斯说:“成千上万的人根本不知道他们曝露在染疫的风险中,在住院人数不断增加
的情况下,这种致命的病毒很有可能散播。”
“这起事件不仅仅是一团乱,这比一团乱还要更糟。”
除了漏数据 还有很多地方做不好
苏格兰爱丁堡大学全球卫生治理学程主任斯里达(Devi Sridhar)说:“这起事件发生的时
机不能更糟了,随着时序准备进入冬季,我们早就知道到时病例数会增加,现在正是需要
当局‘检测和追踪系统’(test-and-trace system)好好发挥功用的时候。”
没想到,英国公共卫生部的检测和追踪系统却出了这样的大包。斯里达继续提到,除了漏
数据一事,当局在防疫上还有许多地方做不好,像是把人送去离家好几百公里远的地方做
检测、实验室的检测效率太慢、累积大量民众没有检测等等。
https://fpscdn.yam.com/world/202010/ba/8a/5f7c22755ba8a.jpg
解决之道:拆成小档案汇入Excel
面对各方挞伐,发生Excel漏数据事件的英国公共卫生部表示,他们现在将检测数据拆分
成小堆汇入能容纳大量数据的Excel模板内,如此一来就不会发生数据量超过上限、数据
被自动删除的情况。
然而,IT专家表示,英国公共卫生部该做的是寻找更适合的数据库软件来取代Excel,而
不是继续使用Excel。
其实,Excel不是万用
根据《卫报》的报导,Excel虽然是全世界最受欢迎的商业工具,但在某些情况下并不适
合使用Excel来记录数据,过去也有不少企业使用Excel出错,结果付出高昂代价的例子。
举例来说,2013年,摩根大通集团(JPMorgan)使用Excel出错,让他们损失将近 60亿美元
(折台币约 1,741亿5,000万元)。当时,Excel试算表中的单元格错误地除以两种利率的总
和,而不是除以利率平均值。这个错误也让美国康乃狄克大学法律系教授柯克(James
Kwak)警告大众,Excel其实“非常脆弱”。
人人都能做 但不一定做得好
柯克说:“对初学者来说,Excel没有办法追踪你的数据从哪里来,Excel也没有审计追踪
的功能,所以你有可能不小心重复打了某些数字,但你自己不知道。此外,Excel也没有
简单的方式可以测试试算表。”
“Excel最大的问题在人人都能生出Excel试算表,但可能做得并不好,因为Excel的操作
太简单,人们在制作重要试算表时并没有侷限于一定要给了解程式设计的人去做。在制作
时,也没有以系统性、能够追踪制作纪录的方式制作。”
5.完整新闻连结 (或短网址):https://dq.yam.com/post.php?id=13062
6.备注:看来英国公家机关是不会放弃用Excel的...