[新闻] Excel漏数据之乱 英国1万6,000名COVID-19

楼主: kailayxiudo (肉毒杆菌)   2020-10-07 19:23:10
1.媒体来源:DQ地球图辑队
2.记者署名:徽徽
3.完整新闻标题:
Excel漏数据之乱 英国1万6,000名COVID-19患者没追踪到
4.完整新闻内文:
为什么不要用Excel纪录确诊病例?这个答案或许问英国公共卫生部最知道。
https://fpscdn.yam.com/world/202010/96/47/5f7c235839647.jpg
漏了将近1万6,000人
周一(5),在COVID-19(武汉肺炎)确诊病例飙破 51万8,000人的英国,传出在 9月25日到
10月2日这 8天内,有将近 1万6,000起新的确诊病例没有追踪到,这代表原本应该接受隔
离治疗的患者依旧在外头,加剧疫情蔓延的风险。
将Excel当作大型数据库
而这 1万5,841起确诊病例之所以被英国公共卫生部(Public Health England)漏掉,原因
就出在英国公共卫生部将微软推出的Excel试算软件当作大型数据库使用,没有注意到
Excel并不适合拿来纪录和追踪每天增幅调整的确诊病例数据。
https://fpscdn.yam.com/world/202010/e3/7f/5f7c2360ce37f.jpg
为什么会漏数据?
如果要还原整起漏数据事件,必须先从英国公共卫生部如何记录COVID-19(武汉肺炎)确诊
病例说起。
每天,英国各地的公私立检测中心会将确诊病例和检测人数等数据以CSV档寄给英国公共
卫生部,英国公共卫生部再将收到的数据汇入在Excel建立的数据库。
虽然CSV的档案大小没有限制,但英国公共卫生部使用的旧版Excel呈现的档案格式XLS只
能呈现 65,536列,这代表多出来的数据会自动被删除,这也是为什么确诊病例数会被遗
漏的原因。
如果是新版的Excel,呈现的档案格式XLSX可以容纳 1,048,576列,能够纪录的检测数据
量是前者的 16倍,相对来说就不容易发生数据遗漏的问题。
要存大数据 Excel不适合
不过,IT专家指出,不管是 1987年推出的Excel XLS档案格式,还是 2007年更新的XLSX
档案格式,这些都不适合拿来存放COVID-19(武汉肺炎)的检测数据,个中道理连中学生都
知道。
英国剑桥大学计算机实验室通讯系统教授克罗克洛夫(Jon Crowcroft)说:“一直以来,
Excel都是专门给小型公司处理数据,并且大致看看数据长相的软件。”
“当你要做某些比较严肃的正事时,你会用为那些正事量身打造处理数据的方式,你有很
多其他的选择,但你不会用Excel,没人会用这个起头。”
https://fpscdn.yam.com/world/202010/c9/e3/5f7c220a6c9e3.jpg
英国公卫部:“技术问题”已解决
回到Excel漏数据事件,在发现漏了 1万5,841起确诊病例没有追踪后,英国公共卫生部表
示他们立刻回溯追踪,并且在 3号凌晨 1点已经大致补完,这项“技术问题”已经被解决

卫生大臣:这起意外根本不该发生
周一,当英国卫生大臣韩考克(Matt Hancock)在下议院接受质询时,也提到了Excel漏数
据事件,他坦言整起事件肇因于英国公共卫生部使用“老旧系统”统计确诊和检测数据,
两个月前当局就已经决定要更换这套系统。
“这起意外根本不应该发生,”韩考克承诺当局除了会深入调查该意外,也会立刻升级过
时的电脑系统。
比一团乱糟多了
对于这起意外,来自工党的影子卫生大臣阿什沃斯(Jonathan Ashworth)表示,就算英国
公共卫生部事后力挽狂澜,人民的生命安全照样因为延迟追踪而陷于危险。
阿什沃斯说:“成千上万的人根本不知道他们曝露在染疫的风险中,在住院人数不断增加
的情况下,这种致命的病毒很有可能散播。”
“这起事件不仅仅是一团乱,这比一团乱还要更糟。”
除了漏数据 还有很多地方做不好
苏格兰爱丁堡大学全球卫生治理学程主任斯里达(Devi Sridhar)说:“这起事件发生的时
机不能更糟了,随着时序准备进入冬季,我们早就知道到时病例数会增加,现在正是需要
当局‘检测和追踪系统’(test-and-trace system)好好发挥功用的时候。”
没想到,英国公共卫生部的检测和追踪系统却出了这样的大包。斯里达继续提到,除了漏
数据一事,当局在防疫上还有许多地方做不好,像是把人送去离家好几百公里远的地方做
检测、实验室的检测效率太慢、累积大量民众没有检测等等。
https://fpscdn.yam.com/world/202010/ba/8a/5f7c22755ba8a.jpg
解决之道:拆成小档案汇入Excel
面对各方挞伐,发生Excel漏数据事件的英国公共卫生部表示,他们现在将检测数据拆分
成小堆汇入能容纳大量数据的Excel模板内,如此一来就不会发生数据量超过上限、数据
被自动删除的情况。
然而,IT专家表示,英国公共卫生部该做的是寻找更适合的数据库软件来取代Excel,而
不是继续使用Excel。
其实,Excel不是万用
根据《卫报》的报导,Excel虽然是全世界最受欢迎的商业工具,但在某些情况下并不适
合使用Excel来记录数据,过去也有不少企业使用Excel出错,结果付出高昂代价的例子。
举例来说,2013年,摩根大通集团(JPMorgan)使用Excel出错,让他们损失将近 60亿美元
(折台币约 1,741亿5,000万元)。当时,Excel试算表中的单元格错误地除以两种利率的总
和,而不是除以利率平均值。这个错误也让美国康乃狄克大学法律系教授柯克(James
Kwak)警告大众,Excel其实“非常脆弱”。
人人都能做 但不一定做得好
柯克说:“对初学者来说,Excel没有办法追踪你的数据从哪里来,Excel也没有审计追踪
的功能,所以你有可能不小心重复打了某些数字,但你自己不知道。此外,Excel也没有
简单的方式可以测试试算表。”
“Excel最大的问题在人人都能生出Excel试算表,但可能做得并不好,因为Excel的操作
太简单,人们在制作重要试算表时并没有侷限于一定要给了解程式设计的人去做。在制作
时,也没有以系统性、能够追踪制作纪录的方式制作。”
5.完整新闻连结 (或短网址):https://dq.yam.com/post.php?id=13062
6.备注:看来英国公家机关是不会放弃用Excel的...
作者: syldsk (Iluvia)   2020-10-07 19:24:00
您可能已经成为
作者: kivan00 (Kivan)   2020-10-07 19:24:00
这脑子有洞吧 试算表当数据库用
作者: t81511270 (justlikeING)   2020-10-07 19:25:00
没有存盘ㄇ
作者: diabolica (打回大師再改ID)   2020-10-07 19:25:00
下去吧 上个时代的输家 ==
作者: Mesa5566 (Victor Mesa)   2020-10-07 19:25:00
英国用excel...
作者: yuetsu (Super White)   2020-10-07 19:25:00
公务员肯用excel就要偷笑了 还想要他们学别的?
作者: winglight   2020-10-07 19:26:00
把excel当数据库我遇过很多,而且档案都超大
作者: xzcb2008 (非常森77牛)   2020-10-07 19:26:00
我也有这个困扰 有个资料有9千多万笔-.-要分很多档案
作者: pinhanpaul (没风度到极点的病)   2020-10-07 19:27:00
再吵就学日本用纸笔和传真机了
作者: jerrys0580 (堕落的阿它)   2020-10-07 19:27:00
他excel用旧版的 能容纳的资料量差太多
作者: winglight   2020-10-07 19:27:00
而且每次买电脑后都会靠杯excel开超慢
作者: arrenwu (键盘的战鬼)   2020-10-07 19:28:00
这怎么看起来像页配文不过他们怎么会还在用那么旧的东西XDDDD
作者: qazxws (QAZ)   2020-10-07 19:29:00
postgresql:
作者: execute (很好)   2020-10-07 19:30:00
不然要用acess,myaql¿
作者: orze04 (orz)   2020-10-07 19:30:00
没救了
作者: yan960521   2020-10-07 19:30:00
能用excel开 就不算大阿 真的大的会被咔掉
作者: ohmylove347 (米特巴爾)   2020-10-07 19:31:00
国家级数据用消费级产品…真有你的英国…
作者: xdseaw (路过牧羊人)   2020-10-07 19:31:00
顾著笑英国,台湾要不要查一下公务员多少资料也是用excel
作者: arrenwu (键盘的战鬼)   2020-10-07 19:31:00
从这案例看起来,如果他们用 xlsx 倒还暂时不会有问题XD
作者: execute (很好)   2020-10-07 19:32:00
这世上有已经写好接口的sql可以用吗?
作者: arrenwu (键盘的战鬼)   2020-10-07 19:32:00
资料用 Excel 不是问题,是怎么用
作者: ddoll288 (风儿卿卿)   2020-10-07 19:33:00
已知用Access
作者: KJC1004   2020-10-07 19:33:00
北七啊不会用SQL吗?
作者: Vincent8026 (交大帅哥)   2020-10-07 19:33:00
用mysql都好一点
作者: richjf (jeff)   2020-10-07 19:33:00
米国:好险我们早破百万了 咦?
作者: soria (soria)   2020-10-07 19:34:00
@@
作者: arrenwu (键盘的战鬼)   2020-10-07 19:34:00
MS Access 这情况能不能用啊? 我不熟这软件就是了
作者: kinghtt (万年潜水伕)   2020-10-07 19:34:00
台湾搞不好也是在做一样的事…
作者: kivan00 (Kivan)   2020-10-07 19:34:00
烂一点的用access 有点底的可以用phpmyadmin
作者: foolfighter (傻瓜斗士)   2020-10-07 19:35:00
白人是不是有点蠢?
作者: swoosh67   2020-10-07 19:36:00
全球公务员都一个样 笑死
作者: superpandal   2020-10-07 19:36:00
果然各国的公务员都是一样 sql烂语法也不是艺术就是
作者: tokyoto (东京京都)   2020-10-07 19:37:00
一定是先换新版的Excel啊 现在哪来时间去找新软件 然后再
作者: execute (很好)   2020-10-07 19:37:00
政府机关可能很难懂apache server + mysql +php花个百万
作者: arrenwu (键盘的战鬼)   2020-10-07 19:37:00
如果MS Access可以解决的话其实可以用吧?
作者: B0988698088 (废文少女小円♥)   2020-10-07 19:38:00
用个MSSQL是有多难…
作者: sourbait (sourbait)   2020-10-07 19:39:00
公务员,不意外。
作者: arrenwu (键盘的战鬼)   2020-10-07 19:39:00
他们有付钱的话 应该可以找微软提供协助虽然我觉得他们过分依赖Excel也不意外
作者: pipiayin (box)   2020-10-07 19:40:00
不升级office....
作者: doubleperson (恶龙)   2020-10-07 19:40:00
2楼瞬间突破盲点
作者: peter0825 (peter0825)   2020-10-07 19:40:00
Access就好了
作者: coutji3184 (十一月的冰雨)   2020-10-07 19:42:00
听起来像日本人会犯的蠢 没想到英国人先搞笑
作者: Vassili242   2020-10-07 19:43:00
台湾公务员会用word
作者: netio (新中间选民)   2020-10-07 19:44:00
还在用2003版?
作者: Minesweeper (lleh)   2020-10-07 19:44:00
access很卡耶...
作者: veigarlol (此为玩笑)   2020-10-07 19:47:00
去问制程 一定一堆用excel
作者: andy199113 (Andy)   2020-10-07 19:47:00
根本就是想黑英国 英国人这么聪明 垃圾YAM酸三小
作者: psynanako   2020-10-07 19:47:00
那要用什么啊?
作者: GrayHS (炫砲烧仙草)   2020-10-07 19:49:00
随便一个SQL数据库都行吧
作者: apple123773 (逆水)   2020-10-07 19:50:00
用个SQL不好吗 又不用钱
作者: james732 (好人超)   2020-10-07 19:51:00
再懒用个sqlite都比excel好ㄅ
作者: mbttar25 (nn)   2020-10-07 19:51:00
建个数据库很难 没有资讯人员也可以委外阿

Links booklink

Contact Us: admin [ a t ] ucptt.com